fbpx

Tutuklular İkilemini Tanımak ve Çözmek (Oyun Teorisi)

Favorilere Ekle (0)
Please login to bookmarkClose
Please login

No account yet? Register

Bir acil tıp kliniğinde işbirliği ve rekabet arasındaki dengeyi yöneten nedir? Kliniğin kendi içerisindeki (hocası, uzmanları, baş asistanı, asistanları) ve içinde bulunduğu çevreyle (hastalar-diğer klinikler) arasındaki işbirliği her zaman rekabetin tehdidi altındadır. Her oyuncu kendisi için o an en iyi olan seçeneği (baskın stratejisini) hayata geçirmek istediğinde bedel işbirliği içinde olduklarında karşılaşacaklarından daha ağır olabilmektedir. Bu durumu oyun teorisi kavramlarıyla  anlatmak için “tutuklular ikilemi”nden yararlanılır. Tutuklular ikilemi (ya da mahkumlar ikilemi), sosyal bilimlerin en çok tanınan strateji oyunudur. İlk olarak 1950 yılında RAND çalışanları Merrill Flood ve Melvin Dresher tarafından şekillendirilmiştir. Ardından Albert William Tucker modele hapis cezası sonucunu eklemiş ve tutsak ikilemi olarak adlandırmıştır. Tutuklular ikilemini anlatmak için pek çok senaryo yazılmıştır ama benim en eğlenceli bulduğum aşağıdaki hayali senaryodur:


Sovyetler Birliğinde (Stalin döneminde) bir orkestra şefi, bir sonraki konserine giderken, trendeki koltuğunda, o gece yöneteceği müziğin notalarını gözden geçiriyordu. İki KGB subayı, şefin okuduklarını gördüler ve müzik notalarının gizli bir şifre olduğunu düşünerek onu casus diye tutukladılar. Şef, bunların Çaykovski’nin Keman Konçertosu notaları olduğunu söyleyerek itiraz ettiyse de, yararı olmadı. Ertesi gün, sorgu yargıcı kendinden emin bir tavırla içeriye girerek şöyle dedi: “Bize her şeyi anlatman iyi olur. Arkadaşın Çaykovski’yi yakaladık ve konuşmaya başladı bile.”

Belki de en iyi bilinen strateji oyunu olan “tutuklular-ikilemi”nin bir öyküsü böyle başlar. KGB’nin, adının Çaykovski olmasından başka hiçbir suçu olmayan birini gerçekten tutukladığını ve onu bir başka yerde, orkestra şefine yapılana benzer bir şekilde sorguladığını varsayarak; öyküyü mantıksal sonuca doğru geliştirelim. Bu masum insanların ikisi de, bu sorgu sırasında gerçeği söylemekte direnirlerse, her ikisi de üçer yıla mahkum olacaktır. Eğer orkestra şefi, meçhul “işbirlikçi”sini suçlayan yalan bir itirafta bulunursa ve Çaykovski susarsa, o zaman orkestra şefi bir yıllık ceza (ve KGB’nin teşekkürleri) ile kurtulacaktır. Çaykovski ise inkarda direndiği için 25 yıl ceza alacaktır.Tabii ki, eğer tersine Çaykovski orkestra şefini suçlayan bir ifade verir, şef de karşı koyarsa, bu halde cezalar buna göre değişir. Eğer her ikisi de itiraf ederlerse, her ikisi de standart ceza olan on yıla mahkum edilecektir.

Şimdi, orkestra şefinin düşüncesini ele alalım. Çaykovski’nin ya itiraf edeceğini, ya da susacağını biliyor. Eğer Çaykovski itiraf ederse; kendisi, susmakla 25 yıl, itiraf etmekle 10 yıl ceza alacaktır; öyleyse itiraf etmek onun için daha iyidir. Eğer Çaykovski susarsa; şef susarsa 3 yıl ve itiraf ederse 1 yıl alacaktır; öyleyse itiraf etmek kendisi için en iyi seçimdir.

Dzerjinski Meydanındaki başka bir hücrede, Çaykovski benzer bir akıl yürütme ile aynı sonuca varır. Doğal olarak, sonuçta ikisi de itiraf ederler. Daha sonra Gulag takımadalarında karşılaşıp öykülerini karşılaştırdıklarında ise, aldatıldıklarını fark ederler. Her ikisi de suçu kabul etmemekte direnselerdi, ikisi de çok daha kısa süreli mahkûmiyetle yakayı kutarabilirlerdi.

Soruşturma öncesinde buluşarak meseleyi konuşabilselerdi, her ikisi de direnmekte karar kılabilirlerdi. Ancak, büyük ihtimalle böyle bir anlaşmanın yararlı olacağını kısa sürede fark ederlerdi. Ayrıldıklarında ve sorgulama başladığında, ikisinin de, ötekine kazık atıp kendi için daha iyi anlaşma elde etme güdüsü hayli güçlü olabilirdi. Tekrar Gulag’da karşılaşabilirlerdi; ama bu sefer aldatmanın hesabını görmek için (uzlaşmanın değil). Bu ikisi, ortak olarak tercih ettikleri çözüme ulaşmak için yeterli karşılıklı güvenilirliği elde edebilirler mi?

Birçok insan, firma ve hatta ulus, tutuklular-ikileminin çatal boynuzuyla yaralanmıştır. İnsanın kendi rahatı, güvenliği, hatta yaşamın kendisi için, tutuklular-ikileminden kurtulmanın yollarını bilmek gerekmektedir.


Acil tıp pratiğinde tutuklular ikileminin boynuzuyla yaralanma olasılığı hep vardır. Diğer kliniklerin hastaları devir almamaları, konsültasyona zamanında gelmeme, klinik içerisinde uzman, kıdemli, çözmez ilişkileri hep işbirliği ve rekabet (kendisi için o an en iyi olanı yapma) karşıtlığı içerisinde süregelmektedir.

İşbirliğinin (anlaşmanın) temelinde yatan sorun, oyuncuların hile yapma dürtüsüdür. Ortaya çıkan temel sorun ise, hile yapanların nasıl ortaya çıkarılabileceğidir? Hangi ceza olasılığı hile yapmayı önleyebilir?

Gerçek yaşam pratiğinde işler daha karmaşıktır ve kimin hile yaptığını ortaya koymak zordur. Bunun çözümlerinden birisi tüm kritik süreçlerin görünür kılınmasıdır. İşbirliği için şeffaflık artırılırken, rekabet karanlık görünmeyen kısımda yürür. (Burada yapılabilecek en acemice hata, kendisinin yaptığının kimsenin bilmeyeceğini-görmeyeceğini düşünerek yapılanlardır.) Bugün kameralı kayıt sistemleriyle, dijital kayıtlarla sürecin büyük çoğunluğu şeffaf ve görünür hale gelmiştir. Hatta elektronik imza ile kritik süreçlerde kimin ne yaptığının yüksek doğrulukla belirlenebilmesi olası hale gelecektir.

Randevu sistemleri, hastane otomasyon sistemleri, elektronik imzalar, elektronik reçeteler, kamera kayıt sistemleri sağlık sistemi aktörlerinin (hasta-hekim-yardımcı sağlık personeli-eczane-SGK-yönetici) hareketlerini sistem yöneticilerine daha şeffaf hale getirmektedir.

Bu sistemin işbirliğine teşvik edebilmesi için, hilebazları cezalandıracak bir mekanizmanın olması gerekmektedir.

Bu mekanizmaya geçmeden önce bir kere oynanan ve tekrarlanan oyunlar kavramından bahsetmek gerekir. Tek seferlik oyunlarda iki taraf tek bir sefer karşılaşır ve bir daha benzer bir oyun olmaz. Örneğin randevu alıp polikliniğe girmek yerine acil servise başvuran kişinin ilk anamnezinde bu durum  “sezilebilir” ama kesin bilinemeyeceği için muayene ilerletilir ve tetkikler yapılır. Sonuçta, kişi polikliniğe yönlendirilebilir. Ama kişi hile mi yapıyor, gerçekten acil bir hastalığı olduğunu mu düşünüyor, yoksa bilgi eksikliğinden mi acil servise başvuruyor ayırt edecek yöntem bulunmamaktadır.

Tekrarlayan oyunlarda ise, örneğin bir kliniğin hasta devralmada direnci, belirli bir kişinin konsültasyonlara yönelik tutumu ya da bir asistanın derslere zamanında gelmemesi tekrarlayan bir örüntü içerisinde olduğu için ayırt edilebilir. Bir kere oynanan oyunlarda karşılıklı işbirliğini başarmak için formül yoktur. Yalnızca tekrarlayan oyunlarda, cezalandırma, yani işbirliğini motive eden bir sopa imkanı bulunabilir. İşbirliğinin bozulmasının, gelecekte oyunlarda zarar vermek gibi otomatik bir bedeli vardır. Bu bedel yeterince yüksekse, hile engellenecek ve işbirliği sürecektir.

Hileyi engelleyip işbirliğini sürdürmek için bir ceza mekanizmasının nitelikleri ne olmalıdır?  Michigan Üniversitesi Politika bilimcisi Robert Axelrod kısasa-kısas kuralının tutuklular ikilemini çözmede kullanılacak ceza mekanizmasının gerekli niteliklerini karşıladığını ileri sürer; açık ve basittir, hiçbir zaman aldatmayı başlatmadığı için iyidir, aldatmayı cezasız bırakmadığı için tahrik edicidir, uzun süre kin beslemeyip işbirliğini onarmaya istekli olduğu için de affedicidir.

Kısasa kısas rakibinin son yaptığı hamleyi tekrarlamaya dayanır; işbiliği-işbirliği, hile-ceza. Axelrod, kısasa-kısasın etkinliğini deneysel olarak da doğrulamak için bir turnuva düzenledi ve tüm dünyadaki oyun teorisyenleri stratejilerini bilgisayar programlarıyla sundular. Kazanan Toronto Üniversitenden matematik profesörü Anatol Rapaport oldu. Çok defa tekrarlanan hayali oyunlarda kısasa-kısas yani “rakibinin en son yaptığını yap” yaklaşımı hep başarılı oldu.

Bu yaklaşımın, bilgisayar dünyası gibi yanlış algılama olanağının olmadığı ortamlarda başarılı olması, gerçek yaşamda uygun olacağı sonucunu getirmediği düşüncesi daha baskındır. Bu yanlış algılama olasılığı, kısasa-kısası kusurlu hale getirmiştir. Burada sorun herhangi bir hatanın ileriye ve geriye doğru yansımalarının olacak olmasıdır. Bunun yerine önerilen ise, sapmanın (kusurun) bir istisna olduğu durumda affedici, kural olduğu durumda ise cezalandırıcı strateji kullanmaktır.

Önerilen ilkeler şunlardır;

1)    İşbirliği ile başla.

2)    İşbirliğini sürdür.

3)    Siz işbirliği yaparken karşı tarafın kaç kez sapma yapmış gibi göründüğünün hesabını tut.

4)    Eğer sapma ilkesi kabul edilebilir değilse, kısasa-kısasa dön.

Bir işbirliği anlaşmasında, hile yapanın cezası ne olmalıdır? Burada amaç hile yapmakdan caydırmak olduğu için oldukça yüksek bir ceza verilebilir, örneğin derse geç kalan asistana idam cezasını vermeyi önerebiliriz çünkü amaç idam etmek değil derse zamanında gelmesini sağlamaktır. İşte bu noktada yanlış anlama olasılığının varlığı devreye girer. O zaman ceza caydırıcı olacak kadar yüksek ama yanlış yere ceza verildiğinde kişinin mağduriyetini en aza indirecek kadar da düşük olmalıdır. Bu durumda tüm kliniğe kahvaltı ısmarlamak makul bir ceza olabilir.

Acil servislerde gerek klinik içi, gerek kliniğin içinde bulunduğu çevreyle olan ilişkilerinde işbirliği içinde bir sistemin oluşturulmasında ve sürdürülmesinde tutuklular ikilemini tanımak ve çözmek yararlı olacaktır. Sağlıkta dönüşüm olarak kavramsallaştırılan değişikliklere bu perspektiften bakıldığında daha anlaşılır olacağı söylenebilir.

 

Aşağıda tutuklular ikilemiyle ilgili Dr. Rand’ın bir videosunu izleyebilirsiniz.

The Prisoner’s Dilemma – Kindness Is Contagious

 

“Dr. Strangelove or: How I Learned to Stop Worrying and Love the Bomb” isimli Soğuk Savaş kara komedisinde, Sovyetler, bir Amerikan saldırısına karşı kullanılmak üzere tüm dünyayı yok edebilecek bir “Mahşer Cihazı” yaratmayı başarır. Bu kadar büyük etkisi olan ve yıldırıcı gücünün çok fazla olmasını bekleyeceğiniz bu cihazın hiçbir yıldırıcı etkisi yoktur. Bunun sebebi ise Amerikalıların böyle bir cihazın varlığından haberdar olmamasıdır.

Oyun teorisinin dengeli çalışması için ceza sisteminin caydırıcı olduğu kadar bilinir ve net olması da gereklidir.

 

Yararlanılan kaynaklar:

Avinash K. Dixit, Barry J. Nalebuff, Stratejik Düşünme, Sabancı Üniversitesi Yayınları

 

Okuma Listesi

http://www.gametheory.net/

Oyun Teorisi: http://science.howstuffworks.com/game-theory.htm

Ekonomi Oyunları

Ultimatum Oyunu: http://money.howstuffworks.com/ultimatum-game.htm

Diktatör Oyunu: http://money.howstuffworks.com/ultimatum-game1.htm

 

 

Bu Yazının Podcasti

Acilcinin Sesi

blank
Ara