Meta Analizlerin Gizli Kırılganlığı: IOTA Çalışması

IOTA

IOTA Çalışmasının Olgu Sunumu

Bu metin, EMCrit’te yayınlanan The hidden fragility of meta-analyses: case study of the IOTA trial yazısından, yazarının yazılı izni ile tercüme edilmiştir.

Giriş: IOTA Çalışması

Muhtemelen şimdiye kadar IOTA çalışmasını duymuşsunuzdur.1 Lancet Dergisi’nde yayınlanan bu meta-analizde kritik hastalarda konservatif oksijen tedavisi ile liberal oksijen tedavisinin sağ kalım üzerindeki etkisi karşılaştırıldı (Detaylar burada). Sonuçları net ve heyecan vericiydi:

Çalışma üzerine yapılan değerlendirmeler tamamen olumluydu. Yardımcı editoryal yazı, çalışmanın hemen uygulama değişikliğine gidilmesi gerektiğini gösterdiğini ifade ediyordu:2

blank

Çalışmanın sonuçlarına katılıyorum (Hiperoksi fizyolojik değildir ve muhtemelen zararlıdır). Ancak, bunun çok kırılgan bir analiz olduğunun farkına varmalıyız. Meta-analizler konusundaki endemik problemlere gözlerimizi açmamız gerekiyor.

Hasta Düzeyinde Kırılganlık: Kırılganlık İndeksi

Kırılganlık İndeksi (Fragility Index), bir çalışmanın istatistiksel önemini yitirmesi (p değerinin <0,05’in üzerine çıkması) için değiştirilmesi gereken çıktı sayısını ifade eder. Düşük bir kırılganlık indeksi, sağlamlığın az olduğunu gösterir. Mesela, NINDS çalışmasının kırılganlık indeksi 3’tü. Eğer 3 çıktı farklı olsaydı, sonuçlar istatistiksel önemlerini yitireceklerdi ve çalışma “negatif ” bir çalışma olarak kabul edilecekti.

İkili sonlanımlı çalışmalarda kırılganlık indeksinin hesaplanması kolaydır (Örn. şuradaki kırılganlık indeksi hesap makinesini kullanarak).  Ancak meta-analizler için kırılganlık indeksinin hesaplanması biraz bulanık bir konudur. Ama evet, bu yazıda o konuya gireceğiz.

Bir meta-analizin kırılganlığını test etmek için atılması gereken ilk adım, içerdiği hesaplamaların tekrarını yapmaktır. IOTA çalışması, Cochrane Topluluğu tarafından üretilen ve ücretsiz dağıtılan bir program olan RevMan 5.3’ü kullanmıştır. Yayında tariflenen metodları kullanarak, hesaplamalarını kendi bilgisayarımda yeniden yaptım (ekran görüntüsü aşağıda). Lancet’taki bir yazım hatası dışında, her sayı yayınlanan dökümandaki ile aynı.

blank

Eğlence şimdi başlıyor. Hadi Young, 2014 çalışmasındaki 3 hastanın daha ölmüş olduğunu varsayalım. Bu durum, bütün meta-analizin negatif sonuçlanmasına yol açacaktı:

blank

Kırılganlık, çalışmalar arasında değişkenlik gösteriyor. Her bir çalışma için, konservatif oksijen grubunun ölen vaka sayısını, p değeri <0,05 olmayana kadar artırdım:

blank

Yani genel olarak, meta-analizin negatif sonuçlanması için, ek olarak 5-9 hastanın farklı bir sonlanımla sonuçlanması yeterli olacaktı. Bu farklı sonlanımlı vakalar, tek bir çalışmada olabileceği gibi, birden fazla çalışmaya yayılmış da olabilir. Mesela ilk 9 çalışmanın konservatif oksijen gruplarına birer kötü sonlanım eklediğimizde, meta-analizin sonuçları hükümsüz hale geliyor:

blank

Liberal oksijen grubundaki hastaların farklı şekilde sonlanması da sonucu etkileyebilirdi. Mesela, liberal oksijen grubundaki 3 ölümlü vaka olmasaydı ve konservatif oksijen grubuna 4 ölümlü vaka eklenseydi, meta-analizin sonuçları hükümsüz hale gelecekti:

blank

Kırılganlık indeksi için net bir sayı vermek zor olsa da, açıkça görüldüğü üzere 10’dan küçük.  Çalışmanın sonuçlarını hükümsüz kılmak için sonuçları değiştirilebilecek hastalar; hem hayatta kalan konservatif oksijen grubu (toplam 7857 hasta) hastaları, hem de ölen liberal oksijen grubu hastaları (toplamda 283 hasta). Protokol ihlalleri gibi teknik problemlerin, 8140 hasta içinde <10 hastalık bir hataya sebep olmuş olabileceğini düşünmek zor değil.

Reklam

Binlerce hastadan oluşan bir meta-analizi okuduğumuzda, doğal olarak hasta sayısının artmasının analizin gücünü artırdığını varsayıyoruz. Ne yazık ki, sıklıkla bu doğru değil. Eğer pozitif ve negatif çalışmalar genellikle birbirini götürüyorsa, meta-analizin kırılganlık indeksi düşük kalır. Daha fazla çalışma eklemek, “sinyali” artırmaya değil, “gürültü”yü artırmaya yarar; ki sonuçta nispeten düşük kırılganlık indeksi olan devasa bir meta-analiz ortaya çıkar (Düşük sinyal/gürültü oranı).

Çalışma Düzeyinde Kırılganlık: Metakırılganlık İndeksi

Kırılganlığı ölçmenin bir diğer yolu da, meta-analizi oluşturan çalışmalar düzeyinde değerlendirme yapmaktır. Bir meta-analiz, temelde bir tedavi ile ilgili çok sayıda çalışmanın bir araya getirilmiş kanıtlarının ölçümü yöntemidir:

blank

Güçlü pozitif meta-analizler, çok sayıda güçlü pozitif çalışma içermelidirler. Böyle olursa, herhangi bir çalışmayı çıkardığımız zaman, meta-analize ait genel sonuçlar etkilenmez:

blank

Alternatif olarak, aşağıda görüldüğü gibi çok zayıf pozitif bir meta-analizi ele alalım. 5 pozitif çalışmanın sonuçları, müdahaleyi sadece zayıf olarak destekliyor. Bir araya geldiklerinde, bu 5 zayıf çalışma, dengeyi müdahale lehine bozmayı başarabiliyor. Ancak, bu çalışmalardan herhangi birini kaldırmamız durumunda, meta-analiz artık pozitif kalamıyor! Bir meta-analizin geçerliliği, her bir çalışmanın geçerliliğine bağlıdır. Bu da meta-analizleri ileri derecede kırılgan yapar.

blank

Bu durum, bizi metakırılganlık indeksi (metafragility index) olarak tanımlayacağım mefhuma getiriyor:

  • Bir meta-analizin p<0,05 kalması için içerdiği bir çalışmaya muhtaç olup olmadığının anlaşılabilmesi için, her bir çalışmanın ayrı ayrı yokluğunda, meta-analizin sonuçlarının yeniden hesaplanması gerekiyor.
  • Metakırılganlık indeksi, tek başına meta-analizden çıkarıldığında, meta-analizin negatif (p>0,05) olarak sonuçlanabildiği çalışma sayısına eşittir. Mesela, yukarıda gösterilen güçlü meta-analizde, metakırılganlık indeksi sıfırdır (Herhangi bir çalışmanın çıkarılması ile meta-analizin sonuçları değişmez). Alternatif olarak, yukarıda gösterilen kırılgan meta-analizde, metakırılganlık indeksi beştir (Beş çalışmadan herhangi biri çıkarıldığında, p değeri >0,05 olur).

blank

 

Sıfırdan büyük bir metakırılganlık indeksi, meta-analizin gizli zayıflığını ortaya koyar. Bir meta-analizi okuduğumuzda, genellikle “bütün, kendini oluşturan parçaların toplamından daha büyüktür” diye düşünürüz. Çünkü meta-analizler, bütün çalışmaların verilerinin bir potada eritilmesi anlamını taşırlar. Bu yüzden, meta-analizin, kendini oluşturan herhangi bir çalışmadan daha güçlü olmasını bekleriz. Eğer metakırılganlık indeksi o’dan büyükse, bu meta-analizin, kendini oluşturan herhangi bir çalışmadan daha güçlü olduğu varsayımını çürütür.

Reklam

“Bir veya iki çalışmanın çıkarılması bir meta-analizin sonuçları üzerinde kayda değer bir etkiye sahip ise, bu sonuçlar bir miktar ihtiyatla belirtilmelidir.” – Viechtbauer W & Cheung MWL5

Eğer metakırılganlık indeksi 0’dan büyükse, bir sonraki soru, meta-analizin hangi çalışmalara bağımlı olduğudur. Bir zincir, ancak en zayıf halkası kadar güçlüdür. Aynı şekilde, bir meta-analiz de ancak bağımlı olduğu en zayıf çalışma kadar güçlüdür. Mesela, eğer bir meta-analiz; büyük, güçlü ve çok merkezli bir Randomize Kontrollü Çalışma’ya bağımlı ise, bu kabul edilebilir olarak görülebilir. Alternatif olarak, eğer meta-analiz küçük ve zayıf bir çalışmaya bağımlı ise, bu ciddi olarak problemli kabul edilmelidir.

IOTA’nın metakırılganlık indeksi 2’dir. NCT00414726 ve Giradis 20166 çalışmalarına bağımlıdır. Mesela, Giradis çalışmasını çıkarırsak, bütün meta-analizin sonucu negatif olur (p=0.14):

blank

Bu veriyi görselleştirmenin güzel bir yolu, metakırılganlık diyagramı oluşturmaktır (aşağıda). Mavi çizgiler, klasik Orman Diyagramı’nı (Forrest plot) temsil etmektedir (Her biri, o bir çalışmanın verilerine dayanan rölatif riskin %95 güven aralığını temsil eder). Her çalışmanın altında yer alan siyah çizgiler ise, meta-analizde yer alan bu çalışma haricindeki çalışmalar kullanılarak gerçekleştirilen meta-analizin sonuçlarını temsil etmektedir:

blank

Metakırılganlık diyagramı, her bir çalışmanın meta-analizin tamamı üzerindeki etkisinin daha rahat anlaşılmasına yardımcı oluyor. Herhangi bir çalışmanın çıkarılması, meta-analizin aksi yöne kaymasına sebep oluyor. Mesela, Stub, 2012 kısmen sola yatkın bir çalışma (resim aşağıda). Bu çalışmanın çıkarılması, meta-analizin sağa kaymasına yol açıyor. Bu çalışma çıkarıldığında ortaya çıkan sağa kayma, bütün meta-analiz üzerindeki etkisini gösteriyor.7

Reklam

 

blank

Diyagram aynı zamanda metakırılganlık indeksinin grafiksel bir görünümünü de veriyor. Eğer meta-analizin pozitif olması için bir çalışma şartsa, meta-analiz o çalışma olmadan tekrarlandığında onu geçen bir %95 güven aralığına sahip olacaktır (siyah çizgi). Metakırılganlık indeksi 2 olan IOTA için, bu iki defa gerçekleşiyor:

blank

Bir çalışmanın meta-analiz üzerinde yüksek oranda etkisi olmasının iki nedeni olabilir: Çok büyük bir çalışma olması (güçlü sonuçlar ve büyük bir ağırlık) veya dışadüşen (outlier) olması. IOTA, NCT000414726 çalışmasına bağımlı ki, bu çalışma küçük, dışadüşen bir çalışma. NCT000414726 güçlü bir çalışma değil, ama dışadüşen bir çalışma olduğu için, meta-analiz sonuçları üzerinde güçlü bir çekim etkisine yol açıyor. Bu çalışma henüz yayınlanmadı bile, bu da sistemik taraflılık veya diğer kusurlar açısından soru işaretlerine neden oluyor. Esasen, yayınlanan IOTA dökümanı bile bu çalışmayı yüksek taraflılık riski ile yargılıyor (alıntılanan not aşağıda). IOTA meta-analizi; bu küçük, dışadüşen, yayınlanmamış ve potansiyel olarak taraflı çalışmaya dayandığı için oldukça kırılgan.

blank

Peki Ya Uzun Dönem Mortalite?

Bu yazı hastane içi mortaliteye odaklanıyor, çünkü yayının yazarları bu analize odaklanıyorlar. Yine çalışmanın en etkileyici sonucu da bu. Zaman geçtikçe, mortalite yararı hızla yok oluyor:

blank

Zaman geçtikçe, etki boyutu daralıyor ve kırılganlık hızla artıyor. En uzun takip süresinde, mortalite üzerindeki farklılığın hasta düzeyinde kırılganlık indeksi sadece 1 hastaya düşüyor:

blank

Metakırılganlık indeksi 10, bu da temelde pozitif yöndeki çalışma sayısı ile aynı. Yine, meta-analizden neredeyse herhangi bir pozitif verinin çıkarılması, istatistiksel önemin yitirilmesine yol açıyor. Bu açıkça kırılganlığı açığa çıkarıyor: Hasta düzeyinde kırılganlık indeksinin 1 olması ile tutarlı. Bütüne bakıldığında, bu sonuç “istatistiksel olarak muhtemel” düzeyinde kırılgan (daha zayıf olsaydı, açıkça negatif sonuçlanmış olacaktı).

Reklam

Bir Adım Geri: p<0,05 Aslında Düşük Bir Bariyer

Yukarıdaki analiz, bir meta-analizin <0,05 p değerine ulaşıp ulaşamamasına odaklanıyordu. Ancak, bunun güçlü bir p değeri limit noktası olmadığını unutmamalıyız. ~0,02-0,05’lik p değeri ~3 olabilirlik oranının kabaca eşdeğeri sayılabilir ve zayıf seviyede kanıt anlamı taşır. Bu durum pek çok istatistikçinin p değeri limit noktasının <0,005’e çekilmesini önermesine yol açmıştır. p<0,05 halen “istatistiksel olarak anlamlı” sayılmak için limit noktası olarak genel kabul görse de, bu kriterin sağlanıyor oluşu, çalışma sonuçlarının geçerli olduğunun garantisi değildir.

Büyük Resim: Meta-Analizleri Dev Aynasında Görüyoruz

blank

Kanıta dayalı tıp, geleneksel olarak meta-analizin en yüksek kanıt formu olduğunu, kanıt piramidinin en üzerinde yer aldığını öğretir. Ancak, birbirleri ile çelişen meta-analizlere rastlamak çok kolaydır (Mesela bu ikili8,9 PE konusunda farklı sonuçlar verirken, yakın tarihli bu meta-analizler10,11 sepsiste steroid konusunda farklı sonuçlar veriyorlar). Çatışan iki ikili de neredeyse aynı zamanda yayınlandılar, ancak tam tersi sonuçlara vardılar! Bu örnekler meta-analizlerin yinelenebilirliklerini çürütüyor: Eğer meta-analizler güvenilir araçlar olsalar, farklı gruplar daima aynı sonuçları elde ederler. Yine elbette, yinelenebilir olmayan bir şey, bilimsel değildir.

Uygunsuz gerçek şu ki, meta-analizler pek de farkında olunmayan bir takım problemlerden muzdaripler (mesela kırılganlık, heterojenite, eski çalışmalar, yetersiz güç analizi). Meta-analizler istatistiksel olarak o kadar kompleksler ki, analizin yüzeyini kırıp içine nüfuz edebilecek araçlardan yoksun olduğumuz için, teslim olmaktan başka çare bırakmıyorlar.

Meta-analizleri en yüksek kanıt düzeyi olarak düşünmeyi bırakma zamanı geldi. En yüksek kanıt düzeyi basitçe Randomize Kontrollü Çalışma’dır. RKÇ’leri detaylıca okumalı ve RKÇ’leri değerlendirerek bunları dikkatlice bir araya getirmek suretiyle bir üst sonuca varmalıyız (Her çalışma için zayıflıklar, güçlülükler, metodolojiler, sonuçlar ve hasta popülasyonları). Çalışmaları kendi kendimize bir araya getirmek, bu işi bir meta-analize bırakmaktan daha zor olsa da, gerçeğe daha fazla yaklaşmamıza yol açacaktır.

Özet

  • Meta-analizler, genelde kırılganlıklarını test etme denemesinde bulunulmadan, çok güçlü olarak kabul görmektedirler.
  • Bu yazı, bir meta-analizin kırılganlığının değerlendirilmesi için iki tekniği tarif etmektedir. Bu teknikler için bir meta-analiz yazılımı kullanılması gereklidir ve Cochrane Topluluğu aracılığıyla ücretsiz olarak edinilebilir.
  • Kırılganlık İndeksi, p değeri <0,05 olana kadar her bir çalışmanın kaç hasta sonucu değişikliğine ihtiyaç duyduğunun belirlenmesi ile hesaplanabilir. Bu numara çalışmalar arasında değişkendir, ancak meta-analizlerin kırılganlığı konusunda genel bir fikir verebilir.
  • Metakırılganlık indeksi, tek başına meta-analizden çıkarıldığında, meta-analizin negatif (p>0,05) olarak sonuçlanabildiği çalışma sayısına eşittir. İdeal olarak, güçlü bir meta-analizin metakırılganlık indeksi 0 olmalıdır (Herhangi bir çalışma analizden çıkarılabilir ve kalan çalışmalar yine de pozitif sonuç verirler). Alternatif olarak, eğer metakırılganlık indeksi o’ın üzerinde ise, bütün meta-analizin bir veya daha fazla çalışmaya bağımlı olduğu anlaşılabilir. Bu nedenle sonuçları dikkatle analiz edilmelidir.
  • Bu testler, yakın zamanda Lancet’ta yayınlanan ve geniş kabul gören IOTA meta-analizine uygulanmıştır. IOTA’nın şaşırtıcı düzeyde kırılganlığı vardır. En güçlü sonuç çıktısı bile (hastane içi mortalite), <10 hastalık kırılganlık indeksine ve 2’lik metakırılganlık indeksine sahiptir. IOTA’nın bağımlı olduğu çalışmalardan biri, küçük, dışadüşen ve yayınlanmamış bir çalışmadır.
  • Meta-analizlerin en güvenilir kanıt düzeyi oldukları dogması sorgulanmalıdır.

blank

Bağlantılar

Kaynaklar

  1. Chu D, Kim L, Young P, et al. Mortality and morbidity in acutely ill adults treated with liberal versus conservative oxygen therapy (IOTA): a systematic review and meta-analysis. Lancet. 2018;391(10131):1693-1705.
  2. McEvoy J. Excess oxygen in acute illness: adding fuel to the fire. Lancet. 2018;391(10131):1640-1642.
  3. Ridgeon E, Young P, Bellomo R, Mucchetti M, Lembo R, Landoni G. The Fragility Index in Multicenter Randomized Controlled Critical Care Trials. Crit Care Med. 2016;44(7):1278-1284.
  4. Fragility index & methodology. What is the fragility index of the NINDS trial? https://emcrit.org/pulmcrit/fragility-index-ninds/.
  5. Viechtbauer W, Cheung M. Outlier and influence diagnostics for meta-analysis. Res Synth Methods. 2010;1(2):112-125.
  6. Girardis M, Busani S, Damiani E, et al. Effect of Conservative vs Conventional Oxygen Therapy on Mortality Among Patients in an Intensive Care Unit: The Oxygen-ICU Randomized Clinical Trial. JAMA. 2016;316(15):1583-1589.
  7. Bir çalışmanın bütün meta-analiz üzerindeki etkisinin miktarının bu çalışmanın ağırlığı ile yansıtıldığını varsayma eğiliminde olsak da, bu yanlıştır. Bir çalışmanın meta-analiz üzerindeki etkisi, hem çalışmanın ağırlığını, hem de sonuçlarının aykırılığını yansıtır. Mesela, düşük ağırlıklı bir dışadüşen çalışma; yine de bütün meta-analiz üzerinde anlamlı bir sonuca sahip olabilir.
  8. Chatterjee S, Chakraborty A, Weinberg I, et al. Thrombolysis for pulmonary embolism and risk of all-cause mortality, major bleeding, and intracranial hemorrhage: a meta-analysis. JAMA. 2014;311(23):2414-2421.
  9. Nakamura S, Takano H, Kubota Y, Asai K, Shimizu W. Impact of the efficacy of thrombolytic therapy on the mortality of patients with acute submassive pulmonary embolism: a meta-analysis. J Thromb Haemost. 2014;12(7):1086-1095.
  10. Rochwerg B, Oczkowski S, Siemieniuk R, et al. Corticosteroids in Sepsis: An Updated Systematic Review and Meta-Analysis. Crit Care Med. 2018;46(9):1411-1420.
  11. Rygård S, Butler E, Granholm A, et al. Low-dose corticosteroids for adult patients with septic shock: a systematic review with meta-analysis and trial sequential analysis. Intensive Care Med. 2018;44(7):1003-1016.

 

Kohort Çalışmalar: Maruziyetten Hastalığa

blank

Kohort’u, bir maruziyetten sonlanıma doğru uygun adım beraberce giden insanlar topluluğu olarak düşünebiliriz. Bu tip çalışmaların en önemli parametresi Zaman’dır. Kohort çalışmaların amacı bir ya da daha fazla çalışma kohortunda hastalık ya da sonlanım insidansını (örn., ölüm) veya ölçümleri (örn., kan basıncı) karşılaştırmaktır. Bu noktada kohortun yani çalışma grubunun çok net bir biçimde tanımlanmış olması ana unsurdur. Eğer bir çalışmada iki kohort varsa, genellikle biri maruziyete uğrayan/uğratılan (bir sebep ya da durumu tecrübe eden) kohort, diğeri de maruziyete uğramayan ya da kontrol/referans kohortudur. Birden fazla kohort olan çalışmalarda genellikle maruziyetin farklı düzeyleri temsil edilmeye çalışılır.

Bazı araştırma kohortlarını örnek olarak verelim:

  • Framingham çalışması: ABD’de Massachusetts eyaleti Framingham şehrinde 1948 yılında yaşamakta olan erişkinler.
  • The Diabetes Study of Northern California (DISTANCE): 2005-2006 yılları arasında Kuzey Kaliforniya Kaiser Permanente bakımevlerinde tedavi alan diyabetik erişkinler.
blank
Kohort Dizaynı

Kohort çalışmaların mantıksal bir sıralaması vardır. Önce maruziyet tanımlanarak buna sahip olan ve olmayan hasta ya da vaka kohortları seçilir. Ardından zaman içinde bu kohortlar takip edilerek, ne kadarında sonlanımın gerçekleştiği karşılaştırılır. Eğer kohortları bugün seçip ileri zamana doğru takip ediyorsak prospektif kohort, eğer geçmişte bir noktadan seçip bugüne kadar takip edilenlerin bugün gözlemlediğimiz sonlanımlarını karşılaştırıyorsak retrospektif kohort çalışmalardan bahsetmiş oluruz. Seçilebilecek kohort sayısında ya da bakılabilecek sonlanım sayısında bir sınırlama yoktur.

Kohort çalışmaların ilk örneklerinden biri, Londra kentinde yaşayan iki insan grubunda gözlenmiş (kendiliğinden oluşan bu gruplara doğal kohort adı verilir) ve (konuyla tamamen alakasız olmasına rağmen ünlenen ismiyle) John Snow tarafından 1855 yılında yayınlanmıştır . Londra’da gerçekleşen kolera salgını sonrasında birbirinden farklı mahallelere su ulaştıran iki şirketin, bölgelerindeki kolera vakalarının sayısını ve gözlemlerini rivayetlerin aksine artık aramızda olmayan John Snow şu şekilde belirterek ilk kohort çalışmalardan birini gerçekleştirmiştir:

“… 1 Ocak – 31 Aralık 1853 tarihleri arasında Southwark ve Vauxhall Şirketi 40.046, Lambeth Şirketi 26.107 eve su tedarik etmiştir. Kolera salgınının ilk haftasında, ilk şirketin hizmet verdiği bölgede 286, ikinci şirketin bölgesinde 14 evde ölümcül kolera vakası görülmüş olup, 10.000 ev başına ölümlü kolera vakası sayısı sırasıyla Southwark ve Vauxhall için 71, Lambeth için 5’dir. Southwark ve Vauxhall’ın tedarik ettiği suyu tüketen kişilerde ölümcül kolera 14 kat daha fazla görülmektedir…”

Kohort çalışmalarla randomize kontrollü çalışmalar (RKÇ) birbirine dizayn olarak çok benzer. İkisinde de maruziyet olan ve olmayan gruplar sonlanımlar açısından karşılaştırılır. Ancak, zararlı olduğu bilinen bir maruziyeti (örn., sigara içimi) randomize edilen iki kohorta uygulayıp, sonlanım gelişip gelişmediğini (örn., akciğer kanseri) incelemek etik olmaz. Bu yüzden randomize kontrollü çalışmalarda maruziyet hemen hemen her zaman bir tedavi ya da önleyici girişimdir. Kohort çalışmalarda ise zarar verici bir maruziyetin de etkisini incelemek mümkündür.

Reklam
blank
Kohort çalışma dizaynı ile RKÇ’lerin karşılaştırılması

RKÇ ile kohort çalışmalar arasındaki bir diğer önemli fark randomizasyon varlığıdır. RKÇ’lerden bahsederken randomizasyonun faydalarına daha ayrıntılı şekilde değineceğiz. Bir örnekle açıklamak gerekirse, belirli bir fabrikada çalışan işçiler kohortunda belirli bir hastalığın gelişme insidansı inceleniyor ve aynı şehirde ama farklı bölgedeki başka bir işkolunda üretim yapan bir fabrikada çalışan işçiler kohortuyla karşılaştırılıyorsa (kohort çalışma), ilk fabrikadaki işçilerde daha fazla görülecek bir hastalık insidansının fabrikadaki üretim kolundan mı, fabrikanın bulunduğu bölgeden mi, yoksa işçilerin yaşadığı mahalleden mi öncelikli olarak kaynaklandığını bilmemiz mümkün olamaz.

Bir kohort çalışma yapılma ihtiyacı, genellikle bir maruziyet ile hastalık arasındaki ilişkiden şüphe duyulmasını sağlayan daha zayıf çalışmalardan elde edilen verilerin öncülüğüyle planlanır. Klinik gözlem, olgu serileri ya da vaka-kontrol çalışmalarında gözlenen bir ilişki, kohort çalışmayla teyit edilmeye çalışılır.  Kayıtların yeterli olması durumunda retrospektif kohort maliyet açısından öncelikli tercih edilmesi gereken yaklaşım olabilir. Özellikle uzun takip gerektiren maliyetli prospektif kohort çalışmaların yapılmasını haklı çıkaracak düzeyde önemli risk faktörü ve sonlanımların sayısı modern tıpta giderek azalmaktadır. Etik olarak RKÇ yapılması mümkün olmayan durumlarda takip süresi de kısa ise (in-utero rubella enfeksiyonu, konjenital malformasyon gibi) prospektif kohort en uygun dizayn haline gelmektedir.

Avantajları

Kesitsel çalışmalarda sadece prevalanstan bahsedebilirken kohort çalışmalarda artık insidanstan bahsedebiliriz. Kohortları belli bir zaman diliminde yeni gelişecek vakaları incelemek üzere takip ettiğimizden, bu sefer zaman faktörü de işin içine dahil edilmiş durumdadır. Böylece belli bir zaman diliminde gelişen yeni vaka sayısı da hesabın içine girmektedir. Bu şekilde yine dört gözlü bir tablo ile prevalans hesabı yapar gibi insidansı hesaplayabiliriz.

Kohort çalışmalar ileride değineceğimiz vaka-kontrol çalışmalarına göre de birçok avantaja sahiptir. Kohort çalışmalar yardımıyla atfedilebilir risk, rölatif risk, gerçek insidans, güven aralıkları, yaşam tabloları, sağkalım eğrileri ve hazard oranları hesaplanabilir. Tıpkı kesitsel çalışmalarda olduğu gibi vaka-kontrol çalışmalarıyla da insidans hesaplanamaz. Hesaplanabilen değer olan odds oranı ise, ancak nadir hastalıklarda rölatif riske yakın değerler verir.

blank
Kohort çalışmalarda dört gözlü tablo ve insidans hesabı

Vakalar ileri dönük olarak izlendiğinden, maruziyete sahip kişilerde gerçekleşen birçok sonlanımın aynı anda tespit edilmesi mümkün olur. Bu durum, kohort çalışmaların en önemli avantajlarından biri olsa da, birçok sonlanımı karşılaştırıp sadece anlamlı olanların bildirilmesi yoluyla literatürde sıkça suiistimal edilmektedir. Bunu engellemek için çalışmanın başında bakılacak olan sonlanımlar net bir şekilde belirtilmeli ve anlamlılıklarından bağımsız şekilde raporlanmalıdır.

Reklam

Kohort çalışmalar nadir maruziyetlerin sonlanımlarının değerlendirilmesinde de avantajlıdır. Örneğin, bir fabrikada radyoaktif madde ya da zehirli bir kimyasala maruz kalan bireylerin takibi toplumda çok nadir gerçekleşecek bir hastalık ve sonlanımları konusunda eşsiz veriler sağlar. Ayrıca bu tip bir çalışmanın deneysel olarak yürütülme ihtimali etik problemler nedeniyle yoktur.

Kohort çalışmalar sağkalan yanlılığı (survivors bias) yönünden de, hem kesitsel hem de vaka-kontrol çalışmalarına göre daha avantajlıdır. Hastanede yapılan ve trafik kazası geçirenlerde akut myokard infarktüsü prevalansını inceleyen bir vaka-kontrol çalışması, trafik kazasında ölüp hastaneye gelemeyen hastalar nedeniyle sağkalan yanlılığı problemiyle karşı karşıyadır. Özellikle hızlı ölüm gerçekleştiren hastalıklar, nadir hastalıklar ve maruziyetlerin değerlendirmesinde kesitsel ve vaka-kontrol çalışmalarına üstündür.

Dezavantajları

Kohort çalışmaların bazı handikapları da mevcuttur. Seçim yanlılığı (selection bias) en birincil problemdir. Maruziyete uğrayan ya da durumu taşıyan kohortun kontrol grubuyla maruziyet haricinde tamamen benzer olması gerekir, ama çoğu zaman bunu sağlamak imkansızdır. Koşunun kardiyovasküler sağlık üzerindeki etkisini inceleyen bir çalışmada, koşu yapan insanlar kohortunun koşu yapmayan insanlar kohortuna göre kardiyovasküler sağlığı etkileyen birçok farklı önlemi de alıyor olması son derece olasıdır. Ne kadar uğraşılırsa uğraşılsın, kendi bedensel sağlığı konusunda diğer gruptan daha duyarlı olan bu kohortun tüm pozitif ve negatif riskler açısından kontrol kohortuna benzeştirilmesi mümkün değildir.

Sigara içme, diyabet varlığı, günlük koşu ve hareket miktarının saatler yardımıyla ölçümü gibi daha birçok önlemin alındığı bu kohort çalışmada koşu yapmanın sağlık parametreleri açısından faydasının değerlendirilmesi tam bir fiyaskoyla sonuçlanmış. Düzenli koşu yapanlarla karşılaştırmak için koşu yapmayan dört farklı kohort alınmasına rağmen, sağlık parametreleri için aradaki fark hep multifaktöryel olarak başka şeylerle de yakın derecede korelasyon göstermiş. Kohortlardan birinde gece kalkıp mutfakta atıştırma yapma davranışı belirgin derecede farklı ve sağlık parametreleriyle daha ilişkili çıkarken; bir diğerinde enginar, kuşkonmaz, brokoli gibi besin tüketimleri, bir diğerinde bitkisel vitamin desteklerinin tüketim miktarları, sonuncusunda ise “outdoor” tabir edilen dağ-bayırda geçirilen ve güneşe maruz kalınan zaman koşu ile denk ya da daha fazla etkili faktörler olarak çalışmayı hep karıştırmış. Ne kadar denk bir kontrol kohortu elde etmeye çalışırsanız çalışın, daima hesaba katmadığınız bir şeyler çıkacaktır. Benzer sıkıntılar vaka-kontrol çalışmalarında da mevcuttur. Bunu aşmanın tek yolu randomizasyondur. 

Reklam

Kohort araştırmalarındaki bir diğer problem ise sebep-sonuç ilişkisindedir. Maruziyet baştan belirlendiğinden, sonlanımla aralarında sebep sonuç ilişkisi olduğu kabulü yapılmıştır, ama bu her zaman doğru olmayabilir.

Kohort çalışmalar, sıklığı çok düşük hastalıklarla ilişkili sonlanımları göstermede de güçsüzdür. Bu tip durumlarda çok uzun süre takip gerekebilir ve çalışma çok maliyetli hale gelir. Vakaların takibe gelmemesi (lost to follow-up) de önemli bir sorundur. Takipten düşen hastaların sayısı ne kadar artarsa verinin güvenilirliği o kadar düşer. Takipten düşen hastaların oluşan bir yan etki ya da tanımlanamayan maruziyetle ilişkili bir sebep yüzünden takibe gelmiyor olma ihtimalleri son derece olasıdır. Özellikle maruziyete sahip olan ve olmayan kohortlarda, takipten düşen hasta oranları arasında fark varsa bu fark maruziyete atfedilir. Bu nedenle takip süresi, özellikle de maruziyetten uzun süre sonra ve az sayıda oluşan sonlanımların incelendiği durumlarda oldukça uzayabilir (örn., sigara içen-içmeyen, akciğer kanseri).

20 yıl takip süresi konulan ve sigara içenlerde akciğer kanseri insidansını inceleyen ilk kohort çalışmaların orijinal araştırmacılarından ne yazık ki hiçbirinin ömrü çalışmanın tamamlandığını görmeye vefa etmemiştir. Çalışmanın takip süresinin bitirilmesinin kutlandığı parti sırasında hayatta olan tek orijinal araştırmacı da ileri demans nedeniyle partiyi kendi 22. doğumgünü kutlaması sanmıştır. Olması gerektiği kadar uzun bir kohort çalışma birkaç nesil hasta gerektirdiği gibi birkaç nesil araştırmacı da gerektirir.

Uzun süre takip gerektirmesi nedeniyle pratikliği azalan kohort çalışmalarında aynı dizayn ama farklı bir yaklaşım da kullanılabilir: Retrospektif kohort, tarihi kohort, ya da non-konkürran prospektif çalışma adı verilen bu yaklaşımda, örneğin 2016 yılında üniversiteye başlayan insanları alıp sigara içme ve içmeme durum ve miktarlarına göre kohortlara ayırıp takip etmek yerine, 1995 yılına ait lise mezuniyet kayıtlarını alıp o insanlara şimdi ulaşarak sigaraya başladılar mı, ne zaman başladılar, ne kadar içtiler gibi verileri elektronik hastane ya da sosyal güvenlik veritabanındaki kayıtlarından inceleyip bugün akciğer kanseri açısından tarama yapmayı tercih edebiliriz.

Prospektif kohort çalışmalarında hatırlama yanlılığı (recall bias) riski olmasa da retrospektif kohort ve vaka-kontrol çalışmalarında bu risk vardır. Aynı örnek üzerinden gidersek, retrospektif kohort çalışmada sigaraya ne zaman başladığı, ne kadar içtiği gibi verileri kayıtlardan bulamadığımızda sormak durumunda kalabilir ve kişilerin beyanlarına göre kohortlarımızı şekillendirmek zorunda kalabiliriz. Vaka-kontrol çalışmasında da aynı şekilde akciğer kanseri olan ve olmayan hastaların, geçmişi hatırlama şekilleri değişkenlik gösterebilir. Prospektif kohort ve RKÇ’ler bu yanlılık açısından en güvenli tekniklerdir.

Kohort çalışmalarda dikkat edilmesi gerekenler

Sonlanım riski kohort ve kontrol gruplarında benzer olmalıdır. Eğer kontrol grubunun sonlanıma ulaşma riski daha az ise yanlılık mevcuttur. Maruziyet net ve açık bir şekilde tanımlanmalı ve ağırlıklandırılmalıdır. Hastalar sigara içen ve içmeyen yerine, günde kaç sigara içildiği net bir şekilde belirlenerek gruplandırılmalıdır. Aynı şekilde sonlanımlar da net, ayrıntılı ve ölçülebilir bir şekilde tanımlanmalıdır. Maruz kalan ve kalmayan kohortlarda sonlanımlara ait verilerin güvenilirliğinde fark olmamalıdır. Objektif sonlanımların varlığını (eritem var/yok, uterus hassas/değil vs) değerlendirecek hekimler hastaların maruziyetlerine karşı kör olmalıdır. Aynı şekilde kayıtlar üzerinden yapılan değerlendirmelerde, kayıtlara bakarak vakaların sonlanıma ulaşıp ulaşmadığına karar verecek olan araştırmacılar maruziyet durumuna kör olmak zorundadır.

Reklam

Kontrol grubu maruziyet dışındaki tüm riskler açısından çalışma kohortuyla aynı olmalıdır. Bu grubu seçerken bazen iç kohort (internal) adı verilen aynı poliklinik, servis ya da merkeze başvuran hastalar seçilebilirken, bazen de dış (external) kaynaklardan yararlanılabilir. İç kohort karşılaştırmaları en tercih edilen yöntemdir. Bazen de kohort içerisinde hastalar kendileri zaten maruziyetlerine göre gruplanmış durumdadır. Bir nevi gözlemsel çalışma hüviyetine bürünen bu kohortlara örnek olarak, Kaposi sarkomunun kutanöz ve oral formuyla başvuran HIV hastalarının sağkalımlarının değerlendirilmesini gösterebiliriz. Eğer tatmin edici bir iç kontrol kohortu yoksa, araştırmacılar dış kontrol kohortları kullanırlar. Buna bazen çift-kohort çalışması da denir. Örneğin, mesleki maruziyetin sonuçlarını inceleyen bir kohort çalışma için aynı fabrikada çalışan maruziyete uğramamış vaka bulmak mümkün olmayabilir. Bu amaçla bölgedeki başka bir fabrika çalışanlar kullanılabilir. Bu dış kohort seçilirken aynı bölgedeki bu iki fabrika çalışanların aynı temel risklere sahip oldukları varsayımı yapılmaktadır. Ancak bu her zaman doğru olmayabilir. Daha riskli olan işte çalışma tercihi, mesleki maruziyet için riski daha yüksek kılan başka faktörlerden etkilenmiş olabilir.

Büyük tonajlı konteyner gemisi üreten ve sürekli kaynak yapılan A tersanesi ile dev lüks yatlar üreten ve metal malzeme yerine ahşap bazlı malzeme kullanan B tersanesinde çalışanlar, tersanede dumanı adı verilen toksik kaynak gazlarına bağlı zehirlenmeler ve restriktif akciğer hastalıkları gelişimi yönünden karşılaştırılıyor olsun. Bu ilk grubun kontrolü gerçekten ikinci tersane çalışanları mıdır? İşin gerektirdiği sanatsal inceliklerin fazlalığı nedeniyle lüks yat üretiminde çalışan personelin daha eğitimli, daha prezentabl, tersanenin de satış profiline uygun şekilde kalite standartlarına daha uyumlu olması çok daha olasıdır. Bu durumda yat tersanesinde çalışan işçilerin işyeri güvenliği kurallarına daha fazla uyuyor olması (makse takımı vb), daha iyi beslenmesi ve belki de daha az sigara kullanıyor olması da mümkündür.

Daha da az tercih edilen yöntem ise genel toplum verilerinin kontrol verisi olarak kullanılmasıdır. Örneğin, belirli bir fabrikada çalışan işçilerin akciğer kanserine bağlı ölüm oranını toplum verisiyle karşılaştırmak akılcı olmaz. Toplumda çalışmayan kişilerin de verisini içeren toplum verileri, çalışmayan kişilerin çalışacak kadar sağlıklı olmaması yüzünden yanlılık içerecektir. Aynı şekilde çalışan kişilerin mali gücünün daha yüksek olması, akciğer kanserine sebep olan ürünlere ya da tam tersine sağlık olanaklarına daha rahat erişmelerine yol açarak yanlılık oluşturabilir.

Kohort çalışmaların yazılması

Araştırmacıların ilk yapması gereken şey maruziyete sahip olan ve olmayan kohortların maruziyet dışında birbirleriyle benzer olduklarına editörü ikna etmektir. Bu sebeple kohort çalışmalarda ilk tablo daima temel demografik özellikler ve sonlanımı etkileyecek faktörler açısından iki grubun karşılaştırılması ve farklılıkların istatistiksel olarak anlamlılıklarının raporlanmasıdır (p değerleri, farkın büyüklükleri ve güven aralıkları). Dikotom sonuçlar (sağ, eksitus gibi) yönünden her iki kohortun sadece oranları değil, ham verileri de verilerek okuyucunun sonuçları konfirme etmesi sağlanmalıdır. Bu amaçla dört gözlü tablolar kullanılır. Kümülatif insidans, insidans hızı, rölatif risk ve güven aralıkları verilmelidir. Özellikle aralıklarla belirtilen sonlanımlar varsa (hafif, orta, ağır), bu veriler net sayısal tanımlamalarla ifade edilmeli, her bir aralık için rölatif risk ve güven aralıkları verilmelidir. P değerlerinin tek başına verilmesi yeterli değildir.


Kaynaklar
  1. Rothman K. Modern Epidemiology. Lippincott Williams & Wilkins  2016.
  2. Kelsey JL. Methods in Observational Epidemiology. Oxford University Press, USA  1996.
  3. Rothman N, Cantor KP, Blair A, Bush D, Brock JW, Helzlsouer K, et al. A nested case-control study of non-Hodgkin lymphoma and serum organochlorine residues. Lancet 1997;350:240–4.

Vaka – Kontrol Çalışması: geriye doğru araştırma

blank

 

Vaka-kontrol çalışması genellikle (ama her zaman değil) geriye doğru çalışır. Önce bir sonlanım belirlenir (mesela bir hastalık) ve geriye dönük olarak bu hastalığa yol açmış olabilecek maruziyetler sorgulanır ya da araştırılır. Bu gruba vaka grubu adı verilir. Bu vaka grubunun geldiği toplumdan benzer özellikte bir kontrol grubu alınarak bu grubun da geriye dönük maruziyetleri sorgulanır ve iki grup arasında maruziyet prevalansları ya da miktarları karşılaştırılır. Vaka-kontrol çalışmalarının en güzel örneği gezi gemilerinde görülen yiyecek ile ilişkili zehirlenme salgınlarıdır. Gezi gemilerinde risk altındaki tüm evren bilinmektedir. Kusma ve diyaresi olanlarla olmayanların yedikleri yemeklerin sorgulanması ve karşılaştırılması ile şüpheli etmen yiyecek belirlenir.

Vaka-kontrol Çalışmasının Avantaj ve Dezavantajları

Vaka-kontrol çalışmaları en sık yapılan ve bildirilen analitik çalışmalardır. Bunun sebebi, ucuz ve hızlı bir şekilde yapılabilmeleridir. Kanıta dayalı tıp ve epidemiyolojinin babalarından David Sackett, Dünya’da güvenilir bir vaka-kontrol çalışması yapacağına inandığı sadece 6 kişi olduğunu belirtmiştir. Modern Epidemiyoloji kitabının yazarı Rothman, vaka-kontrol çalışmalarının ucuz olması ve kısa sürede yapılabilmesinin bu çalışma tipinin temel şartlarının neler olduğundan bile haberdar olmayan çiçeği burnunda araştırmacılar tarafından yürütülmesi ve çoğunlukla hatalı sonuçlar bildirilmesine yol açtığından bahseder. Özellikle genç araştırmacılar bu şekilde kısa zamanda birçok araştırma yapma imkanı bulur. Ancak her ucuz ve hızlı seçenek gibi pahalı ve yavaş seçeneklere göre daha fazla yanlılık ve yanılma ihtimallerine sahiptir.

Bu negatif algısına rağmen, yine de uygun şekilde yapılan vaka-kontrol çalışmalarının modern tıbbın gelişimine katkıları çok büyüktür. Örneğin, henüz HIV virüsü izole edilmeden önce vaka-kontrol çalışmaları sayesinde AIDS hastalığının risk grupları ve risk faktörleri belirlenmiş, bu sayede kan bankalarına risk içeren bireylerin kan vermesi engellenerek hastalığın yayılım hızı ciddi miktarda azaltılabilmiştir.

Vaka-kontrol çalışmaları özellikle nadir görülen sonlanımları inceleyen çalışmalarda kohort çalışmalardan üstündür. Belirmesi uzun zaman alan yan etkiler ya da hastalıkların olası maruziyetlerini ve bu maruziyetlerin prevalanslarını kohort çalışmalardan çok daha ucuza ve kısa zamanda belirleyebilir.

Retrospektif kohort ile vaka-kontrol çalışmalarının en önemli farkı, vaka-kontrol çalışmalarında bugün sonlanıma erişenler belirlenip geriye gidilirken, retrospektif kohortta geçmişte belirlenen belirli bir maruziyete sahip kohort içinde bugün sonlanıma ulaşan ve ulaşmayanların belirlenmesidir (Şekil).

Çalışma tiplerinin zaman ile ilişkisi

Şekil. Çalışma tiplerinin zamanla ilişkisi

Vaka-kontrol çalışmalarında, kohort çalışmalarının tersine, payda kısmında kaç kişi olduğu bilinmediğinden insidans, rölatif risk ya da atfedilen risk hesabı yapılamaz. Bunun yerine ilişkiyi göstermek için odds oranı kullanılır. Maruz kalan ve kalmayan gruplarda çalışmanın aradığı sonlanım insidansının %5’in altında olduğu durumlarda odds oranı genellikle güvenilir ve rölatif riske yakın sonuçlar vermektedir.

Vaka-kontrol çalışmalarının aşağıda belirtilen dezavantaj ve kısıtlılıklarını en aza indirmek için kohort çalışmalar kısmında anlattığımız kohort çalışma içinde yuvalandırılmış vaka-kontrol çalışması tekniği kullanılır. Bu yöntem en etkin ve değerli sonuçların verilmesini sağlar.

Reklam

Vaka grubunun seçimi

Çalışmanın vaka grubuna alınmaya uygunluk kriterleri (eligibility criteria) net ve ayrıntılı bir şekilde verilmelidir. Vaka adayı hastalar arasında vaka örnekleminin hangi yöntemle seçildiği ayrıntılı, net ve objektif kriterlerle belirlenmeli ve raporlanmalıdır. Aranan sonlanım da net bir şekilde tanımlanmalı, kantitatif ölçütlerle (laboratuvar, radyoloji, skorlar) varlığının ispatlandığından emin olunduğu bildirilmelidir. Son olarak, seçim sadece yeni vakalar içinden yapılmalıdır. Zaman içinde tanı kriterleri değiştiğinden eskiden tanı konulmuş hastalar yeni kriterlere göre aynı tanıyı alamayabilir.

Vaka ve kontrol gruplarının seçiminde çoğu kaynakta temsil edebilirlik esasından bahsedilir. Bu esasa göre vaka grubundaki hastalar toplumda hastalığa sahip olan herkesi, kontroller de tüm hasta olmayanları iyi temsil eden birer örneklem olmalıdır. Bu öneri her zaman geçerli değildir ve bu öneriye uymayan gayet kaliteli vaka ve kontrollerin seçilmesi mümkündür. Vaka-kontrol çalışmaları ilgi duyulan herhangi bir vaka tipine özel olarak oluşturulabilir: kadınlar, yaşlılar, ağır hastalar, hastalık tanısı aldıktan sonra 1 ay içinde ölenler, hafif vakalar, İstanbul’da oturanlar, fabrikada çalışanlar gibi. Bu örneklerin hiçbirinde vakalar toplumda hastalığa sahip olanları temsil etmez ama yine de her biriyle mükemmel vaka-kontrol çalışmaları yapmak mümkündür. Rasyoneli net ve doğru olduğu sürece vaka her şekilde tanımlanabilir. Burada en önemli nokta seçilen vakalara kaynak oluşturan toplumun net bir şekilde belirlenmesidir.

Kontrol grubunun seçimi

Kontrol grubu seçilirken hastalığı olmayan herkes gibi genel bir toplum yerine vakaların seçildiği toplumun içinden geliyor olmaları en önemli noktadır. Vakalar seçilirken kullanılan kriterler kontrol grubu için de geçerlidir. Kontrol grubunun vaka grubundan tek farkı maruziyetin (risk faktörü, ilaç, girişim ya da hastalık gibi) ilişkili olduğunu düşündüğümüz sonlanıma (hastalık, durum ya da yan etki gibi) sahip olmamalarıdır (kontrol grubuna vaka grubu hastası alınmamalıdır. Ama kontrol grubuna alınan bir kişinin vaka haline gelme ihtimali vardır). Yani, vaka olmaya aday ama olmamış kontroller seçilmelidir. Bunu kontrol grubunun maruziyetten bağımsız olarak seçilmiş olması, yani vakaların geldiği toplumdan daha farklı bir maruziyet frekansına sahip olmaması olarak da tanımlayabiliriz. Örneklerle bu durumları biraz açalım:

Örneğin, araştırmacıların, yeni reçete edilmeye başlanan bir antihipertansif ajanı kullanmanın (maruziyet) AMI gelişimi üzerindeki etkisini (sonlanım) kardiyoloji servisinde yatan AMI hastalarını vaka grubu, acil servise başvuran AMI hastalarını da kontrol grubu olarak seçerek karşılaştırmak istediklerini varsayalım. Bu kontrol grubu uygun bir kontrol grubu mudur? Eğer kardiyoloji servisine tüm coğrafi bölgelerden AMI hastaları sevk edilerek yatmakta iken acil servise sadece çevredeki 2-3 ilçeden hastalar başvuruyorsa kontrol grubunun vakaların geldiği toplum ile aynı olmadığını rahatlıkla söyleyebiliriz. Coğrafi bölgede bu antihipertansif ilaç belli bir oranda reçete edilirken, hastane çevresindeki 2-3 ilçede bu oran çok daha az ya da yüksek olabilir. Ya da bu antihipertansif ajan vertigo, senkop, görme bozuklukları gibi yan etkiler ile daha fazla trafik kazasına yol açarak bu hastaların acil servise daha fazla başvurmasına yol açıyor olabilir. Bu tip karıştırıcıların tespit edilerek bunların hepsinden bağımsız bir kontrol grubunun belirlenmesi epidemiyolojinin en zor işlerinden biridir. Örneğin 24-55 yaş arasında, Marmara bölgesinde oturan meme kanseri kadınların yer aldığı bir vaka grubumuz varsa, kontrol grubumuz da aynı yaş aralığında meme kanseri olmayan Marmara bölgesinde oturan kadınlardan rastlantısal bir şekilde seçilmelidir. Bu genellikle çok maliyetlidir, ama en güvenilir yoldur.

Bir başka örnek olarak Bağdat Caddesinde hizmet veren bir özel dermatoloji kliniğini ele alalım. Bu klinikteki hekimlerin ününü duyma, diğer illerden buraya gelmelerini öneren akrabalarının olması, internette bu klinikten tedavi alıp memnuniyetini forumlara yazanların yorumlarının etkisi, burada tedavi olma maliyetini karşılayabilecek olmak gibi temel özelliklere sahip olan ve bu kliniğe başvuran psöriyazis hastaları bir vaka-kontrol çalışması için gayet uygun bir vaka grubudur. Ancak bu klinikten yapılacak çalışmada esas sorun yanlılık olmadan bir kontrol grubu seçebilmektir. Seçilen vakalarla aynı riske ve yukarıda belirtilen özelliklere birebir sahip, vakaların geldiği toplumu temsil eden doğru bir kontrol grubu oluşturmak neredeyse imkansızdır. Maliyeti karşılayabilecek ve tüm özellikle açısından vaka grubuna benzer kişinin psöriyazis olduğunda bu klinikten hiç haberi olmaması ve bambaşka bir yerde tedavi olması gayet muhtemeldir. Ya da psöriyazis olup bu kliniğe erişmesi için tüm şartları sağlayan bir kişi hasta olmadan önce bu maliyeti karşılayabilirken hasta olduğunda artık bu maliyeti karşılayabilir olmaktan çıkabilir. Yani kontrol grubunun seçiminde zaman da önemli bir faktör haline gelir.

Bu gibi nedenlerle vaka-kontrol çalışmalarında kontrol grubu seçimi zahmetli ve pahalı bir işlemdir. Maliyet sorununu aşıp vaka ve kontrolleri temel riskler açısından benzer hale getirmek için kohort çalışma bölümünde belirtilen kohort çalışma içine yuvalandırılmış vaka-kontrol çalışması dizaynı kullanılır. Bu yaklaşım bilinen en etkin yöntemlerden biridir. Bunun dışında hastane ya da klinik içinden örnekleme, akran örneklemesi, yakın adres örneklemesi, telefon numarası örneklemesi, ölü kontrollerin seçimi gibi birçok farklı kontrol serisi seçme yöntemleri de vardır. Bunlardan nispeten daha pratik olanlarından biraz bahsedelim:

Reklam
Hastane ya da klinik temelli kontrol grubu seçimi

Hastane ya da klinik temelli vaka-kontrol çalışmalarında vakaların geldiği toplumun tespit edilmesinin güçlüğünden bahsetmiştik (acil servis-kardiyoloji servisi ve dermatoloji kliniği örnekleri). Bu tip çalışmalarda genel toplumdan alınan bir örneklem o hastane ya da kliniğe başvuran/yatan hasta grubunu yansıtmaz. Eğer vakaların alındığı hastane ya da klinik o coğrafi bölgedeki vakaların ancak az bir kısmını alabiliyorsa, bu hastane ya da kliniğe sevk paternleri örneklem seçimi için önemli hale gelir. Mesela, Zonguldak Atatürk Devlet Hastanesi ve Bülent Ecevit Üniversitesi Zonguldak ilinin ortopedi vakalarının hemen hemen tamamının ilk değerlendirildiği yerlerdir. Halbuki Marmara Üniversitesi Hastanesi yılda 3 milyon hasta bakmasına rağmen bulunduğu Pendik ilçesindeki tüm ortopedi vakaları önce buraya başvurmaz. Bu tip durumlarda, genel toplumdan alınan kontrol grubu yerine farklı hastane ya da klinikten alınan bir örneklem daha az yanlılık oluşturan ve vaka grubuna daha yakın bir kontrol grubu sağlayabilir. Rastlantısal olmayan bu tip bir örneklemeyle kontrol grubu oluşturmanın yarattığı en önemli sorun kontrollerin maruziyetten bağımsız (etkilenmeden) bir şekilde seçilmemiş olma ihtimalleridir. Başka hastalıklar sebebiyle yatırılan hastalar vakaların geldiği (kaynaklandığı) topluma göre maruziyete daha az ya da daha fazla uğramış bireyler olabilir. Vaka grubundaki hastalığa neden olduğu varsayılarak ilişkisi incelenen maruziyet, bambaşka bir hastalık için de risk faktörü olup bu sebeple hastaların hastaneye yatmasına yol açıyor olabilir. Böyle bir gruptan seçilen kontrollerde vaka grubundakinden bambaşka bir hastalık olsa da maruziyet frekansı vakaların geldiği toplumla aynı olmayacaktır. Örneğin, hastaneye yatırılan vakalarda sigara içimi ve lösemi arasındaki ilişkiyi inceleyen bir vaka-kontrol çalışması düşünelim. Başka sebeplerle hastaneye yatırılmış hastaları kontrol olarak alsak bile bu kişilerin sigara içimi ile ilgili olarak gelişmiş hastalıklar sebebiyle (kardiyovasküler hastalıklar, koah vs) hastanede yatıyor olma olasılıkları çok yüksektir. Dolayısıyla alınan kontrol grubundaki sigara içmiş hasta oranı lösemi hastalarının geldiği toplumdaki sigara içme oranından daha yüksek çıkacak, sigara içiminin lösemi ile ilişkisinin sayısal değeri olduğundan az gibi görünecektir. Maruziyetle ilişkisi olmadığı bilinen tanılarla kontrolleri sınırlarsak (kardiyovasküler hastalık tanısı olan herkesi dışarda bıraktığımızı varsayalım) kontrol grubunun kalitesini arttırmış oluruz. Böyle bir sınırlamayla kontrol olarak alınabilecek aday hasta sayısı ciddi biçimde azalsa da yine de yeterli sayıya ulaşmak pek zor olmayacaktır. Bu sebeple tıpkı vaka grubu gibi kontrol grubu için de uygunluk kriterleri (eligibility criteria) belirlenmelidir.

Öte yandan, bir maruziyetin bir hastalık ya da tanı grubuyla ilişkisinden emin olmak her zaman mümkün değildir. Bu sebeple tek bir tanısal kategorinin kontrol grubu olarak kullanılmaması gerekir. Birçok tanının aynı anda kullanılması, bilmeden maruziyetle ilişkili olan sabit bir tanının kullanılmasının kontrol grubunda yaratacağı yanlılık etkisini seyreltmeye yardımcı olur.

Kontrol grubunu tanımlar ve uygunluk kriterlerinin belirlerken bazı tanı kategorilerini dışarda bırakmanın amacı (mesela yukarıdaki örnekte kardiyovasküler hastalıklar) kontrol grubunun kaynak toplumu daha iyi temsil etmesi için yapılan bir düzenlemedir. Belirli hastalık hikayesine sahip her hastanın dışlanması anlamına gelmez. Yine yukarıdaki örnek üzerinden gidersek, kontrol grubundan kardiyovasküler hastalığı olanların çıkarılması vaka grubundan da kardiyovasküler hastalığı olan lösemi hastaların çıkarılmasını gerektirmez. Sadece yatış sebebi kardiyovasküler hastalık olan lösemi hastaları dışlanmalıdır. Aynı şekilde kardiyovasküler hastalık hikayesi hatta yatış öyküsü olan ama travma sebebiyle yatırılmış bir hasta da kontrol grubuna alınabilir.

Eğer maruziyet varlığı hastane yatışını direk etkiliyorsa (yatış algoritmasının bir parçasıysa) buradaki yanlılık hastaneye yatış oranları bilinmeden giderilemez. Aslında bu problem hastane kaynaklı çalışmalarda ilk tespit edilen problemlerden biridir ve Berkson tarafından 1946’da tanımlanmıştır. Berksonian yanlılığı olarak da bilinir.

Akran ve arkadaşlar arasından kontrol grubu seçimi

Kontrol olarak vakaların arkadaşlarının ya da akranlarının seçilmesi vakalarla kontrollerin birey bazında denkleştirilmesi amacını güder. Bireylerin eşleştirilmesinin yarattığı sakıncaların yanı sıra kontrollerin vakalar tarafından belirtilmesinin de sakıncaları vardır. İlk olarak, vakaların bir arkadaşını kontrol olarak belirtmesi bu kişinin maruziyet durumu ile ilişkili olabilir. Örneğin, daha sık görüşüp beraber etkinliklerde bulundukları (fiziksel aktivite, spor, alkol alımı gibi) isimleri daha sık belirtmek eğiliminde olabilirler. Daha az samimi oldukları isimleri daha az belirteceklerinden bu kişilerin maruziyet durumları kontrol grubunda daha az temsil edilmiş olur. Dışa dönük ve böylesi bir katılıma onay vereceğini düşündükleri arkadaşları belirli maruziyet paternleri için özellikle risk altında olabilir.

Birden fazla kontrol grubu seçmek

Bazen de kontrol grubundan kaynaklanan yanlılığı azaltmak için birkaç farklı şekilde seçilmiş kontrol grupları kullanmak çözüm olabilir. Hodgkin hastalığı ile ilgili bir vaka-kontrol çalışmasında hastaların eşleri bir kontrol grubu, çocukları bir başka kontrol grubu olarak seçilerek, eşleri üzerinden çevresel faktörlerin etkisi elimine edilirken çocukları üzerinden de cinsiyetin etkisi elimine edilmeye çalışabilir. Hastane temelli kontrol grubu seçiminde fizik tedavi ünitesinde başvuran hastalar bir kontrol grubu, göz servisinde yatanlar ayrı bir kontrol grubu olarak kullanılabilir. Daha fazla emek ve maliyet getirdiğinden dolayı birden fazla kontrol kullanmak genellikle istisnai bir yöntemdir. Analiz aşamasında da her biri farklı yanlılıklar taşıyan birden fazla kontrol grubunun vaka grubuyla karşılaştırılması özellikle de kontrol grupları benzer sonuçlar vermemişse hiç de kolay değildir. Kontrol grupları arasında fark varsa en azından birinin yanlı bir kontrol grubu olduğunu gösterir ama hangisi olduğunu bilmek mümkün olmaz. Kontrol grupları arasında fark yoksa bu da yanlılık olmadığının değil her iki kontrol grubunun da eş miktarda yanlı olduğunun bir göstergesi olabilir.

Kontrol grubundayken vaka grubuna geçme

Kohort çalışmalar için bazen kullanılan bir prensip vardır: çalışma (maruziyet) kohortu takibe başlarken “temiz” olmalıdır, yani içinde henüz hasta olmuş kimse bulunmamalıdır. Vaka-kontrol çalışmalarını kohort çalışmaların tersi gibi değerlendiren bazı araştırmacılar bu prensibi vaka-kontrol çalışmalarına uyarlayarak kontrol grubunun “temiz” olması gerektiğini iddia eder ve bunu sağlamak için düzenlemelerde bulunurlar. Halbuki, nasıl kohort çalışmalarda takip esnasında hastalık geliştiren hastaları çalışmadan çıkartmıyor ve bunun ciddi bir hata olacağını biliyorsak, vaka-kontrol çalışmalarının kontrol grubunda yer alıp maruziyet sonrasında hastalık geliştiren hastaları da dışarıda bırakamayız. Ne yazık ki, sigara içimi ve kolorektal kanser arasındaki ilişkiyi inceleyen bazı vaka-kontrol çalışmalarında yazarlar, “temiz” bir kontrol grubu elde etmek için, sigara içimi ile ilişkili oldukları ve kolon kanserinin öncülü olabilecekleri gerekçesiyle kolon polibi tespit edilen kontrol grubu hastalarını çalışma dışında bırakmışlardır. Bu şekilde bir dışlama kontrol grubunun maruziyet prevalansını vaka grubuna kaynak oluşturan toplumun altına düşürerek maruziyetin etki büyüklüğünü olduğundan daha da büyütür.

Reklam

Bir vaka-kontrol çalışmasına başladığımızı ve vakalarımız ile kontrollerimizi aynı klinikte yatan hastalardan tespit edip çalışmaya aldığımızı varsayalım (vaka-kontrol çalışmalarının her zaman retrospektif olması gerekmez). 1 yıl boyunca kliniğimizde yatan vakaları (mesela ülseratif kolit) toplayıp geçmiş maruziyetlerini sorgularken, kontrolleri de aynı zaman diliminde, cinsiyet yaş gibi özellikler açısından denk olacak şekilde belirleyip sorguladığımızı düşünün (Sonlanım olan hastalığı alıp geriye dönük maruziyetleri taradığımıza, bu sebeple de kohort değil vaka-kontrol çalışması yaptığımıza dikkat edin). Peki, 6 ay sonra tam vakaların yarısını toplamışken kontrol grubuna aldığımız hastalarımızdan birinde (mesela meme adenomu hastası) ülseratif kolit gelişirse ne yapacağız? Kontrol grubunda gelişen bu vaka kontrol grubumuzun “temizliğini” bozar mı? Kontrollerin vaka olma ihtimali olan ama vaka olmamış kişiler olması gerektiğini söylemiştik. O zaman belirli bir zaman diliminde kontrol olarak seçilen hastalar içinden de vakalar çıkması gayet olasıdır. Çoğu araştırmacı bu hastayı kontrol grubundan çıkarıp vaka grubuna alır. Ancak bunu yaptığımızda kontrol grubunda payda kısmından da bu kişiyi silmiş oluruz. Hastalık oluşana kadar her vakanın kontrol olma şansı varsa o zaman her kontrolün de hastalık gelişirse vaka olma şansı olmalıdır, ve bu iki şanstan birinin gerçekleşmesi (bu örnekte olduğu gibi kontrolün vaka haline gelmesi), diğer durumda (yani kontrol olarak) geçirilen süreyi geçersiz kılmaz. Dolayısıyla, bu vaka hem kontrol hem de vaka olarak çalışmada yer almalıdır.

Vaka-kontrol çalışmalarını okurken yazının metot bölümünde kontrol grubunun nasıl seçildiğine dair olan pasaj ilk okunması gereken kısımdır. Burada en ufak bir şüphe oluşturacak durumla karşılaşırsanız o çalışmayı gönül rahatlığıyla okuma listenizden eleyebilirsiniz.

Veri toplayanlardan kaynaklanan yanlılıkların giderilmesi

Gruplardan verileri elde eden araştırmacılar hastaların vaka mı kontrol mu olduğunu bilirlerse kişilerden maruziyet hikayelerini elde etmek daha az ya da çok çaba gösterebilirler. Bu sebeple veri toplayan araştırmacılar hastaların vaka ya da kontrol durumunda olup olmadıklarına tamamen kör olmalıdır. Eğer bu mümkün değilse en azından çalışmanın hipotezinden haberdar olmamaları sağlanmalıdır.

Maruziyet verisinin toplanması ve ölçülmesi

Katılımcılardan hem kontrol hem de vaka grubundakiler özellikle üzerinden belirgin süre geçmiş maruziyetlerin varlığını ve miktarını doğru hatırlayamayabilir. Bu durumun yarattığı yanlılığa hatırlama yanlılığı (recall bias) adı verilir. Hatırlama yanlılığı vaka grubunda kontrol grubuna göre daha az olma eğilimindedir. Vaka grubundaki hastalar, hastalıklarının sebeplerini araştırıp üzerinde daha fazla düşünüp bazı geçmiş maruziyetleri hastalıklarıyla ilişkilendirme eğilimindedirler. Benzer şekilde konulmuş olan tanı vaka grubunun hafızasının bu tip konularda daha da keskinleşmesine yol açar. Bazen de tam tersine hastalık vaka grubunda hafıza ile ilgili problemler yaratarak maruziyet verilerinin alınmasını engeller. Vaka grubu ile kontrol grubu arasında hatırlama yanlılığı düzeyleri açısından oluşan bu farka hatırlama farklılığı (differential recall) adı verilir ve veri yanlılığı (information bias) yaratır. Veri yanlılığı en sofistike analitik tekniklerle bile elimine edilemeyecek kadar ciddi bir yanlılık olup vaka-kontrol çalışmalarının en önemli eksikliğini oluşturur. İsveç’te yapılan Lindefors-Harris ve arkadaşlarının yaptığı ve 1991 yılında yayınlanan bir çalışmada indüklenmiş abortus ve meme kanseri gelişimi arasındaki ilişki bir vaka-kontrol çalışmasıyla incelenmiş. Vaka ve kontrollerin indüklenmiş abortus hikayelerini aldıktan sonra bu bilgileri ulusal merkezi elektronik sağlık veritabanından da verifiye eden araştırmacılar, kontrol grubundaki hastaların verdikleri bilgi ile kayıtlardaki veriler arasında belirgin farklılık gözlemlerken, vaka grubunun çok daha kesin bilgiler paylaşabildiklerini tespit etmişlerdir. Bu çalışma hatırlama farklılığına ve bunun oluşturduğu veri yanlılığının giderilmesi çabalarına güzel bir örnektir.  Verileri toplayanlar hem vaka hem de kontrol gruplarında maruziyet hikayelerini aynı yöntem ve hassaslıkta alacak şekilde eğitilmiş olmalıdır. Hatırlama yanlılığını azaltıcı teknikler kullanmalıdır.

Karıştırıcılardan kaynaklanan yanlılıkların azaltılması

Araştırmacılar olası karıştırıcıları  belirlemeye çalışmalı ve etkilerini azaltmaya yönelik analitik teknikler kullanmalıdır. Dizayn aşamasında vaka-kontrol gruplarının belli özellikler yönünden eşleştirilmesi ya da analiz esnasında lojistik regresyon ve Mantel-Haenszel yaklaşımlarının kullanılması tercih edilen yöntemlerdendir.

Vaka-kontrol çalışma dizaynının farklı tipleri

Yuvalandırılmış vaka-kontrol çalışmaları (yukarıda bahsedilmiştir)
Vaka-kohort çalışmaları

Vaka-kohort çalışması, kaynak toplumun bir kohort olduğu ve bu kohortta yer alan tüm kişilerin çalışılan hastalığı geliştirip geliştirmediğine bakılmaksızın kontrol grubuna alınma şansının eşit olduğu çalışam dizaynıdır. Bu dizayn, araştırılan sonlanım insidansların oranı olduğu durumda son derece faydalıdır.

Reklam

Toplam N sayıda kişi içeren bir kohortta (N1) sayıda maruziyet olan ve (N0) sayıda maruziyeti olmayan kişi vardır. Bu kohortun toplam kişi sayısı (N0)+(N1)‘dir. A sonlanım gelişen kişi sayıları ise, sonlanım insidanslarının oranı (R1 / R0) ya da risk için R aşağıdaki gibi hesaplanır:

Maruziyet riski

Kontrol grubunda maruziyet hikayesi olanların (B1) kohort içinde maruziyet hikayesi olanlara (N1) oranı ile, kontrol grubunda maruziyet hikayesi olmayanların (B0) kohort içinde maruziyet hikayesi olmayanlara (N0) oranının örnekleme hatası dışında aynı olması gerekir:

blank

Kontroller maruziyetlerinden bağımsız şekilde seçildikleri takdirde bu oranların (kontrol örnekleme oranları da denir) aynı olması gerekir. Burada belirtilmeye çalışılan şey özetle kontrol grubunun maruziyet dağılımı açısından seçilen kohortla aynı olmasıdır.

Maruziyeti olan ve olmayan kontrollerdeki sonlanım frekanslarını insidans oranları yerine kullanmamız mümkün olup bunlara psödo-risk adı verilir. Kontrol grubunda maruziyet hikayesi olanların kaçında sonlanım geliştiği (psödo-risk1) ve maruziyet hikayesi olmayanların kaçında sonlanım geliştiğini (psödo-risk0) sayısal olarak hesaplayabiliriz:

psödorisk

 

Psödo-riskleri birbirine oranlarsak çalışma kohortunun risk oranını (risk ratio) elde ederiz. Ama bunu yaparken tüm kohortu hesaplama içine katmamız gerekmediğinden kontrol grubundan kohortun tamamının verisine erişmiş oluruz. Bu veriyi vaka grubuyla karşılaştırarak çalışmamızı tamamlarız.

Vaka-kohort çalışmalarının avantajı aynı kontrol grubunu kullanan tek bir kohorttan birden fazla vaka-kontrol çalışması elde etme imkanı tanımasıdır. Dezavantajı ise vakaların bir kısmı aynı zamanda kontrol grubu içerisinde de yer alacağından aynı derecede kesinlik (power ve güven aralıkları) sağlamak için daha fazla vaka sayısına ulaşmak gerekmesidir. Kohortun 5’de 1’inin vaka haline geldiği bir vaka-kohort çalışmasında (%20) kontrol grubunun da 5’de 1’i vaka olacağından, vaka olmayan yeterli sayıda kontrol sağlamak için kontrol grubunun vaka grubunun 1,25 katı olması gerekir. 100 kişilik bir kohortta 20 kişi vaka ise, 20 kişilik bir kontrol grubunda da 4 tane vaka olacaktır. Kontrol grubunu 25 kişiye çıkardığımızda 20 tane vaka olmayan kontrol elde ederiz. Böylece vaka grubu sayısı kadar kontrol grubunda da vaka olmayan kişi olmuş olur. Hastalık ne kadar nadirse gereken ek kontrol sayısı o kadar azalacaktır.

 

Kaynaklar

  1. Guyatt G. Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice, 3E. McGraw Hill Professional  2014.
  2. Schulz KF, Grimes DA. The Lancet Handbook of Essential Concepts in Clinical Research. The Lancet  2006.
  3. Hulley SB, Cummings SR, Browner WS, Grady DG, Newman TB. Designing Clinical Research. Lippincott Williams & Wilkins  2013.
  4. Funai EF, Rosenbush EJ, Lee MJ, Del Priore G. Distribution of study designs in four major US journals of obstetrics and gynecology. Gynecol Obstet Invest 2001;51:8–11.
  5. Buring JE. Epidemiology in Medicine. Lippincott Williams & Wilkins  1987.
  6. Lilienfeld DE. Lilienfeld’s Foundations of Epidemiology. Oxford University Press, USA  2015.
  7. Rothman K. Modern Epidemiology. Lippincott Williams & Wilkins  2016.
  8. Kelsey JL. Methods in Observational Epidemiology. Oxford University Press, USA  1996.
  9. Rothman N, Cantor KP, Blair A, Bush D, Brock JW, Helzlsouer K, et al. A nested case-control study of non-Hodgkin lymphoma and serum organochlorine residues. Lancet 1997;350:240–4.
  10. Lindefors-Harris BM, Eklund G, Adami HO, Meirik O. Response bias in a case-control study: analysis utilizing comparative data concerning legal abortions from two independent Swedish studies. Am J Epidemiol 1991;134:1003–8.