blank

Merve Yazla | 30 Ekim 2025

Histogram ve Kutu Grafiği ile Tıbbi Veriyi Görselleştirme

Data visualization
17 dk

Herkese Merhaba, bu yazıda tıbbi araştırmalarda veri dağılımını anlamaya yönelik iki temel aracı — histogram ve kutu grafiğini — tanıtacak, aralarındaki farkları açıklayacak ve bu görselleştirmelerin klinik araştırmalarda nasıl yorumlanabileceğini somut tıbbi örneklerle birlikte inceleyeceğiz.

1. Giriş: Tıbbi Araştırmalarda Veri Dağılımını Anlamanın Önemi

Modern tıbbi araştırmalar, genomik, klinik çalışmalar ve elektronik sağlık kayıtları gibi kaynaklardan elde edilen büyük ve karmaşık veri setleriyle karakterizedir. Bu veri zenginliği, hastalıkların mekanizmalarını anlama ve yeni tedaviler geliştirme potansiyeli sunsa da, verinin doğasını ve yapısını anlamadan yapılacak istatistiksel analizler yanıltıcı veya hatalı sonuçlara yol açabilir. Bu noktada veri görselleştirme, ham veriyi yorumlanabilir ve anlamlı içgörülere dönüştüren vazgeçilmez bir köprü görevi görür. Özellikle istatistiksel testlerin varsayımlarını kontrol etme ve analizin yönünü belirlemede, bir “ilk bakış” aracı olarak kritik bir rol oynar.

Bu yazımdaki amacım, sürekli değişkenlerin dağılımını anlamak için tıp literatüründe en sık kullanılan iki temel görselleştirme aracını tanıtmaktır: Histogram ve Kutu grafiği (box plot). Tarihsel olarak istatistiğin temel taşlarından olan histogram, bir veri setinin frekans dağılımını, çarpıklığını ve tepe noktalarını detaylı bir şekilde gösterir. Buna karşın, keşifsel veri analizinin bir ürünü olan kutu grafiği, verinin merkezi eğilimini, yayılımını ve özellikle gruplar arası karşılaştırmaları özetlemede olağanüstü bir etkinlik sunar. Bu iki yöntemin karşılaştırmalı analizi, araştırmacıların kendi veri setleri için ne zaman ve hangi aracı kullanmaları gerektiği konusunda bilinçli kararlar vermelerine yardımcı olacaktır.​1​

2. Histogram: Verinin Frekans Dağılımına Detaylı Bir Bakış

2.1. Histogram Nedir? İstatistiksel Tanımı ve Tarihsel Kökeni

Histogram, sürekli bir değişkenin olasılık dağılımını görselleştirmek için kullanılan temel bir istatistiksel grafiktir. Veri seti, “sütun” (bin) olarak adlandırılan bir dizi eşit aralığa bölünür ve her bir sütunun yüksekliği, o aralığa düşen veri noktası sayısını (frekans) temsil eder. “Histogram” terimi, modern istatistiğin kurucularından Karl Pearson tarafından, verinin temel yapısını ve dağılımını görsel olarak keşfetme amacıyla ilk kez kullanılmıştır.​2​ Bir histogram, bir veri setinin yoğunlaştığı ve seyrekleştiği alanları bir bakışta göstererek, verinin altında yatan dağılım hakkında güçlü bir ilk izlenim sunar.​3​

2.2. Bir Histogram Nasıl Yorumlanır?

Bir histogramın şekli, veri seti hakkında önemli bilgiler içerir. Yorumlama genellikle üç ana özelliğe odaklanır:

  • Simetri ve Çarpıklık (Skewness): Dağılımın kuyruklarının nasıl uzandığını ifade eder. Eğer grafiğin sağ ve sol tarafları ayna görüntüsü gibiyse, dağılım simetrik kabul edilir (örneğin, normal dağılım). Eğer sağa doğru uzun bir kuyruk varsa sağa çarpık, sola doğru uzun bir kuyruk varsa sola çarpık olarak adlandırılır. Örneğin, bir popülasyondaki gelir dağılımı genellikle sağa çarpıktır.
  • Modalite (Modality): Grafikteki tepe (mod) sayısını belirtir. Tek bir belirgin tepe varsa dağılım unimodal‘dır. İki belirgin tepe varsa bimodal‘dır. Bimodal bir dağılım, genellikle altta yatan iki farklı grubun varlığına işaret edebilir. Örneğin, belirli bir biyobelirteç seviyeleri hem sağlıklı hem de hasta bireylerden oluşan bir popülasyonda ölçüldüğünde bimodal bir dağılım gözlemlenebilir.
  • Yayılım (Spread): Verinin ne kadar geniş bir aralığa yayıldığını gösterir.

2.3. En Kritik Karar: Sütun (Bin) Genişliğinin Seçimi ve Etkileri

Bir histogramın en önemli ve en subjektif yönü, sütun genişliğinin seçimidir. Bu seçim, grafiğin görünümünü ve dolayısıyla yorumunu dramatik bir şekilde değiştirebilir. Çok geniş sütunlar verinin önemli özelliklerini (örneğin bimodal bir yapıyı) gizleyebilirken, çok dar sütunlar aşırı dalgalanmaya neden olarak altta yatan deseni görmeyi zorlaştırabilir. Bu keyfiliği azaltmak için, optimal sütun genişliğini belirlemeye yönelik çeşitli formüller geliştirilmiştir. Bunlardan en bilinenleri, verinin standart sapmasını ve gözlem sayısını temel alan Scott kuralı ve çeyrekler arası aralığı (IQR) kullanan, aykırı değerlere karşı daha dayanıklı olan Freedman-Diaconis kuralı‘dır. Bu kurallar, veri keşfi için iyi bir başlangıç noktası sunar.​4​

2.4. Tıbbi Uygulama Örneği: Acil Servis Bekleme Süreleri

Bir hastanenin acil servisine başvuran 500 hastanın, triyajdan doktoru görmeye kadar geçen bekleme sürelerinin (dakika cinsinden) dağılımını incelemek istediğimizi varsayalım. Bu veriyi bir histogram ile görselleştirdiğimizde (Bkz. Şekil 1), dağılımın belirgin bir şekilde sağa çarpık olduğunu gözlemleriz. Hastaların çoğu ilk 30 dakika içinde doktoru görürken (grafiğin sol tarafındaki yüksek frekans), çok daha uzun süreler (90 dakika ve üzeri) bekleyen az sayıda hasta, grafiğin sağa doğru uzanan uzun kuyruğunu oluşturmaktadır. Bu görselleştirme, acil servis yöneticilerine ortalama bekleme süresinin tek başına yanıltıcı olabileceğini, çünkü bu “uzun kuyruğun” hasta memnuniyetini ve klinik riski orantısız bir şekilde etkileyebileceğini anında gösterir.

blank

Şekil 1: Acil servise başvuran 500 hastanın bekleme sürelerinin (dakika) frekans dağılımını gösteren histogram. Dağılımın sağa çarpık yapısı, hastaların çoğunun kısa süre beklerken, az sayıda hastanın çok uzun süreler beklediğini göstermektedir.

3. Kutu Grafiği (Box Plot): Beş Sayılı Özetin Gücü

3.1. Kutu Grafiği Nedir? Keşifsel Veri Analizindeki Yeri

Kutu grafiği (box plot veya box-and-whisker plot), istatistikçi John Tukey tarafından 1970’lerde geliştirilen ve “Keşifsel Veri Analizi” (Exploratory Data Analysis – EDA) felsefesinin temel taşlarından biri olan güçlü bir görselleştirme aracıdır. Tukey, karmaşık istatistiksel hesaplamalara dalmadan önce, bir veri setinin temel özelliklerini hızlıca “keşfetmek” ve özetlemek için basit ve etkili yöntemler önermiştir. Kutu grafiği, bir veri setinin dağılımını, merkezi eğilimini ve yayılımını, “beş sayılı özet” (five-number summary) olarak bilinen bir dizi istatistik aracılığıyla tek bir kompakt görselde sunar. Bu özgün tasarımı, onu özellikle farklı gruplar arasındaki veri dağılımlarını karşılaştırmak için son derece verimli kılar.​5​

3.2. Kutu Grafiğinin Anatomisi

Bir kutu grafiği, beş temel istatistiksel ölçütü görselleştirir:

  • Medyan (Q2): Kutunun içindeki çizgi, verinin orta noktasını temsil eder. Veri setindeki değerlerin %50’si bu değerden küçük, %50’si ise büyüktür. Ortalama (mean) yerine medyanın kullanılması, kutu grafiğini aykırı değerlerin etkisine karşı daha dayanıklı (robust) hale getirir.
  • Birinci Çeyrek (Q1): Kutunun alt kenarıdır. Verinin %25’i bu değerin altındadır.
  • Üçüncü Çeyrek (Q3): Kutunun üst kenarıdır. Verinin %75’i bu değerin altındadır.
  • Çeyrekler Arası Aralık (IQR – Interquartile Range): Kutunun kendisi, Q3 ile Q1 arasındaki farkı temsil eder (IQR = Q3 – Q1). Bu aralık, verinin orta %50’sinin yayılımını gösterir ve dağılımın ne kadar sıkışık veya yayvan olduğu hakkında fikir verir.
  • Bıyıklar (Whiskers) ve Aykırı Değerler (Outliers): Kutunun altından ve üstünden uzanan çizgiler olan “bıyıklar”, genellikle veri setindeki aykırı olmayan en küçük ve en büyük değerleri gösterir. Tukey’in yaygın metoduna göre, bıyıklar Q1’in 1.5 * IQR kadar altına ve Q3’ün 1.5 * IQR kadar üstüne uzanır. Bu sınırların dışında kalan herhangi bir veri noktası, aykırı değer olarak kabul edilir ve grafikte ayrı bir nokta ile işaretlenir.

3.3. Kutu Grafiğinin Asıl Gücü: Gruplar Arası Karşılaştırma

Histogram tek bir grubun dağılımını detaylıca gösterirken, kutu grafiğinin asıl parlama noktası, birden fazla grubun dağılımını yan yana, kolayca ve etkili bir şekilde karşılaştırma yeteneğidir. Williamson ve arkadaşları tarafından tıp camiasına tanıtıldığı gibi, kutu grafikleri, farklı tedavi kollarının veya hasta popülasyonlarının sonuçlarını bir bakışta kıyaslamak için idealdir. Araştırmacılar, grupların medyanlarını, yayılımlarını (IQR kutularının boyutları) ve aykırı değerlerinin varlığını kolayca karşılaştırarak, gruplar arasında istatistiksel olarak anlamlı olabilecek farklılıkları hızla tespit edebilirler.

3.4. Tıbbi Uygulama Örneği: Tedavi Gruplarında İyileşme Süreleri

Yeni bir ağrı kesici ilacın etkinliğini değerlendiren bir klinik çalışma yürüttüğümüzü düşünelim. Hastalar rastgele üç gruba ayrılmıştır: İlaç A, İlaç B ve Plasebo. Çalışmanın birincil sonucu, hastaların ağrılarının “önemli ölçüde azaldığını” bildirdikleri süredir (saat cinsinden). Bu üç grubun iyileşme sürelerini karşılaştırmak için kutu grafiği mükemmel bir araçtır (Bkz. Şekil 2).

blank

Şekil 2: Üç farklı tedavi grubundaki (İlaç A, İlaç B, Plasebo) hastaların iyileşme sürelerinin (saat) dağılımını gösteren karşılaştırmalı kutu grafikleri. İlaç A’nın medyan süresinin daha düşük ve dağılımının daha dar olması, ilacın etkinliğine işaret etmektedir.

Grafiği incelediğimizde:

  • Medyan Karşılaştırması: İlaç A grubunun medyan iyileşme süresi (örneğin, 3 saat), hem İlaç B (5 saat) hem de Plasebo (8 saat) gruplarından belirgin şekilde daha düşüktür. Bu, İlaç A’nın daha hızlı etki ettiğine dair güçlü bir görsel kanıt sunar.
  • Yayılım Karşılaştırması: İlaç A grubunun IQR kutusu, diğer gruplara göre daha dardır. Bu, İlaç A’nın etkisinin daha tutarlı ve öngörülebilir olduğunu, hastaların çoğunun benzer sürelerde iyileştiğini düşündürür. Plasebo grubunun geniş kutusu ise iyileşme sürelerinde büyük bir değişkenlik olduğunu gösterir.
  • Aykırı Değerler: İlaç B grubunda, diğerlerinden çok daha uzun sürede iyileşen bir hasta (aykırı değer) bulunmaktadır. Bu nokta, ilaca yanıt vermeyen veya farklı bir fizyolojiye sahip bir hastayı temsil ediyor olabilir ve daha detaylı incelenmesi gerektiğini işaret eder.​6​

4. Karşılaştırmalı Analiz: Histogram mı, Kutu Grafiği mi?

Histogram ve kutu grafiği, aynı veri setine uygulandığında bile farklı hikayeler anlatabilen, birbirini tamamlayıcı araçlardır. Hangi grafiğin seçileceği, araştırmacının cevaplamak istediği soruya bağlıdır. Bu iki temel aracın güçlü ve zayıf yönlerini anlamak, doğru görselleştirmeyi seçmek için kritiktir.

4.1. Amaç Farklılığı: Detay ve Özet Dengesi

İki grafik arasındaki en temel fark, amaçlarında yatar:

  • Histogram: Tek bir veri setinin dağılım şeklini detaylı bir şekilde incelemek için tasarlanmıştır. Verinin tepe noktalarını (modalite), simetrisini, çarpıklığını ve genel formunu ortaya çıkarır. Amacınız, “Bu grubun veri dağılımı normal mi? Yoksa iki farklı alt grup mu var?” gibi soruları yanıtlamaksa, histogram doğru araçtır.
  • Kutu Grafiği: Bir veya daha fazla grubun temel istatistiksel özetlerini hızlıca karşılaştırmak için tasarlanmıştır. Medyan, yayılım (IQR) ve aykırı değerler üzerinden gruplar arası farkları bir bakışta gösterir. Amacınız, “Tedavi grubu ile kontrol grubu arasında iyileşme süreleri açısından bir fark var mı?” gibi bir soruyu yanıtlamaksa, kutu grafiği çok daha verimlidir. Birden fazla histogramı yan yana koyup karşılaştırmak genellikle kafa karıştırıcı olabilir.

4.2. Gösterdikleri ve Gizledikleri

Her görselleştirme, verinin bazı yönlerini vurgularken bazılarını gizler:

  • Histogramın Gösterdiği: Histogramın en büyük gücü, verinin modalitesini (tepe sayısı) net bir şekilde gösterebilmesidir. Örneğin, bir veri setinde iki farklı alt popülasyonun (örn. sağlıklı ve hasta bireyler) karışımı varsa, bu durum histogramda genellikle bimodal (iki tepeli) bir yapı olarak kendini gösterir.
  • Kutu Grafiğinin Gizlediği: Standart bir kutu grafiği, tanımı gereği unimodal (tek tepeli) bir dağılım varsayar ve bu bimodal yapıyı tamamen gizler. Veri seti iki ayrı tepeye sahip olsa bile, kutu grafiği bunu tek bir kutu olarak özetleyerek alttaki önemli bilgiyi kaybetmemize neden olabilir.
  • Kutu Grafiğinin Gösterdiği: Kutu grafiğinin en belirgin avantajlarından biri, potansiyel aykırı değerleri (outliers) standart bir metotla (genellikle 1.5 * IQR kuralı) tespit edip açıkça işaretlemesidir. Bu, veri temizliği veya istisnai vakaların tespiti için çok değerlidir.
  • Histogramın Gizlediği: Histogramda ise aykırı bir değer, genellikle tek başına duran izole bir sütun olarak görünebilir, ancak kutu grafiğindeki kadar net bir şekilde tanımlanmaz ve işaretlenmez.

4.3. Örneklem Büyüklüğünün Etkisi

  • Küçük Örneklemler: Örneklem boyutu küçük olduğunda (örneğin, n < 20-30), bir histogramın şekli, birkaç veri noktasının eklenmesi veya çıkarılmasıyla dramatik bir şekilde değişebilir ve oldukça yanıltıcı olabilir. Bu durumda, verinin dağılımını daha az hassas ama daha sağlam (robust) bir şekilde özetleyen kutu grafiği genellikle daha güvenilir bir seçenek sunar.
  • Büyük Örneklemler: Örneklem boyutu büyüdükçe, histogram verinin altta yatan gerçek dağılım şeklini daha doğru bir şekilde yansıtmaya başlar ve daha güvenilir bir araç haline gelir.

4.4. Pratik Bir Senaryo: Bimodal Bir Veri Setinin Analizi

Bir diyabet kliniğinde, yeni teşhis konmuş 150 hastanın açlık kan şekeri (mg/dL) seviyelerini analiz ettiğimizi varsayalım. Ancak bu hasta grubunun, genetik olarak farklı iki alt tipten (örneğin, Tip 1 ve Tip 2 başlangıcı) oluştuğundan şüpheleniyoruz. Bu veri setini hem histogram hem de kutu grafiği ile görselleştirelim (Bkz. Şekil 3).

  • Kutu Grafiği (Şekil 3a): Tek başına kutu grafiğine baktığımızda, medyanı yaklaşık 140 mg/dL olan, oldukça geniş bir yayılıma sahip, sağa çarpık gibi görünen bir dağılım görürüz. Ancak bu grafik, veri setinin iç yapısı hakkında bize başka bir ipucu vermez.
  • Histogram (Şekil 3b): Aynı veriyi histogram ile çizdiğimizde ise bambaşka ve çok daha aydınlatıcı bir tablo ortaya çıkar. Grafik, net bir şekilde bimodaldir. Biri yaklaşık 110-120 mg/dL civarında, diğeri ise 160-170 mg/dL civarında olmak üzere iki belirgin tepe noktası vardır. Bu görsel, tek bir homojen grup yerine, aslında iki farklı hasta grubunun bir karışımına baktığımız hipotezini güçlü bir şekilde destekler.

Tartışma: Bu senaryoda, eğer sadece kutu grafiğine baksaydık, verinin en önemli yapısal özelliğini, yani bimodal doğasını tamamen gözden kaçıracaktık. Histogram ise bize, bu iki alt grubu ayırarak analiz etmemiz gerektiğini söyleyen kritik bir içgörü sunmuştur. Bu, iki grafiğin rakip değil, birbirini tamamlayan araçlar olduğunun mükemmel bir kanıtıdır. En iyi pratik, genellikle her ikisini de kullanarak veriye farklı açılardan bakmaktır.

blank

Şekil 3: Bimodal bir yapıya sahip aynı veri setinin (a) kutu grafiği ve (b) histogram ile görselleştirilmesi. Kutu grafiği dağılımın bimodal yapısını gizlerken, histogram bu kritik özelliği net bir şekilde ortaya koymaktadır.

5. Sınırlılıklar ve Modern Alternatifler: Ne Zaman Daha Fazlasına İhtiyaç Duyulur?

Histogram ve kutu grafiği, veri keşfi için vazgeçilmez araçlar olsalar da, her birinin kendine özgü sınırlılıkları vardır. Bu sınırlılıkların farkında olmak ve ne zaman daha gelişmiş görselleştirme yöntemlerine ihtiyaç duyulduğunu bilmek, daha doğru ve nüanslı analizler yapmak için kritik öneme sahiptir. Neyse ki, modern veri görselleştirme araçları, bu iki klasiğin en iyi yönlerini birleştiren hibrit çözümler sunmaktadır.

5.1. Histogramın Sınırlılığı: Sütun Genişliğine Duyarlılık

Daha önce de belirtildiği gibi, bir histogramın en büyük zayıflığı, görünümünün sütun (bin) genişliği seçimine aşırı derecede duyarlı olmasıdır. Aynı veri seti, farklı sütun genişlikleri kullanılarak oluşturulan histogramlarda unimodal, bimodal veya çok tepeli gibi tamamen farklı görünebilir. Bu durum, araştırmacının subjektif seçimine bağlı olarak farklı sonuçlara yol açabilir ve verinin yorumlanmasında tutarsızlıklara neden olabilir. Bu sınırlılık, özellikle gruplar arası histogram karşılaştırmalarını zor ve güvensiz hale getirir.

5.2. Kutu Grafiğinin Sınırlılığı: Dağılım Şeklini Gizlemesi

Kutu grafiğinin temel takası (trade-off), özetleme gücüne karşılık detayları feda etmesidir. En önemli sınırlılığı, verinin dağılım şeklini ve yoğunluğunu tamamen gizlemesidir. Önceki bölümde tartışıldığı gibi, bir kutu grafiği, altta yatan verinin bimodal (iki tepeli) veya multimodal (çok tepeli) bir yapıya sahip olup olmadığını gösteremez. Farklı dağılım şekillerine sahip (örneğin, biri düz bir plato, diğeri keskin bir tepe) ancak aynı medyan ve çeyrekliklere sahip veri setleri, tamamen aynı kutu grafiğini üretebilir. Bu durum, önemli yapısal bilgilerin kaybolmasına yol açabilir.

5.3. Hibrit Çözümler: Kutu Grafiğinin Eksiklerini Tamamlayan Modern Görselleştirmeler

Bu sınırlılıkların üstesinden gelmek için, kutu grafiğinin özetleme gücünü histogramın dağılım detayıyla birleştiren modern ve hibrit görselleştirmeler geliştirilmiştir. Krzywinski ve Altman’ın da vurguladığı gibi, bu araçlar veriye dair daha zengin ve dürüst bir bakış açısı sunar.

  • Keman Grafiği (Violin Plot): Keman grafiği, bu hibrit yaklaşımların en popüler olanıdır. Temelde, bir kutu grafiğini, kendi ekseni etrafında döndürülmüş bir çekirdek yoğunluk grafiği (kernel density plot) ile birleştirir. Ortadaki beyaz nokta genellikle medyanı, kalın siyah çubuk çeyrekler arası aralığı (IQR) gösterirken, dıştaki “keman” şekli, verinin o noktadaki yoğunluğunu (yani ne kadar veri noktası biriktiğini) gösterir.​7​
    • Avantajı: Kutu grafiğinin özet istatistiklerini sunarken, aynı zamanda histogram gibi verinin dağılım şeklini (örneğin bimodal bir yapıyı) net bir şekilde görselleştirir. Bu sayede, “hem karşılaştır hem detay gör” ihtiyacını karşılar.
  • Nokta Grafiği (Dot Plot) ve Sürü Grafiği (Swarm Plot): Bu görselleştirmeler, veri özetlemek yerine, her bir veri noktasını grafikte ayrı bir nokta olarak gösterir. Özellikle sürü grafiği (swarm plot), noktaların üst üste binmesini engelleyecek şekilde onları yatay eksende hafifçe kaydırarak veri yoğunluğu hakkında sezgisel bir fikir verir.
    • Avantajı: En yüksek düzeyde şeffaflık sunarlar. Örneklem büyüklüğü, dağılım, veri yoğunluğu ve aykırı değerler hakkında hiçbir bilgi kaybolmaz. Özellikle küçük ve orta büyüklükteki veri setleri için, verinin “ham” halini görmek ve kutu grafiğinin gizleyebileceği kalıpları fark etmek için mükemmeldirler. Genellikle, daha fazla bağlam sağlamak için bir kutu veya keman grafiğinin üzerine bindirilerek kullanılırlar.

Bu modern alternatifler, araştırmacılara standart grafiklerin ötesine geçerek, veri setlerinin daha eksiksiz ve dürüst bir resmini sunma imkanı tanır.

blank

Şekil 4: Aynı bimodal veri setinin (a) standart kutu grafiği, (b) keman grafiği ve (c) kutu grafiği ile birleştirilmiş sürü grafiği ile gösterimi. Keman ve sürü grafikleri, standart kutu grafiğinin gizlediği bimodal yapıyı ve veri yoğunluğunu açıkça ortaya koymaktadır.

6. Sonuç ve Pratik Öneriler

Veri görselleştirme, istatistiksel analizin sadece bir ön adımı değil, aynı zamanda verinin yapısını anlama, hipotezler geliştirme ve bulguları etkili bir şekilde iletme sürecinin ayrılmaz bir parçasıdır. Bu makalede incelenen histogram ve kutu grafiği, sürekli değişkenlerin dağılımını anlamak için kullanılan iki temel ve güçlü araçtır. Ancak analizlerimizin de gösterdiği gibi, bu iki yöntem birbirinin rakibi değil, farklı sorulara cevap veren ve birbirinin eksiklerini tamamlayan stratejik ortaklardır.

Bir araştırmacının hangi aracı seçeceği, eldeki veriye hangi soruyu yönelttiğine bağlıdır. Bu seçim sürecini kolaylaştırmak için aşağıdaki pratik karar ağacı önerilebilir:

Araştırmacılar İçin Karar Rehberi:

  • Amacınız, tek bir grubun dağılımının genel şeklini, tepe noktalarını (modalite), simetrisini veya çarpıklığını detaylıca incelemek mi?
    • Histogram kullanın. Veri setinizin bimodal bir yapıya sahip olup olmadığını veya normal dağılımdan ne kadar saptığını en iyi histogram gösterir.
  • Amacınız, iki veya daha fazla bağımsız grubu (örneğin, tedavi vs. kontrol, farklı hasta popülasyonları) medyan, yayılım (IQR) ve potansiyel aykırı değerler açısından hızlı ve etkili bir şekilde karşılaştırmak mı?
    • Kutu Grafiği (Box Plot) kullanın. Gruplar arası farkları bir bakışta özetlemede ve sunmada rakipsizdir.
  • Amacınız, hem grupları birbiriyle karşılaştırmak hem de her bir grubun kendi içindeki dağılım şeklini kaybetmeden görmek mi?
    • Keman Grafiği (Violin Plot) veya Sürü Grafiği (Swarm Plot) gibi modern hibrit çözümleri tercih edin. Bu araçlar, kutu grafiğinin özetleme gücünü histogramın dağılım detayıyla birleştirerek veriye dair daha zengin ve eksiksiz bir bakış açısı sunar.

Sonuç olarak, veri görselleştirme sadece estetik bir tercih değil, aynı zamanda bilimsel bir sorumluluktur. Seçilen grafik, verinin hikayesini dürüst, şeffaf ve yanıltıcı olmayan bir şekilde anlatmalıdır. Bazen bir kutu grafiğinin basitliği yeterliyken, bazen bir histogramın ortaya çıkardığı bir detay tüm analizin yönünü değiştirebilir. En iyi pratik, genellikle bu araçları tek başına değil, birlikte kullanarak veriyi farklı açılardan sorgulamak ve doğrulamaktır. Bu sayede, verinin içinde saklı olan bilimsel gerçekliğe ulaşma olasılığımız en üst düzeye çıkar. Umarım faydalı olmuştur. Bir sonraki yazıda görüşmek üzere…

Referanslar

  1. 1.
    Murdoch TB, Detsky AS. The Inevitable Application of Big Data to Health Care. JAMA. Published online April 3, 2013:1351. doi:10.1001/jama.2013.393
  2. 2.
    X. Contributions to the mathematical theory of evolution.—II. Skew variation in homogeneous material. Phil Trans R Soc Lond A. Published online December 31, 1895:343-414. doi:10.1098/rsta.1895.0010
  3. 3.
    Freedman D, Diaconis P. On the histogram as a density estimator:L 2 theory. Z Wahrscheinlichkeitstheorie verw Gebiete. Published online December 1981:453-476. doi:10.1007/bf01025868
  4. 4.
    SCOTT DW. On optimal and data-based histograms. Biometrika. Published online 1979:605-610. doi:10.1093/biomet/66.3.605
  5. 5.
    Krzywinski M, Altman N. Visualizing samples with box plots. Nat Methods. Published online January 30, 2014:119-120. doi:10.1038/nmeth.2813
  6. 6.
    Williamson DF, Parker RA, Kendrick JS. The Box Plot: A Simple Visual Method to Interpret Data. Ann Intern Med. Published online June 1, 1989:916-921. doi:10.7326/0003-4819-110-11-916
  7. 7.
    Hintze JL, Nelson RD. Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician. Published online May 1998:181-184. doi:10.1080/00031305.1998.10480559

Bir yanıt yazın

YAZAR HAKKINDA

blank
Merve Yazla
Yazar
Gazi Tıp mezunudur. Yuvaya Acil Tıp asistanı olarak geri dönmüştür. Eğitimini tamamladıktan sonra 15 yıllık Ankara macerasından mecburi hizmet için ayrılmış İzmit’e gitmiştir. İçinde ukde kalan matematik sevdasına biyoistatistik ile devam etme kararı almıştır.

BU YAZIYI DİNLE

SESLENDİREN

blank
Ömer Yusuf Erdurmuş
Editör
Gazi Üniversitesi Tıp Fakültesinden mezun olup Acil Tıbbı kendisine sevdiren Ankara Üniversitesi Acil Tıp Anabilim Dalı’ndan uzmanlığını almıştır. Halen Ordu Devlet Hastanesinde Acil Tıp Uzmanı olarak meslek hayatına devam etmektedir. Yarışmacı sporların her çeşidiyle ve spor travmalarıyla ilgilenmektedir. Kalan tüm zamanlarında Doruk Efe’nin babası olarak görev yapmaktadır.

ETİKETLER