blank

Merve Yazla | 25 Aralık 2025

Aykırı Değer (Outlier): Hata mı? Bulguyu Değiştiren Bir Gerçek mi?

Outlier: Hata mı Bulguyu Değiştiren Bir Gerçek mi?
10 dk

Bir önceki yazıda kutu grafiğini kullandığımızda verinin dağılımını ve merkez değerlerini görmeyi öğrendik. Bu grafikte çoğu zaman “tek başına duran” noktalar dikkatimizi çeker. İşte bu noktalar — aykırı değer (outlier) — olarak adlandırılır.

Peki bu noktalar gerçekten ‘hatalı ölçüm’ mü, yoksa bize yeni bir biyolojik gerçek mi anlatıyor? Bu yazıda, aykırı değerlerin bazen istatistiksel gürültü, bazen de klinik bulguların kalbi olabileceğini göstereceğiz.

İstatistiksel analiz ve veri bilimi süreçlerinde karşılaşılan en temel zorluklardan biri, veri setinin genel yapısından belirgin şekilde farklılık gösteren gözlemlerin, yani aykırı değerlerin (outliers) yönetimidir. Aykırı değerler, ölçüm hatalarından, veri girişindeki yanlışlıklardan veya popülasyon içindeki doğal bir değişkenlikten kaynaklanabilir. Bu değerler, ortalama ve standart sapma gibi temel istatistiksel ölçümleri çarpıtarak analiz sonuçlarını yanıltabilir ve model performansını olumsuz etkileyebilir. Bu nedenle, herhangi bir analize başlamadan önce aykırı değerlerin doğru bir şekilde tespit edilmesi, nedenlerinin anlaşılması ve uygun stratejilerle yönetilmesi, araştırmanın güvenirliği ve geçerliliği için kritik öneme sahiptir. Bu yazıda, aykırı değerlerin tanımını, türlerini, tespit yöntemlerini ve bu değerlerle ne zaman ve nasıl başa çıkılması gerektiğini klinik senaryolar ve pratik uygulama örnekleriyle ele alacağız.​1​

1. Aykırı Değer (Outlier) Nedir ve Neden Önemlidir?

İstatistikte aykırı değer, bir veri setindeki diğer gözlemlerden önemli ölçüde sapan veri noktası olarak tanımlanır. Bu değerler, veri setinin genel eğiliminin dışında yer aldıkları için dikkat çekerler. Travma hastalarında hastanede yatış süresi genellikle 3–7 gün arasında değişirken, bir hastanın 60 gün yoğun bakımda kalması aykırı bir gözlemdir. Bir klinik çalışmada hastaların CRP düzeyleri çoğunlukla 5–30 mg/L aralığında iken, tek bir hastada 250 mg/L saptanması aykırı değer olarak değerlendirilir. Acil serviste ölçülen sistolik kan basıncı çoğu hastada 100–160 mmHg arasında iken, 60 mmHg veya 260 mmHg gibi değerler aykırı olabilir.​1​

Aykırı değerler önemlidir, çünkü ;

  • İstatistiksel Ölçümleri Saptırır: Ortalama, varyans ve korelasyon gibi ölçümler aykırı değerlere karşı oldukça hassastır. Tek bir aykırı değer bile ortalamayı önemli ölçüde yukarı veya aşağı çekebilir.
  • Model Performansını Düşürür: Özellikle regresyon gibi parametrik testler ve makine öğrenmesi algoritmaları, aykırı değerlerin varlığından olumsuz etkilenir.
  • Varsayımları İhlal Eder: Birçok istatistiksel test, verilerin normal dağıldığı varsayımına dayanır. Aykırı değerler, normal dağılım varsayımını ihlal ederek testlerin gücünü düşürebilir.

2. Aykırı Değer Türleri

Aykırı değerler, kökenlerine ve yapılarına göre farklı şekillerde sınıflandırılabilir. Bu sınıflandırma, onlarla nasıl başa çıkılacağı konusunda önemli ipuçları verir.

  • Nokta Aykırı Değerler (Point Outliers): Bir veri setindeki tek bir gözlemin, diğer tüm gözlemlerden belirgin şekilde farklı olması durumudur. Örneğin, bir grup hastanın yaş verileri incelenirken 110 yaşındaki bir hasta kaydı nokta aykırı değerdir.
  • Bağlamsal Aykırı Değerler (Contextual Outliers): Bir veri noktasının, belirli bir bağlamda aykırı kabul edildiği durumlardır. Değer tek başına anormal olmayabilir, ancak içinde bulunduğu koşullar onu aykırı yapar. Serum kreatinin düzeyinin 1,2 mg/dL olması, genel popülasyonda normal sınıra yakın kabul edilebilse de, genç ve kas kitlesi düşük bir hastada ya da önceden bazal kreatinini 0,6 mg/dL olan bir bireyde bu artış, akut böbrek hasarı açısından bağlamsal bir aykırılık ifade eder. Oksijen satürasyonunun %92 olması, KOAH’lı hastalarda kabul edilebilir bir değer olarak değerlendirilebilirken, akut pulmoner emboli şüphesi bulunan genç bir hastada beklenmedik olup erken hipokseminin uyarıcı bir göstergesi olarak bağlamsal aykırı değer sayılır.
  • Toplu Aykırı Değerler (Collective Outliers): Bir grup veri noktasının, tek başlarına aykırı olmasalar bile bir araya geldiklerinde veri setinin geri kalanından farklı bir desen oluşturmasıdır. Laboratuvar trendlerine bakıldığında, günlük hemoglobin değerlerinin 12,0 → 11,6 → 11,2 → 10,8 g/dL şeklinde kademeli olarak düşmesi, her bir ölçümün tek başına normal sınırlara yakın görünmesine rağmen, birlikte değerlendirildiğinde devam eden gizli kanamayı düşündüren toplu aykırı bir örüntü oluşturur. Benzer şekilde, yoğun bakımda yapılan sürekli kan basıncı izlemi sırasında sistolik kan basıncının ardışık ölçümlerde 90–95 mmHg aralığında seyretmesi, her bir ölçüm tek başına kritik eşiklerin altında olmasa da, bu durumun saatler boyunca düzelme göstermeden devam etmesi, erken septik şok veya süregelen hipovolemiye işaret eden, klinik açıdan anlamlı bir toplu aykırı desen olarak değerlendirilir.​2​

Ayrıca, değişken sayısına göre de tek değişkenli (univariate) ve çok değişkenli (multivariate) aykırı değerler olarak ikiye ayrılırlar.

3. Aykırı Değerler Ne Zaman Silinmeli, Ne Zaman Korunmalıdır?

Bu, analistin vermesi gereken en kritik kararlardan biridir ve duruma göre değişir.

Ne Zaman Silinir veya Düzeltilir?

  • Veri Girişi veya Ölçüm Hatası Varsa: Aykırı değerin bariz bir şekilde yazım hatası (örneğin, yaş için 25 yerine 255 yazılması), ölçüm cihazı arızası veya veri aktarım problemi sonucu oluştuğu kanıtlanabiliyorsa, bu değer düzeltilmeli veya silinmelidir.
  • Örneklem Dışı Bir Gözlemse: İncelenen popülasyonun bir parçası olmayan bir gözlem veri setine dahil edilmişse çıkarılabilir. Örneğin, yetişkinlerde diyabet riski araştırılırken veri setine yanlışlıkla bir çocuğun verisinin dahil edilmesi gibi.

Ne Zaman Korunmalıdır?

Doğal Değişkenliğin Bir Parçasıysa: 

Tıbbi verilerde aykırı görünen bazı değerler, aslında popülasyonun gerçek ve doğal bir parçasını temsil eder ve bu durumda korunmaları gerekir. Örneğin, yoğun bakım hastalarında serum laktat düzeylerinin geniş bir aralıkta dağılması beklenir; bazı hastalarda çok yüksek laktat değerleri ağır doku hipoperfüzyonunu ve yüksek mortalite riskini yansıtır. Bu değerlerin “aykırı” olduğu gerekçesiyle veri setinden çıkarılması, hastalık şiddetinin gerçek dağılımını bozarak analiz sonuçlarının klinik geçerliliğini azaltır. Benzer şekilde, travma hastalarında çok yüksek Injury Severity Score (ISS) değerleri nadir görülse de, travma popülasyonunun gerçek bir parçasıdır ve bu hastaların dışlanması, mortalite analizlerinin gerçek yaşamı yansıtma gücünü düşürür.​3​

Önemli ve Yeni Bir Bilgi Taşıyorsa:

Bazı aykırı değerler, klinik açıdan en değerli ve öğretici bilgileri içerir. Örneğin, tedavi edilen bir hastada, standart tedaviye rağmen beklenenden çok hızlı klinik düzelme görülmesi; hastanın genetik özellikleri, bağışıklık yanıtı veya ilaca özgü bir biyolojik mekanizma hakkında yeni hipotezler geliştirilmesine yol açabilir. Benzer şekilde, ilaç yan etki çalışmalarında nadir fakat ciddi advers olaylar sayıca az oldukları için aykırı gibi görünse de, aslında çalışmanın temel hedefini oluşturan kritik bulgulardır. Bu tür aykırı değerlerin korunması, hasta güvenliği, kişiselleştirilmiş tıp ve yeni tedavi yaklaşımlarının geliştirilmesi açısından büyük önem taşır.​4,5​

4. Aykırı Değerleri Tespit Etme Yöntemleri

Aykırı değerleri tespit etmek için hem görsel hem de istatistiksel yöntemler kullanılır.

a) Görsel Yöntemler

b) İstatistiksel Yöntemler

  • Z-Skoru (Z-Score): Bir veri noktasının, ortalamadan kaç standart sapma uzakta olduğunu gösterir. Genellikle, Z-skoru +3 veya -3’ten büyük olan değerler aykırı olarak kabul edilir. Bu yöntem, verinin normal dağıldığı varsayımına dayanır.
  • Çeyrekler Arası Açıklık (IQR) Yöntemi: Z-skorunun aksine, normal dağılım varsayımı gerektirmez ve aykırı değerlere karşı daha dayanıklıdır. Bir değer, Q1 – 1.5*IQR’den küçük veya Q3 + 1.5*IQR’den büyükse aykırı olarak kabul edilir.
  • Model Tabanlı Yöntemler (Örn: Isolation Forest): Özellikle çok değişkenli veri setlerinde, diğer yöntemlerin yetersiz kaldığı durumlarda kullanılır. Bu algoritmalar, veri noktalarını izole etmenin ne kadar kolay olduğuna bakarak anormallikleri tespit eder.​7​

5. SPSS ve R’da Aykırı Değer Tespiti

SPSS’te Tespit:

  • Explore (Keşfetme) Komutu: Analyze > Descriptive Statistics > Explore menüsü aracılığıyla hem kutu grafiği (boxplot) oluşturulabilir hem de aykırı değerler listelenebilir. SPSS, kutu grafiğinde potansiyel aykırı değerleri daire (outlier) ve aşırı aykırı değerleri yıldız (extreme) ile işaretler.
  • Z-Skorları: Analyze > Descriptive Statistics > Descriptives menüsünden “Save standardized values as variables” seçeneği ile her bir gözlem için Z-skorları hesaplanıp yeni bir değişken olarak kaydedilebilir. Daha sonra bu değişkende ±3’ü aşan değerler filtrelenebilir.​8​

R’da Tespit:

  • Boxplot(): boxplot(veri_seti$degisken) komutu ile kolayca bir kutu grafiği çizilebilir ve aykırı değerler görsel olarak incelenebilir.
  • scale(): scale() fonksiyonu, veriyi standartlaştırarak Z-skorlarını hesaplamak için kullanılır.
  • Paketler: outliers ve EnvStats gibi paketler, Grubbs testi veya Dixon testi gibi daha gelişmiş istatistiksel aykırı değer testleri sunar.​4​

6. Klinik Araştırmalardan Senaryolar

SenaryoAykırı Değer ÖrneğiOlası NedenÖnerilen Eylem
Travma Hastalarında Kan Basıncı AnaliziBir travma hastasında sistolik kan basıncının 320 mmHg olarak kaydedilmesiManşonun yanlış takılması, arter hattı kalibrasyon hatası veya veri giriş hatasıDeğeri doğrula, ölçümü tekrarla. Hatalı olduğu kesinse kaydı düzelt veya analizden çıkar​9​
Sepsis İzleminde Vücut IsısıSepsis tanılı bir hastada vücut sıcaklığının 34,8°C ölçülmesiSepsiste hipotermi (gerçek klinik durum) veya ölçüm tekniği hatasıKlinik bağlamı değerlendir. Ölçüm doğrulanıyorsa değeri koru, prognoz açısından analiz et
Akut Böbrek Hasarı ÇalışmasıBir hastada kreatininin 0,7 → 4,5 mg/dL çıkmasıLaboratuvar hatası veya gerçek akut böbrek hasarıÖnce tekrar ölçüm iste. Doğrulanırsa kritik aykırı değer olarak koru
Yoğun Bakım Laktat İzlemiLaktatın seri ölçümlerde 2,1 → 2,3 → 2,6 → 3,0 mmol/L artmasıSüregelen hipoperfüzyonTekil değerler normal sınıra yakın olsa da toplu aykırı desen olarak analiz et

7. Hızlı Karar Algoritması

blank
Resim-1. Aykırı Değerler için Karar Algortiması

8. Sonuç

Aykırı değer yönetimi, “doğru” veya “yanlış” bir cevabı olmayan, büyük ölçüde bağlama ve araştırmacının alan bilgisine dayanan bir süreçtir. Mekanik bir şekilde tüm aykırı değerleri silmek, veri setindeki değerli bilgilerin kaybolmasına neden olabilirken, tümünü korumak da analiz sonuçlarını tamamen geçersiz kılabilir.

En iyi yaklaşım; şeffaf olmak, yapılan her müdahaleyi (silme, düzeltme, dönüştürme) gerekçeleriyle birlikte raporlamak ve mümkünse analizi hem aykırı değerler dahil edilmiş hem de edilmemiş haliyle sunarak sonuçlar üzerindeki etkisini göstermektir.​10​

Son Söz: Veriye Saygı Duyun

Veri temizliği, veriyi “güzelleştirmek” değil, sorgulamak içindir. Bir klinisyen bir hastanın anormal laboratuvar sonucunu görmezden gelip “bu bir hata olmalı” diyerek hastayı taburcu etmez; nedenini araştırır.

Tıbbi araştırmacı da verisine aynı hassasiyetle yaklaşmalıdır. O tek başına parlayan nokta, bir hatadan ibaret olabilir. Ama belki de o nokta, bir sonraki büyük keşfinizin kapısını aralayacak anahtardır.

Referanslar

  1. 1.
    Lewis T, Barnett V. Outliers in Statistical Data. Wiley; 1995.
  2. 2.
    Kwak SK, Kim JH. Statistical data preparation: management of missing values and outliers. Korean J Anesthesiol. Published online 2017:407. doi:10.4097/kjae.2017.70.4.407
  3. 3.
    Gress TW, Denvir J, Shapiro JI. Effect of Removing Outliers on Statistical Inference: Implications to Interpretation of Experimental Data in Medical Research. MJM. Published online April 2018. doi:10.18590/mjm.2018.vol4.iss2.9
  4. 4.
    Hauskrecht M, Batal I, Hong C, et al. Outlier-based detection of unusual patient-management actions: An ICU study. Journal of Biomedical Informatics. Published online December 2016:211-221. doi:10.1016/j.jbi.2016.10.002
  5. 5.
    Pavlou M, Ambler G, Omar RZ, et al. Outlier identification and monitoring of institutional or clinician performance: an overview of statistical methods and application to national audit data. BMC Health Serv Res. Published online January 10, 2023. doi:10.1186/s12913-022-08995-z
  6. 6.
    Massara P, Asrar A, Bourdon C, et al. New approaches and technical considerations in detecting outlier measurements and trajectories in longitudinal children growth data. BMC Med Res Methodol. Published online October 13, 2023. doi:10.1186/s12874-023-02045-w
  7. 7.
    Cousineau D, Chartier S. Outliers detection and treatment: a review. Int j psychol res. Published online June 30, 2010:58-67. doi:10.21500/20112084.844
  8. 8.
    A SYSTEMATIC REVIEW OF OUTLIERS DETECTION TECHNIQUES IN MEDICAL DATA – Preliminary Study. Proceedings of the International Conference on Health Informatics. Published online 2011:575-582. doi:10.5220/0003168705750582
  9. 9.
    Jones PR. A note on detecting statistical outliers in psychophysical data. Atten Percept Psychophys. Published online May 14, 2019:1189-1196. doi:10.3758/s13414-019-01726-3
  10. 10.
    Janoudi G, Uzun (Rada) M, Fell DB, et al. Outlier analysis for accelerating clinical discovery: An augmented intelligence framework and a systematic review. Sarmiento RF, ed. PLOS Digit Health. Published online May 22, 2024:e0000515. doi:10.1371/journal.pdig.0000515

Bir yanıt yazın

YAZAR HAKKINDA

blank
Merve Yazla
Yazar
Gazi Tıp mezunudur. Yuvaya Acil Tıp asistanı olarak geri dönmüştür. Eğitimini tamamladıktan sonra 15 yıllık Ankara macerasından mecburi hizmet için ayrılmış İzmit’e gitmiştir. İçinde ukde kalan matematik sevdasına biyoistatistik ile devam etme kararı almıştır.

BU YAZIYI DİNLE

SESLENDİREN

blank
Cansu Doğan
Acilcinin Sesleri
Doğan ailesinin tek varisi olarak başladığı hayat serüvenine hiç tahmin edemeyeceği şekilde Acil sevdalısı olarak devam etmektedir. 4 yıl uzmanlık tecrübesinden sonra akademisyenlik hayaline Peygamberler şehri olarak da bilinen Şanlıurfa’da, Harran Üniversitesinde ulaşmıştır. Kitap okumayı, bilim-kurgu film izlemeyi çok sever. Doğada yürüyüş yapmaya ise bayılır. 

ETİKETLER