Ünite 6: Parametrik Olmayan İstatistik

Giriş

Bir çok istatistiksel hipotez testinde parametrelere ve ana kütleye ilişkin varsayımların sağlanması beklenir. Bu varsayımlardan en çok bilineni normallik varsayımıdır. Parametrik olmayan istatistiksel testler, dağılıma bağlı olmayan testler olarak da adlandırılır. Parametrik olmayan testlerde ana kütlede ilgilenilen değişkenin olasılık dağılımının simetrik olup olmadığı veya bilinen bir dağılıma uyup uymadığı gibi hesaplamalar araştırılmaz. Ek olarak parametrik olmayan istatistiksel teknikler değişken hakkında çok daha az varsayıma olanak verir. Sağlık problemlerinin çözümünde sıklıkla parametrik olmayan teknikler, veri sayısının fazla olmaması, katı varsayımlar gerektirmemesi gibi özelliklerinden dolayı kullanılmaktadır.

İyi Uyum Testleri

Her ne kadar parametrik olmayan teknikler genel olarak bir dağılıma bağlı olunmayan durumlarda kullanılsa da bazı parametrik olmayan istatistik teknikleri verinin bilinen bir olasılık dağılımına uyum gösterip göstermediğinin tespiti için kullanılabilir. Aynı zamanda parametrik olmayan teknikler aynı problem için derlenmiş iki farklı rassal örneklem sonuçlarının birbirlerine benzerliklerini test edebilmek amacı ile de kullanılabilirler. İyi uyum testleri kapsamında ele alınacak temel testler Ki-Kare iyi uyum testi, Kolmogorov-Smirnov iyi uyum testi ve Binom testidir.

Ki-Kare İyi Uyum Testi: Uygulamada sınıflayıcı ölçek düzeyinde ölçümlenmiş değişkenler içinde test yapılmasına olanak verdiğinden, Ki-Kare iyi uyum testi sıklıkla kullanılır. En azından sınıflayıcı ölçek ile ölçümlenmiş bir değişkenin sonuçları iki ya da daha fazla kategori altında toplanabiliyorsa bu değişkenin aldığı değerlerin teorik olarak beklenen değerler ile olan uyumunu test etmek için ki-kare iyi uyum testi uygulanır. 1900 senesinde Karl Pearson tarafından geliştirilmiştir. Test yürütülürken her sınıfa yer alan beklenen frekans değerinin en az 5 olması beklenmektedir. Ama daha fazla verinin bulunamadığı veya derlenemediği özel durumlarda, gözelerde en az 1 adet gözlem olması durumunda da uygulanabilen bir testtir. Temel olarak KiKare iyi uyum testinde gözlem sonucu elde edilen sonuçlar ile teorik veya başka bir etkiye bağlı olarak ortaya çıkması beklenen sonuçların birbirlerine ne kadar uyumlu oldukları istatistiksel olarak test edilir.

Kolmogorov-Smirnov İyi Uyum Testi: Eğer ilgilenilen kategorik değişkenin ortaya çıkan sonuçları doğal bir sıralamaya sahip ise ölçülen değişkenin ölçüm düzeyi sıralayıcı ölçektir. Değişkenin en az sıralayıcı ölçek ile ölçümlendiği problemlerde iyi uyum için KolmogorovSmirnov testi yürütülür. Bu testte hesaplanma işlemleri kolaydır. Sınıflara düşen birim sayısı konusunda bir kısıtlama bu testte bulunmaz. Kolmogorov-Smirnov testi teorik ve gözlemlenen kümülatif frekans dağılımlarının karşılaştırılması işlemini içermektedir. Bu karşılaştırmayı yapmak için veri seti değerleri en küçükten en büyüğe sıralanabilecek şekilde sınıflar (kategoriler) halinde düzenlenir. Teorik dağılımın kümülatif oransal frekanslarını Fi, örneklemden elde edilen sonuçların teorik dağılıma karşılık gelenlerini de Si ile gösterirsek Kolmogorov-Smirnov testi için Fi ile Si arasındaki mutlak farklardan en büyüğüne bakılacaktır.

Binom Testi

Binom testi belirli bir özelliği taşıyan veya taşımayan birimlerin tespiti ve sayısının belirlenmesi gereken durumlarda kullanılır. Örneğin üretim hattından alınan bir ürün iyi ya da kötü olarak sınıflanabilir, insanlar hasta veya sağlıklı olarak sınıflanabilir. Bunlara benzer şekilde sonuçları iki kategoride toplanan değişkenler ile çalışılırken Binom dağılımından faydalanılır. Araştırmada ilgilenilen değişkende ortaya çıkan bu ikili sonuçlar, sayma yoluyla tespit edilerek, oranlar şeklinde ifade edilirler. Değişkenin alabileceği en fazla iki adet sonuç olduğu için bu oranların toplamı 1’e eşit olur.

Bir araştırmada elde edilen örneklem 25 ya da daha az gözlemden oluşuyorsa ve araştırmaya konu olan değişkenin ilgilenilen sonucu olasılığı 0,50 ise Tablo 6.5’te (s. 139) yer alan Binom dağılımı tablosu yardımıyla olayların ortaya çıkış olasılıkları hesaplanabilir.

Örneklemde yer alan birim sayısı 25’den daha fazla olduğunda Binom dağılımı tablosu yeterli gelmeyecektir. Bu durumda Binom dağılımı ile Normal dağılım arasındaki ilişkiden faydalanılarak hesaplamalar yürütülür. Örneklemdeki birim sayısı arttıkça Binom dağılımı Normal dağılıma yaklaşır. Bu iki dağılım arasındaki direk ilişkiden dolayı Binom testi yürütülürken normal dağılım tablosu da kullanılabilir. Eğer yürütülen araştırmada p ve q (p : Tek bir denemede istenen durumun ortaya çıkma olasılığı, q = (p-1): Tek bir denemede istenmeyen/diğer durumun ortaya çıkma olasılığı) birbirine çok yakın, örneklem birim sayısı 25’den büyük ve npq ? 9 koşulu sağlanıyor ise Binom dağılımı olasılıkları yerine Normal dağılımdan elde edilen olasılıklar yardımıyla hipotez testi gerçekleştirilebilir.

İşaret Testi

İşaret testi birbiriyle ilişkili olduğu düşünülen gözlemlerin matematiksel farklarının işaretleri kullanılarak yürütülen bir parametrik olmayan testtir. Testin yürütülmesi için ilgilenilen değişkenin dağılımının medyan değerinin belirli bir değere eşit olup olmadığı hipotez testi gerçekleştirilir. Özellikle önce ve sonra testlerinde İşaret testi kullanımı sıklıkla görülmektedir. Örneğin bir diyetisyen, kişilerin kanlarındaki üre miktarını düşüreceğini düşündüğü bir diyet geliştirmek istiyor ise bir grup üzerinde, diyet başlamadan ve diyet başladıktan sonra ölçümler gerçekleştirebilir. Böyle bir durumda İşaret testi kullanımı uygun olabilir. İşaret testi parametrik testlerden bazılarının yerine kullanılabilir. Parametrik testlerde aranan varsayımların gerçekleşmediği durumlarda İşaret testi uygun çözüm üretebilir. Bazı parametrik testler yerine İşaret testi gerçekleştirilmesi mümkündür. Bu parametrik testler; Tek-örneklem t-testi, Eşlenmiş t-testi, sayısal bir ölçeklemenin mümkün olmadığı ancak gözlemlerin bir şekilde sıralanabildiği kategorik verilerde örnek olarak sayılabilir.

Mann-Whitney U Testi

Mann-Whitney U testi parametrik testlerden olan iki örneklem t testinin parametrik olmayan teknikler arasındaki karşılığı olarak yer almaktadır. Elde edilen birbirinden bağımsız iki rassal örneklemin aynı ana kütleden çekilmiş örneklemler olup olmadıklarının testinde Mann-Whitney U testi kullanılır. Test için oluşturulacak sıfır hipotezi “iki ana kütlenin birbiri ile aynı olduğu”, yani elde edilen iki örneklemin ayrı ayrı ana kütlelerden değil tek bir ana kütleden elde edildiği yönündedir. Alternatif hipotez ise “iki ana kütlenin aynı olmadığı”nı göstermek üzere kurulur. Bu test yürütülürken üzerinde işlem yapılan iki örneklem tek bir örneklem gibi ele alınıp küçükten büyüğe sıralama ile teste başlanır.

Kruskall-Wallis H Testi

Kruskall-Wallis H testi sıklıkla parametrik tek yönlü varyans analizinin parametrik olmayan teknikler arasındaki karşılığı olarak görülür. Her iki teknikte de birkaç grup arasındaki farklılıkların karşılaştırılması söz konusudur. Parametrik tek yönlü varyans analizi çalışmalarında ölçümlenen değişkenin en az aralıklı ölçek ile ölçümlenmiş olması istenir. Bu varsayımın sağlanamadığı durumlarda Kruskall-Wallis H testi kullanılabilir. Ayrıca parametrik varyans analizinin normallik ve varyansların eşit olması varsayımlarının karşılanamadığı durumlarda da uygulanır. Araştırmanın yürütülmesi için sıfır hipotezi “örneklemlerin aynı ana kütleden geldiği”ni belirtirken alternatif hipotez “örneklemlerin farklı ana kütlelerden geldiği”ni ifade etmektedir. Kruskall-Wallis H testi için verilebilecek tek kısıt farklı gruplardan alınan örneklemlerin örneklem büyüklüklerinin 5 ya da daha fazla olmasının istenmesidir. Fakat bu kısıta uyulamadığı durumlarda da H testi kolaylıkla kullanılır.

McNemar Testi

Bazı problemlerde üzerinde çalışılan sistem üzerinde değişiklikler gerçekleştirilebilir. Birimlerin değişim öncesi ve sonrasında nasıl etkilendiklerini göstermek amacı ile McNemar testi uygulanır. Önce (+ veya olumlu) olguya sahip iken sonra (- veya olumsuz) olguya sahip olan birimlerin ya da bunun tersi durumda meydana gelen değişimin istatistiksel olarak anlamlı bir farklılık olup olmadığını göstermek amacı ile bu test kullanılır. Test için derlenen veriler 2×2’lik kontenjans tablolarında sunulur. Araştırmada yer alan 2 adet değişken vardır. Bu değişkenler sınıflayıcı ölçeğe göre ölçümlenirler. Eğer X, sınıflayıcı ölçeğe göre iki sonucu olan bir değişken ise Y değişkeni X değişkenin sistemde herhangi bir değişiklik yapıldıktan sonra ya da bir deney yürütüldükten sonraki durumunu temsil eder.

Wilcoxon Testi

İşaret testinde yürütülen işlemlere benzer olarak Wilcoxon testinde de “iki ana kütle medyan değerleri arasındaki fark sıfırdır” sıfır hipotezi test edilir. Ancak İşaret testine göre Wilcoxon testindeki en büyük farklılık, eşlenmiş ikililer (örneğin A grubu ile B grubu üyeleri) arasında ortaya çıkan farkların matematiksel büyüklüklerinin de hipotez testi sürecinde göz önüne alınmasıdır. Bu matematiksel büyüklükler öncelikle mutlak değerleri alındıktan sonraki durumlarına göre sıralanırlar. Daha sonra mutlak büyüklükler için belirlenen her bir sıra numarasına (+) veya (-) işaret ataması yapılır. (+) veya (-) işaret ataması yapılırken eşlenmiş örneklemlerin matematiksel büyüklük durumu incelenir. Hipotez testinde ilk gruba A ve ikinci grubu B denilirse, eğer A’nın bir gözlem değeri B’nin eşlenmiş gözlem değerinden büyük ise sıra numarası (+) işareti alırken, B’nin gözlem değeri A’nın eşlenmiş gözlem değerinden büyük ise (-) işaret alır. Eğer A ve B gruplarının eşlenmiş gözlem değerleri birbirine eşit ise mutlak büyüklükler için belirlenen sıra numaralarına (+) işaret ataması yapılır. Bu yapı oluşturulduktan sonra eğer sıfır hipotezi bu problem için uygun veya doğru ise (+) işarete sahip sıra numaraları toplamı ile (-) işarete sahip sıra numaraları mutlak toplamının birbirine eşit olması gerekir. Eğer bu iki toplam değeri arasında büyük farklar var ise bu iki grup medyan değerlerinin birbirlerinden farklı olabileceği çıkarsaması yapılabilir.

Wilcoxon testinin uygulanması için (+) işaretli sıra numaraları toplamı T+ ile ve (-) işaretli sıra numaralarının mutlak toplamı da T- ile gösterilsin. Wilcoxon örneklem test istatistiği (T+, T-) ikilisinin küçük olanıdır.

Spearman Sıra Korelasyon Katsayısı

İki adet değişken arasındaki ilişkinin derecesini tespit etmek amacı ile Pearson Korelasyon Katsayısı kullanılmaktadır. Pearson Korelasyon Katsayısı hesaplanabilmesi için ilgilenilen değişken ölçme düzeyinin en az eşit aralıklı ölçek olması gerekmektedir. Pearson Korelasyon Katsayısı uzun ve zahmetli matematiksel işlemler yapılmasını gerektirir. Bu aşama Spearman Sıra Korelasyon Katsayısı hesaplama kolaylığı bakımından ön plana çıkmaktadır. Spearman tarafından önerilen hesaplama yöntemine göre belirlenen korelasyon katsayısı rs sembolü ile gösterilir. Spearman Sıra Korelasyon Katsayısı ilişki derecesi belirlenmeye çalışılan değişkenlerin değerlerine sıra numarası verilmesi işlemini içerir. Özellikle değişkenlerin sıralayıcı ölçek ile ölçümlendiği problemlerde Spearman Sıra Korelasyon Katsayısının kullanılması tekniğin en büyük üstünlüğüdür. Spearman Sıra Korelasyon Katsayısı -1 ile +1 arasında değerler alır. Spearman Sıra Korelasyon Katsayısı kullanılarak iki değişken arasındaki ilişki hakkında hipotez testi yapılması da mümkündür.