Parametrik Olmayan İstatistiksel Yöntemler

Caner Erden
4 min readApr 17, 2020

İstatistikte yapılan testler parametrik ve parametrik olmayan testler olmak üzere iki gruba ayrılır. Birincisi yani parametrik testlerde değişkenlerin normal dağılması, varyansların homojen olması ve bazı durumlarda gözlem sayısının 30 ve üzeri olması gibi bazı varsayımlar vardır. Bu varsayımları test ettikten sonra eğer varsayımlar gerçekleşirse t-testi, Z-testi ya da ANOVA testleri gibi testler gerçekleştirilebilir. İkinci testler ise bu varsayımların geçerli olmadığı durumlarda kullanılabilen parametrik olmayan(non-parametric) testlerdir. Literatürde geçen bir çok parametrik olmayan test bulunur. Bu yazıda aşağıdaki testlerden bahsedilecek ve Minitab üzerinde uygulama örnekleri gösterilecektir.

Testlerin Kullanım Alanları

Aşağıda bununla ilgili çok güzel bir akış şeması var. Bu şemadan yola çıkarak kullanılacak test belirlendikten sonra testler gerçekleştirilir ve sonuçlar yorumlanır.

https://medium.com/@BonnieMa/non-parametric-tests-in-hypothesis-testing-138d585c3548

Ayrıca hangi testin hangi durumlarda kullanılacağına dair bir karşılaştırma tablosu da aşağıdaki gibi yapılmış.

https://towardsdatascience.com/demystifying-statistical-analysis-1-a-handy-cheat-sheet-b6229bf992cf

İşaret Testi (Wilcoxon İşaret Testi)

1 örneklemin medyan değerinin belirtilen değerden farklı olup olmadığını test eder. Örneğin bir dersten alınan puanlar aşağıdaki gibi olsun.

38 30 35 55 30 32 55 73 70 54 29 80 30 95

Buna göre %5 anlamlılık düzeyinde medyan değerinin 20 olduğu iddiasını test edelim.

Çözüme geçmeden önce verilerin normal dağılıma uyup uymadığı test edilir. Normallik testi için öncelikle hipotez testleri aşağıdaki gibi kurulur

H0: Veriler ile normal dağılım verileri arasında bir fark yoktur.

H1: Verilerin normal dağılıma uyduğu söylenemez.

Veriler girildikten sonra grafik aşağıdaki gibi elde edilir.

P değeri 0,05’ten küçük olduğu için H0 hipotezi reddedilir. Yani verilerin normal dağılıma uyduğuna dair yeterli kanıt yoktur yorumu yapılır. Şimdi parametrik olmayan testi yapabiliriz.

Seçildikten sonra

Ayarlamaları yapılır.

Sonuçta h0 hipotezi reddedilir. Yani ortalamanın 20’den farklı olduğu sonucuna ulaşılır. Aynı işlemler Wilcoxon Sign testi için de yapılıp sonucun aynı çıktığı görülebilir.

The Mann–Whitney Testi

2 bağımsız örneklemden elde edilen değerler arasında anlamlı bir fark olup olmadığını test eder. Parametrik testlerdeki T-Testi’nin karşılığı gibi düşünülebilir. Eğer veriler parametrik testin varsayımlarına uymuyorsa kullanılır. Ortalama olarak medyanlar alınır.

Örnek

Öğrencilerin aldığı puanlar cinsiyete göre anlamlı farklılık içermekte midir?

E: 38 30 35 55 30 32 55

K: 73 70 54 29 80 30 95

Veriler Minitab’e girildikten sonra daha önce aynı verilerin normallik testini yaptığımız için normallik testini yapmaya gerek duyulmadan direkt analize geçilir.

Stat>>Nonparametrics>>Mann Whitney seçeneğinden veriler girilir.

P değeri 0,05’ten büyük çıktığı için h0 hipotezi kabul edilir. Yani cinsiyete göre ortalamalar arasında fark yoktur denilir.

Kruskal-Wallis Testi

Bağımsız 2’den fazla grubun olması durumunda kullanılır. Parametrik testlerdeki ANOVA gibi düşünülebilir.

Örnek

Bir ürüne ait 5 günlük satış rakamları markalara göre aşağıdaki gibi verilmiştir. Buna göre markalara göre satış miktarları arasında ortalamaları arasında anlamlı fark var mıdır?

Marka 1: 21 79 26 16 25

Marka 2: 62 15 63 75 60

Marka 3: 46 53 65 45 33

Veriler Minitab’e girildikten sonra

P-değeri 0,05'ten büyük olduğu için H0 hipotezi kabul edilir. Yani ortalamalar arasında fark yoktur denilir.

--

--

Caner Erden

Meta-heuristics, optimization algorithms, discrete event simulations, machine learning, statistics