SPSS - Normallik Testi
Analiz yapmadan önce analiz sırasında kullanacağımız değişkenlerin normal dağılıma uygunluğu incelenmelidir. Normalliği incelememizdeki amaç ise parametrik testlerin en önemli varsayımının normallik olmasıdır. Verimize normallik testi yaparken;
- Shapiro Wilk
- Kolmogorov Smirnov
- Skewness/Kurtosis
- Q-Q Plot gibi istatistiksel çıktılar kullanılır.
Shapiro Wilk, Kolmogorov Smirnov, Skewness/Kurtosis gibi çıktılar sayısal ifadeler ile yorumlanır ve Normallik Testi yaparken daha güvenilir sonuçlar verir. Normallik testi çıktısında yer alan grafikler ise normalliği sezgisel olarak yorumlamamıza imkan sağlar.
Peki SPSS kullanarak nasıl Normallik Testi Yaparız?
İlk olarak Analyze sekmesindeki Descriptive Statistics bölümünde yer alan Explore'u seçtiğimizde SPSS yeni bir sekme açacaktır.
Explore sekmesi içerisinde yer alan Dependent List kısmına analiz sırasında kullanılacak olan ve parametrik test uygulamak istediğimiz değişkenimizi ekleriz. Değişkenimizi ekledikten sonra Explore'nin sağ kısmında yer alan sekmeler ile çeşitli düzenlemeler yapılabilir.
Explore içerisindeki Statistics kısmında bizim için Confidence Interval for Mean kısmı önemlidir. Bu kısımda yer alan yüzdelik (%) ifade bize normallik testinin güven düzeyini verir ve biz Confidence Interval for Mean ile bu yüzde ifade ile oynayabiliriz. Peki Normallik Testi yaparken neden güven düzeyi belirleriz? Aslında biz Normallik Testi yaparken hipotez yorumlarız. Normallik testini %95 güven düzeyinde yaptığımızı varsayarsak hipotezlerimiz aşağıdaki gibi olacaktır;
H0 : %95 güven düzeyinde değişkenimiz normal dağılmaktadır.
H1 : %95 güven düzeyinde değişkenimiz normal dağılmamaktadır.
Statistics bölümünde güven düzeyini belirledikten sonra Continue butonuna tıklarız ve Explore içerisinde yer alan Plots sekmesine gideriz. SPSS Factor levels together ve Stem-and-leaf''i otomatik seçer. Biz bu bölümde ayrıca Histogram ve Normality plots with test i seçeriz ve ardından Continue butonuna basarız.
SPSS explore sekmesinde yer alan Display bölümünde Both butonunu otomatik seçer ve SPSS bize test çıktısı olarak grafikler ile istatistikleri verir. Yapılacak çalışmaya göre bu bölümde değişiklik yapabilirsiniz. Düzenlemeleri yaptığımıza göre OK butonuna basarız ve SPSS bize çıktıyı verir.
OUTPUT
Normallik testinin ilk çıktısı olarak Case Processing Summary karşımıza çıkar. Bu kısım bize değişkenimizin gözlem frekanslarını verir. Ayrıca gözlemlerimizin içerisinde yer alan Missing Value değerlerine dair yüzde(%)'ler hakkında bilgi edinebiliriz. Değişkenimiz 43 gözlem değerine sahip ve eksik değer bulundurmamaktadır.
Descriptives çıktımızda çok fazla istatistiksel çıktı yer almaktadır.
Mean, değişkenimizin ortalamasını verir.
5% Trimmed Mean, verimiz küçükten büyüğe doğru sıralandığında alt ve üst sınırda yer alan gözlemlerin % 5 ini dahil etmeden değişkenin ortalamasını hesaplar. 5% Trimmed Mean ile aykırı değerlerin ortalamaya etkisini inceleyebiliriz. Görüleceği üzere değişkenimizin ortalması 93 ve budanmış ortalaması 92,8811 gelmiştir. İki ortalama değerinin birbirine oldukça yakın olmasına bağlı olarak değişken içerisinde aykırı değerin olmadığının veya aykırı değer varsa bile sayısının çok olmadığının yorumunu yapabiliriz.
Ayrıca Descriptives çıktısı ile değişkenimizin Normal Dağılıma uygunluğu ile ilgili varsayımda bulunabiliriz. Skewness(Çarpıklık) ve Kurtosis(Basıklık) değerleri aşağıda belirtilen aralıkta yer alıyorsa değişkenimizin normal dağıldığına dair ön bilgi elde ederiz.
Tabashnik'e göre skewness ve kurtosis statistics değerleri -1,5/+1,5 arasında ise Normal dağılım söz konusudur.
George-Mallery'e göre skewness ve kurtosis statistics değerleri -2/+2 arasında ise Normal dağılım söz konusudur.
Test ettiğimiz değişkenimize ait Skewness değeri 0,158 ve Kurtosis değeri ise 0,501 gelmiştir. Bu iki değer -1,5 ve 1,5 arasında yer aldığı için değişkenimizin normal dağılabileceği varsayımında bulunabiliriz. Ancak bizim için "TEST of NORMALITY" çıktısı daha güvenilir sonuç verecektir.
Tests of Normality çıktısı bize Normallik Testine dair en güvenilir sonucu verir. Tablo görüleceği üzere Kolmogorov-Smirnov ve Shapiro-Wilk olmak üzere ikiye ayrılıyor. Gözlem sayımız 30'dan fazla ise Kolmogorov-Smirnov'a ait Sig. değerini, 30'dan az ise Shapiro Wilk'e ait Sig. kullanırız. Testimizi % 95 güven düzeyinde yapmıştık buna bağlı olarak Sig. değerimiz %5 ten küçük ise %95 güven düzeyinde hipotez reddedilebilir yorumunu yapabiliriz.
Gözlem sayımız 43 olduğu için "Kolmogorov-Smirnov"a göre yorum yaparız. %95 güven düzeyinde yaptığımız testin "Sig." değeri 0,200 çıktığı için H0 hipotezi reddedilemez. Buna bağlı olarak değişkenimizin %95 güven düzeyinde NORMAL DAĞILIM gösterdiğini söyleyebiliriz.
Artık değişkenimizin Normal Dağılıma uygun olduğunu biliyoruz. Ayrıca grafik inceleyerek Normalliği sezgisel olarak kontrol edebiliriz.
Histogram bir veri grubundaki değerlerin sınıflandırılması ve bu yapılan sınıflandırmanın özel oluşturulan sütun grafiği ile gösterilmesidir. Değişkenimizin histogram grafiği normal dağılım ile oldukça benzerlik göstermektedir.
Q-Q Grafikte ise eksenlerde Gözlem değerleri ile Normal değerleri yer almaktadır. Grafikteki değerlerimiz eğri ile oldukça yakın olduğu için yine değişkenimizin normal dağılıma uygun olduğunu söyleyebiliriz.
Normallik testinin nasıl yapıldığını ve yorumlandığını öğrendiğimize göre artık Parametrik Testleri uygulayabiliriz. Buna bağlı olarak bir sonraki paylaşımım Tek Örneklem T-Testi olacaktır. Ayrıca paylaşımlarımda parametrik testleri uygulamadan önce normallik varsayımı kontrol edilecektir.
İyi çalışmalar :)
- Shapiro Wilk
- Kolmogorov Smirnov
- Skewness/Kurtosis
- Q-Q Plot gibi istatistiksel çıktılar kullanılır.
Shapiro Wilk, Kolmogorov Smirnov, Skewness/Kurtosis gibi çıktılar sayısal ifadeler ile yorumlanır ve Normallik Testi yaparken daha güvenilir sonuçlar verir. Normallik testi çıktısında yer alan grafikler ise normalliği sezgisel olarak yorumlamamıza imkan sağlar.
Peki SPSS kullanarak nasıl Normallik Testi Yaparız?
İlk olarak Analyze sekmesindeki Descriptive Statistics bölümünde yer alan Explore'u seçtiğimizde SPSS yeni bir sekme açacaktır.
Explore içerisindeki Statistics kısmında bizim için Confidence Interval for Mean kısmı önemlidir. Bu kısımda yer alan yüzdelik (%) ifade bize normallik testinin güven düzeyini verir ve biz Confidence Interval for Mean ile bu yüzde ifade ile oynayabiliriz. Peki Normallik Testi yaparken neden güven düzeyi belirleriz? Aslında biz Normallik Testi yaparken hipotez yorumlarız. Normallik testini %95 güven düzeyinde yaptığımızı varsayarsak hipotezlerimiz aşağıdaki gibi olacaktır;
H0 : %95 güven düzeyinde değişkenimiz normal dağılmaktadır.
H1 : %95 güven düzeyinde değişkenimiz normal dağılmamaktadır.
Statistics bölümünde güven düzeyini belirledikten sonra Continue butonuna tıklarız ve Explore içerisinde yer alan Plots sekmesine gideriz. SPSS Factor levels together ve Stem-and-leaf''i otomatik seçer. Biz bu bölümde ayrıca Histogram ve Normality plots with test i seçeriz ve ardından Continue butonuna basarız.
SPSS explore sekmesinde yer alan Display bölümünde Both butonunu otomatik seçer ve SPSS bize test çıktısı olarak grafikler ile istatistikleri verir. Yapılacak çalışmaya göre bu bölümde değişiklik yapabilirsiniz. Düzenlemeleri yaptığımıza göre OK butonuna basarız ve SPSS bize çıktıyı verir.
OUTPUT
Normallik testinin ilk çıktısı olarak Case Processing Summary karşımıza çıkar. Bu kısım bize değişkenimizin gözlem frekanslarını verir. Ayrıca gözlemlerimizin içerisinde yer alan Missing Value değerlerine dair yüzde(%)'ler hakkında bilgi edinebiliriz. Değişkenimiz 43 gözlem değerine sahip ve eksik değer bulundurmamaktadır.
Descriptives çıktımızda çok fazla istatistiksel çıktı yer almaktadır.
Mean, değişkenimizin ortalamasını verir.
5% Trimmed Mean, verimiz küçükten büyüğe doğru sıralandığında alt ve üst sınırda yer alan gözlemlerin % 5 ini dahil etmeden değişkenin ortalamasını hesaplar. 5% Trimmed Mean ile aykırı değerlerin ortalamaya etkisini inceleyebiliriz. Görüleceği üzere değişkenimizin ortalması 93 ve budanmış ortalaması 92,8811 gelmiştir. İki ortalama değerinin birbirine oldukça yakın olmasına bağlı olarak değişken içerisinde aykırı değerin olmadığının veya aykırı değer varsa bile sayısının çok olmadığının yorumunu yapabiliriz.
Ayrıca Descriptives çıktısı ile değişkenimizin Normal Dağılıma uygunluğu ile ilgili varsayımda bulunabiliriz. Skewness(Çarpıklık) ve Kurtosis(Basıklık) değerleri aşağıda belirtilen aralıkta yer alıyorsa değişkenimizin normal dağıldığına dair ön bilgi elde ederiz.
Tabashnik'e göre skewness ve kurtosis statistics değerleri -1,5/+1,5 arasında ise Normal dağılım söz konusudur.
George-Mallery'e göre skewness ve kurtosis statistics değerleri -2/+2 arasında ise Normal dağılım söz konusudur.
Test ettiğimiz değişkenimize ait Skewness değeri 0,158 ve Kurtosis değeri ise 0,501 gelmiştir. Bu iki değer -1,5 ve 1,5 arasında yer aldığı için değişkenimizin normal dağılabileceği varsayımında bulunabiliriz. Ancak bizim için "TEST of NORMALITY" çıktısı daha güvenilir sonuç verecektir.
Gözlem sayımız 43 olduğu için "Kolmogorov-Smirnov"a göre yorum yaparız. %95 güven düzeyinde yaptığımız testin "Sig." değeri 0,200 çıktığı için H0 hipotezi reddedilemez. Buna bağlı olarak değişkenimizin %95 güven düzeyinde NORMAL DAĞILIM gösterdiğini söyleyebiliriz.
Artık değişkenimizin Normal Dağılıma uygun olduğunu biliyoruz. Ayrıca grafik inceleyerek Normalliği sezgisel olarak kontrol edebiliriz.
Histogram bir veri grubundaki değerlerin sınıflandırılması ve bu yapılan sınıflandırmanın özel oluşturulan sütun grafiği ile gösterilmesidir. Değişkenimizin histogram grafiği normal dağılım ile oldukça benzerlik göstermektedir.
Q-Q Grafikte ise eksenlerde Gözlem değerleri ile Normal değerleri yer almaktadır. Grafikteki değerlerimiz eğri ile oldukça yakın olduğu için yine değişkenimizin normal dağılıma uygun olduğunu söyleyebiliriz.
Normallik testinin nasıl yapıldığını ve yorumlandığını öğrendiğimize göre artık Parametrik Testleri uygulayabiliriz. Buna bağlı olarak bir sonraki paylaşımım Tek Örneklem T-Testi olacaktır. Ayrıca paylaşımlarımda parametrik testleri uygulamadan önce normallik varsayımı kontrol edilecektir.
İyi çalışmalar :)