Tanım
Bağımsızlık testi, iki değişken arasında istatistiksel bir bağlantı olmadığını doğrulamak için kullanılırX veY. İkisi arasında istatistiksel bir bağlantı olmadığında bağımsız oldukları söylenir, başka bir deyişleX hakkında bir yargıya varmamıza hiçbir şekilde izin vermez.Y.
İki değişken arasındaki bağımsızlık χ2 (chi-2) bağımsızlık testi veya Pearson's χ2 ile test edilebilir.
χ2 bağımsızlık testinin yapılması
Bir hipotezin formüle edilmesi
X ve Y değişkenlerinin birbirinden bağımsız olduğu şeklinde bir sıfır hipotezi (H0) formüle edilir.
Mesafe hesaplama
Formüle edilen hipotez, X ve Y değişkenlerinin birbirleriyle ilişkili olmadığını ima etmektedir, bu koşul altında bir sınıfın beklentisi aşağıdaki gibi tanımlanabilir:
Bir sınıfın X ve Y değişkenlerinin bir çift değeri ile tanımlandığını bilmek.
E beklenti, O gözlenen değer, I X değişkeninin değer sayısı, J Y değişkeninin değer sayısı ve N örnek sayısıdır.
Yukarıdaki beklenen değer ile gözlenen değer arasında bir mesafe ölçümü χ2 yapılır.
Sonuçların analizi
χ2 mesafesi serbestlik derecesine göre a ile karşılaştırılırreferans tablosu. Bir hipotez genellikle χ2 mesafesi ile ilişkili p-değeri 0,05'ten küçük olduğunda doğrulanmış kabul edilir.
Değer bu eşiğin altındaysa hipotez doğrulanır, aksi takdirde hipotez geçersiz sayılır.
Eğer bağımsızlık hipotezi doğrulanırsa, iki değişken arasında bir bağlantı bulmak mümkün değildir.
Hipotez reddedilirse, ikinci değişkenin değerlerinden bir değişken çıkarılabilir.
χ2 bağımsızlık testinin yapılması için koşul
χ2 bağımsızlık testi yalnızca örnek sayısı 30'dan fazla olduğunda gerçekleştirilebilir.
Cochran kriteri de karşılanmalıdır, bu kritere göre :
Tüm sınıflar sıfır olmayan bir beklentiye sahiptir
Sınıfların %80'i 5'ten fazla beklentiye sahiptir