Definition
En uafhængighedstest gør det muligt at verificere fraværet af en statistisk sammenhæng mellem to variabler X og Y . De to siges at være uafhængige, når der ikke er nogen statistisk sammenhæng mellem dem, med andre ord, viden om X på ingen måde tillader en mening om Y .
Vi kan verificere uafhængigheden mellem to variabler ved en test χ2 (chi-2) af uafhængighed eller χ2 af Pearson.
Udførelse af en uafhængighedstest χ2
Formulering af en hypotese
Der formuleres en nulhypotese (H0), sidstnævnte og variablerne X og Y er uafhængige af hinanden.
Beregn en afstand
Den formulerede hypotese antyder, at variablerne X og Y ikke er relateret til hinanden, under denne betingelse kan forventningen om en klasse defineres som følger:
At vide, at en klasse er defineret af et par værdier af variablerne X og Y.
E er forventningen, O er den observerede værdi, I er antallet af værdier for variablen X, J er antallet af værdier for variablen Y, og N er tallet d 'prøver.
Der foretages en afstandsmåling χ2 mellem den forventede værdi ovenfor og den observerede værdi.
Analyse af resultater
Afstanden χ2 sammenlignes i henhold til frihedsgraden til en referencetabel . Det anses generelt for, at en hypotese er valideret, når p-værdien forbundet med afstanden χ2 er mindre end 0,05.
Hvis værdien er under denne tærskel, valideres hypotesen, ellers er hypotesen ugyldig.
Hvis uafhængighedshypotesen bekræftes, er det ikke muligt at finde en forbindelse mellem de to variabler.
Hvis hypotesen er ugyldig, kan vi udlede en variabel takket være værdierne for den anden variabel.
Betingelse for at udføre independence2 uafhængighedstest
Uafhængighed χ2-testen kan kun udføres, når antallet af prøver er større end 30.
Cochran-kriteriet skal også respekteres, det siger, at:
Alle klasser har en forventning, der ikke er nul
80% af klasserne har en forventning, der er større end 5