Definizione
Un test di indipendenza viene utilizzato per verificare l'assenza di un collegamento statistico tra due variabili X e Y . Si dice che i due siano indipendenti quando non esiste un legame statistico tra loro, in altre parole, la conoscenza di X non consente in alcun modo un'opinione su Y .
Possiamo verificare l'indipendenza tra due variabili con un test χ2 (chi-2) di indipendenza o χ2 di Pearson.
Esecuzione di un test di indipendenza χ2
Formulazione di un'ipotesi
Viene formulata un'ipotesi nulla (H0), quest'ultima e le variabili X e Y sono indipendenti l'una dall'altra.
Calcola una distanza
L'ipotesi formulata implica che le variabili X e Y non siano correlate tra loro, in questa condizione, l'aspettativa di una classe può essere definita come segue:
Sapere che una classe è definita da una coppia di valori delle variabili X e Y.
E è l'aspettativa, O è il valore osservato, I è il numero di valori della variabile X, J è il numero di valori della variabile Y e N è il numero d 'campioni.
Viene effettuata una misurazione della distanza χ2 tra il valore previsto sopra e il valore osservato.
Analisi dei risultati
La distanza χ2 viene confrontata in base al grado di libertà a tabella di riferimento . Si ritiene generalmente che un'ipotesi sia convalidata quando il valore p associato alla distanza χ2 è inferiore a 0,05.
Se il valore è inferiore a questa soglia, l'ipotesi è convalidata, altrimenti l'ipotesi è invalidata.
Se l'ipotesi di indipendenza è confermata, non è possibile trovare un collegamento tra le due variabili.
Se l'ipotesi è invalidata, possiamo dedurre una variabile grazie ai valori della seconda variabile.
Condizione per eseguire il test di indipendenza χ2
Il test di indipendenza χ2 può essere eseguito solo quando il numero di campioni è maggiore di 30.
Anche il criterio di Cochran deve essere rispettato, afferma che:
Tutte le classi hanno aspettative diverse da zero
80% delle classi ha un'aspettativa maggiore di 5