Definición
Se utiliza una prueba de independencia para comprobar la ausencia de un vínculo estadístico entre dos variables X e Y . Se dice que los dos son independientes cuando no existe un vínculo estadístico entre ellos, en otras palabras, el conocimiento de X no permite de ninguna manera una opinión sobre Y .
Podemos comprobar la independencia entre dos variables mediante una prueba χ2 (chi-2) de independencia o χ2 de Pearson.
Realización de una prueba de independencia χ2
Formulación de una hipótesis
Se formula una hipótesis nula (H0), esta última y las variables X e Y son independientes entre sí.
Calcular una distancia
La hipótesis formulada implica que las variables X e Y no están relacionadas entre sí, bajo esta condición, la expectativa de una clase se puede definir de la siguiente manera:
Saber que una clase está definida por un par de valores de las variables X e Y.
E es la expectativa, O es el valor observado, I es el número de valores de la variable X, J es el número de valores de la variable Y y N es el número d 'muestras.
Se realiza una medición de distancia χ2 entre el valor esperado arriba y el valor observado.
Análisis de resultados
La distancia χ2 se compara según el grado de libertad con un tabla de referencia . Generalmente se considera que una hipótesis se valida cuando el valor p asociado a la distancia χ2 es menor que 0.05.
Si el valor está por debajo de este umbral, la hipótesis se valida; de lo contrario, la hipótesis se invalida.
Si se confirma la hipótesis de independencia, no es posible encontrar un vínculo entre las dos variables.
Si se invalida la hipótesis, podemos deducir una variable gracias a los valores de la segunda variable.
Condición para realizar la prueba de independencia χ2
La prueba de independencia χ2 solo se puede realizar cuando el número de muestras es superior a 30.
También se debe respetar el criterio de Cochran, que establece que:
Todas las clases tienen una expectativa distinta de cero
80% de las clases tienen una expectativa mayor a 5