Definição
Um teste de independência é utilizado para verificar a ausência de uma ligação estatística entre duas variáveisX eY. Diz-se que os dois são independentes quando não há ligação estatística entre eles, por outras palavras, conhecimento deX não nos permite de forma alguma fazer um julgamento sobreY.
A independência entre duas variáveis pode ser testada através de um teste de independência χ2 (chi-2) ou do Pearson's χ2.
Realização de um teste de independência χ2
Formulação de uma hipótese
É formulada uma hipótese nula (H0), que é a de que as variáveis X e Y são independentes uma da outra.
Cálculo de uma distância
A hipótese formulada implica que as variáveis X e Y não estão relacionadas entre si, sob esta condição, a expectativa de uma classe pode ser definida como se segue:
Sabendo que uma classe é definida por um par de valores das variáveis X e Y.
E é a expectativa, O é o valor observado, I é o número de valores da variável X, J é o número de valores da variável Y, e N é o número de amostras.
É feita uma medição da distância χ2 entre o valor acima esperado e o valor observado.
Análise dos resultados
A distância χ2 é comparada de acordo com o grau de liberdade a umtabela de referência. Uma hipótese é geralmente considerada como validada quando o valor p associado à distância χ2 é inferior a 0,05.
Se o valor for inferior a este limiar, então a hipótese é validada, caso contrário a hipótese é invalidada.
Se a hipótese de independência for confirmada, não é possível encontrar uma ligação entre as duas variáveis.
Se a hipótese for desmentida, uma variável pode ser inferida a partir dos valores da segunda variável.
Condição para a realização do teste de independência χ2
O teste de independência χ2 só pode ser realizado quando o número de amostras for superior a 30.
O critério Cochran também deve ser cumprido, afirma que :
Todas as classes têm uma expectativa não nula
80% das aulas têm uma expectativa de mais de 5