Определение
Тест на независимость позволяет проверить отсутствие статистической связи между двумя переменными X и Y . Они считаются независимыми, если между ними нет статистической связи, другими словами, знание X никоим образом не позволяет высказать мнение о Y .
Мы можем проверить независимость между двумя переменными с помощью теста χ2 (chi-2) независимости или χ2 Пирсона.
Проведение теста независимости χ2
Формулировка гипотезы
Сформулирована нулевая гипотеза (H0), последняя и переменные X и Y независимы между ними.
Расчет расстояния
Сформулированная гипотеза подразумевает, что переменные X и Y не связаны друг с другом, при этом условии ожидание класса можно определить следующим образом:
Зная, что класс определяется парой значений переменных X и Y.
E - математическое ожидание, O - наблюдаемое значение, I - количество значений переменной X, J - количество значений переменной Y, а N - число d. 'образцы.
Измерение расстояния χ2 выполняется между ожидаемым выше значением и наблюдаемым значением.
Анализ результатов
Расстояние χ2 сравнивается по степени свободы с справочная таблица . Обычно считается, что гипотеза подтверждается, когда значение p, связанное с расстоянием χ2, меньше 0,05.
Если значение ниже этого порога, гипотеза подтверждается, в противном случае гипотеза считается недействительной.
Если гипотеза независимости подтверждается, невозможно найти связь между двумя переменными.
Если гипотеза недействительна, мы можем вывести переменную, используя значения второй переменной.
Условие для выполнения теста независимости χ2
Тест независимости χ2 может быть выполнен только в том случае, если количество выборок превышает 30.
Критерий Кокрана также должен соблюдаться, он гласит, что:
Все классы имеют ненулевое ожидание.
80% классов имеют ожидание больше 5