独立测试

检查两个变量是否相互关联

A
作者:Anthony Cabos
一周前更新

定义

通过独立性测试,可以验证两个变量 X Y 之间是否没有统计链接。当两者之间没有统计联系时,这两者被认为是独立的,换句话说, X 的知识绝不会允许对 Y

我们可以通过检验独立性的χ2(chi-2)或Pearson的χ2来检查两个变量之间的独立性。

进行χ2独立性测试

假设的形成

制定了零假设(H0),后者和变量X和Y在它们之间是独立的。

计算距离

的假设意味着变量X和Y彼此不相关,在这种情况下,对类别的期望可以定义如下:

知道一个类是由变量X和Y的两个值定义的。

E是期望,O是观测值,I是变量X的值数,J是变量Y的值数,N是数d '样本。

在上述期望值和观察值之间进行距离测量χ2。

结果分析

根据自由度将距离χ2与参考表 。通常认为,当与距离χ2相关的p值小于0.05时,就可以验证假设。

如果该值低于此阈值,则该假设有效,否则,该假设无效。

如果独立性假设得到确认,则不可能在两个变量之间找到联系。

如果假设无效,则由于第二个变量的值,我们可以推断出一个变量。

执行χ2独立性测试的条件

仅当样本数大于30时才能执行独立χ2检验。

还必须遵守Cochran标准,该标准指出:

  • 所有类的期望均非零

  • 80%的班级期望值大于5

这是否解答了您的问题?