定义
通过独立性测试,可以验证两个变量 X 和 Y 之间是否没有统计链接。当两者之间没有统计联系时,这两者被认为是独立的,换句话说, X 的知识绝不会允许对 Y 。
我们可以通过检验独立性的χ2(chi-2)或Pearson的χ2来检查两个变量之间的独立性。
进行χ2独立性测试
假设的形成
制定了零假设(H0),后者和变量X和Y在它们之间是独立的。
计算距离
的假设意味着变量X和Y彼此不相关,在这种情况下,对类别的期望可以定义如下:
知道一个类是由变量X和Y的两个值定义的。
E是期望,O是观测值,I是变量X的值数,J是变量Y的值数,N是数d '样本。
在上述期望值和观察值之间进行距离测量χ2。
结果分析
根据自由度将距离χ2与参考表 。通常认为,当与距离χ2相关的p值小于0.05时,就可以验证假设。
如果该值低于此阈值,则该假设有效,否则,该假设无效。
如果独立性假设得到确认,则不可能在两个变量之间找到联系。
如果假设无效,则由于第二个变量的值,我们可以推断出一个变量。
执行χ2独立性测试的条件
仅当样本数大于30时才能执行独立χ2检验。
还必须遵守Cochran标准,该标准指出:
所有类的期望均非零
80%的班级期望值大于5