Zum Hauptinhalt springen
Unabhängigkeitstest

Überprüfen Sie, ob zwei Variablen miteinander verknüpft sind

A
Verfasst von Anthony Cabos
Vor über 4 Jahren aktualisiert

Definition

Ein Unabhängigkeitstest wird verwendet, um das Fehlen einer statistischen Verbindung zwischen zwei Variablen X und Y zu überprüfen. Die beiden gelten als unabhängig, wenn keine statistische Verbindung zwischen ihnen besteht, mit anderen Worten, die Kenntnis von X erlaubt in keiner Weise eine Meinung zu Y .

Wir können die Unabhängigkeit zwischen zwei Variablen durch einen Test χ2 (Chi-2) der Unabhängigkeit oder χ2 von Pearson überprüfen.

Durchführung eines χ2-Unabhängigkeitstests

Formulierung einer Hypothese

eine Nullhypothese (H0) formuliert, wobei letztere und die Variablen X und Y unabhängig voneinander sind.

Berechnung einer Entfernung

Die formulierte Hypothese impliziert, dass die Variablen X und Y nicht miteinander in Beziehung stehen. Unter dieser Bedingung kann die Erwartung einer Klasse wie folgt definiert werden:

Wissen, dass eine Klasse durch einige Werte der Variablen X und Y definiert ist.

E ist die Erwartung, O ist der beobachtete Wert, I ist die Anzahl der Werte der Variablen X, J ist die Anzahl der Werte der Variablen Y und N ist die Anzahl d 'Proben.

Eine Abstandsmessung χ2 wird zwischen dem oben erwarteten Wert und dem beobachteten Wert durchgeführt.

Analyse der Ergebnisse

Der Abstand χ2 wird gemäß dem Freiheitsgrad mit einem verglichen. Referenztabelle . Es wird allgemein angenommen, dass eine Hypothese validiert wird, wenn der mit dem Abstand χ2 verbundene p-Wert kleiner als 0,05 ist.

Wenn der Wert unter diesem Schwellenwert liegt, wird die Hypothese validiert, andernfalls wird die Hypothese ungültig.

Wenn die Unabhängigkeitshypothese bestätigt wird, kann keine Verbindung zwischen den beiden Variablen gefunden werden.

Wenn die Hypothese ungültig ist, können wir dank der Werte der zweiten Variablen eine Variable ableiten.

Bedingung für die Durchführung des χ2-Unabhängigkeitstests

Der Test von χ2 auf Unabhängigkeit kann nur durchgeführt werden, wenn die Anzahl der Proben größer als 30 ist.

Das Cochran-Kriterium muss ebenfalls eingehalten werden. Es besagt:

  • Alle Klassen haben eine Erwartung ungleich Null

  • 80% der Klassen haben eine Erwartung von mehr als 5

Hat dies deine Frage beantwortet?