Alle Kollektionen
Die Modelle
DatenQUALITÄT
Intervall und Konfidenzniveau
Intervall und Konfidenzniveau

Definitionen, Formeln und Einschränkungen: Was Sie wissen müssen

Maxime LE MOIGNIC avatar
Verfasst von Maxime LE MOIGNIC
Vor über einer Woche aktualisiert

Wenn sie nicht über die von ihnen abgedeckten Verkaufsstellen verfügen, ermöglichen OpenHealth und seine europäischen Partner ihren Kunden, modellierte Daten auf nationaler Basis zu verfolgen, d. h das heißt, extrapoliert aus einer Stichprobe von Verkaufsstellen. Diese extrapolierten Daten bieten unseren Nutzern zwar eine sehr solide Grundlage für ihre Marktanalysen, weisen jedoch eine gewisse statistische Unsicherheit auf, deren Größe von mehreren nachstehend aufgeführten Faktoren abhängt.

Definitionen

Konfidenzintervall:

Ein Konfidenzintervall umrahmt einen realen Wert, den wir mithilfe von Messungen schätzen möchten, die durch einen zufälligen Prozess durchgeführt wurden. Dieses Konzept ermöglicht es, eine statistische Unsicherheitsspanne zu definieren.

Konfidenzniveau:

Ein Konfidenzniveau repräsentiert das Sicherheitsniveau und wird in% ausgedrückt. In statistischen Studien wird am häufigsten ein Konfidenzniveau von 95% verwendet.

Faktoren, die die Größe des Intervalls für ein bestimmtes Konfidenzniveau beeinflussen

Es gibt 4 Faktoren, die die Größe des Konfidenzintervalls für ein bestimmtes Konfidenzniveau bestimmen:

  • Stichprobengröße

  • Der Prozentsatz

  • Die Größe der Bevölkerung

  • Der Zeitraum

Die Größe der Stichprobe

Je größer die Stichprobe, desto mehr spiegeln die Ergebnisse die Population wider. Dies zeigt an, dass für ein gegebenes Konfidenzniveau das Konfidenzintervall umso kleiner ist, je größer die Stichprobengröße ist. Die Beziehung ist jedoch nicht linear (d. H. Das Verdoppeln der Stichprobengröße halbiert das Konfidenzintervall nicht).

Der Prozentsatz

Genauigkeit hängt auch vom Prozentsatz der Stichprobe ab, die eine bestimmte Antwort auswählt. Wenn 99% der Stichprobe mit "Ja" und 1% mit "Nein" geantwortet haben, ist die Wahrscheinlichkeit einer statistischen Unsicherheit unabhängig von der Stichprobengröße gering. Wenn die Prozentsätze jedoch 51% und 49% betragen, ist die Wahrscheinlichkeit einer statistischen Unsicherheit viel größer. Extreme Reaktionen sind sicherer als Zwischenreaktionen.

Die Größe der Bevölkerung

Bevölkerungsgröße ist wahrscheinlich nur ein Faktor, wenn mit einer relativ kleinen Bevölkerung gearbeitet wird.

Der Zeitraum

Der Verkauf der digitalen Distribution hängt vom untersuchten Zeitraum ab. Ein DNV wird täglich niedriger und daher größer unsicher.

Formel für die Stichprobengröße

  • Z = Z-Wert (z. B. 1,96 für 95% Konfidenzniveau)

  • p = Prozentsatz der Auswahl einer Auswahl, ausgedrückt als Dezimalzahl (.5 für die benötigte Stichprobengröße)

  • c = Konfidenzintervall, ausgedrückt als Dezimalzahl (z. B. .04 = ± 4)

Korrekturformel für endliche Population

Einschränkungen

Konfidenzintervallberechnungen wird davon ausgegangen, dass Sie eine echte Zufallsstichprobe der betroffenen Bevölkerung haben.

Wenn Ihre Stichprobe nicht wirklich zufällig ist, können Sie den Intervallen nicht vertrauen.

Abbildungen

Für das französische Festland außer Korsika:

  • Wenn mein Produkt einen DNV von 100% und einen extrapolierten Umsatz von 100 Einheiten aufweist, bedeutet ein Konfidenzintervall von 0,68% , dass 95% von vorhanden sind Zum Glück liegen meine tatsächlichen Verkäufe zwischen 99,32 Einheiten und 100,68 Einheiten. Die Unsicherheit ist gering.

  • Wenn mein Produkt einen DNV von 1% und einen extrapolierten Umsatz von 100 Einheiten aufweist, bedeutet ein Konfidenzintervall von 9,05% , dass 95 vorhanden sind % Wahrscheinlichkeit, dass mein tatsächlicher Verkauf zwischen 90,95 Einheiten und 109,05 Einheiten liegt. Die Unsicherheit ist größer.

Hat dies Ihre Frage beantwortet?