Alle samlinger
Modellerne
Data KVALITET
Interval og tillidsniveau
Interval og tillidsniveau

Definitioner, formler og begrænsninger: hvad du har brug for at vide

Maxime LE MOIGNIC avatar
Skrevet af Maxime LE MOIGNIC
Opdateret over en uge siden

Når de ikke har folketællingen af de salgssteder, de dækker, giver OpenHealth og dets europæiske partnere deres kunder mulighed for at følge modellerede data på nationalt plan, dvs. dvs. ekstrapoleret fra et udsnit af salgssteder. Selvom disse ekstrapolerede data giver vores brugere et meget solidt grundlag for deres markedsanalyser, bærer de ikke desto mindre en margen for statistisk usikkerhed, hvis størrelse afhænger af flere faktorer beskrevet nedenfor.

Definitioner

Konfidensinterval:

Et konfidensinterval omgiver en reel værdi, som vi søger at estimere ved hjælp af målinger foretaget ved en tilfældig proces. Dette koncept gør det muligt at definere en statistisk usikkerhedsmargen.

:

Et konfidensniveau repræsenterer sikkerhedsniveauet og udtrykkes i%. Et 95% konfidensniveau bruges mest i statistiske undersøgelser.

Faktorer, der påvirker størrelsen på intervallet for et givet konfidensniveau

Der er 4 faktorer, der bestemmer størrelsen på konfidensintervallet for et givet konfidensniveau:

  • Prøvestørrelse

  • Procentdelen

  • Befolkningens størrelse

  • Tidsperioden

Størrelsen på prøven

Jo større stikprøvestørrelse, jo mere afspejler resultaterne virkelig befolkningen. Dette indikerer, at jo større konfidensinterval er for et givet konfidensniveau, jo større stikprøvestørrelse er. Forholdet er dog ikke lineært (dvs. en fordobling af prøvestørrelsen halverer ikke konfidensintervallet).

Procentdelen

Præcision afhænger også af procentdelen af prøven, der vælger et bestemt svar. Hvis 99% af prøven svarede "Ja" og 1% svarede "Nej", er chancerne for statistisk usikkerhed lave uanset stikprøvestørrelsen. Men hvis procenterne er 51% og 49%, er chancerne for statistisk usikkerhed meget større. Ekstreme svar er lettere at være sikre end mellemliggende svar.

Befolkningens størrelse

Befolkningsstørrelse er sandsynligvis kun en faktor, når man arbejder med en relativt lille befolkning.

Tidsperioden

Sælger den digitale distribution afhænger af den undersøgte tidsperiode. En DNV vil være lavere dagligt og dermed større usikkerhed.

Eksempelstørrelsesformel

  • Z = Z-værdi (f.eks. 1,96 for 95% konfidensniveau)

  • p = procentdel, der vælger et valg, udtrykt som decimal (.5, der bruges til den ønskede prøvestørrelse)

  • c = konfidensinterval, udtrykt som decimal (f.eks. 0,04 = ± 4)

Korrektionsformel for den endelige befolkning

Begrænsninger

Konfidensintervalberegninger antager, at du har en ægte tilfældig stikprøve af den berørte population.

Hvis din prøve ikke er tilfældig, kan du ikke stole på intervallerne.

illustrationer

For Frankrigs fastland undtagen Korsika:

  • Hvis mit produkt har en DNV på 100% og ekstrapoleret salg på 100 enheder, betyder et konfidensinterval på 0,68% at der er 95% af heldig at mit faktiske salg er mellem 99,32 enheder og 100,68 enheder. Usikkerheden er lav.

  • Hvis mit produkt har en DNV på 1% og ekstrapoleret salg på 100 enheder, betyder et konfidensinterval på 9,05% , at der er 95 % chance for, at mit faktiske salg er mellem 90,95 enheder og 109,05 enheder. Usikkerheden er større.

Besvarede dette dit spørgsmål?