Intervall og selvtillit

Definisjoner, formler og begrensninger: hva du trenger å vite

Maxime LE MOIGNIC avatar
Skrevet av Maxime LE MOIGNIC
Oppdatert over en uke siden

Når de ikke har folketellingen av salgsstedene de dekker, tillater OpenHealth og dets europeiske partnere sine kunder å følge modellerte data på nasjonal basis, dvs. det vil si ekstrapolert fra et utvalg av salgssteder. Selv om disse ekstrapolerte dataene gir brukerne våre et veldig solid grunnlag for markedsanalysene, har de likevel en margin for statistisk usikkerhet, hvor omfanget avhenger av flere faktorer beskrevet nedenfor.

Definisjoner

Konfidensintervall:

Et konfidensintervall rammer inn en reell verdi som vi søker å estimere ved hjelp av målinger tatt av en tilfeldig prosess. Dette konseptet gjør det mulig å definere en statistisk usikkerhetsmargin.

Konfidensnivå:

Et konfidensnivå representerer sikkerhetsnivået og uttrykkes i%. Et 95% konfidensnivå er mest brukt i statistiske studier.

Faktorer som påvirker størrelsen på intervallet for et gitt konfidensnivå

Det er fire faktorer som bestemmer størrelsen på konfidensintervallet for et gitt konfidensnivå:

  • Prøvestørrelse

  • Prosentandelen

  • Befolkningens størrelse

  • Tidsperioden

Størrelsen på prøven

Jo større utvalgsstørrelse, jo mer vil resultatene virkelig gjenspeile befolkningen. Dette indikerer at for et gitt konfidensnivå, jo større utvalgsstørrelse, jo mindre er konfidensintervallet. Forholdet er imidlertid ikke lineært (dvs. at dobling av prøvestørrelsen halverer ikke konfidensintervallet).

Prosentandelen

Presisjon avhenger også av prosentandelen av prøven som velger et bestemt svar. Hvis 99% av utvalget svarte "Ja" og 1% svarte "Nei", er sjansene for statistisk usikkerhet lave, uavhengig av utvalgsstørrelsen. Imidlertid, hvis prosentandelen er 51% og 49%, er sjansene for statistisk usikkerhet mye større. Ekstreme svar er lettere å være sikre enn mellom svar.

Størrelsen på befolkningen

Befolkningsstørrelse er bare sannsynlig å være en faktor når du arbeider med en relativt liten befolkning.

Tidsperioden

Den selgende digitale distribusjonen vil avhenge av den studerte perioden. En DNV vil være lavere daglig og derfor større usikkerhet.

Eksempel på størrelsesformel

  • Z = Z-verdi (f.eks. 1,96 for 95% konfidensnivå)

  • p = prosentandel som velger et valg, uttrykt som desimal (.5 brukt for prøvestørrelse nødvendig)

  • c = konfidensintervall, uttrykt som desimal (f.eks .04 = ± 4)

Korreksjonsformel for endelig befolkning

Begrensninger

Konfidensintervallberegninger antar at du har et reelt tilfeldig utvalg av den berørte befolkningen.

Hvis utvalget ditt ikke er tilfeldig, kan du ikke stole på intervallene.

illustrasjoner

For fastlands-Frankrike unntatt Korsika:

  • Hvis produktet mitt har en DNV på 100% og ekstrapolert salg på 100 enheter, betyr et konfidensintervall på 0,68% at det er 95% av heldig at mitt faktiske salg er mellom 99,32 enheter og 100,68 enheter. Usikkerheten er lav.

  • Hvis produktet mitt har en DNV på 1% og ekstrapolert salg på 100 enheter, betyr et konfidensintervall på 9,05% at det er 95 % sjanse for at mitt faktiske salg er mellom 90,95 enheter og 109,05 enheter. Usikkerheten er større.

Svarte dette på spørsmålet?