Przejdź do głównej zawartości
Wszystkie kolekcjeMODELEJAKOŚĆ DANYCH
Przedział czasu i poziom ufności
Przedział czasu i poziom ufności

Definicje, wzory i ograniczenia: co musisz wiedzieć

Maxime LE MOIGNIC avatar
Napisane przez Maxime LE MOIGNIC
Zaktualizowano ponad 3 lata temu

W przypadku braku spisu punktów sprzedaży, które obsługują, OpenHealth i jego europejscy partnerzy pozwalają swoim klientom na śledzenie modelowanych danych na poziomie krajowym, tj. to znaczy ekstrapolowane z próbki punktów sprzedaży. Chociaż te ekstrapolowane dane zapewniają naszym użytkownikom bardzo solidną podstawę do ich analiz rynkowych, niemniej jednak obarczone są pewnym marginesem niepewności statystycznej, której wielkość zależy od kilku czynników opisanych poniżej.

Definicje

Przedział ufności:

Przedział ufności określa rzeczywistą wartość, którą staramy się oszacować za pomocą pomiarów wykonanych w procesie losowym. Koncepcja ta umożliwia zdefiniowanie statystycznego marginesu niepewności.

Poziom zaufania:

Poziom ufności reprezentuje poziom pewności i jest wyrażany w%. W badaniach statystycznych najczęściej stosuje się poziom ufności 95%.

Czynniki wpływające na wielkość przedziału dla danego poziomu ufności

Istnieją 4 czynniki określające wielkość przedziału ufności dla danego poziomu ufności:

  • Rozmiar próbki

  • procent

  • wielkość populacji

  • Okres

Rozmiar próbki

Im większy rozmiar próbki, tym bardziej wyniki będą naprawdę odzwierciedlać populację. Oznacza to, że dla danego poziomu ufności im większa wielkość próby, tym mniejszy przedział ufności. Jednak zależność nie jest liniowa (tj. Podwojenie wielkości próby nie zmniejsza o połowę przedziału ufności).

Procent

Precyzja zależy również od odsetka próbki, który wybiera konkretną odpowiedź. Jeżeli 99% próby odpowiedziało „Tak”, a 1% odpowiedziało „Nie”, szanse na niepewność statystyczną są niskie, niezależnie od wielkości próby. Jeśli jednak odsetki wynoszą 51% i 49%, szanse na niepewność statystyczną są znacznie większe. Skrajne odpowiedzi są łatwiejsze do uzyskania pewności niż odpowiedzi pośrednie.

Wielkość populacji

Wielkość populacji prawdopodobnie będzie czynnikiem tylko przy pracy ze stosunkowo niewielką populacją.

Okres

Sprzedaż cyfrowej dystrybucji zależy od badanego okresu. DNV będzie codziennie niższy, a tym samym większa niepewność.

Wzór na wielkość próbki

  • Z = wartość Z (np. 1,96 dla 95% poziomu ufności)

  • p = procent wybierania opcji, wyrażony jako dziesiętny (0,5 używane do określenia wielkości próby)

  • c = przedział ufności wyrażony dziesiętnie (np. 0,04 = ± 4)

Wzór korygujący dla skończonej populacji

Ograniczenia

Obliczenia przedziału ufności zakładają, że masz prawdziwą losową próbkę populacji, której dotyczy problem.

Jeśli twoja próbka nie jest naprawdę losowa, nie możesz ufać interwałom.

ilustracje

Dla Francji kontynentalnej z wyjątkiem Korsyki:

  • Jeśli mój produkt ma DNV 100% i ekstrapolowana sprzedaż 100 jednostek, przedział ufności 0,68% oznacza, że 95% mam szczęście, że moja rzeczywista sprzedaż wynosi od 99,32 do 100,68 jednostek. Niepewność jest niska.

  • Jeśli mój produkt ma DNV 1% i ekstrapolowana sprzedaż 100 jednostek, przedział ufności 9,05% oznacza 95 % szans, że moja rzeczywista sprzedaż mieści się w przedziale od 90,95 do 109,05 jednostek. Niepewność jest większa.

Czy to odpowiedziało na twoje pytanie?