Все коллекции
Модели
КАЧЕСТВО данных
Интервал и уровень достоверности
Интервал и уровень достоверности

Определения, формулы и ограничения: что нужно знать

Maxime LE MOIGNIC avatar
Автор: Maxime LE MOIGNIC
Обновлено больше недели назад

Когда у них нет данных переписи точек продаж, которые они охватывают, OpenHealth и его европейские партнеры позволяют своим клиентам использовать смоделированные данные на национальном уровне, т. е. то есть экстраполировано из выборки точек продаж. Хотя эти экстраполированные данные предоставляют нашим пользователям очень прочную основу для анализа рынка, они, тем не менее, несут некоторую статистическую неопределенность, величина которой зависит от нескольких факторов, подробно описанных ниже.

Определения

Доверительный интервал:

Доверительный интервал окружает реальное значение, которое мы стремимся оценить, используя измерения, сделанные случайным процессом. Эта концепция позволяет определить запас статистической неопределенности.

Уровень уверенности:

Уровень достоверности представляет уровень достоверности и выражается в%. В статистических исследованиях чаще всего используется уровень достоверности 95%.

Факторы, влияющие на размер интервала для заданного уровня достоверности

Существует 4 фактора, определяющих размер доверительного интервала для данного уровня достоверности:

  • Размер выборки

  • Процент

  • Численность населения

  • Период времени

Размер выборки

Чем больше размер выборки, тем точнее результаты будут отражать генеральную совокупность. Это указывает на то, что для данного уровня достоверности, чем больше размер выборки, тем меньше доверительный интервал. Однако эта зависимость не является линейной (т. Е. Удвоение размера выборки не уменьшает вдвое доверительный интервал).

Процент

Точность также зависит от процента выборки, выбирающей конкретный ответ. Если 99% выборки ответили «Да», а 1% ответили «Нет», шансы статистической неопределенности низки, независимо от размера выборки. Однако, если процентные значения составляют 51% и 49%, шансы статистической неопределенности намного выше. В крайних ответах убедиться легче, чем в промежуточных.

Размер населения

Размер населения может быть фактором только при работе с относительно небольшим населением.

Период времени

Цифровое распространение продаж будет зависеть от исследуемого периода времени. DNV будет ниже за день и, следовательно, с большей неопределенностью.

Формула размера выборки

  • Z = Z значение (например, 1,96 для уровня достоверности 95%)

  • p = процент выбора варианта, выраженный в десятичной форме (0,5 используется для необходимого размера выборки).

  • c = доверительный интервал, выраженный в десятичной форме (например, 0,04 = ± 4).

Формула поправки для конечного населения

Ограничения

расчетах доверительного интервала предполагается, что у вас есть истинная случайная выборка затронутого населения.

Если ваша выборка не является действительно случайной, вы не можете доверять интервалам.

иллюстрации

Для материковой Франции, кроме Корсики:

  • Если DNV моего продукта составляет 100% а объем экстраполированных продаж составляет 100 единиц, доверительный интервал 0,68% означает, что 95% К счастью, мои фактические продажи составляют от 99,32 до 100,68 единиц. Неопределенность низкая.

  • Если DNV моего продукта составляет 1% а объем экстраполированных продаж составляет 100 единиц, доверительный интервал 9,05% означает, что 95 % вероятность того, что мои фактические продажи составляют от 90,95 до 109,05 единиц. Неопределенность больше.

Нашли ответ на свой вопрос?