間隔と信頼レベル

定義、式、制限:知っておくべきこと

Maxime LE MOIGNIC avatar
対応者:Maxime LE MOIGNIC
一週間前以上前にアップデートされました

となる販売拠点の人口統計がない場合、OpenHealthとそのヨーロッパのパートナーは、顧客がモデル化されたデータを全国的に追跡できるようにします。つまり、販売ポイントのサンプルから推定されます。これらの推定データは、ユーザーに市場分析の非常に強固な基盤を提供しますが、それでも統計的な不確実性のマージンがあり、その大きさは以下に詳述するいくつかの要因に依存します。

定義

信頼区間:

信頼区間は、ランダムプロセスによって行われた測定値を使用して推定しようとする実際の値を構成します。この概念により、統計的な不確実性マージンを定義することができます。

信頼度:

信頼レベルは確実性のレベルを表し、%で表されます。 95%の信頼レベルは、統計研究で最も一般的に使用されます。

特定の信頼レベルの間隔のサイズに影響を与える要因

特定の信頼レベルの信頼間隔のサイズを決定する4つの要因があります。

  • サンプルサイズ

  • パーセンテージ

  • 人口の大きさ

  • 期間

サンプルのサイズ

サンプルサイズが大きいほど、結果は実際に人口を反映します。これは、特定の信頼レベルに対して、サンプルサイズが大きいほど、信頼間隔が小さくなることを示しています。ただし、この関係は線形ではありません(つまり、サンプルサイズを2倍にしても、信頼区間は半分になりません)。

パーセンテージ

精度は、特定の回答を選択するサンプルの割合にも依存します。サンプルの99%が「はい」と回答し、1%が「いいえ」と回答した場合、サンプルサイズに関係なく、統計的な不確実性の可能性は低くなります。ただし、パーセンテージが51%と49%の場合、統計的な不確実性の可能性ははるかに高くなります。極端な応答は、中間の応答よりも確実になりやすいです。

人口のサイズ

人口の大きさは、比較的少数の人口で作業する場合にのみ要因となる可能性があります。

期間

デジタル配信の販売は、調査期間によって異なります。 DNVは毎日低くなるため、不確実性が大きくなります。

サンプルサイズの式

  • Z = Z値(例:95%の信頼レベルの場合は1.96)

  • p =選択肢を選択する割合。10進数で表されます(必要なサンプルサイズに0.5を使用)

  • c =信頼区間、10進数で表されます(例:.04 =±4)

有限母集団の補正式

制限

信頼区間の計算では、影響を受ける母集団の真のランダムサンプルがあることを前提としています。

サンプルが本当にランダムでない場合、間隔を信頼することはできません。

イラスト

コルシカを除くフランス本土の場合:

  • 私の製品のDNVが 100% 、推定販売台数が100ユニットの場合、信頼区間 0.68% は、95%の私の実際の販売が99.32ユニットから100.68ユニットの間であることは幸運です。不確実性は低いです。

  • 私の製品のDNVが 1% 、推定販売台数が100ユニットの場合、信頼区間 9.05% は、95個あることを意味します。私の実際の売上高が90.95ユニットから109.05ユニットの間である可能性の割合。不確実性はより大きくなります。

こちらの回答で解決しましたか?