Tutte le collezioni
I MODELLI
QUALITÀ dei dati
Intervallo e livello di confidenza
Intervallo e livello di confidenza

Definizioni, formule e limitazioni: cosa devi sapere

Maxime LE MOIGNIC avatar
Scritto da Maxime LE MOIGNIC
Aggiornato oltre una settimana fa

Quando non hanno il censimento dei punti vendita che coprono, OpenHealth e i suoi partner europei consentono ai propri clienti di seguire i dati modellati su base nazionale, vale a dire ovvero estrapolati da un campione di punti vendita. Sebbene questi dati estrapolati forniscano ai nostri utenti una base molto solida per le loro analisi di mercato, tuttavia comportano un margine di incertezza statistica, la cui entità dipende da diversi fattori descritti di seguito.

Definizioni

Intervallo di fiducia:

Un intervallo di confidenza inquadra un valore reale che cerchiamo di stimare utilizzando misurazioni prese da un processo casuale. Questo concetto consente di definire un margine di incertezza statistica.

Livello di fiducia:

Un livello di confidenza rappresenta il livello di certezza ed è espresso in%. Un livello di confidenza del 95% è più comunemente utilizzato negli studi statistici.

Fattori che influenzano la dimensione dell'intervallo per un dato livello di confidenza

Esistono 4 fattori che determinano la dimensione dell'intervallo di confidenza per un dato livello di confidenza:

  • Dimensione campione

  • La percentuale

  • La dimensione della popolazione

  • Il periodo di tempo

La dimensione del campione

Maggiore è la dimensione del campione, più i risultati rifletteranno veramente la popolazione. Ciò indica che per un dato livello di confidenza, maggiore è la dimensione del campione, minore è l'intervallo di confidenza. Tuttavia, la relazione non è lineare (ovvero, raddoppiare la dimensione del campione non dimezza l'intervallo di confidenza).

La percentuale

precisione dipende anche dalla percentuale del campione che sceglie una particolare risposta. Se il 99% del campione ha risposto "Sì" e l'1% ha risposto "No", le possibilità di incertezza statistica sono basse, indipendentemente dalla dimensione del campione. Tuttavia, se le percentuali sono del 51% e del 49%, le possibilità di incertezza statistica sono molto maggiori. Le risposte estreme sono più facili da essere sicuri delle risposte intermedie.

La dimensione della popolazione

È probabile che la dimensione della popolazione sia un fattore importante solo quando si lavora con una popolazione relativamente piccola.

Il periodo di tempo

La distribuzione digitale di vendita dipenderà dal periodo di tempo studiato. Un DNV sarà giornaliero inferiore e quindi maggiore incertezza.

Esempio di formula delle dimensioni

  • Z = valore Z (ad es. 1,96 per un livello di confidenza del 95%)

  • p = percentuale di scelta di una scelta, espressa come decimale (.5 utilizzato per la dimensione del campione necessaria)

  • c = intervallo di confidenza, espresso come decimale (ad esempio, .04 = ± 4)

Formula di correzione per la popolazione finita

Limitazioni

calcoli dell'intervallo di confidenza presumono che tu abbia un vero campione casuale della popolazione interessata.

Se il tuo campione non è veramente casuale, non puoi fidarti degli intervalli.

illustrazioni

Per la Francia continentale tranne la Corsica:

  • Se il mio prodotto ha un DNV del 100% e vendite estrapolate di 100 unità, un intervallo di confidenza dello 0,68% significa che c'è il 95% di fortunato che le mie vendite effettive siano comprese tra 99,32 unità e 100,68 unità. L'incertezza è bassa.

  • Se il mio prodotto ha un DNV di 1% e vendite estrapolate di 100 unità, un intervallo di confidenza di 9,05% significa che ci sono 95 % di probabilità che le mie vendite effettive siano comprese tra 90,95 unità e 109,05 unità. L'incertezza è maggiore.

Hai ricevuto la risposta alla tua domanda?