Quelques définitions préalables

  • Séroprévalence : Part de la population ciblée affectée par un virus

  • Test sérologique : test sanguin mesurant la présence d'anticorps reflétant l'immunité du patient à une nouvelle infection

  • Echantillonnage : étape de sélection des individus à interrogée dans la population ciblée  

Principes de l'échantillonnage aléatoire stratifié
Parmi les méthodes d'échantillonnage disponibles, cette méthode consiste dans un premier temps à constituer des strates relativement homogènes dans une population ciblée. Dans un second temps de déterminer des échantillons au sein de chacune des strates.
La stratification d'une population est construite  à partir de variables d'intérêt choisies en fonction de l'étude et qui peuvent être de plusieurs types :

  • Des variables démographiques (âge, sexe, etc.)

  • Des variables géographiques (régions, départements, communs, etc.)

  • Des variables sociologiques (statut matrimonial, familial, etc.)

  • Des variables socio-économiques (activité professionnelle, revenu, etc.)

Le choix de ces variables nécessite que ces variables soient connues dans la population ciblée pour être prises en compte dans l'étape de construction des strates.
Chaque strate devra être strictement exclusive, c'est à dire qu'un individu ne peut appartenir qu'à une seule strate.
Dans le cas de strate relativement homogène, il est possible d'avoir une approche proportionnelle dans le choix de l'échantillon de chaque strate. Autrement dit, chaque strate de l'échantillon aura la même représentativité par rapport aux strates de la population ciblée.
L'un des objectifs est, dans ce qui est appelée l'inférence statistique, de pouvoir dégager des conclusions généralisées à la population ciblée, à partir des résultats de l'échantillon.

Exemple de plan d'échantillonnage aléatoire stratifié appliqué au département du Morbihan

Considérons la population cible, comme l'ensemble des habitants du Morbihan (recensement INSEE dont les données sont disponibles en Opendata à l'adresse suivante : https://www.insee.fr/fr/statistiques/1893198), dont la résidence principale est dans le département, au 1er janvier 2020.
Les variables d'intérêt retenues sont les sexes et les tranches d'âge (pour 17 tranches d'âge de 5 ans) des habitants du Morbihan.
Nous avons alors 34 strates (2 sexes x 17 tranches d'âges) dans la population ciblée réparties de la façon suivante :

Les populations de chacune des strates sont relativement homogènes, ce qui assure que la méthode est adaptée.
A l'aide des effectifs de population, nous pouvons calculer une part de la population pour chacune des strates.
En appliquant la même représentativité de population à un échantillon de 1.000 individus, nous obtenons alors la stratification suivante :

Pour mesurer la précision souhaitée, le niveau de confiance, généralement fixé à 95%, permet de calculer un intervalle de de confiance. L'intervalle de confiance permettra de définir une marge d'erreur et calculée selon les règles décrites dans l'artcile ci-dessous :
http://success.openhealth.fr/fr/articles/3928466-intervalle-de-confiance

Cet échantillon peut constituer la cible à interroger dans chacune des strates pour être représentatif de la population cible et constitue la première phase de l'échantillonnage.

La seconde phase de l'échantillonnage consiste à choisir les individus qui doivent être interrogés dans chacune des strates.
Le tirage des individus de l'échantillon peut être considéré comme un tirage aléatoire sans remise : on tire aléatoirement un individu répondant aux critères d'inclusion, mais cet individu ne sera pas réinterrogé.

Dans les phases d'analyses, les individus interrogés peuvent être soumis à un questionnaire permettant un enrichissement de variables descriptives, potentiellement exploitées par la suite. Ceci permettant d'affiner les analyses sur des sous-populations.

Application aux tests sérologiques du virus SARS-CoV-2

Pour mener une enquête de séroprévalence du virus SARS-CoV-2 au sein du département du Morbihan, nous pouvons reprendre la méthode d'échantillonnage ci-dessus, représentatif de la population du département, dans le cadre d'une étude incluant les patients asymptomatiques.

La mesure de la qualité d'un test, particulièrement en épidémiologie est mesurer par 2 facteurs :

  • la sensibilité (capacité à donner un résultat positif)

  • la spécificité ( capacité d'un test à donner un résultat négatif) .

Vous pouvez retrouver un descriptif détaillé de ces 2 notions dans l'article suivant :
http://success.openhealth.fr/fr/articles/3928135-sensibilite-et-specificite-d-un-test


Les individus devront être interrogés devront être choisis aléatoirement pour atteindre les effectifs de représentativité de chaque strate.
Les participants à l'étude devront, en respectant le plus strict anonymat :

  • Réaliser un test sérologique qui sera analysé pour valider la présence d'anticorps d'immunoglobuline de type M (IgM), de type G (IgG), voir de type A (IgA).

  • Répondre à un questionnaire permettant un enrichissement des données comme par exemple :

critères de vulnérabilité : >65 ans, diabétique, souffrant de maladies cardio-vasculaires ou des voies respiratoires, faiblesses immunitaires dues à une maladie ou à une thérapie, avec un cancer actif ou obèse
lieu d'habitation : collectif ou individuel
activité professionnelle profession et possibilité d'exercer cette fonction en temps de confinement
handicap  

L'ensemble de ces informations permettraient :

  • d'estimer l'immunité sur une population large,

  • de suivre l'évolution épidémique,

  • de cibler les facteurs de risque dans les populations séropositives

Avez-vous trouvé votre réponse?