Analyse en Composantes Principales

ACP

Sébastien MEIGE avatar
Écrit par Sébastien MEIGE
Mis à jour il y a plus d’une semaine

Introduction à l'ACP

L'ACP est une méthode statistique, apparentée à la famille des statistiques multivariées, basée sur la réduction de dimensions dont l’objectif est de comprendre ce qui discrimine des groupes d’individus.

Elle consiste à étudier des données multidimensionnelles en les transformant en nouvelles variables décorrélées. Ce sont ces nouvelles variables que l'on appelle les composantes principales ou axes principaux.

L'un des avantages de l'ACP est de permettre des visualisations de données multidimensionnelles dans un plan à 2 dimensions, en minimisant la perte d'information, appelée en statistique inertie.

Intérêts de l'ACP

L'ACP est une méthode statistique très visuelle permettant :

  • à la fois d'étudier les corrélations entre les variables,

  • aussi de déterminer des groupes d'individus homogènes au sein du même groupe et différenciés entre les différents groupes.

Elle peut être appliquée à de nombreux domaines, et permet d'obtenir des résultats visuels et facilement explicables en termes d'interprétation.

Application de l'ACP à l'étude de séroprévalence SEROCOV56

Dans le cadre de l'étude SEROCOV56, l'ACP a été utilisée pour observer les différences des tests positifs entre les différents kits.

L’une des interprétations sous-jacente étant d'approcher une forme de cinétique d'apparition entre les résultats des tests.

Avant d'appliquer l'ACP, les densités optiques ont été normalisées afin de pouvoir les comparer entre elles.

Les résultats obtenus pour le graphique des corrélations des axes principaux ont été les suivants :

En partant du cadran en haut à droite vers le cadran en bas à droite, nous observons une forme de cinétique d’apparition (identique à celle relevée lors de l'analyse des tests de concordance de la même étude), à savoir :

1. IgM,

2. IgA,

3. IgG « Spike »,

4. IgG « Nucleocapside ».

Ces premiers résultats semblent indiquer une cinétique d’apparition (IgM > IgA > IgG « Spike » > IgG « Nucleocapside »), amenant à l’intérêt de se servir de l’ensemble des kits.

A noter :

Dans notre cas, l’usage de l’ACP n’est pas associé à une analyse de facteur de risques, par association à des variables d’intérêt et pouvant être obtenus via une régression à rangs réduits (méthode RRR).

Pour aller plus d'informations sur l'ACP et l'analyse de données

Avez-vous trouvé la réponse à votre question ?