Hovedkomponentanalyse

AVS

Sébastien MEIGE avatar
Skrevet af Sébastien MEIGE
Opdateret over en uge siden

Introduktion til CPA

PCA er en statistisk metode, der er relateret til familien af multivariate statistikker, baseret på reduktion af dimensioner, hvis mål er at forstå, hvad der skelner mellem grupper af individer.

Den består i at studere flerdimensionelle data ved at omdanne dem til nye dekorrelerede variabler. Det er disse nye variabler, som vi kalder de vigtigste komponenter eller hovedakser.

En af fordelene ved PCA er at tillade visualisering af flerdimensionelle data i et 2-dimensionelt plan, samtidig med at tab af information minimeres, kaldet i statistisk inerti.

CPA's interesser

PCA er en meget visuel statistisk metode, der tillader:

  • begge for at undersøge sammenhængen mellem variabler,

  • også for at bestemme homogene grupper af individer inden for den samme gruppe og differentieret mellem forskellige grupper.

Det kan anvendes på mange felter og giver mulighed for at opnå visuelle og let forklarbare resultater med hensyn til fortolkning.

Anvendelse af PCA til seroprevalensundersøgelsen SEROCOV56

I SEROCOV56-undersøgelsen blev PCR brugt til at observere forskellene i positive tests mellem forskellige sæt.

En af de underliggende fortolkninger er at nærme sig en form for udseende kinetik mellem testresultaterne.

Før der blev anvendt PCA, blev de optiske densiteter normaliseret for at kunne sammenligne dem med hinanden.

Resultaterne opnået for grafen for sammenhængen mellem hovedakserne var som følger:

Startende fra urskiven øverst til højre til urskiven nederst til højre, observerer vi en form for udseende kinetik (identisk med den, der blev observeret under analysen af overensstemmelsestestene i samme undersøgelse) , nemlig:

1. IgM,

2. IgA,

3. IgG "Spike",

4. IgG "Nucleocapsid".

Disse første resultater synes at indikere en kinetik for udseende (IgM > IgA > IgG "Spike" > IgG "Nucleocapsid"), hvilket fører til interessen for at bruge alle kits .

Bemærk:

I vores tilfælde er brugen af PCA ikke forbundet med en risikofaktoranalyse ved tilknytning til variabler af interesse, og som kan opnås via en regression ved reduceret antal (RRR-metode).

For mere information om PCA og dataanalyse

Besvarede dette dit spørgsmål?