Gå til hovedinnhold
Hovedkomponentanalyse

AVS

Sébastien MEIGE avatar
Skrevet av Sébastien MEIGE
Oppdatert for over 4 år siden

Introduksjon til CPA

PCA er en statistisk metode, relatert til familien av multivariat statistikk, basert på reduksjon av dimensjoner hvis mål er å forstå hva som diskriminerer grupper av individer.

Den består i å studere flerdimensjonale data ved å transformere dem til nye dekorrelerte variabler. Det er disse nye variablene vi kaller hovedkomponentene eller hovedaksene.

En av fordelene med PCA er å tillate visualiseringer av flerdimensjonale data i et todimensjonalt plan, samtidig som tap av informasjon, kalt statistisk treghet, minimeres.

CPAs interesser

PCA er en veldig visuell statistisk metode som tillater:

  • begge for å studere sammenhenger mellom variabler,

  • også for å bestemme homogene grupper av individer i samme gruppe og differensiert mellom forskjellige grupper.

Den kan brukes på mange felt, og gjør det mulig å oppnå visuelle og lett forklarbare resultater når det gjelder tolkning.

Anvendelse av PCA på seroprevalensstudien SEROCOV56

I SEROCOV56-studien ble PCR brukt til å observere forskjellene i positive tester mellom forskjellige sett.

En av de underliggende tolkningene er å nærme seg en form for utseende kinetikk mellom testresultatene.

Før du anvender PCA, ble de optiske tettheter normalisert for å kunne sammenligne dem med hverandre.

Resultatene oppnådd for grafen over korrelasjonene til hovedaksene var som følger:

Fra skiven øverst til høyre til skiven nederst til høyre observerer vi en form for utseende kinetikk (identisk med den som ble observert under analysen av samsvarstestene i samme studie) , nemlig:

1. IgM,

2. IgA,

3. IgG "Spike",

4. IgG "Nucleocapsid".

Disse første resultatene ser ut til å indikere en kinetikk for utseende (IgM > IgA > IgG "Spike" > IgG "Nucleocapsid"), noe som fører til interessen for å bruke alle settene .

Merk:

I vårt tilfelle er ikke bruk av PCA assosiert med en risikofaktoranalyse, ved tilknytning til variabler av interesse og som kan oppnås via en regresjon ved reduserte ranger (RRR-metoden).

For mer informasjon om PCA og dataanalyse

Svarte dette på spørsmålet?