Hovedkomponentanalyse

AVS

Sébastien MEIGE avatar
Skrevet av Sébastien MEIGE
Oppdatert over en uke siden

Introduksjon til CPA

PCA er en statistisk metode, relatert til familien av multivariat statistikk, basert på reduksjon av dimensjoner hvis mål er å forstå hva som diskriminerer grupper av individer.

Den består i å studere flerdimensjonale data ved å transformere dem til nye dekorrelerte variabler. Det er disse nye variablene vi kaller hovedkomponentene eller hovedaksene.

En av fordelene med PCA er å tillate visualiseringer av flerdimensjonale data i et todimensjonalt plan, samtidig som tap av informasjon, kalt statistisk treghet, minimeres.

CPAs interesser

PCA er en veldig visuell statistisk metode som tillater:

  • begge for å studere sammenhenger mellom variabler,

  • også for å bestemme homogene grupper av individer i samme gruppe og differensiert mellom forskjellige grupper.

Den kan brukes på mange felt, og gjør det mulig å oppnå visuelle og lett forklarbare resultater når det gjelder tolkning.

Anvendelse av PCA på seroprevalensstudien SEROCOV56

I SEROCOV56-studien ble PCR brukt til å observere forskjellene i positive tester mellom forskjellige sett.

En av de underliggende tolkningene er å nærme seg en form for utseende kinetikk mellom testresultatene.

Før du anvender PCA, ble de optiske tettheter normalisert for å kunne sammenligne dem med hverandre.

Resultatene oppnådd for grafen over korrelasjonene til hovedaksene var som følger:

Fra skiven øverst til høyre til skiven nederst til høyre observerer vi en form for utseende kinetikk (identisk med den som ble observert under analysen av samsvarstestene i samme studie) , nemlig:

1. IgM,

2. IgA,

3. IgG "Spike",

4. IgG "Nucleocapsid".

Disse første resultatene ser ut til å indikere en kinetikk for utseende (IgM > IgA > IgG "Spike" > IgG "Nucleocapsid"), noe som fører til interessen for å bruke alle settene .

Merk:

I vårt tilfelle er ikke bruk av PCA assosiert med en risikofaktoranalyse, ved tilknytning til variabler av interesse og som kan oppnås via en regresjon ved reduserte ranger (RRR-metoden).

For mer informasjon om PCA og dataanalyse

Svarte dette på spørsmålet?