Introduksjon til CPA
PCA er en statistisk metode, relatert til familien av multivariat statistikk, basert på reduksjon av dimensjoner hvis mål er å forstå hva som diskriminerer grupper av individer.
Den består i å studere flerdimensjonale data ved å transformere dem til nye dekorrelerte variabler. Det er disse nye variablene vi kaller hovedkomponentene eller hovedaksene.
En av fordelene med PCA er å tillate visualiseringer av flerdimensjonale data i et todimensjonalt plan, samtidig som tap av informasjon, kalt statistisk treghet, minimeres.
CPAs interesser
PCA er en veldig visuell statistisk metode som tillater:
begge for å studere sammenhenger mellom variabler,
også for å bestemme homogene grupper av individer i samme gruppe og differensiert mellom forskjellige grupper.
Den kan brukes på mange felt, og gjør det mulig å oppnå visuelle og lett forklarbare resultater når det gjelder tolkning.
Anvendelse av PCA på seroprevalensstudien SEROCOV56
I SEROCOV56-studien ble PCR brukt til å observere forskjellene i positive tester mellom forskjellige sett.
En av de underliggende tolkningene er å nærme seg en form for utseende kinetikk mellom testresultatene.
Før du anvender PCA, ble de optiske tettheter normalisert for å kunne sammenligne dem med hverandre.
Resultatene oppnådd for grafen over korrelasjonene til hovedaksene var som følger:
Fra skiven øverst til høyre til skiven nederst til høyre observerer vi en form for utseende kinetikk (identisk med den som ble observert under analysen av samsvarstestene i samme studie) , nemlig:
1. IgM,
2. IgA,
3. IgG "Spike",
4. IgG "Nucleocapsid".
Disse første resultatene ser ut til å indikere en kinetikk for utseende (IgM > IgA > IgG "Spike" > IgG "Nucleocapsid"), noe som fører til interessen for å bruke alle settene .
Merk:
I vårt tilfelle er ikke bruk av PCA assosiert med en risikofaktoranalyse, ved tilknytning til variabler av interesse og som kan oppnås via en regresjon ved reduserte ranger (RRR-metoden).