Huvudsaklig komponentanalys

ACP

Sébastien MEIGE avatar
Skrivet av Sébastien MEIGE
Uppdaterad för mer än en vecka sedan

Introduktion till CPA

PCA är en statistisk metod, relaterad till familjen av multivariat statistik, baserad på minskningen av dimensioner vars mål är att förstå vad som diskriminerar grupper av individer.

Den består i att studera flerdimensionella data genom att förvandla dem till nya avkorrelerade variabler. Det är dessa nya variabler som vi kallar huvudkomponenterna eller huvudaxlarna.

En av fördelarna med PCA är att möjliggöra visualisering av flerdimensionella data i ett tvådimensionellt plan, samtidigt som förlusten av information minimeras, kallad statistisk tröghet.

CPA: s intressen

PCA är en mycket visuell statistisk metod som möjliggör:

  • båda för att studera sambandet mellan variabler,

  • också för att bestämma homogena grupper av individer inom samma grupp och differentierade mellan olika grupper.

Den kan tillämpas på många fält och gör det möjligt att få visuella och lättförklarliga resultat när det gäller tolkning.

Tillämpning av PCA på seroprevalensstudien SEROCOV56

I SEROCOV56-studien användes PCR för att observera skillnaderna i positiva tester mellan olika kit.

En av de underliggande tolkningarna är att närma sig en form av utseendekinetik mellan testresultaten.

Innan PCA applicerades normaliserades de optiska densiteterna för att kunna jämföra dem med varandra.

Resultaten för grafen för korrelationerna mellan huvudaxlarna var följande:

Från ratten längst upp till höger till ratten längst ner till höger, observerar vi en form av utseende kinetik (identisk med den som observerades under analysen av överensstämmelsestest i samma studie) , nämligen:

1. IgM,

2. IgA,

3. IgG "Spike",

4. IgG "Nucleocapsid".

Dessa första resultat tycks indikera en kinetik för utseendet (IgM > IgA > IgG "Spike" > IgG "Nucleocapsid"), vilket leder till intresset att använda alla kit .

Obs:

I vårt fall är användningen av PCA inte förknippad med en riskfaktoranalys, genom associering med variabler av intresse och som kan erhållas via en regression vid minskat antal (RRR-metod).

För mer information om PCA och dataanalys

Fick du svar på din fråga?