Alle collecties
Principale componentenanalyse
Principale componentenanalyse
Sébastien MEIGE avatar
Geschreven door Sébastien MEIGE
Meer dan een week geleden bijgewerkt

Inleiding tot PCA

PCA is een statistische methode, verwant aan de familie van multivariate statistiek, gebaseerd op de reductie van dimensies, met als doel te begrijpen wat onderscheid maakt tussen groepen individuen.

Hierbij worden multidimensionale gegevens bestudeerd door ze te transformeren in nieuwe, decorrelatieve variabelen. Deze nieuwe variabelen worden principale componenten of principale assen genoemd.

Een van de voordelen van PCA is dat multidimensionale gegevens kunnen worden bekeken in een tweedimensionaal vlak, terwijl het verlies aan informatie, in de statistiek bekend als traagheid, wordt geminimaliseerd.

Belangen van de CPA

PCA is een zeer visuele statistische methode voor :

  • om de correlaties tussen de variabelen te bestuderen,

  • ook om groepen individuen te identificeren die homogeen zijn binnen dezelfde groep en gedifferentieerd tussen verschillende groepen.

Het kan worden toegepast op een groot aantal gebieden en levert visuele resultaten die eenvoudig te interpreteren zijn.

Toepassing van PCA op het SEROCOV56-seroprevalentieonderzoek

In het SEROCOV56-onderzoek werd PCA gebruikt om de verschillen in positieve tests tussen de verschillende kits te observeren.

Een van de onderliggende interpretaties is het benaderen van een vorm van verschijningskinetiek tussen testresultaten.

Voordat de PCA werd toegepast, werden de optische dichtheden genormaliseerd zodat ze met elkaar vergeleken konden worden.

De resultaten voor de correlatiegrafiek van de hoofdassen waren als volgt:

Van de rechterbovenhoek naar de rechterbenedenhoek zien we een patroon van verschijningskinetiek (identiek aan het patroon dat werd gevonden toen de concordantietests in hetzelfde onderzoek werden geanalyseerd):

1. IgM,

2. IgA,

3. piek IgG,

4. nucleocapsid IgG.

Deze eerste resultaten lijken te wijzen op een kinetisch verschijningspatroon (IgM > IgA > IgG "Spike" > IgG "Nucleocapside"), wat suggereert dat het nuttig zou zijn om alle kits te gebruiken.

Let op:

In ons geval is het gebruik van PCA niet gekoppeld aan een analyse van risicofactoren, door associatie met variabelen die van belang zijn en die kunnen worden verkregen via gereduceerde rangregressie (RRR-methode).

Voor meer informatie over PCA en gegevensanalyse

Was dit een antwoord op uw vraag?