Introduzione al CPA
PCA è un metodo statistico, relativo alla famiglia delle statistiche multivariate, basato sulla riduzione delle dimensioni il cui obiettivo è capire cosa discrimina tra gruppi di individui.
Consiste nello studio di dati multidimensionali trasformandoli in nuove variabili decorrelate. Sono queste nuove variabili che chiamiamo componenti principali o assi principali.
Uno dei vantaggi della PCA è di consentire la visualizzazione di dati multidimensionali su un piano bidimensionale, riducendo al minimo la perdita di informazioni, chiamata inerzia statistica.
Interessi del CPA
PCA è un metodo statistico molto visivo che consente:
entrambi per studiare le correlazioni tra variabili,
anche per determinare gruppi omogenei di individui all'interno dello stesso gruppo e differenziati tra gruppi diversi.
Può essere applicato a molti campi, e permette di ottenere risultati visivi e facilmente spiegabili in termini di interpretazione.
Applicazione della PCA allo studio di sieroprevalenza SEROCOV56
Nello studio SEROCOV56, la PCR è stata utilizzata per osservare le differenze nei test positivi tra diversi kit.
Una delle interpretazioni sottostanti è quella di avvicinarsi a una forma di cinetica dell'aspetto tra i risultati del test.
Prima di applicare il PCA, le densità ottiche sono state normalizzate per poterle confrontare tra loro.
I risultati ottenuti per il grafico delle correlazioni degli assi principali sono stati i seguenti:
Partendo dal quadrante in alto a destra fino al quadrante in basso a destra, si osserva una forma di cinetica dell'aspetto (identica a quella osservata durante l'analisi dei test di concordanza dello stesso studio) , ovvero:
1. IgM,
2. IgA,
3. IgG "Spike",
4. IgG "Nucleocapsid".
Questi primi risultati sembrano indicare una cinetica dell'aspetto (IgM > IgA > IgG "Spike" > IgG "Nucleocapsid"), che porta all'interesse di utilizzare tutti i kit .
Nota:
Nel nostro caso, l'uso della PCA non è associato ad un'analisi dei fattori di rischio, per associazione con variabili di interesse e che può essere ottenuta tramite una regressione a ranghi ridotti (metodo RRR).