Logo Dielnet www.dielnet.it

STATISTICA

Statistica

I metodi statistici, negli ultimi anni, hanno assunto un ruolo sempre più importante nel settore socio-sanitario e in particolare in quello della ricerca medica. L'esigenza principale è quella di trattare e interpretare una grossa mole di dati messi a disposizione dagli operatori sanitari in relazione alle innovazioni tecnologiche e alla scoperta di nuove tecniche mediche e farmacologiche.
I dati qualitativi e quantitativi, se elaborati correttamente e velocemente utilizzando le opportune metodiche statistiche permettono di eseguire delicate sperimentazioni cliniche.
Nel campo della statistica applicata agli studi clinici, gli elementi appartenenti alla popolazione sottoposta ad osservazione (in genere pazienti) prendono il nome di UNITA' STATISTICHE.
Ogni unità statistica avrà delle caratteristiche proprie (ad esempio il sesso, l'altezza, il peso), queste vengono definite CARATTERI dell'unità statistica o VARIABILI.
Queste variabili possono essere di tipo QUALITATIVO o QUANTITATIVO.
Le variabili di tipo qualitativo sono ad esempio il sesso (maschio, femmina), la nazionalità (italiana, straniera) e vengono quindi definiti da degli aggettivi a cui può essere assegnato un codice numerico (ad es. maschio = 1, femmina = 2).
Le variabili quantitative sono riferite ad intensità misurabili ad esempio l'età o l'altezza. Le variabili quantitative si dividono a loro volta in discrete e continue. L'età appartiene alla categoria delle variabili discrete perché può assumere un numero finito di valori rappresentabile da numeri naturali mentre l'altezza è un carattere di tipo continuo perché può assumere anche valori compresi in un intervallo ed è rappresentata attraverso numeri reali.
Quando si procede alla stesura di un lavoro scientifico, la prima operazione è la rappresentazione dei dati attraverso statistiche descrittive: frequenze; medie semplici e ponderate; deviazione standard.
Se tali statistiche descrittive vengono considerate in un intervallo di tempo, assumono il significato di tassi.
Vediamo i tassi più importanti:
- Il tasso di incidenza descrive il numero di nuovi casi all'interno di un gruppo di individui a rischio:
tasso di incidenza = (numero di nuovi casi di malattia in un anno/numero totale di soggetti esposti al rischio) x K
dove K dipende dal numeratore. Si sceglie solitamente K=100 per le malattie comuni, mentre per le malattie rare si usa K=100000
- Il tasso di prevalenza fornisce una misura del diffondersi di una malattia all'interno di una popolazione. E' definito come:
tasso di prevalenza = numero di persone con una malattia in un certo istante/numero totale del gruppo in quell'istante.
- Tassi di mortalità. I tassi di mortalità indicano la frequenza con cui l'evento morte si manifesta in un determinato intervallo di tempo in una data popolazione. Il denominatore dei tassi di mortalità è formato dalla popolazione a rischio mentre il numeratore è dato dalle morti avvenute relativamente alla popolazione considerata nel denominatore. Vediamo i tassi di mortalità più utilizzati:
  • tasso grezzo di mortalità annuale =(numero di morti in un anno solare/popolazione totale) x K con K generalmente uguale a 1000
  • tasso di mortalità infantile= (numero di decessi con meno di un anno di vita/numero dei nati vivi in un anno) x K

Infine accenniamo ad alcuni tassi di fecondità che indicano come una collettività si riproduce:
  • tasso grezzo di natività = (numero dei nati vivi in un anno/popolazione totale) x 1000
  • tasso di fecondità generale = (numero di nati vivi in un anno/numero di donne in età feconda) x 1000
  • tasso di fecondità specifico per età = (numero di nati da donne di una particolare età in un anno/numero di donne con quella particolare età) x 1000.
Statistica
Nel campo degli studi clinici molto utilizzata è l'analisi della sopravvivenza. Il modo più semplice per descrivere la sopravvivenza in un campione è quello di stimarne la Life Table. Questa tecnica rientra fra i metodi più “antichi” per l'analisi dei dati (tempi) di
sopravvivenza, risale infatti ai primi anni '50 il suo primo utilizzo. Questa tabella può essere pensata come una tabella di distribuzione della frequenza; tale distribuzione dei tempi di sopravvivenza è divisa in un certo numero di intervalli. Per ciascuno di questi possiamo stimare il numero e la proporzione di casi (o oggetti) che sono entrati funzionanti nell'intervallo in esame, il numero di fallimenti, e il numero di casi censurati.
Negli ultimi anni con le nuove metodologie statistiche, la tecnica Life Table è stata sostituita con delle funzioni, come ad esempio la funzione di Kaplan-Meyer: Al posto di classificare i tempi di sopravvivenza osservati in una Life Table, possiamo stimare la funzione di sopravvivenza direttamente dai tempi continui di sopravvivenza o fallimento. Intuitivamente, immaginiamo di creare una Life Table in modo tale che ogni intervallo di tempo contenga esattamente un caso. Moltiplicando le probabilità di sopravvivenza negli intervalli (cioè, per ogni singola osservazione) potremmo stimare la funzione di sopravvivenza.
Oltre alla funzione di soppravvivenza, con l'analisi di Kaplan-Meyer è molto importante la costruzione della curva di sopravvivenza considerando per il periodo di tempo prestabilito tutte le unità statistiche, interrompendo lo studio di ogni unità statistica o al momento dell'evento oggetto dello studio (fallimento) o alla fine del periodo di osservazione (censurati). In molti studi risulta molto interessante il confronto tra curve di sopravvivenza.
Il test da utilizzare è il log rank test. Nonostante il nome di questo test alluda ai logaritmi e ai ranghi esso non ha nulla a che fare né con i logaritmi né con i ranghi. Per capire il procedimento alla base del test facciamo un esempio pratico. Supponiamo di avere a che fare con due gruppi di pazienti costituiti entrambi da 6 soggetti e di voler confrontare la sopravvivenza del
gruppo esposto al fattore di rischio (Gruppo 1) con quella del gruppo non esposto (Gruppo 2).
Il nostro obiettivo è verificare se la differenza di sopravvivenza tra i due gruppi è o meno statisticamente significativa ovvero se
a sopravvivenza è più bassa nel gruppo con il fattore di rischio rispetto al gruppo senza il fattore di rischio.
Praticamente si costruisce una tabella dove si inseriscono tutti i casi di ogni gruppo in due colonne differenti. Poi segnaliamo i censurati per ogni gruppo, gli eventi e infine ci calcoliamo la mortalità attesa dei due gruppi; Per mortalità attesa in un gruppo s'intende il massimo contributo in termini di mortalità che quel Gruppo può dare nell'ambito del totale dei pazienti a rischio. Fatto questo si passa al calcolo del long frank test che è dato da un rapporto dove al numeratore c'è il quadrato della somma tra mortalità attesa e mortalità osservata (numero di casi persi per il verificarsi dell'evento) e al denominatore c'è la somma dei prodotti delle mortalità attese nei due gruppi. Il valore che esce da questo rapporto deve essere confrontato con le tavole del chi quadro per stabilire la significatività statistica. Affinché un log rank test sia statisticamente significativo (P<0.05) è necessario che abbia un valore di almeno 3.84.

L'analisi del Kaplan-Meyer è una delle tante metodologie applicate gli studi clinici. Tanti sono i test utilizzati per fare confronti tra gruppi di unità statistiche o fare analisi nel tempo.

Al di là dei test statistici utilizzati a seconda della tipologia del campione e delle variabili, la cosa più importante è capire che oggi l'utilizzo delle statistiche diventa determinante per il miglioramento delle metodologie cliniche e farmacologiche.