Un'infrastruttura informatica a supporto di studi epidemiologici multicentrici su sistemi informativi sanitari: il software open source TheMatrix (dicembre 2015)


immagine presentazione software TheMatrixIn molti paesi sono in sviluppo infrastrutture che consentono l'analisi distribuita di dati sanitari. Questa architettura prevede che i dati vengano trattati all'interno delle istituzioni che li hanno in custodia, ma con un software comune. Ogniqualvolta che si sviluppa un protocollo di studio, i partner ricevono il software e lo eseguono. Il risultato del trattamento è un dataset che contiene unicamente i dati necessari per l'analisi prevista dal protocollo. I dataset vengono conferiti alla sede del ricercatore principale, che provvede all'analisi statistica. Le risorse messe a disposizione dai partner locali possono essere così essere usate per discutere il disegno di studio, stendere il protocollo e discutere i risultati, invece che per programmare i software locali.

In Italia è stato sviluppato un software open source chiamato TheMatrix, che facilita l'analisi distribuita dei sistemi informativi delle aziende sanitarie e delle regioni. All'interno del progetto MATRICE-BPCO dell'Agenas è stato utilizzato TheMatrix per svolgere uno studio sui sistemi informativi di quattro regioni italiane (Emilia-Romagna, Toscana, Puglia e Sicilia), con l'obiettivo di testare l'infrastruttura informatica di TheMatrix. Sono stati registrati i tempi di esecuzione dei passaggi e l'impegno dei soggetti coinvolti. La numerosità delle popolazioni estratte dal software è stata comparata con la numerosità delle popolazioni registrate nell'anagrafe Istat. I risultati dello studio sono stati discussi con i partner locali per individuare criticità nella qualità del dato risalenti alla modalità del trattamento.

RISULTATI. In due regioni (Emilia-Romagna e Toscana) il software era già installato, nelle altre due (Puglia e Sicilia) l'installazione è avvenuta durante il progetto. In queste ultime, il processo ha richiesto circa due settimane-persona di attività di un referente locale, distribuite nel periodo in cui veniva sviluppato il protocollo di studio (circa quattro mesi). Il supporto centrale ha fornito documentazione e assistenza telefonica. Nelle altre due regioni l'impegno per aggiornare l'installazione è stato di due giorni-persona. Quando il protocollo è stato completato, il programmatore di TheMatrix ha sviluppato e testato lo script per il trattamento del dato in sei giorni. Tra il momento della trasmissione dello script e il conferimento dei dataset aggregati risultanti dal trattamento è trascorsa una settimana. La  numerosità della popolazione trattata da TheMatrix e ricavata dall'anagrafe dell'Istat, rispettivamente, è stata di 4.546.664 e 4.446.354 in Emilia-Romagna, di 3.725.329 e 3.750.511 in Toscana, di 3.804.735 e 4.090.266 in Puglia, di 4.990.343 e 5.094.937 in Sicilia. La discussione dei risultati dello studio non ha rilevato criticità riferibili alla modalità del trattamento.

CONCLUSIONI. L'infrastruttura di TheMatrix consente lo svolgimento in tempi rapidi di studi epidemiologici multicentrici da sistemi informativi su ampie popolazioni.

Consulta e scarica la presentazione