Depressione postpartum: un algoritmo per l’identificazione precoce delle donne a rischio basato sui dati amministrativi della Toscana. Insignito del Premio Maccacaro il lavoro targato ARS-UniFI


22/4/2024
A cura di: Martina Pacifici*, Monia Puglia*, Caterina Silvestri*, Caterina Milli*, Michela Baccini°§, Fabio Voller

*  Osservatorio di Epidemiologia, Agenzia Regionale di Sanità della Toscana, Firenze (FI)
°  Dipartimento di Statistica e Applicazioni Giuseppe Parenti, Università degli Studi di Firenze, Firenze (FI)
§  Co-senior authorship

Premiato con il primo posto alla sessione dedicata al Premio Maccacaro, volto ai giovani ricercatori o ricercatrici, durante il XLVIII congresso AIE il lavoro Depressione postpartum: un algoritmo per l’identificazione precoce delle donne a rischio basato sui dati amministrativi della Toscana targato ARS Toscana e UniFI. Il lavoro è stato svolto a cura di Martina Pacifici, Monia Puglia, Caterina Silvestri, Caterina Milli, Fabio Voller* (ARS Toscana) e Michela Baccini* (UniFI).

L’obiettivo del lavoro è stato quello di creare un algoritmo di machine-learning (ML) che fosse in grado di classificare le donne come a rischio o meno di sviluppare la DPP già al momento della dimissione dall’ospedale dopo il parto, utilizzando come base dati i flussi sanitari correnti della Toscana.

La depressione postpartum (DPP) è definita come l’insorgenza di sintomi depressivi nel periodo successivo il parto. La prevalenza del fenomeno in Paesi a economia avanzata in letteratura è varia: si attesta intorno al 5% se la fonte sono i flussi sanitari correnti, mentre raggiunge il 10-15% con questionari autocompilati. L’identificazione precoce delle madri a rischio potrebbe evitare l’insorgenza di questa malattia così come una serie di conseguenze negative sulla donna, il/la bambino/a e la loro relazione.

A partire dall’archivio dei Certificati di assistenza al parto (CedAP) sono state selezionate tutte le donne che hanno partorito sul territorio regionale dal 2018 al 2020. Ci siamo ristretti poi, attraverso una procedura di record linkage con l’Anagrafe degli assistiti tramite l’identificativo univoco anonimo ‘iduni’, a coloro che fossero presenti e assistite nel territorio toscano da almeno 10 anni prima e per almeno 1 anno successivo al parto. In questo modo abbiamo potuto osservare la loro storia passata in termini di disturbi di salute mentale, che in letteratura è un fattore di rischio per l’insorgenza della DPP, e seguirne l’eventuale insorgenza nel postpartum. Per l’identificazione di problemi di salute mentale nei 10 anni prima e nell’anno successivo al parto abbiamo effettuato un’ulteriore record linkage con i flussi sanitari SALM (RFC 160, flusso della salute mentale territoriale), SDO (schede di dimissione ospedaliera), PS (pronto soccorso), FED (farmaci erogati direttamente), SPF (prestazioni farmaceutiche) e CON (flusso delle prestazioni consultoriali). Il database creato ha raccolto 33 variabili dal CedAP riguardanti il background socio-economico materno, l’andamento della gravidanza, il parto e caratteristiche del/della bambino/a nell’immediato postpartum, oltre all’aver avuto precedenti problemi di salute mentale nei 10 anni pre-partum e all’outcome DPP (sì/ no).

Dal database ottenuto è stato campionato un 8% di unità con dati completi da usare come test set per testare l’algoritmo allenato per la previsione della depressione postpartum. Sul restante 92% dei soggetti è stato utilizzato un metodo di imputazione multipla, ottenendo 10 database imputati. Ognuno di questi è stato utilizzato per allenare algoritmi di classificazione binaria (Logistic Regression, Random Forest, Gradient Boosting e due Support Vector Machines) le cui performance, in termini di accuracy, balanced accuracy, specificità e sensitività, sono state calcolate come media entro le 10 imputazioni con una 10-fold-cross-validation ripetuta 10 volte. In fase di training sono state impiegate tecniche di ricampionamento per superare i problemi di imbalance. L’algoritmo migliore è stato infine ri-allenato su ognuna delle imputazioni e testato sul test set. Le misure di variabile importance sono calcolate come media sulle 10 imputazioni.

In Toscana tra il 2018 e il 2020 sono avvenuti 71.176 parti. Sono stati inclusi nello studio solo 41.383 parti di donne presenti nell’anagrafe assistiti da almeno 10 anni prima e per 1 anno dopo il parto. Abbiamo stimato una prevalenza della DPP pari al 4,8% delle donne; il 3% l’aveva già sviluppata nel primo trimestre postpartum (Figura 1).

Figura 1. Stima di Kaplan-Meier della survival function alla depressione postpartum.
fig1 news depressione postpartum
Gli algoritmi di classificazione binaria testati hanno avuto risultati simili in termini di previsione ma quello con performances leggermente migliori è risultato essere la Random Forest. L’accuracy sul test set era pari a 0,80, la sensitivity 0,73, la specificity 0,80, la balanced accuracy 0,77. Le variabili più importanti per la previsione in termini di decrescita media dell’indice di Gini sono state: avere avuto precedenti problemi di salute mentale, età al parto e tipo di nutrizione del bambino immediatamente postpartum (Figura 2).

Figura 2. Variable importance dell’algoritmo Random Forest per la previsione della depressione postpartum
fig2 news depressione postpartum
Le variabili più importanti dal punto di vista predittivo sono in linea con i fattori di rischio per la DPP riscontrati in letteratura. La salute mentale delle madri dovrebbe essere seguita fin dalle prime fasi della gravidanza e nel postpartum, specialmente se la donna ha avuto precedenti problemi. Sviluppare algoritmi di ML su dati amministrativi opportunamente pre-processati può fornire indicazioni preziose in materia di prevenzione e programmazione sanitaria e essere di aiuto nella pratica clinica. Sarebbe opportuna una fase di validazione nei punti nascita.

Si ringraziano l’Associazione italiana di epidemiologia per il prezioso riconoscimento; gli autori e le autrici e Franca Rusconi, Luigi Gagliardi (AUSL Toscana Nord-ovest), Francesco Profili, Daniela Nuvolone, Cristina Stasi (ARS Toscana), Ilaria Lega, Edoardo Corsi (ISS), Anna Maria Nannavecchia (AReSS Puglia) e Riccardo Pertile (APSS Trento) per le osservazioni ed i contributi al lavoro e alla presentazione.