Prevedere le infezioni respiratorie acute attraverso i dati dei social media e l’apprendimento automatico

Le infezioni respiratorie acute (ARI) rappresentano uno dei principali oneri per la salute pubblica globale e richiedono una sorveglianza tempestiva e una diagnosi precoce per mitigarne l’impatto. I sistemi di monitoraggio epidemiologico tradizionali soffrono spesso di ritardi nelle segnalazioni, il che ha spinto a esplorare fonti di dati alternative, ad esempio i social media, integrati con tecniche di machine learning. Un gruppo di ricercatori ha eseguito una revisione sistematica con la finalità di approfondire l’argomento riguardante la previsione delle ARI mediante l’uso di dati provenienti dai social media e di modelli di machine learning.

Seguendo le linee guida PRISMA, i lavori pertinenti sono stati individuati attraverso ricerche strutturate nei principali database scientifici, (Preferred Reporting Items for Systematic Reviews and Meta-Analyses). Gli studi selezionati sono stati classificati in quattro livelli di complessità e successivamente analizzati in termini di fonti di dati, strategie di estrazione delle caratteristiche (feature extraction), algoritmi di machine learning, metriche di valutazione e obiettivi predittivi. I risultati dimostrano che le piattaforme social, in particolare Twitter (ora X), possono fornire segnali preziosi correlati all’incidenza delle ARI. È stata impiegata un’ampia gamma di metodi di machine learning, tra cui modelli di regressione, macchine a vettori di supporto (SVM), metodi ensemble e approcci di deep learning.

Complessivamente, i risultati indicano che i modelli di machine learning che sfruttano i dati dei social media possono raggiungere prestazioni predittive competitive, spesso integrando o potenziando i sistemi di sorveglianza tradizionali. Tuttavia, rimangono sfide aperte relative al “rumore” nei dati, ai pregiudizi statistici della popolazione (population bias) e alla capacità di generalizzazione dei modelli.

Gli Autori concludono che appare evidente il potenziale dell’integrazione tra dati dei social media e tecniche di machine learning per la previsione delle ARI e la sorveglianza della salute pubblica. Sebbene i presupposti siano promettenti, la ricerca futura dovrebbe concentrarsi sul miglioramento della qualità dei dati, dell’interpretabilità dei modelli e della loro robustezza, oltre che sulla validazione di questi approcci in diverse regioni geografiche e per differenti malattie respiratorie.

Fonte:BMC Med Inform Decis Mak.

2026 Feb doi: 10.1186/s12911-026-03390-8

Contenuti simili

I più visti