decisionslabs

Scenari predittivi? c’è il Decisions Labs

Di MASSIMILIANO FERRARA  

 L’aumento della popolazione mondiale, la globalizzazione e le tecnologie stanno producendo effetti – qualche anno fa inimmaginabili – la cui scala non si era mai vista nella storia. Tutte le applicazioni dell’industria 4.0 generano un ingente volume di dati, conosciuti più comunemente, con il termine Big Data. Pertanto, le tecniche di data science e di analisi predittiva consentono di espandere qualità e quantità dei dati, generando un cambiamento fondamentale nel modo in cui le informazioni vengono prodotte e successivamente archiviate.

Il fine che queste tecniche si prefiggono di raggiungere è quello di pervenire a una migliore valutazione di quello che accadrà in futuro andando oltre, dunque, la semplice comprensione di cosa sia successo; in altri termini l’analisi predittiva mira ad utilizzare dati, algoritmi statistici e tecniche di Machine Learning per individuare la probabilità di risultati futuri basandosi su dati storici.

I modelli matematici si sono rilevati ottimi strumenti nell’analisi dell’andamento epidemico, ma sono necessari big data di qualità al fine di garantire una corretta previsione. Infatti, la modellizzazione restituisce output sotto forma di previsioni e in particolare, i modelli predittivi sfruttano risultati noti per sviluppare (o addestrare) un modello che può essere utilizzato per prevedere valori di dati diversi o nuovi.

Oggigiorno sentiamo parlare di Intelligenza Artificiale e delle sue innumerevoli applicazioni. Una tra tutte è la capacità di produrre modelli predittivi in grado di evidenziare la probabile evoluzione di un’epidemia individuando in anticipo i settori o i contesti territoriali che sono maggiormente suscettibili di sviluppare focolai. Per poter realizzare questa previsione è necessario far processare agli algoritmi di Machine Learning non solo dati (variabili) epidemiologici ma anche dati (variabili) esogeni (dati sulla mobilità, sulle modalità organizzative del lavoro nei diversi settori, sui trasporti ecc.).

L’Università Mediterranea di Reggio Calabria, e in particolare, il laboratorio scientifico Decisions Lab sono stati al centro di un network internazionale per una ricerca riguardante gli effetti della pandemia da Covid-19.

Il progetto di ricerca internazionale Dynamics of transmission and control of Covid-19 da noi promosso e avviato nel mese di settembre del 2020, sotto l’egida dell’Organizzazione Mondiale della Sanità, vede come obiettivo l’elaborazione di modelli matematici predittivi circa la diffusione del Covid-19 nei diversi Continenti e nuovi strumenti di diagnosi attraverso l’Intelligenza Artificiale e il Machine Learning. Tra i partners del progetto troviamo l’Università Bocconi, la National University of Malaysia, la Bahcesehir University (Turchia) con l’apporto di alcune aziende lombarde operanti nell’ambito dei Big Data.

Il gruppo di ricercatori composto in primis da studiosi autoctoni, sono riusciti ad individuare 34 ceppi diversificati del Virus. Questo importante risultato è stato ottenuto mediante l’implementazione di tre modelli matematici e utilizzando come dati di partenza quelli offerti dall’Organizzazione Mondiale della Sanità. I contributi scientifici maturati, nel corso di questi mesi, hanno trovato collocazione editoriale su riviste ad alto impatto scientifico internazionale (tra le altre ricordiamo Scientific Report – Nature di cui dirò, in particolare, successivamente).

In letteratura, diversi studi ci hanno mostrato come le analisi di Big Data e dell’Intelligenza Artificiale hanno permesso di migliorare i dettagli delle scansioni del cervello umano e non solo; è sotto questa chiave di lettura che il nostro gruppo ha implementato la seconda linea di ricerca che ci vede coinvolti nel progetto Dynamics of transmission and control of Covid-19.

L’obiettivo che il nostro gruppo di ricerca composto da Bruno Pansera, Tiziana Ciano, Mariangela Gangemi, Stefania Merenda, Valentina Mallamaci e Pasquale Fotia è stato quello di modellizzare il fenomeno pandemico “COVID-19” su due direttrici di ricerca: la prima la modellizzazione per l’appunto; la seconda nuovi modelli di intelligenza artificiale e di machine learning per la predizione. Infatti, i tentativi di frenare la diffusione del COVID-19 introducendo rigide misure di quarantena hanno sortito effetti diversificati nei paesi in cui si è diffuso il virus: mentre il numero di nuovi casi è diminuito in Cina, Corea del Sud e Malesia, esso mostra una certa dinamica in Italia e in altri paesi Europei. Rifacendosi al classico modello SIR, l’obiettivo è stato l’elaborazione di un nuovo modello fuzzy di infezione e progressione della crescita partendo dal presupposto che tutti gli individui infetti vengono isolati dopo il periodo di incubazione in modo tale da non poter infettare altre persone. La progressione della malattia in questo modello fuzzy è determinata dal numero di riproduzione di base (il numero di individui appena infettati durante il periodo di incubazione), che è diverso rispetto a quello del modello SIR standard. Combinando un modello di trasmissione fuzzy con dati sui casi di COVID-19 a Wuhan e casi internazionali originati a Wuhan, è stato modellizzato come la trasmissione sia variata nel tempo tra luglio 2020 e gennaio 2021. Sulla base di queste stime, è stato calcolata quindi la probabilità che casi insorti possano generare focolai in altre aree. Per stimare le prime dinamiche della trasmissione nel resto del mondo, si è adattato un modello dinamico di trasmissione fuzzy a più set di dati disponibili relativi a casi conclamati. I set di dati a cui si riferiranno i ricercatori coinvolti, sono: numero giornaliero di nuovi casi esportati a livello internazionale (Italia, Turchia, Malesia e altri) e numero giornaliero di nuovi casi in Cina. Il modello in corso di definizione descrive i molteplici percorsi di trasmissione nella dinamica dell’infezione e sottolinea il ruolo del serbatoio ambientale nella trasmissione e diffusione di questa malattia. Il modello fuzzy proposto impiega anche velocità di trasmissione non costanti che cambiano con lo stato epidemiologico e le condizioni ambientali.

I modelli ad oggi pubblicati e presenti in letteratura non hanno tenuto conto del ruolo dell’ambiente nella trasmissione del COVID-19. Inoltre, tutti i modelli non hanno considerato l’importante ruolo dell’incertezza nella costruzione previsionale. I parametri definiti in questi modelli sono deterministici e finora non sono in grado di gestire il ruolo significativo di condizioni incerte nei dati reali. Come evidenziato dai fatti, la maggior parte delle persone infette non ha avuto alcun contatto con i mercati di Wuhan; il numero di infezioni mostra dinamiche eterogenee.

Il risultato raggiunto è stata l’elaborazione di un nuovo modello matematico per il COVID-19 che incorpora molteplici percorsi di trasmissione, inclusi i percorsi da ambiente a uomo e da uomo a uomo; introdurre un compartimento ambientale che rappresenti la concentrazione di virus nel bacino ambientale; proporre un’efficace tecnica numerica per ottenere una soluzione altamente accurata del nuovo modello adattabile anche ad altre situazioni pandemiche.

La seconda direttrice ha avuto come missione l’elaborazione di modelli matematici predittivi circa la diffusione del COVID-19 nei diversi Continenti e nuovi strumenti di diagnosi attraverso l’Intelligenza Artificiale e il Machine Learning, ha ottenuto un riconoscimento scientifico importante: è stato accettato per la pubblicazione un lavoro dalla prestigiosa rivista Nature-Scientific Reports.

La pubblicazione dal titolo: “GraphCovidNet: A Graph Neural Network based Model for Detecting COVID-19 from CT scans and X-Rays of Chest”, vede come Autori oltre che il Prof. Ferrara nella qualità di Coordinatore della Ricerca anche i Dr. Pritam Saha, Debadyuti Mukherjee, Pawan Kumar Singh, Ali Ahmadian e Ram Sarkar. La ricerca ha unito gli sforzi e le competenze dei menzionati ricercatori facenti parte delle Faculty dei seguenti Dipartimenti universitari:

Department of Electrical Engineering, Department of Computer Science and Engineering, Department of Information Technology, Jadavpur University, Kolkata India; Institute of IR 4.0, The National University of Malaysia, Selangor, Malaysia oltre che naturalmente l’ICRIOS – Università Bocconi e il Decisions LAB dell’Università Mediterranea grazie alla presenza del Prof. Massimiliano Ferrara. Di fatto, un network internazionale che unisce due Continenti attraverso una ricerca riguardante gli effetti di questa pandemia globale. Con questo studio si introduce una nuova rete isomorfa “a grafo. Il nuovo modello “GraphCovidNet” (questo il nome del brevetto che gli Autori hanno presentato negli USA) valuta la radiografia del torace sulla base di quattro set di dati standard di cui si dispone, tra cui: set di dati SARS-COV-2 Ct-Scan, set di dati COVID-CT, combinazione di set di dati Covid-radiografia del torace, immagini radiografiche del torace (Polmonite) dataset e CMSC-678-ML-Project dataset e, infine, in un confronto con queste basi di dati da cui si rileva il COVID-19 e soprattutto le sue tre varianti principali. Il modello mostra un’incredibile precisione del 99% per tutti i set di dati e la sua capacità di previsione diventa precisa al 100% per il problema della classificazione binaria del rilevamento delle scansioni COVID-19.

Tags: No tags

Leave A Comment

Your email address will not be published. Required fields are marked *