Presentato il report di NTT DATA e Train "Generative AI and synthetic data for clinical application"
Un'alleanza strategica destinata a trasformare radicalmente il panorama sanitario italiano e internazionale, con particolare attenzione alle malattie rare, partendo dai dati sintetici. È quanto emerge dal report "Generative AI and synthetic data for clinical application", presentato pochi giorni fa da NTT DATA, leader mondiale nei servizi tecnologici e business digitale, e Train, spin-off dell'IRCCS Istituto Clinico Humanitas specializzato nello sviluppo dell'AI generativa.
L’AI PER STIMOLARE UN NUOVO MODO DI FARE RICERCA CLINICA
L'intelligenza artificiale generativa sta emergendo come una forza rivoluzionaria in numerosi settori, con l'ambito sanitario che si configura come uno dei più promettenti per le sue applicazioni. I motivi? Giusto un paio: entro il 2035, il 60% dei bisogni clinici della popolazione anziana saranno quesiti clinici complessi, molto più di adesso e quasi ogni giorno si scoprono malattie rare o si trovano fenotipi diversi all’interno della stessa patologia. Per stare al passo, la ricerca clinica tradizionale non basta più: vuoi perché non ci sono abbastanza pazienti da arruolare nelle sperimentazioni cliniche, come nel caso delle malattie rare, vuoi perché anche chi potrebbe arruolarsi, non lo fa. Una delle paure maggiormente correlate al rifiuto di partecipare a un trial clinico è abbastanza intuitiva: chi partecipa teme di finire nel “braccio di controllo”, cioè far parte del gruppo di pazienti che non riceverà il farmaco sperimentale, ma il placebo.
Ecco quindi che strumenti come l’intelligenza artificiale possono diventare essenziali per facilitare le sperimentazioni cliniche, come anche i processi diagnostici, quelli di drug discovery (o di drug repurposing) e migliorare l’approccio terapeutico personalizzato. Non si tratta però di una questione banale, perché il processo di validazione dell’intelligenza artificiale in ambito medico non può essere simile alla validazione di un farmaco. Occorre certificare gli algoritmi, usare l’Explicable AI per permettere ai clinici di capire fino in fondo perché l’AI ha generato quel risultato. A tal proposito il report di NTT e Train fa luce su un nuovo modo di utilizzare l’AI in modo ottimale per tutti, attraverso l’uso dei dati sintetici.
I DATI SINTETICI: LA VIA PER COLMARE IL GAP DEGLI ARRUOLAMENTI
L’uso dei dati sintetici può essere di grande aiuto perché, pur imitando quelli reali e condividendone le stesse proprietà statistiche, non contengono informazioni effettive sui pazienti. Ma queste informazioni devono rispecchiare fedelmente la realtà che vogliono rappresentare. E devono essere informazioni utili per i clinici. In questo sta il grosso lavoro di validazione che deve essere fatto sui dati.
Ma che cos’è il dato sintetico? Il dato sintetico non è il dato anonimizzato (il dato al quale si tolgono le informazioni sensibili e si lasciano solo quelle sanitarie, ma il dato rimane unico e riferibile a un solo paziente), non è nemmeno il gemello digitale (una rappresentazione virtuale di un sistema fisico, progettata per riflettere accuratamente le caratteristiche e il comportamento dell'entità reale). Il dato sintetico è un dato artificiale, generato attraverso modelli matematici, che imita i dati reali.
“Il dato sintetico è un amplificatore – ha riassunto Saverio D'Amico, CEO e Co-Founder di Train – e fa vedere tutti quegli elementi potenziali che di solito non si riescono a spiegare. Serve soprattutto per amplificare i dati dei bracci di controllo di una sperimentazione clinica”. Si tratta quindi di trasferire quello che si conosce già nella pratica clinica (attraverso dati di altre ricerche, studi osservazionali, registri di patologia, e altri real world data) e amplificarlo come dato sintetico da usare nei bracci di controllo. In questo modo, si risolverebbe anche la questione del reclutamento dei pazienti per i bracci di controllo, un tema che presenta non pochi problemi sotto il profilo etico.
Questi dati sintetici offrono vantaggi sostanziali: possono essere generati in grandi quantità secondo necessità, fornendo una preziosa fonte per analisi e addestramento di modelli di machine learning; garantiscono la protezione della privacy, non contenendo informazioni personali; e possono essere progettati specificamente per ridurre i bias presenti nei dati reali.
In poche parole, nell’ambito dei trial clinici, l'AI generativa può creare pazienti "sintetici" (virtual patients) utilizzando dati provenienti da pazienti reali, consentendo confronti con pazienti sottoposti a nuove terapie e generando risultati sintetici che descrivono scenari alternativi di trattamento. Come ha spiegato Emanuele Corbetta, Head of Life Sciences di NTT DATA Italia: “La sinergia tra i modelli di intelligenza artificiale specializzati di Train e la solida infrastruttura tecnologica di NTT DATA crea un ecosistema ideale per accelerare l'implementazione dell'AI generativa nel settore sanitario e farmaceutico. Questa alleanza strategica va oltre la semplice gestione sicura dei dati sensibili: integra perfettamente tecnologie AI avanzate nei flussi di lavoro esistenti, garantendo che ogni applicazione soddisfi i più rigorosi standard di validazione, affidabilità, trasparenza e sicurezza”.
UN CAMBIO DI ROTTA PER LE MALATTIE RARE
I dati sintetici possono essere prodotti su richiesta e in grandi quantità, offrendo una fonte praticamente inesauribile per analisi e addestramento dei modelli di machine learning. E questo aspetto è particolarmente vantaggioso quando la disponibilità di dati reali è limitata, come nel caso delle malattie rare.
Il report approfondisce infatti anche le problematiche dei trial clinici tradizionali, particolarmente evidenti nel contesto delle malattie rare, dove il numero limitato di pazienti disponibili rende spesso difficile, se non impossibile, condurre studi significativi. La soluzione innovativa di Train propone un approccio rivoluzionario basato su algoritmi di intelligenza artificiale proprietari, sviluppati su database clinici autentici, che assicurano confidenzialità e precisione, anche grazie all'implementazione del federated learning. Il sistema di verifica "SAFE" (Synthetic vAlidation FramEwork powered by Train) garantisce l'eccellenza dei dati sintetici prodotti, verificandone la coerenza statistica clinica. La soluzione potenzia inoltre la disponibilità e l'integrità delle informazioni sanitarie, ottimizza l'arruolamento dei partecipanti e abbatte costi e tempistiche delle sperimentazioni, utilizzando pazienti virtuali per costituire gruppi di controllo e perfezionare la selezione dei candidati reali. Questa metodologia offre un quadro più esaustivo e granulare delle condizioni cliniche e degli effetti terapeutici.
Il report presenta anche casi studio reali che dimostrano l'efficacia dell'approccio, incluso un esempio di utilizzo di dati sintetici come braccio di controllo in un trial clinico sulla luspatercept per il trattamento di pazienti con sindromi mielodisplastiche. In questo contesto i ricercatori hanno replicato una coorte reale di 187 pazienti, generando un insieme di dati sintetici con caratteristiche comparabili e alto coefficiente di privacy.
“L'alleanza strategica tra Train e NTT DATA dimostra come l'unione di competenze complementari possa generare soluzioni che coniugano innovazione e applicabilità concreta. Siamo convinti che questa collaborazione ridisegnerà il panorama tecnologico in ambito sanitario – conclude Saverio D'Amico – creando un ecosistema dove l'intelligenza artificiale e l'efficienza operativa convergono per migliorare gli esiti clinici, catalizzare l'innovazione farmaceutica e perfezionare i percorsi di cura”.
Seguici sui Social