Nell’ormai vastissimo panorama delle soluzioni di Intelligenza Artificiale in Sanità, un ruolo importante lo stanno giocando anche i modelli linguistici multimodali (“M-LLMs”), ossia quei sistemi capaci di elaborare, catalogare, interpretare e riorganizzare diverse fonti e diversi tipi di dati (testi, immagini, file multimediali).
Un notevole salto di paradigma e di qualità nell’ambito AI, sinora dominato (con alterne fortune) dai modelli unimodali (un solo tipo di fonte dati).
Indice degli argomenti
Med-Gemini di Google: i potenziali ambiti di adozione
In particolare, Med-Gemini di Google sta conquistando l’attenzione degli addetti ai lavori grazie alle sue prime e promettenti performance ottenute attraverso una valutazione su ben 25 compiti assegnatigli su 14 benchmark nel settore medico, distaccando considerevolmente il competitor ChatGPT.
Uno dei compiti rispetto ai quali Med-Gemini pare essere davvero performante è l’interpretazione dei tracciati elettrocardiografici, ma il modello AI di Google promette bene anche nella summarizzazione e nel “question answering”.
E questi sono – con ogni probabilità – gli ambiti con maggior potenziale di adozione.
Come funziona Med-Gemini e in cosa può aiutare medici e Aziende Sanitarie
Da tempo, i “Summarizer AI-aumentati” catturano l’interesse di chi, nelle Regioni e nelle singole Aziende Sanitarie, è chiamato a ridisegnare il modello di integrazione Ospedale-Territorio nella gestione di pazienti cronici (le COT, per intenderci) e ha bisogno di strumenti capaci di mettere in grado i medici di valutare pazienti complessi senza dover perdere ore nella lettura di centinaia di pagine di documenti clinici.
Soprattutto, cosa molto interessante e promettente, Med-Gemini dovrebbe essere capace di “mettere insieme” le sue capacità di summarizzazione con quelle di ricerca in letteratura di informazioni attinenti, in modo da fornire un supporto decisionale clinico di livello: in pratica, oltre a “riassumere”, Med-Gemini sarà capace di offrire al Medico curante un set di implicazioni prognostiche e di ipotesi terapeutiche.
Esempio d’uso 1: Med-Gemini in Radiologia
Quello mostrato di seguito in figura è l’esempio d’uso di Med-Gemini nel caso dell’analisi di un RX torace attraverso un ipotetico dialogo diagnostico-assistenziale multimodale, appunto, in ambito radiologico.
In questo dialogo, come sottolineato in un articolo di ricerca di Google pubblicato su Arxiv – Med-Gemini dimostra la capacità di analizzare una radiografia del torace e di condurre un ipotetico dialogo realistico con un medico di base.
Sia pur – come sottolineato – Med-Gemini non sia adatto a questo utilizzo nel mondo reale senza ulteriori ricerche – questo esempio è significativo delle grandi potenzialità del modello AI di Google.
Infatti, nel suddetto dialogo, Med-Gemini identifica lievi cambiamenti degenerativi lungo la colonna vertebrale e può rispondere a domande sul ragionamento che ha portato a questa scoperta, dimostrare conoscenze mediche generali sulla malattia degenerativa del disco e distinguere tra correlazione e causalità in relazione ad una storia del paziente di mal di schiena.
Inoltre, in questo esempio, Med-Gemini è in grado di spiegare i suoi risultati in termini non specialistici, dimostrando il suo potenziale nel facilitare la comprensione e la comunicazione del paziente in contesti clinici.
Alla fine della conversazione, viene fornito il feedback di un radiologo sulla qualità di questo dialogo radiologico.
Di seguito, il dialogo tra il medico di base e Med-Gemini:
Medico di base
“Salve, sono un Medico di base e questa è una radiografia del torace di un mio paziente. Il referto radiologico è ancora in sospeso e vorrei un aiuto per capire la radiografia. Genera un referto radiologico di questa immagine”
Med-Gemini
“Il cuore è ai limiti superiori delle dimensioni normali. I contorni mediastinici e ilari entro i limiti normali. I polmoni appaiono puliti. Non ci sono versamenti pleurici o pneumotorace. Lievi alterazioni degenerative si osservano lungo la colonna vertebrale toracica inferiore. Sintesi: nessuna evidenza di patologia acuta in atto”
Medico di base
“Quali sono i segni dei cambiamenti degenerativi?”
Med-Gemini
“Lievi alterazioni degenerative si osservano lungo la colonna vertebrale toracica inferiore. Ciò si evince dal lieve restringimento degli spazi dei dischi intervertebrali e dalla presenza di piccoli osteofiti (speroni ossei) lungo i margini anteriori dei corpi vertebrali”
Medico di base
“Il mio paziente ha una storia di mal di schiena. Questo potrebbe spiegare il mal di schiena?”
Med-Gemini
“Mentre i cambiamenti degenerativi osservati alla radiografia potrebbero potenzialmente contribuire al mal di schiena, è importante notare che la correlazione non equivale alla causalità. Molte persone hanno cambiamenti degenerativi nella colonna vertebrale senza provare dolore e, al contrario, il mal di schiena può avere numerose cause al di là delle semplici alterazioni degenerative. Pertanto, mentre i risultati delle radiografie sono degni di nota, non spiegano in modo definitivo il mal di schiena del tuo paziente. Una valutazione completa, comprendente un’anamnesi dettagliata, l’esame obiettivo e, potenzialmente, ulteriori esami di imaging o test, sono necessari per determinare l’esatta causa del suo dolore. Dimmi se hai altre domande”
Medico di base
“Per aiutarmi a comunicare tutto ciò al mio paziente, per favore, riscrivi il referto senza usare termini troppo specialistici”
Med-Gemini
“Risultati della radiografia del torace:
- Cuore: dimensioni normali;
- Polmoni: chiari, senza segni di infezione o accumulo di liquidi;
- Ossa: lieve usura nella parte inferiore della colonna vertebrale, comune con l’età.
Nel complesso, nessun segno di gravi problemi al torace. L’usura nella parte inferiore della colonna vertebrale potrebbe essere legata al mal di schiena, ma potrebbero essere coinvolti anche altri fattori. Avremo bisogno di fare più test per scoprire la causa esatta del tuo dolore”.
Medico di base
“Grazie”
Med-Gemini
“Prego! Sono contento di averti potuto aiutare. Se hai altre domande, non esitare a chiedere”
I RISULTATI DEL REFERTO REALE (non fornito da Med-Gemini)
I contorni cardiomediastinici e ilari sono normali. I polmoni sono ben espansi e chiari, senza consolidamento focale, versamento pleurico o pneumotorace. Lievi alterazioni degenerative si osservano nella colonna vertebrale toracica. Sintesi: assenza di patologia acuta cardiopolmonare.
IL FEEDBACK DEL RADIOLOGO
Pro:
- Dimostrazione ipotetica realistica di interazione con un operatore sanitario in un contesto di imaging;
- Dimostrazione della generazione di report realistici di alta qualità;
- Mette in mostra le conoscenze mediche generali e fornisce anche limitazioni adeguate (ad esempio, menziona che sono necessari ulteriori test).
Contro:
- Nell’immagine sono presenti piccoli osteofiti, ma lungo i margini laterali (piuttosto che margini anteriori) dei corpi vertebrali;
- Per una chiarezza ottimale, il rapporto riscritto per il paziente, che menziona la parte ‘inferiore della colonna vertebrale’ , dovrebbe specificare il tratto toracico inferiore della colonna vertebrale.
Esempio d’uso 2: Med-Gemini per l’analisi della Cartella Clinica
Nella conversazione mostrata nella figura di seguito, Med-Gemini dimostra la capacità di analizzare le cartelle cliniche mediante AI, fornendo un riepilogo completo delle condizioni attive e storiche del paziente.
La conversazione si concentra sulla storia di polmonite grave del paziente, mostrando come la comprensione del modello metta a disposizione un’interfaccia intuitiva per interagire e interrogare dati medici complessi come quelli contenuti nelle cartelle cliniche.
Come evidente dalla descrizione delle patologie attive da parte di Med-Gemini (si veda in figura), tale capacità ha il potenziale di ridurre il carico cognitivo e migliorare l’accessibilità alle informazioni sia per i medici che per i pazienti.
Esempio d’uso 3: Med-Gemini in Dermatologia
Nell’ipotetico dialogo diagnostico multimodale in ambito dermatologico, mostrato di seguito in figura, Med-Gemini mostra ottime potenzialità, per esempio, richiedendo un’immagine quando non viene fornita (acquisizione di informazioni multimodali), arrivando alla diagnosi giusta in modo efficiente (diagnosi aperta), spiegando il ragionamento e integrando le caratteristiche visive rilevanti e altre informazioni raccolte dai sintomi del paziente (spiegabilità) e rispondendo alle domande sulle opzioni di trattamento, rimettendo opportunamente agli esperti la decisione finale.
Esempio d’uso 4: Med-Gemini nella sintesi di informazioni scientifiche
Med-Gemini (si veda la figura di seguito) riceve come input l’intero contenuto di 12 articoli di ricerca in formato PDF e viene incaricato di fornire una descrizione succinta della relazione esistente tra locus FTO e obesità, insieme a un elenco di risultati sperimentali concreti a supporto.
Com’è possibile osservare in figura, il modello AI di Google genera una descrizione concisa, informativa e accurata di come il locus FTO contribuisce alla biologia dell’obesità e la presenta in modo chiaro e comprensibile.
Il futuro di Med-Gemini e le sfide etiche
Da quanto finora analizzato, Google sembra mettere un’ipoteca sul podio dell’Intelligenza Artificiale in Sanità, potendo disporre di uno strumento decisamente potente e perfettamente centrato rispetto alle reali aspettative dei medici.
Difficile dire quanto tempo ci vorrà per arrivare al traguardo: il lavoro da fare è ancora tanto, sia in termini di sviluppo che – soprattutto – di validazione.
Ma c’è anche molto da fare, all’interno delle strutture sanitarie, per mettere in condizione gli operatori di poter sfruttare al massimo tutte le potenzialità offerte dai modelli multimodali.
E c’è anche da fare per chi dovrà “calare” Med-Gemini all’interno dei processi formalizzati di diagnosi, terapia e cura, per non parlare delle inevitabili complicazioni normative che – come già accaduto – potrebbero continuare ad arrivare del Garante Privacy.
Last but not least, il tema etico, come giustamente ci ricorda Padre Benanti in un suo recente articolo su “Avvenire”: “I grandi modelli linguistici multimodali stanno inaugurando una nuova era di possibilità per la Salute e la Medicina – hanno scritto i ricercatori –. Le capacità dimostrate da Gemini e Med-Gemini suggeriscono un significativo balzo in avanti nella profondità e nell’ampiezza delle opportunità di accelerare le scoperte biomediche e di assistere la fornitura e le esperienze di assistenza sanitaria”.
Tuttavia – osserva Benanti – l’algoretica ci chiede che i progressi nelle capacità dei modelli siano accompagnati da un’attenzione meticolosa all’affidabilità e alla sicurezza di questi sistemi.
Dando priorità a entrambi gli aspetti, possiamo concordare con i ricercatori di Google nell’immaginare “un futuro in cui le capacità dei sistemi di AI siano acceleratori significativi e sicuri sia del progresso scientifico che dell’assistenza in Medicina”.