L’Intelligenza Artificiale ruba il lavoro alle Sacerdotesse di Delfi.
Dobbiamo ammettere che, questa volta, l’abbiamo presa un po’ larga. Forse il collegamento fra l’Oracolo di Delfi e l’Intelligenza Artificiale non è proprio immediato.
E se vi suggeriamo il nome “Pizia” (Πυθία) forse, l’oscurità si approfondisce.
Indice degli argomenti
CIAO, Pizia e… l’Informatica
Ma ecco i fatti: la città greca di Delfi (Δελφοί) ha avuto un ruolo importante nella storia dell’antica Grecia. Oltre ad essere posizionata strategicamente alle pendici del Parnaso e vicino al mare, circa a metà strada fra Atene e l’attuale Patrasso, era sede dell’Oracolo di Apollo, meglio noto come Oracolo di Delfi, appunto. Il dio Apollo, però, non si rivolgeva direttamente ai mortali, ma utilizzava una donna come tramite: Pizia.
Il ruolo di Pizia era affidato alle giovani e meno giovani donne di Delfi, purché vergini, che diventavano le Sacerdotesse e si sistemavano in un ipogeo al di sotto del Santuario di Apollo, oggi in rovina, per ascoltare le domande che venivano poste da selezionati “clienti”.
La Sacerdotessa raggiungeva quindi uno stato di trance (grazie anche alle acque della sorgente Cassotis ed alle erbe che venivano masticate durante la funzione, ufficialmente foglie di alloro, ma chissà) ed emetteva il responso divino, in forma spesso poetica ma talvolta sconnessa e difficilmente comprensibile.
Pizia non era che un’interfaccia, diremmo oggi.
Questa vicenda dell’antica Grecia ha da sempre affascinato gli informatici: alcuni di voi ricorderanno un ambiente di sviluppo nato negli anni ‘90 dal nome Delphi, e non appare certo casuale l’assonanza di Oracle (uno dei big player dell’IT) con l’Oracolo in questione.
Ebbene, con il progetto CIAO dell’AOU Careggi, abbiamo voluto eliminare Pizia dalle nostre vite, prendendoci il lusso di interrogare l’Oracolo direttamente e mandando in pensione, dopo quasi 3000 anni, le Sacerdotesse di Delfi.
Il progetto CIAO dell’AOU Careggi: big data, big challenges
Usciamo dalla metafora classica e torniamo ai nostri giorni.
I sistemi dibusiness intelligence delle aziende ospedaliere (ma di tutte le aziende, in verità) sono ricchissimi di informazioni. Il problema è riuscire a scovarle, non a caso si parla di “data mining”, come se per estrarle si dovessero scavare tunnel nel profondo del suolo alla ricerca di pepite d’oro.
Ovviamente, esistono applicazioni, anche visuali, per accedere a queste informazioni che permettono di costruire query, report, cruscotti informativi anche accattivanti, ma molto spesso le competenze per accedere a tali risorse sono appannaggio di pochi “eletti” nell’azienda, tipicamente gli informatici o gli addetti al controllo di gestione. E, sebbene questi si prodighino nell’elaborare soluzioni sempre più estese ed articolate, ci sarà sempre la tabellina o il grafico che non fanno parte del set standard messo a disposizione dei manager.
Questo comporta, da una parte, la continua richiesta di nuovi report alle “sacerdotesse del dato”, dall’altra un inevitabile sottoutilizzo delle risorse informative presenti nei database aziendali.
Il progetto CIAO (Careggi Intelligenza Artificiale Operativa) nasce proprio da questa esigenza: rendere fruibile in maniera facile ed intuitiva l’informazione senza ricorrere ad intermediari.
Vogliamo, in altre parole, mandare finalmente in pensione le Pizie e interrogare direttamente l’Oracolo.
La scelta tecnologica: il modello di AI per CIAO
Per realizzare CIAO la scelta tecnologica è caduta su un LLM (Large Language Model). Si tratta di un modello linguistico in grado di ottenere la comprensione e la generazione di linguaggio di ambito generale, nel nostro caso in italiano. Gli LLM acquisiscono questa capacità adoperando grandi quantità di dati per apprendere miliardi di parametri nell’addestramento, e consumando elevate risorse di calcolo nell’operatività. L’aggettivo “Large” presente nel nome si riferisce proprio alla grande quantità di parametri del modello probabilistico (nell’ordine dei miliardi).
In particolare, nelle prime fasi di sviluppo, abbiamo testato un LLM italiano, denominato Italia 9B, realizzato da iGenius e CINECA. Il 9B sta per “9 billions” cioè 9 miliardi di parametri che lo compongono.
La versione di CIAO attualmente implementata si basa invece sul più noto Llama 3.1 11B, messo a disposizione da Meta.
Una volta installato il motore, abbiamo proceduto alla fase di apprendimento, “insegnando” la struttura dei dati sottostanti (siamo partiti dal database del personale: anagrafica, presenze, stato giuridico).
È stato necessario anche introdurre un thesaurus di termini di contesto (ad esempio, abbiamo spiegato a CIAO che “dottore” è equivalente a “medico”, “caposala” a “coordinatore”) in modo da consentire l’uso di termini di uso corrente nelle interrogazioni.
L’uomo che sussurrava ai database
Si è trattato poi di realizzare un’interfaccia potente ma facile da utilizzare per l’utente.
La scelta è caduta su una soluzione tipo ChatGPT, molto lineare e facile da sfruttare sia tramite tastiera che con microfono (per il riconoscimento vocale abbiamo utilizzato direttamente le funzioni presenti in Google Chrome).
La pagina principale di interrogazione del sistema, o l’orecchio dell’Oracolo, se preferite, si presenta come in figura.
La struttura è quella classica della chat: sulla destra le “domande”, sulla sinistra le “risposte”. Il menu scuro a sinistra consente di selezionare l’universo informativo dal quale estrarre i dati.
Il sistema non fa altro che tradurre le domande poste in italiano in opportune query e “lanciarle” sul database, presentando immediatamente la risposta nel formato più opportuno (normalmente tabellare). Con domande successive si può approfondire la ricerca (effettuando una forma di “drill down” sui risultati) fino ad arrivare alla risposta cercata.
Le domande possono essere poste anche a voce, come del resto si può fare da tempo con Alexa o con Siri. L’interfaccia vocale è, però, sinora scarsamente utilizzata nei software sanitari e gestionali in genere.
Un dipendente di Careggi può ad esempio scrivere (o pronunciare): “Quanti sono i dipendenti residenti nel comune di Sesto Fiorentino?”. E ancora: “Elenca la lista di questi dipendenti”, per avere una serie di informazioni in forma tabellare che possono essere poi scaricate per elaborazioni successive.
Progetto CIAO AOU Careggi: futuro e prospettive
Una volta che CIAO sarà completato ed addestrato su gran parte del sistema informativo ospedaliero, chi attualmente “interroga l’Oracolo” non servirà più? Diremmo proprio di no, al contrario, il suo ruolo sarà più importante e cambierà di livello.
La professionalità sarà trasformata nel “cercare il prompt”, ovvero la domanda migliore da porre a CIAO. E non è detto che sia più facile che scrivere una query corretta. Ma, sicuramente, lo strumento permetterà di migliorare la caccia al dato con l’uso, e sarà anche lo strumento a migliorare se stesso grazie al lavoro degli utenti.
Per tutto questo ci vorrà una Pizia del XXI secolo? Noi pensiamo di no.