Intelligenza Artificiale

Riconoscere le emozioni analizzando la voce: il progetto Talking About

Un algoritmo di deep learning è in grado di rilevare in tempo reale le emozioni da un semplice tracciato vocale. Già utilizzato come supporto per lo screening della depressione post-partum, laddove è risultato molto promettente, l’algoritmo è pronto per altri scenari applicativi, soprattutto nell’ambito delle patologie cardiovascolari, neurodegenerative e del burnout

Pubblicato il 09 Ott 2023

Emanuele Villa

talking-about-gpi-emozioni-voce

Tra i temi di attualità, un posto al sole è occupato dall’impiego degli algoritmi di intelligenza artificiale come supporto decisionale per le diagnosi e per la definizione di percorsi di cura personalizzati.

Nell’ultimo decennio, la ricerca si è concentrata su diversi filoni, tra cui l’analisi predittiva dei dati clinici e l’interpretazione delle immagini radiologiche, alimentando campi promettenti come quello della radiomica. Tuttavia, non bisogna sottovalutare le potenzialità dell’analisi della voce umana: nell’ottica di una Sanità sempre più digitale, la voce si “acquisisce” e si trasmette facilmente, mantiene inalterati molti dei suoi tratti (come il timbro) nella trasmissione e, soprattutto, incorpora informazioni di straordinario valore per la pratica medica, che gli algoritmi di intelligenza artificiale possono far affiorare in modo netto e sicuro.

L’AI che riconosce le emozioni

La divisione R&D del Gruppo GPI ha sviluppato un algoritmo di deep learning (Talking About) che è in grado di riconoscere in maniera affidabile le emozioni attraverso l’analisi in tempo reale della voce. Una volta validato, uno strumento del genere offre enormi potenzialità, dentro ma anche al di fuori del mondo della Sanità: può essere utilizzato per potenziare il benessere dei dipendenti, per prevenire il burnout o, a livello individuale, per gestire al meglio situazioni di stress.

Nonostante la sua versatilità, Talking About è stato sviluppato con l’obiettivo di integrarsi nella pratica medica, anche a distanza.

Antonio Colangelo, direttore R&D del Gruppo GPI, ci spiega che l’idea di realizzare uno strumento di analisi della voce con potenzialità di supporto alle diagnosi nacque agli albori del Covid, quando le modifiche apportate dal virus ai pattern vocali erano talmente evidenti da essere rilevabili a orecchio. Parallelamente, il tono dell’umore assumeva sempre più centralità nell’ambito di svariate patologie croniche: a titolo di esempio, uno degli elementi che porta a non rispettare una terapia è proprio la depressione indotta dalla patologia. Rilevare le fluttuazioni emotive può avere un impatto centrale sugli esiti di un percorso terapeutico.

Colangelo ci spiega che all’epoca “c’erano tutti gli elementi per avviare un esperimento. Abbiamo coinvolto i 7.000 dipendenti di GPI chiedendo loro su base volontaria di entrare in un portale interno ed eseguire un test che abbiamo sviluppato insieme ad alcuni psicologi, il cui fine era rilevare lo stato emotivo dell’utente. Si è trattato di un invito alla donazione, a cui hanno risposto in 3.000. A seguire, abbiamo chiesto agli aderenti di registrare una breve nota vocale ottenendo in tutto circa 30 ore di registrazione”.
Le dimensioni dell’azienda hanno quindi permesso alla divisione R&D di GPI di crearsi un dataset interno, che poi è stato utilizzato per il complesso e laborioso percorso di pre-processing, preparazione dei dati, suddivisione dei dataset in training e test, addestramento dell’algoritmo, rilevamento e analisi delle feature nei tracciati vocali e molto altro.

Inoltre, ci spiega Colangelo, “abbiamo utilizzato tecniche di dati sintetici per migliorare il dataset e aumentarlo. Abbiamo poi utilizzato come test un ulteriore grande dataset pubblico con 150mila registrazioni audio e, infine, abbiamo eseguito dei test interni con decine di collaboratori, ottenendo un’accuratezza prossima al 90%”.
Questo significa, in termini pratici, che Talking About è in grado di rilevare l’umore delle persone in tempo reale e con un apprezzabile livello di affidabilità, anche durante le televisite.

Infine, un aspetto da sottolineare è l’insensibilità del test ai condizionamenti che l’utente può subire, siano essi interni o esterni. Non c’è modo di ingannarlo, perché Talking About concentra la propria analisi principalmente sulle basse frequenze, dove il grado di controllo da parte dell’individuo è minimo.

L’applicazione di Talking About nella depressione post-partum

Per quanto concerne l’applicazione pratica, il Gruppo GPI ha collaborato con l’Università degli Studi di Cagliari (in particolare con il professor Vassilios Fanos, direttore della Scuola di Specializzazione in Pediatria) alla realizzazione di due tesi aventi ad oggetto l’Intelligenza Artificiale nella depressione post-partum.

Intelligenza Artificiale e Depressione Post Partum

Intelligenza Artificiale e Depressione Post Partum

Guarda questo video su YouTube

Talking About, l’algoritmo IA di GPI per il riconoscimento delle emozioni nella voce umana, applicato alla ricerca sulla depressione post-partum (fonte: GPI)

Il test vocale (basato su Talking About) è stato eseguito da 154 mamme parallelamente al Test di Edimburgo, che è lo standard internazionale per lo screening della depressione post-partum.
Le emozioni identificate dall’analisi della voce sono state categorizzate in una scala a cinque livelli, che vanno dalla forte negatività alla completa positività. Il risultato del test vocale è stato infine confrontato con il punteggio ottenuto con la scala di Edimburgo, ottenendo sostanziale concordanza.
Pur essendo il campione limitato, ed essendo quindi necessari ulteriori approfondimenti, il risultato non può che essere molto promettente.

Talking About GPI: le prossime applicazioni, dalla cardiologia alla neurologia

Come anticipato, un algoritmo affidabile di analisi della voce si presta a innumerevoli scenari applicativi, che vanno al di là della depressione post-partum e anche della Medicina in sé.

GPI ha una visione molto chiara sulle potenziali applicazioni del proprio algoritmo e sta lavorando in tal senso. Insieme al Politecnico di Torino, all’Università di Verona e all’Università Politecnica delle Marche, l’azienda ha candidato un progetto al MIMIT nel quale lavorerà sui biomarcatori presenti nella voce.
L’intento dell’azienda è quello di specializzare la propria soluzione per individuare i marcatori di patologia in ambito cardiovascolare, del burnout e delle malattie neurodegenerative.

Lungi dal sostituire la centralità del medico in ambito diagnostico, un ruolo che nessuno intende affidare alla tecnologia, il progetto di GPI consentirebbe a una soluzione digitale di proporsi come supporto decisionale per svariate attività di screening, con il vantaggio decisivo della totale integrazione con la Telemedicina.
Le premesse, ripetiamo, sono molto incoraggianti.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 5