Adrià Mallol Ragolta (Figueres, 1993), alumni d’Enginyeria de Sistemes Audiovisuals de la Universitat Pompeu Fabra de Barcelona i investigador de la Universitat d’Augsburg (Alemanya), desenvolupa models computacionals per detectar estats de salut i emocionals de les persones. El treball sobre els estossecs i la Covid-19 que ha realitzat amb la investigadora del grup de recerca Tecnologia Musical Helena Cuesta, i en què també han participat els investigadors Emilia Gómez i Björn Schuller, ha estat acceptat al congrés Interspeech, que se celebrarà a Txèquia a l’agost.

De quina forma ens pot donar informació la tos?

De les poques coses que sabem de la Covid-19 és que afecta l’aparell respiratori. Per tant, qualsevol senyal biològic que generi el nostre propi cos i que estigui condicionat per aquest aparell té potencial per contenir informació rellevant per a la detecció de la Covid-19. En el nostre estudi en concret ens hem centrat en l’anàlisi de la tos, però hi ha altres estudis que també han explorat la utilització de la respiració o fins i tot la veu per a la detecció de la Covid-19.

Quines són les característiques de la tos d’un malalt de Covid? En què es diferencia de la resta de tos?

Per respondre aquesta pregunta cal fer estudis perceptius per detectar i reconèixer auditivament les diferències. Actualment, s’estan fent estudis en aquesta direcció, però dels quals encara no en tenim resultats. En l’estudi que hem presentat, nosaltres hem analitzat l’espectrograma de la tos. L’espectrograma és una representació de les freqüències presents en un senyal acústic en funció del temps i la seva energia. Utilitzant tècniques d’IA hem entrenat una xarxa neuronal que analitza aquests espectrogrames amb l’objectiu d’aprendre a extreure la informació rellevant per a la detecció de la Covid-19. En altres paraules, com que desconeixem quines són les característiques rellevants en la tos per a la detecció de la Covid-19, utilitzem l’IA perquè ens ajudi a resoldre aquesta tasca.

«La tecnologia té sentit si pot contribuir a millorar la qualitat de vida de les persones»

Hi ha algun altre tipus de tos que també permeti identificar l’afecció de la persona que estossega?

Aquesta és una pregunta que te la respondria millor un metge, però, des d’un punt de vista perceptiu, l’oïda humana és capaç de sentir un estossec i detectar-ne una possible anomalia. Segurament, l’oïda humana no és capaç de detectar la patologia exacta, però sí que som capaços de dir allò de: «Aquesta tos no sona bé». Des del punt de vista de la investigació en salut digital seria molt interessant poder recollir una base de dades d’estossecs anotada per metges amb la o les patologies associades a cada estossec per veure si els models computacionals podrien ser capaços de fer aquesta detecció de manera automàtica.

Com des del vessant de l’enginyeria de sistemes audiovisuals en el seu cas i de la tecnologia musical pel que fa a la seva companya d’investigadors us interesseu per una recerca mèdica i científica?

Des del meu punt de vista, la tecnologia només té sentit si pot contribuir a millorar la qualitat de vida de les persones i, per això, intento enfocar la meva línia d’investigació en la salut digital i la computació afectiva. En el context pandèmic actual, hem vist com un dels grans esculls per fer front a la Covid-19 ha estat l’accés a les proves diagnòstiques, les quals, a més, són cares en termes de temps i de diners. Tots portem un mòbil al damunt i hi interactuem moltíssimes hores cada dia. Per què no utilitzar-lo com a instrument per fer proves prediagnòstiques que ens permetin fer cribratges de manera massiva, econòmica i efectiva? És en aquest punt on ens plantegem aprofitar l’experiència i el coneixement en el processament de senyals acústics –que també es troben en els fonaments de la tecnologia musical– i en IA adquirits durant la nostra formació i investigar la detecció automàtica de la Covid-19 a partir de senyals de tos.

Us han sorprès els resultats del vostre treball?

En certa manera, sí. A la detecció automàtica de la Covid-19 hi vam voler afegir una perspectiva de gènere. Per això, vam comparar models computacionals que utilitzaven el sexe del pacient que tossia per a fer-ne la predicció. Els resultats que hem obtingut suggereixen que considerar el sexe del pacient per aquesta tasca és rellevant.

El fet que hàgiu determinat que es pot detectar la Covid a través de la tos ha generat molta expectació. Tindrà alguna utilitat pràctica a partir d’ara?

El nostre estudi ha tingut ressò a escala nacional, estatal i fins i tot internacional. Tant de bo que aquestes tecnologies desenvolupades poguessin tenir una utilitat pràctica! De totes maneres, aquesta investigació encara està en un estat inicial. Ens caldria fer molta més recerca i caldria recollir moltes més dades per tal de poder entrenar models més robustos.

«Seria molt interessant poder recollir una base de dades d'estossecs anotada per metges»

Com es fa la detecció?

En primer lloc, calculem l’espectrograma del senyal de tos, el qual analitzem amb una xarxa neuronal que n’extreu una representació. A continuació, utilitzem un mecanisme d’atenció contextual per ressaltar la informació més rellevant de la representació extreta i, finalment, la classifiquem en funció de si correspon a un pacient amb Covid-19 o no. A més d’aquesta informació, el model ens indica la probabilitat amb la qual ha fet la predicció.

És el primer estudi d’aquest tipus en què participa?

En l’àmbit concret de la salut digital, també he participat en un altre estudi relacionat amb la detecció de la Covid-19 a partir de la fusió d’informació extreta d’estossecs i respiracions. A més, també he treballat en la detecció d’altres condicions com la depressió o el trastorn per estrès posttraumàtic.

Què signfica que el treball ha estat acceptat al programa científic d’Insterspeech?

L’acceptació d’un article científic en un congrés significa que l’article sobre el nostre estudi ha estat revisat per altres investigadors, els quals l’han considerat correcte des d’un punt de vista metodològic, així com rellevant, ja que contribueix a generar nou coneixement. A més, l’acceptació del nostre article a Interspeech té una importància especial, ja que Interspeech és un dels congressos més prestigiosos en l’àmbit de la ciència i la tecnologia del processament del senyal de veu.

Computacióafectiva, salut digital i Intel·ligència Artificial

L’àrea d’especialització d’Adrià Mallol Ragolta és la computació afectiva i la salut digital. Utilitzant tècniques d’Intel·ligència Artificial (IA) i analitzant informació extreta de la parla, el llenguatge, l’expressió facial o del propi cos a partir de dispositius intel·ligents, com smartphones i smartwatches, desenvolupa models computacionals per detectar estats de salut i emocionals de les persones. «L’objectiu últim és el de crear una Intel·ligència Emocional Artificial que ajudi a la detecció precoç de malalties, que en millori la monitorització, i que ens permeti millorar el benestar de la societat», explica ell mateix.