Un nou sistema d’Intel·ligència Artificial facilitarà el pronòstic i l’estimació de l’evolució de pacients amb COVID-19

Combinant informació sobre símptomes, comorbilidades i proves de laboratori, permet obtindre el pronòstic de cada individu i classificar-lo segons el nivell de gravetat al qual poguera arribar

· En aquells casos en els quals es preveu major gravetat, ajudaria a instaurar tractaments de manera més precoç, amb l’objectiu final de reduir la mortalitat i els ingressos en UCI

· El seu desenvolupament està liderat per la Universitat Politècnica de València i en ell participen també experts del INCLIVA-Hospital Clínic Universitari de València i de l’Institut d’Investigació Hospital 12 d’Octubre de Madrid

Investigadors de la Universitat Politècnica de València (UPV), juntament amb l’Institut d’Investigació Sanitària INCLIVA de l’Hospital Clínic Universitari de València i l’Institut d’Investigació de l’Hospital Universitari 12 d’Octubre de Madrid i+12, treballen en una nova eina que ajudarà a donar un pronòstic robust per a cada pacient amb COVID-19 en el moment de l’ingrés. Es tracta d’un Sistema d’Ajuda a la Decisió Clínica basat en tècniques d’Intel·ligència Artificial i aprenentatge automàtic. Combinant informació sobre símptomes, comorbilidades i proves de laboratori, permet obtindre aqueix pronòstic personalitzat per a cada individu i classificar-lo segons el nivell de gravetat al qual poguera arribar –“per exemple, després de diversos dies pot patir una insuficiència respiratòria aguda, per al que un tractament precoç seria fonamental.

Un dels principals desafiaments per a l’aprenentatge automàtic en la COVID-19 és la qualitat de les dades; repte al qual aquesta eina del Biomedical Data Science Lab-ITACA de la UPV, ajudarà a respondre.

Segons explica Juan Miguel García-Gómez, coordinador del BDSLab-ITACA de la UPV, l’aprenentatge automàtic té el potencial d’ajudar en aquesta tasca mitjançant l’aplicació de tècniques d’aprenentatge no supervisat i supervisat als Registres de Salut Electrònics (EHR) dels hospitals. Aquestes tècniques permeten extraure els patrons més significatius de l’historial de comorbilidad del pacient, els símptomes i les proves de laboratori en el moment de l’ingrés, fins a les seues últimes dades de la Unitat de Vigilància intensiva (UCI), que poden conduir a una estratificació primerenca del pacient i a la predicció de la seua gravetat.

No obstant això, hi ha fortes evidències que les dades reals (real world data, RWD) continguts en els Registres de Salut Electrònics dels hospitals estan lluny de ser perfectes, la qual cosa limita la seua extracció de coneixement tant pels professionals mèdics com per les màquines que poden ajudar al diagnòstic del pacient. A més, la variabilitat inherent a la pràctica clínica i la codificació de dades entre els hospitals, o fins i tot entre les seues poblacions destinatàries, pot esbiaixar qualsevol resultat extret de les dades.

“Per tant, els mètodes aprenentatge automàtic i d’Intel·ligència Artificial (IA) requereixen una avaluació i explicació de la Qualitat de les Dades (DQ) associada tant a l’aprenentatge com a les noves prediccions per a garantir solucions correctes i pragmàtiques i això és al que contribueix la metodologia que hem ideat, que serà emprada per primera vegada en aquesta eina”, apunta Carlos Sáez, investigador postdoctoral del BDSLab-ITACA de la Universitat Politècnica de València.

Projecte SUBCOVERWD-19, Fons SUPERA COVID-19

L’equip de la UPV, juntament amb experts de l’Institut d’Investigació Sanitària INCLIVA de l’Hospital Clínic Universitari de València i de l’Institut d’Investigació de l’Hospital Universitari 12 d’Octubre de Madrid i+12, treballen en el desenvolupament d’aquesta eina en el Projecte SUBCOVERWD-19, que permetrà disposar d’una estratificació primerenca del risc de gravetat-severitat del pacient en el moment de l’ingrés. L’eina es basarà en un model que combina aprenentatge no supervisat i supervisat. A més, superarà les limitacions de la RWD per a la investigació mitjançant un aprenentatge automàtic que tindrà en compte la qualitat i variabilitat de dades.

El Dr. Rafael Badenes, del Grup d’Investigació en Anestèsia de INCLIVA, assegura que des d’un punt de vista clínic, el comptar amb eines d’intel·ligència artificial que siguen capaces de predir, en fases primerenques de la malaltia, quin serà l’esdevenir d’aquesta, constitueix un element crucial en la lluita contra la malaltia. “En aquells casos en els quals es preveu major gravetat, podríem instaurar tractaments de manera més precoç, amb l’objectiu final de reduir la mortalitat i els ingressos en UCI”, afig el Dr. Badenes, també cap de secció d’Anestèsia de l’Hospital Clínic i Universitari de València i professor de la Universitat de València.

“L’heterogeneïtat i complexitat de la COVID19 fa imprescindible l’ús de tècniques molt avançades i sofisticades d’anàlisis, per a poder identificar els patrons clínics i epidemiològics encara molt desconeguts en aquesta malaltia. Creiem que aquest projecte pot contribuir a aconseguir aquest objectiu”, afig el Dr. Agustín Gómez de la Cambra, cap de la Unitat d’Investigació i Suport Científic de l’Hospital 12 d’Octubre.

Aquest projecte, coordinat per l’investigador de la UPV, Carlos Sáez, ha sigut un dels seleccionats en la convocatòria del FONS SUPERA COVID-19, impulsada per Crue Universitats Espanyoles, Banc Santander, a través de Santander Universitats, i el Consell Superior d’Investigacions Científiques (CSIC).

Estudi previ

La falta de dades representatives de COVID-19 és una de les raons per les quals s’ha desaconsellat l’ús clínic de models predictius recentment desenvolupats per a COVID-19, segons un estudi publicat recentment en el British Medical Journal.

“La qualitat de les dades és crítica. Especialment en els entorns de compartició de dades en múltiples llocs, la variabilitat entre les fonts de dades és una possible font de biaixos inesperats en l’aprenentatge de models i la seua posterior utilització”, apunta Carlos Sáez.

Amb la finalitat de descobrir i classificar els subgrups de severitat de COVID-19 utilitzant el conjunt de dades nCov2019, recentment publicat en la revista Scientific Data, l’equip del BDSLab-Ítaca de la UPV ha descobert que els dos països amb major prevalença en tals dades (la Xina i Filipines) es van dividir en subgrups separats amb manifestacions de gravetat diferents. “La variabilitat de les fonts de dades pot comportar potencials biaixos per al procés d’aprenentatge automàtic de COVID-19, així com per a la generalització dels seus resultats en nous pacients i localitzacions. És crucial tindre la variabilitat i qualitat de dades en compte per a una IA robusta i de confiança”, explica Carlos Sáez.

Deixa el teu comentari