Manuel Álvarez és voluntari d’aquesta comunitat virtual que ja ha aconseguit reunir prop de 550 experts per lluitar contra la Covid-19
Aquests dies, la ciència treballa a contrarellotge per frenar una pandèmia que ha colpejat els cinc continents. Però, amb el coronavirus, també es propaguen els estudis científics. L’objectiu és comú: accelerar el lent camí cap a una vacuna i frenar els contagis per evitar més morts. I els esforços no ens queden lluny. A tall d’exemple, per iniciativa d’una professora de la Universitat Politècnica de Catalunya (UPC), Montserrat Alsina, s’ha impulsat l’elaboració urgent de models matemàtics predictius d’infeccions i ingressos hospitalaris, així com la proposta de millores logístiques en els serveis d’urgències. Mentrestant, la comunitat virtual CoronaWhy, creada fa menys de dues setmanes, ja ha aconseguit reunir prop de 550 voluntaris provinents de diferents branques del coneixement. Són més de mig miler de persones dedicades a pensar, coordinar i elaborar estratègies per ajudar la comunitat mèdica a respondre els interrogants vitals que planteja la malaltia. La Tecnòloga ha entrevistat un voluntari d’aquesta organització: el científic de dades Manuel Álvarez.
Primer de tot, què és CoronaWhy?
CoronaWhy és un esforç comunitari per fer digerible la col·lecció d’articles científics vinculats a la pandèmia més extensa que existeix, l’anomenat CORD-19 [Covid-19 Open Research Dataset], que ja reuneix més de 45.000 publicacions. L’expert en sistemes d’intel·ligència artificial Artur Kiulian va fer una crida a l’acció utilitzant la plataforma Kaggle, on va començar a reunir-se gent amb ganes de fer alguna cosa, fa dues setmanes. I el projecte ha agafat una dimensió exponencial. A més, CoronaWhy va néixer en el si d’una competició. Inicialment, l’Allen Institute for Artificial Intelligence oferia 1.000 dòlars per al guanyador de cada tasca plantejada. Cal tenir en compte que normalment s’hi ofereixen més diners i aquest és, en realitat, un preu simbòlic. Així, aquest cop ha desaparegut l’incentiu del guany personal però, donada la urgència de la situació, hi ha hagut una col·laboració molt bèstia.
Com s’organitza un grup tan gran i multidisciplinar per treballar i, després, reunificar esforços?
Aquest problema encara s’està intentant resoldre. La comunitat es veu una mica superada pel seu propi creixement. Per això fem una separació cada cop més acotada de les diferents tasques. Per comunicar-nos internament utilitzem el servei de missatgeria Slack. Fem una videotrucada diària amb Zoom per coordinar-nos i fer una actualització dels diferents equips de treball. I amb Trello gestionem les diferents tasques, on el moviment és frenètic i cada grup de feina té el seu propi tauler.
Quin són els problemes que intenta resoldre CoronaWhy?
Amb base al conjunt massiu d’articles, els científics de dades filtrem, sintetitzem i estructurem el coneixement. L’objectiu és que els especialistes mèdics puguin tenir accés a la informació resumida i agrupada al voltant de preguntes com, per exemple, “què en sabem dels factors de risc de la Covid-19?” o “què sabem sobre les vacunes i els fàrmacs?”. Sobre tot això s’ha investigat i escrit moltíssim. Nosaltres recopilem la informació i la processem. A més, elaborem una guia amb l’objectiu de, posem per cas, fer polítiques de prevenció. Cada dia entren nous articles i es plantegen noves preguntes, mentre d’altres es reformulen. Al mateix temps, alguns especialistes mèdics revisen la feina que fem.
La Intel·ligència Artificial s’ha convertit en una de les especialitats per intentar predir l’avançament de la Covid-19. Com s’està fent servir, en aquest cas?
La principal tasca de la intel·ligència artificial a CoronaWhy és el processament del llenguatge natural per identificar similituds i confluències entre els articles científics. Això permet als investigadors crear un feed de cerca personalitzat en funció dels seus interessos. D’aquesta manera, estem entrenant uns models capaços de processar i entendre els llenguatge mèdic, amb les seves particularitats, i en qualsevol idioma. Passa el mateix quan fem una cerca a Google, i aquest ens retorna una resposta sintètica a partir dels diferents continguts que ha trobat a la xarxa. O sigui, que a partir de tots els textos, la intel·ligència artificial en resumeix la informació més rellevant. També s’utilitza el processament del llenguatge natural per vectoritzar els textos, de manera que s’identifiquen i es relacionen diferents paraules que són sinònimes i, així, es fa una relació i una classificació d’articles.
I quina és la teva tasca principal?
Jo estic a l’equip Task-Geo. Ens dediquem a la recopilació de dades geogràfiques i a l’estudi de la influència dels elements geogràfics, com poden ser la meteorologia o la densitat de població, en la transmissió del virus. Concretament, jo em dedico a recopilar dades empíriques com la temperatura, la humitat, la incidència del tabaquisme o la diabetis, que es troben repartides en mil fonts i formats diferents. La idea és estructurar aquesta informació d’una manera unificada per reentrenar els models matemàtics amb dades actualitzades dia a dia. Així, podrem veure quines hipòtesis es mantenen i quines altres no.
Qui pot participar a CoronaWhy? Fa falta més gent?
Qualsevol persona hi pot participar. Paral·lelament als grups de treball dels àmbits científics, se’n formen d’altres de caràcter transversal, dedicats a la comunicació o a la gestió de projectes. Si no es té un perfil tècnic, es pot participar en l’organització, la coordinació de l’equip, la comunicació interna o la divulgació. Ara tenim moltes mans. Si som capaços de canalitzar tot aquest esforç i el que pugui arribar, podem fer que la feina avanci més ràpid. I això pot ajudar a salvar vides.
Respostes com la de CoronaWhy poden canviar la manera de fer recerca?
Aquest esforç no seria possible sense el pes de la comunitat del Software Lliure i plataformes com Kaggle, que canalitzen aquesta iniciativa. Desconec si això tindrà una influència en el món acadèmic i canviarà la manera d’investigar, però sí que s’obren per a les Dades Massives (en anglès, Big Data) nous horitzons en la recerca mèdica. És a dir, sobre el coronavirus s’ha fet recerca, i nosaltres fem recerca sobre la recerca. Dit d’una altra manera: busquem quins resultats de la investigació són més o menys influents. Molts equips científics s’han adonat que els mateixos estudis no arriben als mateixos resultats o, directament, són difícils o impossibles de replicar o reproduir. La ciència de dades també pot ajudar a resoldre aquesta mena de problemes que s’han convertit en sistemàtics en el món de la recerca.
Normalment, els científics de dades treballeu amb problemes més ben definits, i en aquest cas, en canvi, les preguntes no estan del tot plantejades…
Sí, habitualment treballem amb problemes molt més acotats. Per exemple, ens demanen que predim el preu d’un pis en funció d’unes variables com els metres quadrats, els anys que té, la il·luminació o la localització. És un problema tancat. A CoronaWhy també tenim clar l’objectiu: aturar l’epidèmia. Però això no és una pregunta, sinó un conjunt de preguntes molt obertes. Per això, la nostra primera feina és intentar acotar al màxim els interrogants. Quina és la millor manera d’evitar noves transmissions és una pregunta molt oberta. En canvi, no ho és tant demanar-nos si els Estats que han mantingut el transport públic han tingut menys èxit que els que l’han tancat. Aquesta darrera pregunta és més fàcil de respondre amb ciència de dades.
L’Estat utilitzarà les dades de les teleoperadores per rastrejar els moviments anonimitzats dels ciutadans amb la finalitat de monitoritzar l’avanç de la Covid-19. Què n’opines?
Fa uns dies vaig llegir en algun lloc que, abans d’una tragèdia, totes les prevencions semblen innecessàries i, després, totes les mesures pal·liatives semblen insuficients. Al gener, ningú podia saber que això explotaria d’aquesta manera. També és cert que l’Estat ha badat i ha flaquejat a l’hora d’implementar determinades mesures. No tenia sentit mantenir el transport públic i la indústria en funcionament mentre es tancaven tots els bars. Opino que la mesura de monitoritzar els moviments de la població arriba tard i és insuficient, perquè ja hi ha hospitals col·lapsats i falta material. Tot i així, com a mesura em sembla vàlida. Una llei que no és capaç de forçar el seu compliment no serveix per a res. Aquesta sembla una mica orwelliana, però té sentit que es controli la quarentena perquè és una situació molt extremada. També espero que quan tot això passi, el control s’aturi. I això sospito que no passarà, perquè lamentablement trobaran nous motius per fer-ho.
One Reply to ““A CoronaWhy s’obren per a les Dades Massives nous horitzons en la recerca mèdica””