Un nou mètode basat en intel·ligència artificial accelera la identificació de gens relacionats amb el càncer. El mètode i els seus resultats es descriuen a la revista "Nature Communications". La seva validesa ja ha estat comprovada en línies cel·lulars de diversos tipus de càncer.
El nou sistema utilitza tècniques d'aprenentatge automàtic -l'anomenat machine learning- per relacionar grans quantitats de dades. L'equip està integrat per diversos investigadors del University College de Londres. Ha estat liderat per Natasa Przulj, professora ICREA (Institució Catalana de Recerca i Estudis Avançats) que s'acaba d'incorporar al BSC (Barcelona Supercomputing Center) com a líder del grup de Biologia Computacional Integrativa de Xarxes.
A l'article, els autors expliquen que, si bé s'han identificat molts gens clau en el càncer, els efectes dels mecanismes alterats a les cèl·lules no es coneixen prou. S'han recollit moltes dades sobre gens, proteïnes i el metabolisme en general, però per extreure'n la màxima informació es requereixen nous algoritmes.
L'equip de la doctora Prulj ha fet servir les tècniques de machine learning per relacionar grans quantitats de dades. Bàsicament, el sistema fusiona xarxes d'interacció molecular que permeten conèixer i estudiar les interaccions entre proteïnes i entre gens.
Totes les dades s'integren en un prototip informàtic que anomena cèl·lula integrada o iCell. Segons els investigadors, aquest model permet comprendre molt millor l'organització funcional de la cèl·lula que amb una sola xarxa.
Comprovat amb els càncers més estesos
Els autors han construït iCells dels quatre càncers més prevalents en humans: mama, pròstata, pulmó i còlon-recte. Amb la comparació amb iCells de teixits sans han pogut identificar els gens activats o la interacció de gens que juguen un paper en el càncer.
El mètode ha assenyalat 63 gens. Un procés de validació biològica ha confirmat que almenys 36 d'ells contribueixen al creixement irregular de les cèl·lules.
El sistema es pot fer servir per descobrir nous gens biomarcadors, que poden ser rellevants per predir la supervivència en pacients amb càncer. Així, s'ha observat que els pacients amb càncer de mama amb alta expressió de la proteïna MRPL3, que prèviament no s'havia relacionat amb el càncer, tenen una menor supervivència.
Przulj destaca que aquest nou mètode permet la identificació de gens alterats en el càncer que no apareixen com a alterats en cap altre tipus de dades:
"Aquest descobriment posa de manifest la importància dels enfocaments integratius per analitzar dades biològiques i aplana el camí cap a anàlisis integratives comparatives de totes les cèl·lules."
Els autors conclouen l'article afirmant que, si bé s'han focalitzat en el càncer, el seu mètode permet analitzar tot tipus de cèl·lules. Així, pot ser aplicat a altres malalties, l'envelliment, l'especialització i diferenciació de les cèl·lules i tots els processos que requereixin capturar i analitzar dades sobre diferents aspectes del funcionament de cèl·lules i teixits.
Xavier Duran