10 de novembre 2011

Jugant al Tetris amb proteïnes...

Qui diria que simplement per jugar podem aparèixer com a autors d'un article de recerca científica publicat a una de les revistes més prestigioses, Nature?


Fa ja uns quants anys van començar a aparèixer sistemes de col·laboració que utilitzen els nostres ordinadors mentre nosaltres no hi treballem amb l'objectiu d'aprofitar la potència de càlcul no usada per a fer càlculs i anàlisis especialment complexes de diversos àmbits científics. El primer projecte d'aquesta mena fou el projecte GIMPS per a calcular nombres primers de Mersenne, tot i que potser el més famós és el SETI@Home, per a analitzar els senyals rebuts per radiotelescopis d'arreu del món i buscar-hi possibles indicis de civilitzacions extraterrestres. La idea és utilitzar la potència de càlcul de milers i milers d'ordinadors d'arreu del món mentre ningú no els utilitza per realitzar càlculs i anàlisis científiques. Avui ja hi ha molts projectes d'aquesta mena en marxa, tots basats en el que s'anomena un sistema de computació distribuïda, en concret el sistema BOINC (doneu un cop d'ull a la llarga llista de projectes). En aquests casos també s'anomena computació voluntària, ja que els participants ofereixen voluntàriament temps de càlcul del seu ordinador per a la tasca en qüestió.

Fins aquí res de jocs, ja ho sé, ara hi arribem...


Poc després es va pensar en aprofitar no els ordinadors, sinó les persones que són davant dels ordinadors. Així han anat sorgint altres sistemes de «computació» distribuïda en què es proposa als usuaris d'ordinadors amb connexió a la xarxa que facin una sèrie de tasques. Quines tasques? Està clar que han de ser tasques senzilles, perquè tothom les pugui fer, sense haver de ser cap expert en el tema que s'està estudiant ni sense haver de tenir cap mena de formació científica. I tasques senzilles vol dir tasques rutinàries, repetitives i segurament tedioses si algú les hagués de fer 8 hores al dia, però no tant si en lloc d'una persona dedicant-s'hi 8 hores al dia, ho fan 100 persones dedicant-hi 5 minuts al dia. Ara potser podeu pensar «però aquesta mena de tasques repetitives no són les que fan tan i tan bé els ordinadors?» Bé, sí i no. I aquí hi ha un punt clau: els humans som molt bons en reconèixer patrons, formes i estructures tridimensionals, molt millors del que ho puguin ser actualment els ordinadors. Per tant es va pensar en aprofitar aquesta capacitat dels humans per ajudar en projectes de recerca que impliquin reconèixer patrons i establir estratègies de resolució de problemes espacials. D'aquesta manera han aparegut projectes com Galaxy Zoo o Be a Martian, entre molts d'altres, tots els quals es basen en comparar imatges i identificar patrons destacables, sigui en galàxies o en la superfície de Mart. I repeteixo: a nosaltres humans ens resulta molt fàcil identificar patrons, però als ordinadors els costa molt; al capdavall milions d'anys de selecció natural ens han dut a ser molt bons en això, ja que en depenia la nostra supervivència. El factor lúdic s'introdueix fent que aquesta tasca aporti una certa recompensa, una recompensa tant en termes de «punts» obtinguts com en termes del plaer de poder ser partícip d'un descobriment científic. Estarem d'acord que com a joc és limitadet, però el punt important és que per primera vegada s'introdueix el joc no com a element didàctic, no com a element d'estudi, sinó com a eina de recerca d'alt nivell.

I dins d'aquesta mena de projectes arribem al que segurament és el més sofisticat de tots actualment: FoldIt. De què va FoldIt? Doncs de plegament de proteïnes... Calma, que ara ho explico. Segurament ja sabeu que a les nostres cèl·lules tenim ADN, i resulta que la missió d'aquest ADN és codificar proteïnes. Què vol dir codificar proteïnes? Doncs que cada fragment d'ADN, cada gen, conté les instruccions necessàries perquè la maquinària bioquímica de la cèl·lula construeixi una proteïna (a través de l'ARN, però ara no hi entrarem). En concret, cada tres trossets d'ADN (cada tres bases, fragment que s'anomena codó) indiquen que a l'hora de construir la proteïna s'ha de col·locar un aminoàcid concret (per posar un exemple, el grup de tres bases GCC indica que s'ha de posar l'aminoàcid alanina). I una bona tirallonga d'aminoàcids formen precisament una proteïna; i vés per on, les proteïnes són les que fan funcionar tot plegat, els veritables pencaires de qualsevol organisme. Ja veieu com van les coses, doncs: ADN > ARN > proteïnes > activitat biològica.


Ara bé, les proteïnes, aquestes tirallongues d'aminoàcids (entre 100 i 1.000) no serveixen per a res així tal qual, amb els aminoàcids ben endreçadets posats un rere l'altre: per tal de funcionar correctament, aquesta tirallonga s'ha de plegar sobre sí mateixa com un llençol fins a arribar a una forma (la conformació nativa) que és la que li permet funcionar com li pertoca (i que resulta que, normalment, és la que fa que la proteïna tingui la menor energia possible). El plegament d'una proteïna està totalment determinat a partir dels aminoàcids que la formen, però el problema és que no sabem gaire bé com collons s'ho fa, com carai arriba a la conformació nativa final; vaja, no sabem predir quina serà l'estructura final d'una proteïna només a partir de la cadena d'aminoàcids. L'interès és que determinar l'estructura de les proteïnes és fonamental per entendre les causes de moltes malalties i elaborar fàrmacs per evitar-les; i encara més, sabent el mecanisme de plegament podem fer proteïnes a mida que tinguin una activitat determinada (el que s'anomena enginyeria de proteïnes).

I és que el nombre de formes diferents en què es pot plegar una proteïna, fins i tot una de petitona, és astronòmic, i determinar quina de totes les formes és la nativa és un dels problemes més durs de la biologia molecular, i un dels que consumeix més temps de càlcul dels ordinadors, fins i tot dels grans superordinadors. I aquí arriba FoldIt: el projecte FoldIt, en lloc d'intentar-ho amb força bruta (superordinadors), vol aprofitar la capacitat innata de resolució de problemes espacials dels humans, de manera que des de casa seva milers de persones juguin competitivament a plegar proteïnes a la pantalla del seu ordinador i trobin les conformacions més estables (les d'energia menor, recordeu que la conformació nativa és la de menor energia). La idea és la mateixa que ja hem comentat anteriorment, en què l'aspecte lúdic s'introdueix gràcies a un sistema de puntuació i a una competició entre individus o grups d'individus per trobar la millor conformació en un temps determinat. A la pantalla t'apareix la proteïna i pots dedicar-te, literalment, a jugar amb ella, estirant-la, doblegant-la, arrossegant-la amb el ratolí (i també amb unes eines addicionals que la «sacsegen» i fan altres marranades a la pobra proteïna).


Tot això en un entorn plenament dospuntzero, amb una wiki i una veritable xarxa social de participants, que intercanvien idees i les estratègies que segueixen quan són davant de la pantalla i intenten fer encaixar la proteïna. Evidentment, els investigadors del projecte han de comprovar i treballar força amb els resultats aconseguits pels jugadors abans d'arribar a cap conclusió, però la idea que cal destacar és que un entorn lúdic permet fer les tasques inicials de la recerca amb una efectivitat superior a la dels algorismes informàtics.


El resultat més espectacular de tot plegat ha estat la publicació del següent article aquest octubre:
En aquest treball, a partir dels resultats dels jugadors de FoldIt, s'ha pogut determinar l'estructura de la proteasa retroviral (un enzim, un tipus de proteïna) del virus Mason-Pfizer de les mones, un virus que provoca en les mones una malaltia de la mateixa família que la sida. Déu n'hi do, per jugar al Tetris amb proteïnes!

Trobareu més informació també a:


1 comentari:

Alejandro Ramos ha dit...

La primera part de l'article ja la coneixia, de fet tinc un amic que li dedica part del seu temps lliure al Galaxy Zoo xD

Però no coneixia lo del Foldit, molt interessant sens dubte ;)