La iniciativa, parte del proyecto “1000 plantas” (1KP), ha generado un conjunto de datos de 852 genes nucleares, el más grande de este tipo generado hasta la fecha en plantas. Según los investigadores, el procesamiento de estos macrodatos, ofrece una nueva base para estudiar la evolución vegetal. El estudio ha sido publicado en la revista Proceedings of the National Academy of Sciences (PNAS).
Esta gran matriz de datos ha permitido ver que, en contra de la hipótesis más aceptada hasta ahora, existe un estrecho parentesco entre las plantas terrestres y un grupo de algas verdes llamadas algas conjugadas. Además, también se han descubierto importantes pistas sobre el proceso de divergencia de los linajes de las plantas terrestres: según los nuevos datos, las plantas hepáticas son el grupo hermano de los musgos, en lugar de serlo del resto de plantas con flores.
‘Big Data’
“En comparación con otros organismos, el genoma de las plantas es desproporcionadamente grande. El ADN humano contiene algo más de 3.000 millones de pares de bases mientras que el un pino cualquiera tiene alrededor de 20.000 millones de pares de bases. Por eso en este proyecto secuenciamos transcriptomas, las regiones del ADN que después se traducen a ARN, como los genes que después dan lugar a proteínas, en lugar de secuenciar genomas completos”, explica la investigadora del CSIC Lisa Pokorny, del Real Jardín Botánico.
El problema al que se han enfrentado los investigadores de 1KP es que procesar el volumen de datos resultante de dichos transcriptomas requiere una gran capacidad computacional. “Cuando trabajas con 852 genes nucleares tu matriz de datos es inmensa y los métodos estadísticos desarrollados hasta ahora se quedan cortos. Como resultado de esa necesidad, a lo largo de este proyecto han surgido nuevos métodos que podrán ser empleados en el futuro para lidiar con volúmenes de datos comparables”, añade Pokorny.
Claves de la evolución
El estudio del transcriptoma aporta información sobre los genes que el ancestro de las plantas terrestres tuvo a su disposición en la transición del medio acuático al medio terrestre en la Tierra. Esos genes suponen la clave de su supervivencia en un medio sin humedad constante, bajo las radiaciones solares y donde la gravedad limita el crecimiento.
“El transciptoma nos permite, además, arrojar luz sobre el ‘abobinable misterio de Darwin’. Podemos comprender cómo, en relativamente poco tiempo a escala geológica, en apenas unos cuantos millones de años, se sentaron las bases que dieron lugar a la enorme diversidad de plantas con flores que habitan nuestro planeta, y en las que seguimos encontrando infinitos compuestos con aplicaciones médicas, agrícolas, etc. Pero nada de esto se puede hacer sin comprender cómo las plantas se relacionan entre sí, sin conocer su clasificación”, concluye la investigadora.
Wickett, N.J., S. Mirarab, N. Nguyen, T. Warnow, E. Carpenter, N. Matasci, S. Ayyampalayam, M. Barker, G. J. Burleigh, M. A. Gitzendanner, B. Ruhfel, E. Wafula, J.P. Der, S. W. Graham, S. Mathews, M. Melkonian, D. E. Soltis, P. S. Soltis, C. Rothfels, L. Pokorny, J. Shaw, L. DeGironimo, D. Stevenson, B. Surek, J.C. Villarreal, B. Roure, H. Philippe, C. W. dePamphilis, T. Chen, M. Deyholos, J. Wang, Y. Zhang, Z. Tian, Z. Yan, X. Wu, X. Sun, G. K-S. Wong, and J. Leebens-Mack. A phylotranscriptomic analysis of the origin and early diversification of land plants. Proceedings of the National Academy of Sciences (PNAS). DOI: 10.1073/pnas.1323926111