06 Septiembre 2012

Más de 30 artículos científicos publicados al mismo tiempo en Nature, Genome Research y Genome Biology es el fruto del trabajo de un equipo internacional de investigadores –con participación española- que revela que la mayoría del que hasta ahora se llamaba "ADN basura" en el genoma humano, es en realidad útil y muy importante.

Hoy, un equipo internacional de investigadores revela que la mayoría de lo que hasta ahora se ha llamado "ADN basura" en el genoma humano es, en realidad, un gran panel de control con millones de interruptores que regulan la actividad de nuestros genes. Sin dichos interruptores, los genes no funcionarían y las mutaciones en estas regiones causarían enfermedades. Descubierto por cientos de científicos trabajando en el proyecto ENCODE, esta nueva información es tan exhaustiva y compleja que ha dado lugar a un nuevo modelo de publicación mediante el cual los documentos electrónicos y los conjuntos de datos están interconectados.

ENCODE ha combinado los esfuerzos de 442 científicos en 32 laboratorios en el Reino Unido, los Estados Unidos, España, Singapur, Japón y Suiza. Se han generado y analizado cerca de 15 terabytes (15 billones de bytes) de datos en bruto – todos ellos ahora disponibles públicamente. El estudio ha utilizado alrededor de 300 años en tiempo de ordenador para estudiar 147 tipos de tejido y determinar qué enciende o apaga a genes específicos y cómo ese interruptor difiere entre tejidos o tipos celulares.

Los artículos publicados «representan una nueva forma de hacer que los investigadores puedan navegar y acceder a los datos», comenta Magdalena Skipper, editora senior de la revista Nature, que ha producido la plataforma de publicaciones gratuita en internet. Todo el contenido de ENCODE, en las tres revistas (Nature, Genome Research y Genome Biology), está conectado digitalmente por temas, así los lectores pueden seguir su área de interés entre los trabajos y hasta los datos originales.

Según los expertos, igual que el Proyecto Genoma Humano revolucionó la investigación biomédica, ENCODE nos ofrecerá una mejor comprensión y abrirá nuevos caminos para la ciencia biomédica. Liderado por el National Genome Research Institute (NHGRI) en los Estados Unidos y el EMBL-European Bioinformatics Institute (EMBL-EBI) en el Reino Unido, ENCODE presenta ahora un mapa detallado de la función del genoma que identifica 4 millones de "interruptores" de genes. Esta referencia esencial ayudará a los investigadores a localizar áreas muy específicas de enfermedades humanas. Estos descubrimientos se han publicado en 30 artículos de acceso abierto conectados entre sí que aparecen en tres revistas científicas.

«Nuestro genoma sólo funciona gracias a los interruptores: millones de lugares que determinan si un gen se enciende o se apaga», explica Ewan Birney del EMBL-EBI, coordinador de análisis del proyecto. «El Proyecto Genoma Humano mostró que sólo el 2% de nuestro genoma contiene genes, que son las instrucciones para hacer proteínas. Con ENCODE, podemos ver que cerca del 80% del genoma está activamente haciendo algo. Hemos encontrado que una gran parte del genoma –de hecho, una cantidad sorprendente– está implicada en controlar cuándo y dónde se producen las proteínas más allá de simplemente fabricarlas.»

Estos descubrimientos nos ofrecen el conocimiento que necesitamos para mirar más allá de la estructura lineal del genoma y ver cómo toda la red está conectada. Tan importante es saber dónde se están ubicados ciertos genes como también qué secuencias los controlan. Por culpa de la compleja estructura tridimensional de nuestro genoma, estos controles a menudo están lejos del gen que ellos regulan si leemos la secuencia linealmente pero, si la leemos de forma tridimensional veremos que se encuentran envueltos alrededor para contactar con ellos. Si no fuera por ENCODE, probablemente nunca habríamos mirado estas regiones. Este es un paso enorme hacia la comprensión del complejo diagrama de cableado del ser humano. ENCODE nos ayuda a mirar en lo más hondo del circuito de regulación que nos cuenta cómo todas las partes se unen para crear un ser complejo.

La aportación del CRG a ENCODE

portadaVeinte de los 442 científicos de ENCODE son del Centro de Regulación Genómica (CRG) en Barcelona (aunque algunos están, a fecha de hoy, en el CNAG o en otros centros). Roderic Guigó, coordinador del programa de Bioinformática y Genómica del CRG y profesor en la UPF ha liderado el grupo de análisis de ARN de ENCODE. A nivel español, hay también dos investigadores del CNIO que han participado en el estudio. El trabajo también ha contado con el apoyo del Instituto Nacional de Bioinformática.

Los investigadores del CRG han participado en dos de los manuscritos publicados en Nature (y son los autores principales en uno de ellos), en cuatro de los artículos publicados en Genome Research (y son los autores principales en tres de ellos), y en dos de los publicados en Genome Biology. Además, investigadores asociados al CRG han diseñado la portada del número especial sobre ENCODE en Genome Research inspirándose en el estilo del artista catalán Joan Miró.

En concreto, el grupo coordinado por Roderic Guigó ha participado en el análisis de la actividad transcripcional del genoma, dentro de los subproyectos coordinados por Tom Gingeras, de Cold Spring Harbour Laboratory (US), y Tim Hubbard, del Welcome Trust Sanger Institute (UK). La extensión de las instrucciones codificadas en el genoma se desencadenan por la transcripción del ADN en ARN. Antes de ENCODE, se consideraba que la actividad transcripcional del genoma iba dirigida a sintetizar moléculas de ARN mensajero para fabricar proteínas. No obstante, durante la última década se han desarrollado nuevas tecnologías que permiten monitorizar toda la actividad transcripcional del genoma con una resolución sin precedentes. Utilizando esta tecnología, los investigadores de ENCODE han descubierto una gran actividad transcripcional en el genoma humano que no va dirigido a la fabricación de proteínas. «Las moléculas de ARN son muy abundantes y todavía más diversas en su secuencia, estructura o función de lo que imaginábamos. La biología del ARN será cada vez más crucial para la investigación básica y para las aplicaciones técnicas en biología y medicina en particular», explica Roderic Guigó.

Participar en el proyecto ENCODE ha sido al mismo tiempo un reto y una recompensa para los investigadores del CRG. «El proyecto ENCODE ha establecido nuevos estándares en relación a la cooperación entre científicos», añade Roderic Guigó. «Hemos estado trabajando de forma muy próxima con científicos de todo el mundo. Nuestro grupo de trabajo se reunía semanalmente por teleconferencia y contaba con investigadores de California, la costa Este de los Estados Unidos, el Reino Unido, Suiza, Singapur y Japón. La reunión era a las 6 de la mañana para los investigadores de California pero a medianoche para los japoneses».

Sarah Djebali, que se ha encargado de la logística de la coordinación en el CRG afirma: «La logística era un reto pero las discusiones entre científicos de todo el mundo, la planificación de los experimentos, el análisis de resultados y tota esta proximidad y voluntad por compartir han sido una enorme recompensa». Uno de los principales retos del CRG ha sido el de enfrentarse a la gran cantidad de datos generadas en este proyecto. «El CRG ha sido la base para almacenar los datos sobre ARN y eso, a menudo ha puesto a prueba la capacidad de la infraestructura informática del centro», dice Julien Lagarde, que ha sido el responsable de la informática en este proyecto del CRG.

El proyecto ENCODE es sólo el primer paso en la larga y compleja tarea de descifrar el significado de la secuencia del genoma. «Esta es, en realidad, la tarea de la biología del siglo XXI. Como investigadores, nos sentimos profundamente privilegiados por poder contribuir en este proyecto» afirma Roderic Guigó. Y añade, «nuestra participacinó en este proyecto es, en parte, fruto de unas políticas directas de promoción de la investigación científica. La posibilidad de que investigadores de nuestro país participen en proyectos científicos de relevancia global com éste, depende de una apuesta firme y decisiva por apoyar la investigación científica».

Sobre ENCODE

ENCODE (Encyclopedia of DNA Elements) es un consorcio público y abierto de investigación impulsado el año 2003 por el National Human Genome Research Institute (NHGRI) de los Estados Unidos con el objetivo de identificar todos los elementos funcionales de la secuencia del genoma humano. Durante la fase piloto (2003-2007) se comprobaron y compararon los métodos existentes para analizar con rigor una porción definida de la secuencia del genoma humano. Las conclusiones de esta fase piloto se publicaron en junio de 2007 en Nature y en Genome Research. El proyecto pasó a fase de producción en septiembre de 2007. El consorcio ENCODE está formado por investigadores de diversos orígenes y experiencia en la producción y el análisis de datos. Durante el proyecto ENCODE, el Centro de Coordinación de Datos almacenó y gestionó todos los datos del consorcio. Todos los datos generados por los participantes en ENCODE se han añadido rápidamente a bases de datos públicas y están disponbiles mediante el Centro de Coordinación de Datos. 

Enlaces y recursos:

Proyecto ENCODE:www.encodeproject.org/ENCODE

National Human Genome Research Institute (NHGRI): www.genome.gov

European Bioinformatics Institute: www.ebi.ac.uk

Siete Días MédicosEl FarmacéuticoEl Farmacéutico JovenActa PediátricaEspacio Asma

La revista el farmacéutico hospitales y su web son un producto de Ediciones Mayo S.A. destinado a los farmacéuticos de hospital. Los contenidos de la revista y la web requieren de una formación especializada para su correcta interpretación. En ningún caso la información proporcionada por el farmacéutico hospitales reemplazará la relación de los profesionales farmacéuticos con los pacientes.