“La mayoría de los problemas tienen, o muchas soluciones, o ninguna. Solo unos pocos problemas tienen una sola solución.” Edmund C. Berkeley
La búsqueda de las diferencias genéticas entre las personas representa una de las áreas de investigación más activa, hecha posible gracias a la finalización de la secuencia del genoma humano. Sin embargo, la noción de que existe algo llamado “el genoma humano” trae consigo la implicación de que existen características genómicas fundamentales que son universales entre todos los miembros de una especie. La más obvia de éstas se refiere a la cantidad y al arreglo o distribución del material genético. Sabemos que:
- Una copia del genoma humano contiene 3.5 picogramos (pg o 10-12 gramos) de ADN empacado en 23 cromosomas.
- Los chimpancés, los parientes más cercanos a Homo sapiens, poseen un genoma un poco más pesado (3.75 pg) repartidos en 24 cromosomas.
- En contraste, el genoma del cerdo hormiguero, oricteropo o “aardvark” (Orycteropus afer) está contenido en apenas 10 cromosomas pero pesa 5.8 pg.
La idea básica que dice que la cantidad de ADN por juego de cromosoma puede ser consistente entre las células de un cuerpo y entre individuos de la misma especie fue avanzada desde 1885. Sin embargo, una “hipótesis de la constancia del ADN” explícita no fue desarrollada hasta mediados del Siglo XX.2 Ésta surgió de un informe publicado en 1948 sobre la “notable constancia en el contenido de ADN nuclear de todas las células en todos los individuos de una especie animal dada,”3 lo cual fue interpretado como evidencia a favor del ADN, en vez de proteínas, como las moléculas responsables de la herencia.
La hipótesis de la constancia del ADN
* La cantidad de ADN por juego de cromosoma dentro de un organismo individual es constante.
* El contenido de ADN de un juego de cromosomas es, por lo general, invariable entre miembros de la misma especie.
La paradoja del Valor C
La paradoja del Valor C ha sido tradicionalmente descrita en tres formas diferentes:
*Los organismos más complejos no tienen necesariamente genomas más grandes que los organismos más simples. “La cantidad de ADN no parece estar relacionada al número de genes, dado que la cantidad de ADN no aumenta claramente con la complejidad y el número de caracteres hereditarios.”
*Cualquier genoma parece contener más ADN que la necesaria para el número predicho de genes. “Uno de los problemas de la genética de los eucariotes es que los organismos más avanzados poseen mucho más ADN en su genoma que el que necesitan como información genética.”
*Algunas especies cercanamente relacionadas exhiben contenidos de ADN divergentes. “La paradoja es el hecho de que organismos con el mismo nivel general de complejidad morfológica, la cual se presume que tiene el mismo requerimiento genético, a menudo poseen genomas cuyo contenido de ADN difiere en varios órdenes de magnitud.
Considere por ejemplo el tamaño reportado de los genomas versus las nociones semi-subjetivas de complejidad de algunos organismos bien conocidos:
* Nematodo (Caenorhabditis elegans): 0.1 pg
* Berro común de pared (Arabidopsis thaliana): 0.16 pg
* Mosca de la fruta (Drosophila melanogaster): 0.18 pg
* Pez fugo o globo (Takifugu rubripes): 0.4 pg
* Arroz (Oryza sativa): 0.5 pg
* Humano (Homo sapiens): 3.5 pg
* Rana leopardo (Rana pipiens): 6.7 pg
* Cebolla (Allium cepa): 16.75 pg
* Saltamontes de montaña (Podisma pedestris): 16.9 pg
* Salamandra tigre (Ambystoma tigrinum): 32 pg
* Azucena (Lilium longiflorum): 35.2 pg
* Anguila pulmonada (Protopterus aethiopicus): 132 pg
Dado que somos un poco chauvinistas acerca de nuestra propia especie, nos gustaría pensar que el hombre es con seguridad una de las especies más complicadas de la tierra y, por lo tanto, que requiere el número máximo de genes. Sin embargo, la humilde hepática de las fuentes (Marchantia polymorpha) tiene 18 veces más ADN que nosotros y la viscosa salamandra conocida como Amphiuma tiene 26 veces más ADN que nuestro complemento. Para añadir más al insulto, la unicelular Euglena tiene casi tanto ADN como un ser humano.
ADN no codificador y el fin de la paradoja
Hace 20 años, Stanley K. Sessions lo dijo mejor que nadie en una revisión editorial del libro de mucha influencia titulado La Evolución del Tamaño del Genoma:
La paradoja del Valor C es la observación de que el tamaño del genoma no corresponde a la cantidad de ADN necesaria para la codificación de proteínas. Esta observación es paradójica solo bajo la expectativa de que el tamaño del genoma debería ser igual o proporcional al número de genes y, por lo tanto, debería incrementar a medida que aumenta la “complejidad del organismo.” Esta paradoja, literalmente, desapareció con el descubrimiento de que los genomas contienen ADN “en exceso” (repetitivo) que no se transcribe en productos funcionales. Por lo tanto, no es ya misterioso que las salamandras, por ejemplo, puedan tener un genoma más grande que el de los humanos. El origen y la función precisa de este ADN “en exceso” (el cual puede constituir más del 99% del ADN genómico) continua siendo un problema sin resolver, aunque no es una paradoja.
* 1.5% de genes codificadores de proteínas
* 25.9% de intrones (regiones no codificadoras entre las secuencias de genes)
* 20.4% elementos nucleares largos intercalados (“LINEs” en sus siglas en inglés),
* incluyendo 516.000 copias de el elemento transportable conocido como LINE-1
* 13.1% de elementos nucleares cortos intercalados (“SINEs” en sus siglas en inglés), incluyendo 1.090.000 copias del elemento Alu
* 2.9% de transposones de ADN (elementos móviles de ADN)
* 8.3% de repeticiones terminales largas (“LTRs” en inglés) retrotransposones (transposones copiados del ARN y flanqueados por secuencias repetidas)
* 5% duplicaciones de segmentos
* 3% repeticiones de secuencias simples
* 11.6% secuencias únicas misceláneas
* 8% misceláneo material de ADN, o heterocromatina.
El enigma del Valor C
Como un enigma, es decir, un rompecabezas complejo, el tema de la variación del tamaño del genoma puede ser dividido explícitamente en varias preguntas, cada una de las cuales debe ser respondida si uno quiere lograr una comprensión completa del tema:
* ¿En qué proporciones están representados los varios tipos de ADN no codificador en los genomas de especies diferentes?
* ¿Por cuáles mecanismos se gana o se pierde ADN no codificador en la historia evolutiva?
* ¿Cuáles son las implicaciones fenotípicas, o en unos casos hasta funcionales, del ADN no codificador?
* ¿Por qué los genomas de ciertas especies, como los de los nematodos o el del arroz, son económicos y los de los peces pulmonados o las azucenas son positivamente enormes?
Desenredando el enigma
*Una gran fracción de los genomas eucarióticos está compuesta de “parásitos genómicos” en forma de elementos transponibles; en los humanos, casi la mitad del genoma consiste de dicho “ADN egoísta”. Es más, los genomas grandes contienen una gran proporción de elementos transponibles y una proporción más baja de genes que codifican proteínas que los genomas más pequeños.
Existen mecanismos que son capaces de aumentar o disminuir el tamaño del genoma en escalas evolucionarias tanto cortas como largas. Por ejemplo, la transposición duplicativa de elementos transponibles y las duplicaciones a escalas pequeñas y grandes (desde un gen sencillo hasta genomas enteros) puede añadir ADN a los genomas, a veces en cantidades grandes y a menudo muy rápidamente en términos evolutivos. Otros procesos pueden ya sea añadir o remover ADN en un rango de escalas, como por ejemplo, la inserción o la eliminación desde uno a varios nucleótidos durante la replicación del ADN, los eventos de recombinación que llevan a la ganancia o pérdida de segmentos de cromosomas, y las ganancias o pérdidas de cromosomas enteros.
* El tamaño del genoma en un gran rango de tipos de células y de organismos se correlaciona positivamente al tamaño de la célula y del núcleo y negativamente a la tasa de división celular. La preponderancia de evidencia indica que el tamaño del genoma ejerce una influencia causativa a estos parámetros celulares.
* Dependiendo de la biología del grupo en cuestión, los efectos a nivel celular de la variación del tamaño del genoma pueden resultar en correlaciones entre el contenido de ADN y el tamaño del cuerpo, la tasa metabólica, la tasa de desarrollo, la complejidad de los órganos, la distribución geográfica y el nicho ecológico.
¿Una nueva paradoja?
La inspección de los genomas de otras especies muestra que, tal como el tamaño del genoma, el número de genes es un mal pronosticador de la complejidad de los organismos:
* Mosca de la fruta (Drosophila melanogaster): 13.500 genes
* Nematodo (Caenorhabditis elegans): 20.000 genes
* Ser humano (Homo sapiens): 20.000 a 25.000 genes
* Pez fugo o globo (Takifugu rubripes): 21.000 genes
* Berro común de pared (Arabidopsis thaliana): 25.500 genes
* Arroz (Oryza sativa): 40.000 a 50.000 genes
Al igual que con los Valores C, esta observación ha sido la fuente de mucha sorpresa entre los investigadores de genomas. Algunos se han preguntado, “¿Cómo puede nuestra supremamente sofisticada especie estar gobernada por solamente de un 50 a un 100% más genes que los de un nematodo?”22 Siguiendo la misma fórmula que la del tamaño del genoma (expectativa simplista + datos contradictorios = “paradoja”), esta disparidad entre el número de genes y la complejidad ha sido llamada la “paradoja del Valor G” o “paradoja del Valor N.”
El enigma del Valor G
*¿Cuáles son los mecanismos que regulan a los genes y cómo esto contribuye a la alta diversidad de tejidos que son construidos por un número bajo de genes? La sugerencia reciente de un segundo “código” no génico en el ADN basado en las posiciones de las estructuras empaquetadoras llamadas nucleosomas, provee un ejemplo estimulante del tipo de descubrimiento que se verá venir en esta área.
*¿De qué formas las interacciones entre los genes son responsables por la emergencia de unidades complejas completas a partir de un número relativamente limitado de partes?
*¿Cuántos productos proteínicos diferentes puede codificar una región simple de un gen a través de procesos tales como el empalme alternativo y hasta que punto esto puede explicar la diversidad de productos proteínicos que pueden resultar de un genoma codificador de proteínas relativamente simple?
Perspectivas futuras
*Pensar sobre los genomas como entidades biológicas complejas con sus propiedades inherentes y sus historias evolutivas.
*Caracterizar tanto a los componentes de los genomas codificadores como a los no codificadores y sus proporciones relativas en los proyectos de secuenciación completa.