GENÉTICA HUMANA. Conceptos, Mecanismos y Aplicaciones de la Genética en el campo de la Biomedicina. Texto Multimedia

Tamaño: px
Comenzar la demostración a partir de la página:

Download "GENÉTICA HUMANA. Conceptos, Mecanismos y Aplicaciones de la Genética en el campo de la Biomedicina. Texto Multimedia"

Transcripción

1 GENÉTICA HUMANA Conceptos, Mecanismos y Aplicaciones de la Genética en el campo de la Biomedicina Texto Multimedia Francisco Javier Novo Villaverde Departamento de Genética UNIVERSIDAD DE NAVARRA

2

3 PRÓLOGO La generalización del uso de Internet y de los ordenadores domésticos permite concebir libros de texto cada vez más interactivos, con tutoriales multimedia y enlaces a los abundantísimos sitios educativos disponibles en la Red. Esto es especialmente útil en una materia como la Genética, en la que la percepción gráfica de los procesos es imprescindible para la adecuada comprensión de los conceptos y mecanismos implicados. Este libro de texto es fruto de mi reflexión acerca del modo de impartir la docencia de Genética a alumnos de disciplinas biomédicas que se enfrentan por primera vez con el apasionante mundo de los genes. Durante años he venido impartiendo la asignatura de Genética Humana a alumnos de las licenciaturas de Biología y Bioquímica de la Universidad de Navarra, y esto me ha permitido preparar poco a poco un manual detallado y abundante material gráfico que han constituido el esqueleto del presente texto. Sobre este esqueleto inicial he añadido nuevos capítulos y gran cantidad de material multimedia que han dado como resultado este texto de "Genética Humana: conceptos, mecanismos y aplicaciones de la Genética en el campo de la Biomedicina". Quizás lo que más llame la atención sobre este texto es que se presenta en un formato novedoso: sólo se incluyen algunas tablas e ilustraciones que ayudan a mantener la fluidez de la lectura, pero todos los materiales gráficos se han incluido en un CD que contiene todas las figuras a las que se hace referencia en el texto. El CD está compuesto por una serie de páginas web que se pueden visualizar con cualquier navegador, y que van guiando al alumno paso a paso a través de tutoriales propios o de enlaces a videos o figuras de especial interés para comprender algún concepto. Por tanto, el mayor aprovechamiento se conseguirá si el alumno va estudiando el texto y siguiendo al mismo tiempo, con calma, las figuras del CD. Este método permitirá, o al menos eso espero, una comprensión rápida de los conceptos y mecanismos, ya que éste es el enfoque que he pretendido dar al texto. En mi opinión, ninguna figura "estática" puede suplir la información aportada por un video ó una animación comentada, y por ello la mayoría de los tutoriales están grabados con una voz en off" que explica lo que se está viendo. Esto supone que el alumno debe utilizar un ordenador con tarjeta de sonido y altavoces (o auriculares); para los enlaces externos necesita también conexión a Internet. Confío en que la mayoría de los hogares cuentan hoy en día con esta tecnología. Una ventaja (no despreciable) de esta estructura es que permite abaratar significativamente el coste final del producto, al no requerir figuras a color dentro del propio texto; espero que esto ayude también a conseguir una amplia difusión del libro. Sin duda, algunos de los que han leído las líneas precedentes (en especial, colegas en la docencia universitaria de Genética) habrán pensado que este libro de texto supone una especie de "autotexto" que podría hacer innecesarias las clases teóricas. Nada más lejos de mi intención. De todas formas, al elaborar este método he tenido en mente las directrices sobre el nuevo Espacio Europeo de Educación Superior, y en especial el sistema de transferencia de créditos europeos (ECTS) de reciente implantación en la Unión Europea. Este sistema está basado en la cantidad de trabajo que a juicio del profesor debe invertir un alumno para la adecuada comprensión y aprendizaje de la materia respectiva, y por eso el concepto de crédito incluye también las horas de trabajo personal del alumno. El presente libro, que exige al alumno una inversión sustancial de tiempo mientras "navega" por las figuras al tiempo que estudia el texto, se adapta especialmente bien a este nuevo concepto. En cualquier caso, como es lógico, las clases presenciales siguen siendo un pilar básico de la docencia universitaria, puesto que en ellas el alumno recibe una visión diferente de los mismos conceptos que se exponen en el libro, puede además aclarar las dudas que le hayan surgido (si ha leido el capítulo correspondiente antes de la clase, como es aconsejable) y puede también fijar los conceptos clave que poco a poco le irán ayudando a "pensar" como un genetista.

4 Como he dicho, el principal destinatario de este texto es el alumno que cursa una asignatura general de Genética en una licenciatura biomédica (Medicina, Farmacia), y que se enfrenta por primera vez con esta materia. De todas formas, también puede ser útil para alumnos de la licenciatura de Biología que ya hayan cursado una asignatura de Genética General (y, quizás, Ingeniería Genética) y se enfrentan con una asignatura más específica de Genética Humana, especialmente los capítulos incluidos en los bloques B, D y E. En este caso, los capítulos correspondientes al bloque A y al bloque C ya habrán sido estudiados con mucho más detalle en esas otras asignaturas, pero lo presentado aquí puede servir como resumen que ayude a recordar los conceptos fundamentales. Lógicamente, espero que este texto también resulte útil a médicos y otros profesionales del mundo biomédico que quieran ponerse al día, o que necesiten un compendio claro, actualizado y moderno de los conceptos, mecanismos y aplicaciones que ofrece la Genética en el siglo XXI.

5 INDICE DE CAPÍTULOS A. INTRODUCCIÓN Capítulo 1. El flujo de la información genética. Los Ácidos Nucleicos. Visión general de la expresión génica. Transcripción. Regulación de la transcripción en eucariotas. Procesamiento del ARN mensajero: maduración y ayuste (splicing). Traducción y código genético en eucariotas. Capítulo 2. El ADN en el núcleo de la célula eucariota. La cromatina durante el ciclo celular. Replicación de la cromatina en interfase. Formación y segregación de los cromosomas durante la mitosis. Gametogénesis y meiosis. Recombinación a nivel molecular. Capítulo 3. Técnicas básicas de genética molecular. Tecnología del ADN recombinante: métodos y usos más frecuentes. Enzimas de restricción. Amplificación in vitro de ADN (PCR). Secuenciación. Técnicas básicas de hibridación de ácidos nucleicos. Microarrays. B. EL GENOMA HUMANO Capítulo 4. La geografía del genoma humano. Historia y desarrollo del Proyecto Genoma Humano. Estructura del genoma humano y variación inter-individual. El ADN repetitivo. El genoma mitocondrial. Capítulo 5. El genoma humano en acción. La secuencia influye en el estado funcional de la cromatina. Modificaciones epigenéticas y su importancia en la regulación del estado funcional de la cromatina. Relación entre secuencia, estructura y función de la cromatina: territorios cromosómicos. Capítulo 6. Origen de la variación genética en humanos. Variación en el ADN: polimorfismos y mutaciones. Mecanismos de reparación del ADN en humanos. Enfermedades causadas por alteraciones en los mecanismos de reparación. C. LA TRANSMISIÓN DE LOS CARACTERES HEREDITARIOS Capítulo 7. Genética mendeliana. Planteamiento experimental de Mendel. Monohibridismo: primera ley de Mendel. Cruzamiento de prueba. Dihibridismo: segunda ley de Mendel. Redescubrimiento del trabajo de Mendel. Teoría cromosómica de la herencia. Capítulo 8. Herencia relacionada con el sexo. Cada sexo tiene distinta constitución cromosómica. Los genes situados en el cromosoma X muestran un modo especial de herencia. Determinación del sexo y compensación de dosis: hipótesis de Lyon. Estructura de los cromosomas sexuales humanos. Capítulo 9. Modificaciones de las proporciones mendelianas. Modo de estimar si se cumplen las proporciones mendelianas esperadas. Causas por las que se obtienen desviaciones de las proporciones mendelianas para un carácter: dominancia incompleta, codominancia y alelos múltiples. Alelos letales. Interacción génica: epistasia.

6 Capítulo 10. Genética de los caracteres cuantitativos. Genética de los caracteres cuantitativos: experimentos de Johannsen, Nilsson-Ehle y East. Modelo poligenes-ambiente y enfermedades multifactoriales. Heredabilidad en sentido amplio y en sentido restringido. Cálculo de la heredabilidad en Genética humana. Capítulo 11. Ligamiento genético en humanos. El concepto de ligamiento: fracción de recombinación y distancia genética. Informatividad de los marcadores utilizados en estudios de ligamiento. El cálculo del LOD score. Ligamiento no paramétrico y su utilización en genética humana. Capítulo 12. Los genes en las poblaciones. Evolución. El equilibrio de Hardy-Weinberg. Cambios en las condiciones que mantienen el equilibrio. Aplicaciones en Genética Humana. Formación de la Teoría Sintética de la evolución. Explicación actual del proceso evolutivo. D. PATOLOGÍA GENÉTICA Capítulo 13. Citogenética El estudio de los cromosomas humanos. El fenómeno de no disyunción meiótica y sus implicaciones. Anomalías del número de los cromosomas. Anomalías estructurales de los cromosomas. Capítulo 14. La Mutación como causa de enfermedad. Características generales de las mutaciones. Mutaciones simples: tipos y nomenclatura. Potencial patogénico de las mutaciones en el ADN codificante y en el ADN no-codificante intragénico e intergénico. Capítulo 15. Potencial patogénico de las secuencias repetidas. Mutaciones en secuencias que están repetidas en tándem. Expansión de trinucleótidos: neuropatías por expansiones de CAG y enfermedades por expansión de otros trinucleótidos. Otras enfermedades por expansión de secuencias repetidas. Mutaciones debidas a repeticiones dispersas. Desórdenes genómicos. Capítulo 16. Efectos fenotípicos de las mutaciones. Pérdida de función: fenotipos recesivos y fenotipos dominantes por haploinsuficiencia. Fenotipos dominantes por ganancia de función. Alteraciones de la impronta genómica. Mutaciones que afectan a la morfogénesis. Capítulo 17. Diagnóstico de enfermedades genéticas. Estrategias generales de diagnóstico de enfermedades genéticas. Métodos de detección de mutaciones. Aplicación del ligamiento genético al diagnóstico: el proceso de diagnóstico indirecto de enfermedades genéticas. Capítulo 18. Genética Clínica. Genética clínica y consejo genético. Enfermedades de herencia autosómica y de herencia ligada al cromosoma X. Aplicación del teorema de Bayes al cálculo de riesgos genéticos. Enfermedades por alteración del ADN mitocondrial. Diagnóstico prenatal. E. NUEVAS HERRAMIENTAS DE LA GENÉTICA MODERNA Capítulo 19. Terapia Génica. Componentes de un sistema de terapia génica y vías de administración. Naturaleza del ácido nucleico terapéutico. Tipos de vectores y su utilización en distintas estrategias

7 de transferencia génica. Aplicaciones clínicas de la terapia génica en el momento actual. Capítulo 20. Bioinformática del genoma humano. Bases de datos de utilidad en Genética Humana: bases de datos de secuencias y bases de datos relacionadas con enfermedades. Búsquedas en bases de datos con BLAST. Navegadores del Genoma Humano.

8

9 CAPÍTULO 1: EL FLUJO DE LA INFORMACIÓN GENÉTICA 1 A. INTRODUCCIÓN Se incluyen en esta sección tres temas que servirán para repasar los aspectos fundamentales de la estructura de los ácidos nucleicos y la biología molecular del gen, así como la estructura básica de la cromatina y sus cambios durante el ciclo celular. Capítulo 1. El flujo de la información genética. Los Ácidos Nucleicos. Visión general de la expresión génica. Transcripción. Regulación de la transcripción en eucariotas. Procesamiento del ARN mensajero: maduración y ayuste (splicing). Traducción y código genético en eucariotas. Los Ácidos Nucleicos La información genética se transmite a través de unas moléculas llamadas ácidos nucleicos, polímeros formados por unidades denominadas nucleótidos. Un nucleótido es una molécula formada por una pentosa, una base nitrogenada y un grupo fosfato. Al conjunto formado por la pentosa y la base nitrogenada se le denomina nucleósido. Por tanto, un nucleótido es el éster fosfato de un nucleósido. Dependiendo de la naturaleza de la pentosa, se distinguen dos tipos de ácidos nucleicos: el ácido ribonucleico (ARN) lleva D-ribosa, y el ácido desoxi-ribonucleico (ADN) contiene 2-desoxi-D-ribosa. Las bases nitrogenadas que forman parte de los ácidos nucleicos pueden ser monocíclicas (pirimidinas) o bicíclicas (purinas). Las bases que intervienen en la formación del ADN se denominan Adenina (A), Citosina (C), Guanina (G) y Timina (T). El ARN contiene las tres primeras y Uracilo (U) en vez de Timina. Fue Friedrich Miescher el primero en identificar, en 1869, un material que llamó nucleína. Estudios posteriores fueron caracterizando progresivamente la naturaleza química de esta sustancia, así como su importancia biológica. Después de bastante controversia, Avery, MacLeod y McCarthy demostraron en 1944 que la introducción de ADN purificado en bacterias hace que éstas cambien su fenotipo y es, por tanto, la molécula transmisora de la información genética. En 1953, Rosalind Franklin, Maurice Wilkins, James Watson y Francis Crick describieron la estructura tridimensional del ADN. La Figura 1.1 contiene enlaces a los artículos originales de estos autores. El ADN y el ARN son cadenas de polinucleótidos. Como los nucleótidos tienen direccionalidad debido a la posición del grupo fosfato en el carbono 5' y del grupo hidroxilo en el carbono 3' de la pentosa, las moléculas de ADN y ARN también tienen una polaridad concreta que viene definida por la dirección 5' 3'. El ADN es una molécula formada por dos cadenas antiparalelas, es decir, con polaridad contraria. Cada cadena está formada por un esqueleto desoxi-ribosa-fosfato, en el que alternan moléculas de desoxiribosa unidas a los grupos fosfato mediante enlaces fosfo-diéster. De este esqueleto "protruyen" las bases nitrogenadas, unidas a la pentosa mediante enlaces glucosídicos. Además, la molécula de ADN está formada por dos cadenas complementarias, lo que significa que la secuencia de bases nitrogenadas de una cadena es

10 2 GENÉTICA HUMANA complementaria a la de la otra cadena. Esto se debe al hecho de que las bases nitrogenadas forman sólo dos tipos de parejas: Citosina se empareja con Guanina y Adenina se empareja con Timina. Erwin Chargaff fue el primero en demostrar en 1950 que el ADN de doble cadena tiene relaciones equimolares de purinas y pirimidinas, siendo la cantidad total de desoxi-adenina (da) igual a la de desoxi-timina (dt), y la de desoxi-guanina (dg) igual a la de desoxi-citosina (dc). Por tanto, una conclusión derivada de esto es que siempre se emparejan una purina con una pirimidina del mismo modo, siendo los pares da con dt y dg con dc. Watson y Crick, en su modelo de doble hélice, establecieron el modo exacto en que se forman los enlaces en cada par de bases, con tres puentes de hidrógeno en un par dg dc y dos puentes de hidrógeno en un par da dt. Aunque hay muchos más tipos posibles de enlaces entre cada uno de estos nucleótidos, los enlaces tipo Watson-Crick tienen una propiedad importante: ocupan el mismo espacio dentro de la doble cadena y pueden intercambiarse sin distorsionar la molécula. Finalmente, el hecho de que sólo se formen dos tipos de pares de bases explica que las dos cadenas sean complementarias, ya que la secuencia de bases de una puede convertirse fácilmente en la secuencia de bases de la otra cadena sustituyendo cada base por su complementaria. La Figura 1.2 contiene un enlace a animaciones en las que se explica la estructura de los ácidos nucleicos y de la doble hélice. Por tanto, en la molécula completa de ADN, las cadenas polinucleotídicas se mantienen unidas entre sí gracias a los puentes de hidrógeno que se forman entre bases pertenecientes a cada una de las cadenas. Además, esta doble hebra no es lineal (como una escalera de mano), sino que adopta una configuración helicoidal en la que las bases nitrogenadas ocupan el interior y se disponen perpendicularmente a las cadenas laterales. Este fenómeno se denomina "apilamiento" de las bases (base stacking) y es muy importante para mantener la estabilidad global de la doble hélice. Existen distintos tipos de configuraciones que puede adoptar la doble hélice dependiendo de las condiciones del medio, pero la más relevante desde el punto de vista biológico es la forma B, ya que es la más frecuente en condiciones fisiológicas. En esta configuración, la hélice es dextrógira, con un diámetro de 2 nm, tiene 10 pares de bases por vuelta y una distancia de 0,34 nm entre cada par de bases. Las dos moléculas de desoxi-ribosa a las que se unen cada una de las bases del mismo par forman dos "surcos" en la superficie externa de la hélice. Además, como estas dos desoxi-ribosas no están situadas simétricamente, sino que miran hacia la misma cara de la doble hélice, los dos surcos que se forman no son iguales: uno de ellos es más ancho (surco mayor) y otro más estrecho (surco menor). La Figura 1.3 permite visualizar la forma B del ADN en tres dimensiones. Visión general del proceso de expresión génica La secuencia de nucleótidos de determinados fragmentos del ADN contiene información para la fabricación de proteínas, que son los principales elementos estructurales y funcionales de las células. De hecho, la secuencia de nucleótidos determina el tipo de aminoácidos y el orden en que se añaden en el proceso de síntesis de proteínas, y esa información está contenida de un modo codificado en la secuencia de bases del ADN. El proceso por el que dicha información es descodificada y "traducida" para dar lugar a la síntesis de proteínas específicas se conoce como expresión génica. Este proceso comprende varios pasos de descodificación, que en líneas generales son la transcripción y la traducción. En lenguaje coloquial, transcribir significa pasar algún tipo de información de un medio a otro. Por ejemplo, se transcribe una conversación al ponerla por escrito. El primer paso en la lectura de la información contenida en la secuencia

11 CAPÍTULO 1: EL FLUJO DE LA INFORMACIÓN GENÉTICA 3 de nucleótidos consiste en la síntesis de una cadena de ARN a partir de un segmento de ADN. Este proceso de copia de una secuencia "molde" de ADN en un ARN se denomina transcripción. El ARN mantiene la información que estaba contenida en el ADN precisamente porque lleva la misma secuencia de nucleótidos (con la excepción de las timinas, que son sustituidas por uracilos). Esta cadena de ARN puede intervenir directamente en algún proceso celular, pero lo más habitual es que transmita la información al siguiente elemento de la cadena de descodificación, y por eso se llama ARN mensajero (abreviado como ARNm). El ARNm es, por tanto, la molécula que va a llevar la información contenida en un segmento concreto de ADN (es decir, un gen) hasta la maquinaria de fabricación de proteínas. Como esta maquinaria está en el citoplasma, el ARNm debe salir del núcleo celular a través de los poros nucleares y llegar a los ribosomas. Allí, mediante un proceso denominado traducción, la información genética contenida originalmente en la secuencia de nucleótidos del ADN será finalmente traducida en una serie de instrucciones que permiten al ribosoma sintetizar una proteína concreta. En los siguientes apartados veremos con detalle cada uno de estos procesos. La Figura 1.4 contiene un video en el que se ve el proceso general de expresión génica. La transcripción El proceso general de transcripción consiste en la síntesis de una cadena de ARN por la acción de una polimerasa de ARN, que lee la secuencia de nucleótidos contenida en el ADN molde y sintetiza la nueva cadena de ARN utilizando nucleótidos libres. En este proceso, la polimerasa se desliza por la cadena molde de ADN. La transcripción es un proceso cíclico que se repite, en el que hay varias fases esenciales: i) determinar la región molde de ADN que ha de ser copiada, ii) iniciar la síntesis de ARN, iii) estabilizar y modular la elongación del ARNm naciente, iv) terminar el proceso. En eucariotas, la molécula encargada de la síntesis es una polimerasa de ARN dependiente de ADN, es decir una polimerasa que usa un molde de ADN para sintetizar un ARN. Este enzima es en realidad un complejo enzimático formado por múltiples subunidades proteicas al que se unen también factores accesorios sin los cuales no puede reconocer el lugar correcto de inicio de la síntesis. En eucariotas se distinguen 3 tipos de ARN polimerasas en función del tipo de genes que transcriben. Los genes tipo I de eucariotas son los que codifican los ARN ribosomales que veremos más adelante, y la polimerasa encargada de transcribir estos genes es la ARN polimerasa I. La mayoría de los genes son genes tipo II, que codifican proteínas y algunos ARN pequeños con funciones concretas; su transcripción corre a cargo de la ARN polimerasa II. Finalmente, otros ARN pequeños, algunos ARN ribosomales y los ARN transferentes son sintetizados por la ARN polimerasa III. El primer paso en la transcripción es determinar en qué punto comienza. Esto viene determinado por la existencia de unas secuencias que definen la región del gen en la que se une el complejo enzimático responsable de la síntesis. Estas secuencias se llaman promotores, y son necesarios para que la transcripción pueda tener lugar. Un promotor consta de varios pequeños motivos de secuencia, dispersos a lo largo de varios cientos de pares de bases, a los que se unen los distintos factores proteicos necesarios para la transcripción. De hecho, la ARN polimerasa no se une al promotor directamente, sino a través de otro complejo proteico denominado complejo de preiniciación. Por ejemplo, una de las secuencias más constantes en promotores de eucariotas es la caja TATA, cuya secuencia consenso es 5'-TATATAAAT-3'; a esta secuencia se une un factor proteico llamado "proteína de unión a TATA" (en inglés TATA-binding protein, abreviado TBP). Sobre este factor se unen otros factores accesorios y dan lugar a un factor de transcripción llamado TFIID. De modo similar, se forman otros factores de transcripción, que en el fondo

12 4 GENÉTICA HUMANA no son más que proteínas con algún dominio de unión al ADN, que reconocen específicamente las secuencias presentes en los promotores y se unen a ellas. En el promotor eucariota típico de genes tipo II se forma un complejo con TFIID, TFIIA, TFIIB y TFIIF, al que se une la ARN polimerasa II. La unión posterior de TFIIH y TFIIE añade otras actividades al complejo, como la actividad helicasa necesaria para abrir la doble hélice y permitir el copiado de una cadena, y hace que comience la transcripción. Por tanto, la formación del complejo de preiniciación sobre promotores específicos es la forma de controlar que la ARN polimerasa comience a sintetizar en el lugar correcto. Además, los promotores eucariotas están también modulados por otros elementos más lejanos del punto de inicio de la transcripción, llamados "potenciadores" (enhancers en inglés) ó "silenciadores". Estos elementos son secuencias de ADN sobre las que se unen factores proteicos que contribuyen a estabilizar y potenciar el complejo de preiniciación, en el caso de los potenciadores, o a impedir la transcripción en el caso de los silenciadores. Existen muchos otros elementos de secuencia que forman parte de promotores y que permiten regular dónde ó cuándo se transcribe un gen. Muchos de estos elementos tienen una localización precisa respecto al inicio de la transcripción: por ejemplo, la caja TATA suele estar 25 nucleótidos en dirección 5' al inicio de la transcripción (es decir, en posición 25, ya que se considera como posición +1 la del nucleótido donde se inicia la síntesis). Otros elementos frecuentes son la caja GC (secuencia consenso GGGCGG) o la caja CAAT (CCAAT) en posición 100, a las que se unen factores de transcripción específicos. PROMOTOR Exon 1 CAJA TATA INICIO DE LA TRANSCRIPCIÓN 5 ACGtataaGATCTCGATCGAGACTAGCTAGCTAGCTAgCGATCGAGCTA-3 3 -TGCTAGCTAGATAGCTAGCTCTGATCGATCGATCGATCGCTAGCTCGAT-5 DOBLE CADENA DE ADN (GEN) Con la fosforilación del extremo carboxilo-terminal de la ARN polimerasa II, comienza el desplazamiento de la misma por la cadena molde de ADN y la síntesis del ARN naciente. En este proceso, la polimerasa lee la secuencia de nucleótidos de una de las cadenas de la doble hebra de ADN y sintetiza un polinucleótido complementario, reemplazando las timinas del ADN por uracilos. De este modo, se conserva perfectamente la información que estaba contenida en el ADN. En este sentido, tiene importancia saber cuál es la hebra de la doble hélice que es utilizada como molde, y a veces existe cierta confusión sobre la nomenclatura de las dos hebras del ADN bicatenario. Es importante recordar que los polinucleótidos se sintetizan en dirección 5' 3', y lo mismo sucede con la síntesis del ARN mensajero. Por tanto, la hebra molde se lee en sentido 3' 5' (es decir, antisentido) al tiempo que la transcripción procede en sentido 5' 3'. Por eso, el convenio es llamar "hebra codificante" ó "hebra sentido" a la hebra de la doble cadena de ADN que contiene exactamente la misma secuencia de nucleótidos que el futuro ARNm transcrito

13 CAPÍTULO 1: EL FLUJO DE LA INFORMACIÓN GENÉTICA 5 (excepto por los uracilos). A la hebra complementaria, que es la que se utiliza como molde, se le llama "hebra molde" ó "hebra antisentido". La figura 1.5 muestra una secuencia de ADN en la que se representan las principales secuencias implicadas en la transcripción de un gen. El proceso de elongación del transcrito naciente, al menos en eucariotas, está sujeto a numerosas pausas ó paradas, debido a diversos obstáculos que la polimerasa se puede encontrar al avanzar por el ADN molde. Como veremos en el siguiente capítulo, la doble hélice está empaquetada en forma de cromatina, y esto crea obstáculos importantes a los procesos de transcripción; además, el ADN puede haber sufrido daños que a veces impiden el paso del complejo transcripcional. Por eso, es importante la presencia de factores que favorecen la elongación, tales como algunos factores de transcripción (TFIIF y TFIIS) ó la elongina. La fosforilación de la ARN polimerasa también favorece significativamente el proceso de elongación. La última fase del proceso de transcripción es la terminación de la síntesis. Así como en procariotas la terminación está mediada por unas secuencias específicas en el ADN molde, en eucariotas la terminación no sigue este modelo, sobre todo en el caso de la ARN polimerasa tipo II. La síntesis habitualmente sigue hasta que se ha sobrepasado el punto que constituirá el extremo 3' del ARN mensajero, y la terminación está ligada a los procesos de maduración del transcrito que se describen a continuación. La figura 1.6 contiene un enlace a un video que muestra esquemáticamente el proceso de transcripción. Regulación de la transcripción en eucariotas Así como los mecanismos que regulan la expresión génica son bastante bien conocidos en procariotas, y se han identificado distintos tipos de ARN polimerasas y de factores de transcripción implicados en el inicio de la transcripción, el panorama en eucariotas es mucho más complejo. Sólo en los últimos años ha comenzado a conocerse con cierto detalle el modo en que se regula la intensidad de la expresión génica, su restricción a determinados tejidos y su variación en respuesta a estímulos extracelulares. Aunque esta regulación se puede dar a varios niveles de complejidad, en este apartado estudiaremos únicamente el nivel basal, que es el compuesto por las secuencias promotoras, potenciadoras y silenciadoras del inicio de la transcripción y los factores proteicos que se unen a ellas. El complejo basal de iniciación es una maquinaria molecular gigante, con distintas actividades, cuyo ensamblaje es necesario para la transcripción correcta tanto de genes constitutivos como de genes que se expresan sólo en determinados tejidos. Hasta hace unos 10 años, se conocían 6 factores generales de iniciación de la transcripción de genes clase II en eucariotas, llamados TFIIA, TFIIB, TFIID, TFIIE, TFIIF y TFIIH. Éstos, junto con la ARN polimerasa II, son suficientes para iniciar la transcripción de algunos genes in vitro, es decir, en el tubo de ensayo. Pronto se vio que algunos de estos factores generales eran en realidad complejos formados por varios componentes, y se identificaron un total de 23 proteínas además de las 12 subunidades de la ARN polimerasa II; con esto, se propuso un modelo por el que todos estos factores se ensamblan durante la iniciación de la transcripción. Los progresos de los últimos años han revelado que en realidad el transcriptosoma es un complejo mucho mayor de lo que se creía, con muchos otros componentes proteicos que llevan a cabo otras funciones, como la remodelación de la cromatina ó la reparación del ADN. La regulación de la expresión génica se ejerce, a este nivel basal, mediante la regulación del ensamblaje de la maquinaria proteica necesaria para la transcripción, y en este sentido se ha estudiado especialmente el

14 6 GENÉTICA HUMANA papel de los potenciadores y los activadores. Los potenciadores ("enhancers" en inglés) son pequeños elementos de secuencia del ADN a los cuales se unen unos factores proteicos llamados activadores, y dicha unión estimula la transcripción. Dado que distintos genes tienen distintos elementos potenciadores y que no todas las células poseen los mismos activadores, este sistema permite cierta especificidad en la respuesta a estímulos fisiológicos que recibe las células de distintos tejidos. Además, los activadores son proteínas modulares, es decir, poseen distintos dominios de unión a potenciadores diferentes, lo cual regula la afinidad y especificidad de las interacciones con los elementos de ADN. El modo en que la unión de los activadores a los potenciadores es capaz de promover la trancripción, ha sido estudiado con profundidad en los últimos años. Estos estudios han permitido aislar otro complejo proteico llamado mediador, constituido también por varias subunidades, que interacciona con los activadores y con la ARN polimerasa II y así transduce las señales proporcionadas por los potenciadores al promotor basal de la transcripción. Se han identificado varios mediadores en humanos, como TRAP, DRIP y otros; además de ayudar a estabilizar el complejo de iniciación gracias a las interacciones con los activadores y los factores generales de transcripción, los mediadores también pueden regular directamente la actividad de la ARN polimerasa II. La figura 1.7 muestra el ensamblaje del complejo basal de transcripción por la acción de activadores y mediadores. Maduración del ARN mensajero En los genes transcritos por la ARN polimerasa tipo II, que en su inmensa mayoría son genes codificantes de proteínas, el ARN mensajero primitivo debe ser procesado para mejorar su estabilidad y para eliminar las regiones que no son codificantes. Además, en algunos casos es sometido a un proceso de corrección de errores o "edición". En primer lugar, el ARN naciente es estabilizado mediante la adición de distintos grupos en sus extremos 5' y 3', ya que los extremos libres de la molécula de ARN son los más vulnerables a la degradación por unas enzimas llamadas exonucleasas. El extremo 5' es modificado mediante la adición del capuchón ó caperuza ("cap" en inglés), que consiste en la adición al primer nucleótido del ARN de una guanina modificada. Podemos representar el extremo 5' de un ARN recién transcrito por 5'-pppNpN -3', siendo cada p un grupo fosfato y N un nucleótido cualquiera (como es habitual, el primer nucleótido de la cadena tiene 3 grupos fosfato unidos al carbono 5' de la ribosa). La caperuza consiste en una guanina metilada en posición 7, que se une por su carbono 5' al primer grupo fosfato de la cadena. Por tanto, el enlace entre la 7-metilguanina y el primer nucleótido es atípico, ya que es un enlace 5' 5' en vez del enlace 5' 3' habitual. El otro tipo de modificación del ARN mensajero tiene lugar en el extremo 3' del mismo, y consiste en el corte por un punto concreto y la posterior adición de una cola de poli-adeninas. Es importante recordar que dicha cola no se añade al extremo final del transcrito primario, sino que previamente tiene lugar un corte interno. El punto de corte viene definido por la presencia de una señal de poli-adenilación en el ARNm (cuya secuencia consenso es 5'-AAUAAA-3') y un tracto rico en guaninas y uracilos (tracto GU) localizado unos nucleótidos por debajo de la señal de poli-adenilación (es decir, en dirección 3'). El proceso está mediado por unos factores proteicos que se unen a cada una de estas señales, cortan al ARN mensajero unos 20 nucleótidos por debajo de la señal de poli-adenilación, y comienzan a añadir adeninas. La formación de esta cola poli(a) es muy importante para mantener la estabilidad del ARNm y asegurar que éste pueda seguir siendo procesado y llegue a traducirse correctamente.

15 CAPÍTULO 1: EL FLUJO DE LA INFORMACIÓN GENÉTICA 7 La figura 1.8 contiene un enlace a un video educativo que muestra esquemáticamente la adición de la caperuza y la formación de la cola poli(a). Un último tipo de modificación que pueden sufrir algunos ARNm es la corrección ó "edición". La edición del ARN es un mecanismo de modificación co- ó post-transcripcional mediante el cual se cambian uno ó varios nucleótidos de un ARNm, con el resultado de que la secuencia del mensajero es ligeramente distinta de la que venía codificada en la secuencia genómica. Este fenómeno, bastante común en otras especies pero más raro en humanos, permite generar diversos ARNm a partir de un mismo gen. Por ejemplo, la apolipoproteína ApoB48, que se produce en el intestino para entrar a formar parte de los quilomicrones, se origina por efeco de un cambio C U en el que una citosina se des-amina para dar lugar a un uracilo; este cambio crea un codón de parada en el ARNm de la ApoB100 y se produce una proteína más corta de lo que sería esperado según la secuencia inicial. Un mecanismo similar está implicado en el origen de enfermedades como la neurofibromatosis tipo I ó el tumor de Wilms, debidas a alteraciones en los genes NF1 y WT1, respectivamente. La figura 1.9 muestra esquemáticamente la edición del ARN que da lugar a la ApoB48. El ayuste (splicing) y su regulación Los ARN mensajeros de eucariotas tienen una característica muy importante: no son codificantes en su totalidad, desde el principio al fin, sino que las regiones codificantes están interrumpidas por otras regiones no-codificantes. Es decir, no todos los nucleótidos del ARN mensajero son leídos para sintetizar proteínas, sino que existen regiones codificantes llamada exones que alternan con otras regiones no-codificantes llamadas intrones. Debido a esta configuración, el siguiente paso en la maduración de un ARNm consiste en eliminar los intrones y pegar los exones para formar un mensajero maduro que pueda ser traducido desde el principio hasta el fin y sin interrupciones. Este proceso de corte y eliminación de intrones con empalme de los exones se denomina en inglés splicing, término naútico que corresponde al castellano ayuste: la unión de dos cabos por sus chicotes. El ayuste es un proceso complejo, porque hay que tener en cuenta que el número de exones e intrones de un gen puede ser muy grande, y requiere una maquinaria proteica bastante sofisticada. En primer lugar, es importante definir el punto exacto que delimita la frontera entre un exón y un intrón, para que la maquinaria encargada del ayuste pueda actuar. Estos puntos vienen determinados por secuencias específicas del ARNm. Por ejemplo, los intrones de eucariotas comienzan en la práctica totalidad de los casos por los nucleótidos Guanina-Uracilo (secuencia 5' de ayuste, GU) y terminan en Adenina Guanina (secuencia 3' de ayuste, AG). Estas secuencias se localizan dentro de unas regiones más amplias que cumplen un consenso de secuencia concreto. Por ejemplo, la secuencia de ayuste 5' está formada por el consenso 5'-AG GU[A/G]AGU-3' (la barra vertical indica el sitio de corte donde termina el exón precedente y comienza el intrón; [A/G] significa que en esa posición puede haber una A ó una G). Por su parte, la secuencia de ayuste 3' se ajusta al consenso 5'-NCAG G-3' (siendo N cualquier nucleótido). Además, es importante la presencia de una adenina nucleótidos por arriba (es decir, en dirección 5') de la secuencia 3' de ayuste. Esta adenina se encuentra en la secuencia consenso 5'-CU[A/G]A[C/U]-3' (es la adenina en negrita y subrayada), es decir, precedida por A ó G y seguida por C ó U, y se denomina punto de ramificación (en inglés, "branch point"). Entre el punto de ramificación y la secuencia de ayuste 3' se encuentra un tracto rico en pirimidinas, es decir, formado casi exclusivamente por timinas ó

16 8 GENÉTICA HUMANA citosinas. Finalmente, se han identificado pequeños elementos de secuencia en exones ó en intrones que actúan como potenciadores ó silenciadores del proceso de ayuste, y que tienen gran importancia en la modulación y regulación fina del proceso. La figura 1.10 muestra esquemáticamente las distintas secuencias que son importantes en el proceso de ayuste. Exon 1 Exon 2 Intron 1 ARNnp U1 GUC CAUUCA CAG GUAAGU UGAC...[C/T] [C/T][C/T][C/T] [C/T] [C/T]UG G El proceso de ayuste implica varias reacciones enzimáticas que realizan cortes endonucleolíticos y unión de extremos libres. El primer paso del proceso es el corte en el sitio de ayuste 5', justo por delante de la guanina del GU inicial del intrón. Este extremo libre se une a la Adenina del punto de ramificación mediante un enlace fosfo-diéster 5'-2', creando una estructura en lazo. Finalmente, se corta la secuencia de ayuste 3' por detrás de la guanina del sitio AG, lo que resulta en la liberación del intrón; los extremos libres de los dos exones flanqueantes son entonces religados. Las moléculas que llevan a cabo estos procesos son unas ribonucleoproteínas nucleares pequeñas (RNPnp), formadas por un ARN nuclear pequeño (ARNnp) y varias subunidades proteicas. Aunque hay varios tipos de ARNnp, los que participan en el proceso de ayuste se llaman U1, U2, U4, U5 y U6, y además dan su nombre a las correspondientes RNPnp. La RNPnp U1 se une a la secuencia de ayuste 5' por complementariedad de bases, ya que uno de sus extremos es complementario a la secuencia consenso que rodea a la GU del extremo 5' del intrón. Las otras ribonucleoproteínas implicadas actúan en los siguientes pasos del proceso. La RNPnp U2 se une al punto de ramificación y esto hace ambas RNP entren en contacto y facilita la formación del lazo. A continuación, un complejo formado por la RNPnp U4/6 y la RNPnp U5 se une a la región de ayuste 3' y estabiliza la formación de todo el complejo, llamado ayusteosoma (spliceosome en inglés), y lleva a cabo el corte 3' y la unión de los exones.

17 CAPÍTULO 1: EL FLUJO DE LA INFORMACIÓN GENÉTICA 9 La figura 1.11 contiene un enlace a un video educativo que muestra esquemáticamente el proceso de ayuste. Como se puede suponer, en un genoma eucariota hay miles de sitios que cumplen el consenso de secuencia necesario para funcionar como sitios de ayuste, pero sin embargo sólo unos pocos participan en el procesamiento normal de los genes. De hecho, uno de los temas más interesantes en la regulación del ayuste es cómo se definen exactamente los límites de exones e intrones, de modo que la maquinaria de ayuste los reconozca como tales. Aunque todavía quedan incógnitas por resolver, hoy en día sabemos que hay otros elementos que cooperan para estabilizar el ayusteosoma y permitir que se lleve a cabo el proceso. Entre estos elementos destacan la proteínas SR (llamadas así por ser ricas en los aminoácidos Serina y Arginina), que interaccionan con distintos componentes del ayusteosoma y se unen a secuencias moduladoras como son los potenciadores exónicos del ayuste. Todas estas interacciones tienen lugar antes de la unión de las RNPnp U4/6 y RNPnp U5, y son muy importantes para definir los límites de exones e intrones y para regular el ayuste alternativo, que es el fenómeno por el cual un mismo gen puede sufrir distintos patrones de ayuste dependiendo del tejido ó del tipo celular en que se lleva a cabo. El ayuste alternativo es un fenómeno muy común en humanos, y hace que los ARNm resultantes de los distintos tipos de ayuste sean diferentes y por tanto tengan la capacidad de codificar proteínas distintas, lo que añade un nivel más de complejidad en la función del genoma. La figura 1.12 muestra esquemáticamente los complejos que intervienen en la definición de los exones e intrones, así como el fenómeno de ayuste alternativo. Traducción y código genético en eucariotas El paso final en el proceso de la expresión génica es la fabricación de una proteína a partir de la información contenida en la secuencia del ARNm. Conceptualmente, este proceso es parecido a la interpretación de unas instrucciones escritas en un idioma, siguiendo un código de interpretación concreto. Por eso, el proceso se denomina traducción. Si queremos traducir un lenguaje, en primer lugar necesitamos conocer el diccionario para entender el significado de las palabras. En este caso, el diccionario se conoce como código genético, que es la correspondencia entre la información contenida en el ARNm y el tipo de aminoácido que se añade a la proteína durante su síntesis. En el ARNm, las instrucciones están compuestas por palabras de tres letras, es decir, cada tres nucleótidos forman una palabra que instruye a la maquinaria de síntesis proteica a añadir un aminoácido concreto. Estas palabras de tres letras se denominan codones. Es fácil calcular el número posible de palabras de tres letras que se pueden formar con un alfabeto de cuatro letras (A, C, G y T): 4 3, es decir 64 palabras distintas. Sin embargo, sólo hay 20 aminoácidos esenciales en las proteínas, por lo que en teoría sólo serían necesarios 20 codones. Teniendo en cuenta las palabras palabras necesarias para la instrucción de iniciar la transcripción (AUG) y de terminarla (UAG, UAA, UGA), todavía tenemos la posibilidad de codificar un mismo aminoácido con varios codones distintos. Para indicar este fenómeno se dice que el código genético es degenerado, en el sentido de que varias palabras a veces codifican el mismo aminioácido. Por ejemplo, algunos aminoácidos como la leucina están codificados por 6 codones diferentes. La Figura 1.13 muestra el código genético, con la tabla de equivalencias entre los distintos aminoácidos y los codones que los codifican.

18 10 GENÉTICA HUMANA El hecho de que el código genético utilice palabras de tres letras implica que cualquier secuencia anónima, cuyo significado no conocemos, podría dar lugar al menos a tres proteínas distintas dependiendo del punto de inicio de la traducción. En efecto, cualquier secuencia (supongamos la secuencia 5'- ACGACTGCGTACACGTC-3', por ejemplo) puede dividirse en bloques de tres palabras que configurarán instrucciones distintas si comenzamos a contar desde el primer nucleótido (ACG, ACT, GCG, etc en nuestro ejemplo), desde el segundo (CGA, CTG, CGT, etc) ó desde el tercero (GAC, TGC, GTA, etc). Como puede observarse, las proteínas codificadas en cada caso tienen una secuencia de aminoácidos diferente. Cada una de estas posible formas de leer una secuencia codificante se denomina marco de lectura, y siempre existen tres marcos de lectura posibles (en secuencias de una sola hebra) porque el cuarto marco de lectura es idéntico al primero, el quinto al segundo, etc. Esto plantea el problema de cómo reconoce la célula cuál es el marco de lectura que debe usar para sintetizar la proteína correcta. Esto se soluciona de dos formas: en primer lugar, por la existencia de un codón de inicio (AUG, que codifica para el aminoácido metionina), y en segundo lugar porque sólo uno de los tres marcos de lectura (llamado por eso "abierto") da lugar a una proteína de longitud adecuada, ya que en los otros dos marcos de lectura aparecen codones de parada y las proteínas codificadas resultarían muy cortas y sin funcionalidad. En eucariotas, el codón de inicio está incluido en una secuencia consenso definida por Marilyn Kozak, que es 5'-C[A/G]CCAUGG-3'. El marco de lectura abierto quedará definido, por tanto, cuando el codón de inicio vaya seguido por un número suficiente de codones codificantes hasta llegar a un codón de parada. Es importante tener en cuenta que la traducción no comienza al principio del ARNm, y tampoco termina al final del mensajero. De hecho, en el gen y en el ARNm se pueden definir dos regiones no-traducidas, una en dirección 5' al inicio de la traducción y otra desde el codón de parada hasta el final, que flanquean la región codificante (el marco de lectura abierto). La región no traducida 5' (RNT-5', en inglés UnTranslated Region ó 5'-UTR) se extiende desde el inicio del ARNm (la caperuza) hasta el inicio de la traducción (codón de iniciación); la RNT-3' (en inglés 3'-UTR) se extiende desde el codón de parada hasta el inicio de la cola poli(a). La Figura 1.14 muestra una secuencia de ADN con los distintos marcos de lectura posibles en el ARNm, señalando además las regiones no traducidas : : : : : :---- atgtggttttctgtccacttcccctatgcaggtgtccaacggatgtgtgagtaaaattct M W F S V H F P Y A G V Q R M C E * N S C G F L S T S P M Q V S N G C V S K I L V V F C P L P L C R C P T D V * V K F W : : : : : :---- GGGCAGGTATTACGAGACTGGCTCCATCAGACCCAGGGCAATCGGTGGTAGTAAACCGAG G Q V L R D W L H Q T Q G N R W * * T E G R Y Y E T G S I R P R A I G G S K P R A G I T R L A P S D P G Q S V V V N R E La maquinaria que lleva a cabo la traducción está constituida básicamente por dos elementos: los ribosomas y los ARN de transferencia. El ribosoma es una partícula compleja formada por subunidades de naturaleza ribonucleoproteica. En eucariotas, el ribosoma consta de una subunidad pequeña (coeficiente de

19 CAPÍTULO 1: EL FLUJO DE LA INFORMACIÓN GENÉTICA 11 sedimentación 40S) formada por un ARN y unas 30 proteínas, y otra subunidad grande (60S) formada por 3 ARN y unas 50 proteínas. Los ARN transferentes (ARNt) son pequeñas moléculas de ARN que llevan en uno de sus extremos un aminoácido, y actúan como los adaptadores que leen la información de cada codón y la transforman en un aminoácido específico. Aunque se representan habitualmente con forma de trébol, en realidad están doblados en forma de L. Las dos regiones más importantes de un ARNt son el anticodón y el extremo 3', que termina en los nucleótidos 5'-CCA-3' y lleva el aminoácido correspondiente. El anticodón está formado por los tres nucleótidos que se emparejan con el codón por complementariedad, ya que la secuencia del codón y la del anticodón son complementarias (ambas en dirección 5' 3'). Este emparejamiento no necesita ser siempre perfecto, sino que en ocasiones se permite un cierto "tambaleo" cuando uno de los tres nucleótidos no forma un emparejamiento perfecto tipo Watson-Crick; precisamente, esto es lo que permite que varios codones sean leídos por un mismo anticodón. La Figura 1.15 muestra un ARNt, señalando el anticodón unido al codón. El proceso de traducción comienza con la fase de iniciación, mediante la unión de la subunidad pequeña del ribosoma a la caperuza del ARNm maduro que proviene del proceso de ayuste. A continuación, la misma subunidad ribosomal se desplaza por el ARNm hasta encontrar el codón de iniciación apropiado, momento en que se unen el ARNt Met (el ARN transferente que lleva el aminoácido Metionina) y la subunidad ribosomal grande. El bolsillo del ribosoma donde está unido este primer ARNt se llama sitio A (aminoacil). En este proceso participan también varios factores de iniciación (eif1 a eif6, del inglés eukaryotic initiation factor). La segunda fase de la traducción se llama elongación, y consiste en un proceso cíclico por el que el ribosoma se desplaza tres nucleótidos y el ARNt que ocupaba el sitio A pasa a ocupar otra región del ribosoma llamada sitio P (peptidil). Gracias a este movimiento, el siguiente codón del ARNm queda dentro del sitio A, a donde acude otro ARNt con un anticodón complementario al nuevo codón. A continuación, la cadena peptídica que "cuelga" del ARNt que ocupa el sitio P es transferida al aminoácido del ARNt que ocupa el sitio A, con lo que la cadena polipeptídica se alarga en un aminoácido. Estos procesos están ayudados y catalizados por los propios ARN ribosomales y por dos factores de elongación (eef1 y eef2, del inglés eukaryotic elongation factor). La terminación de la traducción tiene lugar cuando alguno de los tres codones de parada ocupa el sitio A, porque en vez de unirse un ARNt acude un factor de terminación (erf1 y erf3 en eucariotas, del inglés eukaryotic release factor). La Figura 1.16 contiene un enlace a un video que muestra el proceso de traducción. La traducción completa el proceso de expresión génica. Aunque actualmente se está reconociendo el papel de los ARN no codificantes, que se transcriben y son procesados pero no se traducen en proteínas, el aforismo "un gen, una proteína" sigue siendo válido en la mayoría de los casos. Igualmente, el "dogma central de la biología molecular" (es decir, la vía ADN ARN Proteína) no siempre se cumple, porque algunos virus y otros organismos tienen un genoma con ARN que se retro-transcribe a ADN. En cualquier caso, las nociones y mecanismos que se han repasado en este capítulo constituyen el punto básico de arranque para comprender la naturaleza molecular de los genes y su función como portadores de información biológica.

20 12 GENÉTICA HUMANA

21 CAPÍTULO 2: EL ADN EN EL NÚCLEO 13 Capítulo 2. El ADN en el núcleo de la célula eucariota. La cromatina durante el ciclo celular. Replicación de la cromatina en interfase. Formación y segregación de los cromosomas durante la mitosis. Gametogénesis y meiosis. Recombinación a nivel molecular. La cromatina durante el ciclo celular En las células somáticas que tienen núcleo, la molécula de ADN está presente en una forma peculiar llamada originalmente cromatina. Por la estructura de la doble hélice del ADN, sabemos que la distancia entre nucleótidos es de 0,34 nm; si el genoma humano haploide tiene 3x10 9 pares de bases, la longitud total del genoma en forma de doble hélice lineal sería algo superior a 1 metro, y además cada núcleo contiene dos copias del genoma. Todo este material debe entrar en el núcleo de una célula eucariota, cuyo diámetro medio es de 5 m. Esto significa que el ADN ha de adoptar un alto grado de empaquetamiento para poder alojarse dentro del núcleo. Este empaquetamiento se lleva a cabo mediante la unión de la doble hélice con varios tipos de proteínas para dar lugar a una estructura que es, precisamente, la cromatina. Las células eucariotas, al proliferar, siguen una serie de etapas en las que se llevan a cabo los procesos necesarios para dar lugar a dos células hijas: duplicar los componentes celulares, segregarlos espacialmente y dividir la célula de modo que las dos células resultantes lleven todos los ingredientes necesarios para su correcto funcionamiento. Estas etapas deben completarse en orden, de un modo altamente regulado, y constituyen lo que se llama ciclo celular. En cada ciclo celular se distinguen por tanto varias fases: la interfase (etapa en la que la célula duplica su contenido), la mitosis (etapa en la que los componentes se separan a polos opuestos de la célula) y citoquinesis (separación física de las dos células hijas). Probablemente sea la cromatina el componente celular en el que es más importante la duplicación y segregación correctas, ya que esto va a asegurar que la información genética se transmita sin alteraciones. Por tanto, es importante saber cómo se comporta la cromatina en las distintas etapas del ciclo celular. La Figura 2.1 muestra las distintas fases del ciclo celular de una célula eucariota y los cambios que sufre la cromatina. Durante la interfase, que es la etapa más larga del ciclo, la cromatina está sujeta a un grado de empaquetamiento de unas 2000 veces, es decir, lo que en su estado natural ocuparía un tamaño de 2000 m se reduce a un tamaño de 1 m. Esto se consigue por la unión de la doble hebra de ADN con unas proteínas básicas llamadas histonas, cuyos grupos positivos interaccionan con los grupos negativos del esqueleto fosfato del ADN. Hay 5 tipos principales de histonas, llamadas H1, H2A, H2B, H3 y H4, que se asocian entre sí para formar un octámero: dos moléculas de H3 junto con dos moléculas de H4 forman un tetrámero, y dos dímeros H2A/H2B forman otro tetrámero; ambos tetrámeros se asocian para formar un núcleo proteico (octámero) alrededor del cual se enrolla la molécula de ADN. En concreto, 146 pares de bases de ADN dan 1,65 vueltas alrededor del octámero, y sobre este complejo se une la histona H1. Esta estructura, de unos 10 nm de diámetro, es lo que se conoce con el nombre de nucleosoma, y es la unidad básica de organización de la cromatina. Los nucleosomas están unidos entre sí por el filamento de ADN que se va enrrollando a su alrededor, como bolas en una cuerda, y esto da lugar a la fibra de cromatina de 10 nm. En esta estructura, unos 200 pares de bases ocupan 10 nm, lo que significa un grado de empaquetamiento de unas 6 veces respecto al tamaño lineal que ocuparía un fragmento de ADN de esa longitud (200 X 0,34 nm = 64 nm).

22 14 GENÉTICA HUMANA La Figura 2.2 muestra algunos modelos tridimensionales de un nucleosoma. En condiciones fisiológicas, la fibra de 10 nm sufre un segundo grado de enrollamiento sobre sí misma para dar lugar a una estructura en forma de solenoide, con 6 nucleosomas por vuelta. Esta configuración constituye la fibra de 30 nm, en la que el grado de empaquetamiento del ADN es de unas 40 veces. La fibra de 30 nm sufre diferentes grados de empaquetamiento durante interfase y, especialmente, en la mitosis, en la que la cromatina alcanza su empaquetamiento máximo (unas veces) y da lugar a las estructuras visibles que llamamos cromosomas. Estos tipos de alto grado de enrollamiento se consiguen porque la fibra de 30 nm forma asas que se unen por su base a una estructura proteica que sirve como andamio. El andamio ("scaffold" en inglés) está constituido por proteínas no histonas, de las que las principales son la Sc1 (idéntica a la topoisomerasa II) y la Sc2 ó SMC2, que pertenece a una familia de proteínas llamada SMC (Structural Maintenance of Chromosomes, en inglés). Estas proteínas cumplen también un papel importante en el mantenimiento de la condensación de la cromatina (de ahí que también se les llame condensinas). Las asas de la fibra de 30 nm se unen al andamio mediante unas secuencias ricas en Adeninas y Timinas llamadas SAR (Scaffold Attachment Region en inglés), que tienen gran afinidad por las proteínas del andamio. La estructura que resulta de este enrollamiento da lugar a una fibra de unos 300 nm de grosor, en la que el grado total de empaquetamiento del ADN es de unas veces. Las SAR son regiones importantes, dispersas por el genoma, que flanquean genes y a menudo se asocian con los orígenes de replicación que veremos más adelante, por lo que se piensa que pueden jugar un papel importante en la función y estructura de la cromatina. Finalmente, el empaquetamiento máximo de la cromatina durante la mitosis se consigue al espiralizarse la fibra de 300 nm para dar lugar a una estructura de 600 nm de grosor (una cromátide) en la que el ADN alcanza ya un grado de empaquetamiento de veces. La Figura 2.3 muestra los distintos grados de empaquetamiento de la cromatina. Doble hélice (2 nm) Nucleosoma Fibra de 30 nm Fibra de 10 nm Solenoide Replicación de la cromatina en interfase La interfase se subdivide en tres fases, de las que la más importante es la fase de síntesis (fase S). En esta fase tiene lugar la duplicación de los componentes celulares, incluyendo la cromatina. La fase S viene

23 CAPÍTULO 2: EL ADN EN EL NÚCLEO 15 precedida y seguida por dos breves fases G (de "gap", hueco ó hiato), fase G1 y fase G2 respectivamente. Uno de los principales procesos que tienen lugar durante la fase S es la duplicación del contenido total de ADN del núcleo, que se lleva a cabo mediante la replicación del ADN y el ensamblaje en nucleosomas para dar lugar a la nueva cromatina. El proceso de replicación del ADN ya había sido sugerido por Watson y Crick en su descripción del ADN, al darse cuenta que la estructura de la doble hélice y la complementariedad de bases permitía un mecanismo sencillo de copia. Aunque durante algunos años se discutió cómo podría funcionar este mecanismo, Matthew Meselson y Franklin Stahl demostraron que el ADN se replica de modo semi-conservativo, es decir, que cada una de las nuevas moléculas lleva una cadena de la molécula original y otra cadena nueva, sintetizada tomando como molde la cadena complementaria. Posteriormente se fueron descubriendo los detalles del proceso, e identificando los distintos componentes que lo llevan a cabo. La Figura 2.4 muestra esquemáticamente la replicación semiconservativa, y contiene un enlace a un sitio educativo que explica los experimentos de Meselson y Stahl. En eucariotas, la replicación comienza en múltiples sitios de una misma molécula de ADN a la vez, llamados orígenes de replicación. Dada la velocidad de copia de las polimerasas, una sola molécula de ADN polimerasa tardaría varios días replicar un cromosoma completo, por lo que de hecho la replicación de la cromatina se lleva a cabo en varios miles de orígenes de replicación a la vez. De todas formas, aunque todos los orígenes funcionan durante la fase S, no todos se ponen en marcha a la vez: en algunos orígenes la replicación comienza al principio de la fase S (replicación temprana) y en otros comienza hacia el final (replicación tardía). En cada origen de replicación se forma una burbuja de replicación, por acción de unas helicasas que abren la doble hélice para permitir la unión de las enzimas que llevarán a cabo la síntesis, que son las polimerasas de ADN. Este primer paso está sujeto a una fina regulación, ya que un mismo origen sólo se replica una vez en cada ciclo celular. De hecho, aunque la replicación a partir de un origen ya haya terminado y ése mismo origen pudiese volver a iniciar otro ciclo de replicación en la misma fase S, esto nunca sucede. Esta regulación se lleva a cabo por la acción de varios complejos proteicos como el ORC (del inglés Origin Recognition Complex), el complejo de proteínas MCM, y la geminina. En cada burbuja se forman dos horquillas de replicación, apuntando en direcciones contrarias. Como los eventos que tienen lugar en cada horquilla son idénticos, basta estudiar lo que sucede en una de ellas. En primer lugar, una proteína de unión a ADN mono-catenario, llamada RPA (Replication Protein A, en inglés) se une a las cadenas que han sido separadas por las helicasas, y esto ayuda a mantener la burbuja de replicación abierta. A continuación, a cada una de las cadenas se une una enzima llamada primasa, que es una ARN polimerasa dependiente de ADN (es decir, sintetiza ARN tomando como molde ADN). La primasa sintetiza un pequeño ARN que actúa como cebador (primer, en inglés, de ahí su nombre) para iniciar la síntesis de ADN. Las polimerasas de ADN dependientes de ADN llevan a cabo la síntesis de ADN elongando la cadena a partir del cebador de ARN generado previamente. Esta síntesis tiene lugar de modo diferente en cada una de las cadenas, debido a la distinta orientación que tienen. En la cadena que discurre en sentido 3' 5', el cebador y la nueva cadena sintetizada sobre ella discurrirán en sentido 5' 3', que es el único modo en que pueden sintetizar ADN las polimerasas. Por tanto, en esta cadena, llamada cadena guía (leading strand en inglés) se puede sintetizar el nuevo ADN de modo continuo. Por el contrario, la otra cadena de la molécula original discurre en sentido 5' 3', por lo que la nueva cadena sintetizada a partir de ésta (cadena retrasada, o lagging strand en inglés) debería crecer en sentido 3' 5'. Como esto no es posible, ya que las polimerasas son incapaces de sintetizar ADN de esta forma, lo que sucede es que se

24 16 GENÉTICA HUMANA generan varios cebadores de ARN a pequeñas distancias, sintetizándose el ADN a partir de cada uno de ellos en sentido 5' 3'. El resultado neto es la síntesis semi-discontínua de la cadena retrasada en sentido 3' 5' gracias a la síntesis de pequeños fragmentos (cada uno de los cuales fue sintetizado en sentido 5' 3'). Estos fragmentos se denominan fragmentos de Okazaki, y tienen una longitud entre 100 y 1000 nucleótidos en eucariotas. A medida que la horquilla de replicación avanza, las helicasas continúan abriendo la doble hélice (ayudadas por otras enzimas llamadas topoisomerasas, que relajan la tensión generada por delante de la horquilla). Tras la síntesis en ambas cadenas, otras enzimas eliminan los fragmentos de ARN que habían servido de cebadores, rellenan los huecos que quedan, y finalmente unas ligasas sellan los últimos enlaces fosfo-di-éster para obtener una cadena continua sin solución de continuidad. Figura 2.5 En estas animaciones se muestra esquemáticamente el proceso de síntesis de la cadena guía y de la cadena retrasada durante la replicación del ADN. Aunque los complejos proteicos que intervienen en la replicación del ADN en eucariotas no han sido caracterizados con tanta profundidad como en procariotas, hoy en día se conocen bastantes detalles. De entre las diferentes ADN polimerasas identificadas en eucariotas, la síntesis de los cebadores de ARN es obra de la primasa, que actúa junto con la ADN polimerasa. Ésta, prolonga el cebador de ARN unos pocos nucleótidos. El factor C de la replicación (RFC) desplaza la polimerasa -primasa, una vez que se ha formado el cebador de ARN, y trae consigo otra proteína llamada PCNA (Proliferating Cell Nuclear Antigen, en inglés), que a su vez es la responsable de reclutar la polimerasa que lleva a cabo la síntesis de ADN. Éstas son la ADN polimerasa (en la cadena retrasada) y la ADN polimerasa (en la cadena guía). El complejo PCNA-Polimerasa también incluye una endonucleasa (FEN1 en eucariotas) que es la responsable de degradar los cebadores de ARN que seon desplazados por la polimerasa. Finalmente, la ligasa que culmina el proceso en eucariotas es la ADN ligasa I. La Figura 2.6 contiene un video que explica el proceso de replicación de la cadena retrasada, con los distintos complejos proteicos implicados. Es importante entender que la replicación del ADN no se refiere sólo a la duplicación de la doble cadena, sino que implica también el ensamblaje de la cromatina a medida que el ADN se va replicando. De hecho, durante la replicación sólo se altera el empaquetamiento de la cromatina en una pequeña región: se estima que sólo los dos nucleosomas por delante de la horquilla de replicación se ven afectados por el avance de la maquinaria replicativa, y que unos 300 nucleótidos por detrás de la horquilla ya se vuelven a ensamblar los nuevos nucleosomas para comenzar a formar las dos nuevas fibras de cromatina. Este reensamblaje de la cromatina se produce en varias etapas, comenzando con la unión del tetrámero H3-H4 en primer lugar, seguida de la deposición del tetrámero H2A/H2B; finalmente se añade la histona H1. Lógicamente, es muy importante mantener la "memoria" acerca del estado en que estaba una región de cromatina, para que las fibras hijas que se producen tras la replicación mantengan el mismo estado que tenía la fibra original. Como veremos, esto se consigue por modificaciones químicas de algunos aminoácidos de las histonas, que se distribuyen por igual desde los nucleosomas de la fibra original a los nucleosomas de las fibras recién formadas. En el caso de moléculas lineales de ADN, como los cromosomas, la replicación de los extremos terminales presenta un problema particular, puesto que el cebador de ARN localizado en el extremo de la cadena retrasada no puede ser reemplazado por ADN (como ocurre en la replicación normal). Por tanto, los

25 CAPÍTULO 2: EL ADN EN EL NÚCLEO 17 cromosomas estarían sujetos a una degradación progresiva de sus extremos con cada división celular, y esto sería letal en células que se dividen muchas veces a lo largo de la vida de un individuo. Para evitar esto, los cromosomas de eucariotas tienen en sus extremos unas estructuras especiales, llamadas telómeros, que protegen los extremos libres y evitan la erosión asociada con la replicación. Estas estructuras están formadas por la repetición una pequeña secuencia que está repetida múltiples veces al final del extremo 3' de una de las cadenas de la doble hélice, cadena que por tanto será más larga que la otra. Estas repeticiones, que en humanos están formadas por el hexanucleótido TTAGGG, son añadidas por la acción de un enzima denominada telomerasa, que consta de un componente ARN y de un componente enzimático con actividad polimerasa de ADN dependiente de ARN. Usando el componente ARN como molde, la telomerasa va añadiendo nuevas repeticiones TTAGGG al extremo 3' de una de las cadenas del cromosoma. Esto posibilita que, durante la replicación, se sintetice el cebador de ARN sobre las repeticiones teloméricas y no se pierda material genético propio del cromosoma. Las repeticiones que se pierden por causa de la replicación, son después añadidas por acción de la telomerasa, lo que asegura la integridad de los cromosomas durante toda la vida de la célula. La Figura 2.7 incluye un video que ilustra el problema de la replicación de los extremos y la acción de la telomerasa. Una consecuencia importante de la replicación es que el contenido total de ADN de la célula se duplica antes de que los cromosomas se hagan visibles y se separen en la mitosis, como veremos a continuación. Esto es precisamente lo que hace que cada cromosoma, durante la mitosis, esté compuesto por dos cromátides hermanas pegadas. En este sentido, es importante evitar la confusión entre el número de cromosomas y el contenido total de ADN de una célula. El número haploide de cromosomas (número de cromosomas distintos, que es característico de cada especie) se representa por la letra n; una célula somática tiene un número diploide (2n) de cromosomas, ya que tiene 2 copias de cada cromosoma (n parejas de cromosomas homólogos). Antes de entrar en la fase S, una célula somática tiene un número 2n de cromosomas (aunque no se ven en su forma típica, por estar la cromatina poco condensada) y un contenido total de ADN correspondiente a una cromátide por cromosoma: esto se representa por la cantidad de ADN 2C. Al final de la replicación del ADN, esa célula sigue teniendo 2n cromosomas (todavía invisibles) pero ahora tiene un contenido de ADN igual a 4C, ya que tenemos dos cromátides por cromosoma. Tras la mitosis, la segregación de las cromátides hermanas tiene como resultado que cada una de las células hijas lleva otra vez 2n cromosomas y un contenido de ADN igual a 2C. De este modo, se mantiene el número de cromosomas y la cantidad total de ADN tras las sucesivas divisiones celulares. Formación y segregación de los cromosomas durante la mitosis La cromatina es una estructura dinámica cuyo grado de empaquetamiento es máximo durante la mitosis, y por eso en esta fase del ciclo celular se puede ver en una forma especialmente condensada que da lugar a los cromosomas. Como hemos visto, esta condensación se produce porque la fibra de cromatina de 300 nm se enrolla en forma de espiral, proporcionando un grado de empaquetamiento unas 5 veces mayor al observado durante la interfase. La mitosis es el proceso de división de las células somáticas, fundamental en la proliferación celular que tiene lugar durante el desarrollo embrionario, el crecimiento y el mantenimiento de los tejidos. Supone una reorganización drástica de todos los componentes celulares, pero muy especialmente de los cromosomas, cuya segregación a cada una de las células hijas debe ser muy precisa y estar finamente regulada y coordinada con la separación física de las nuevas células (citoquinesis). Durante la mitosis, la maquinaria celular se especializa en llevar a cabo los distintos procesos que tienen

26 18 GENÉTICA HUMANA lugar en la célula: condensación de la cromatina, formación del huso mitótico, segregación de los componentes y fisión celular. La primera fase de la mitosis (profase), comienza con la condensación de la cromatina, la ruptura de la envuelta nuclear y el desarrollo del huso mitótico. Es importante recordar que la cromatina ha sido replicada en la fase S de la interfase previa, por lo que cada cromosoma está ahora formado por dos cromátides hermanas. Los microtúbulos se unen a los quinetocoros, estructuras proteicas formadas sobre los centrómeros de cada cromosoma, y comienzan a transportar a los cromosomas hacia el plano ecuatorial del huso. En la fase siguiente (metafase) cada cromosoma está unido a microtúbulos procedentes de los dos polos de la célula, de modo que todos los cromosomas están en el ecuador del huso mitótico sometidos a fuerzas tensionales opuestas. Los mecanismos moleculares que regulan la cohesión de cromátides hermanas comienzan a conocerse cada vez mejor, y su implicación en patología humana está adquiriendo mayor relevancia. Por ejemplo, se han identificado las proteínas cromosómicas necesarias para mantener la cohesión de cromátides hermanas, que se denominan cohesinas. En eucariotas funcionan como cohesinas al menos cuatro miembros de la familia SMC (Structural Maintenance of Chromosomes), y en Xenopus (sapo) se ha identificado un complejo que es necesario para la cohesión y que está formado por SMC1 y SMC3 junto con SCC1 (Sister Chromatid Cohesion 1). La cohesión se establece en la fase S del ciclo celular, durante la replicación del ADN, aunque las cohesinas estaban ya presentes en la cromatina. Al replicarse el ADN, ambas cromátides quedan unidas por las cohesinas en toda su longitud, distinguiéndose dos tipos de cohesión: la cohesión en los centrómeros y la cohesión en los brazos cromosómicos. Ambos tipos de cohesión están mediados por cohesinas, pero los procesos que los regulan son algo diferentes. El mantenimiento de esta cohesión durante metafase es muy importante, porque es precisamente el balance entre las fuerzas de los microtúbulos y la cohesión de ambas cromátides lo que permite el alineamiento de los cromosomas en el plano ecuatorial: la tendencia de los microtúbulos a separar las cromátides se ve contrarrestada por la cohesión que las mantiene unidas, y gracias a esta cohesión se genera la tensión necesaria para formar la placa metafásica. Es precisamente la pérdida brusca de cohesión lo que permite la separación de las cromátides. Lógicamente, un componente fundamental en estos procesos es el quinetocoro, que en definitiva es el punto de cada cromosoma donde se anclan los microtúbulos. Existe en células eucariotas un sistema que comprueba que todos los quinetocoros estén unidos a microtúbulos y activa un punto de control que impide la separación de las cromátides antes de conseguir la perfecta unión de todos los quinetocoros a sus microtúbulos respectivos. La metafase va seguida por la anafase, en la que tiene lugar la segregación de las cromátides hermanas de cada cromosoma hacia polos opuestos de la célula. La separación simultánea de 46 pares de cromátides hermanas en la transición metafase-anafase es un momento crucial del ciclo celular, y por tanto está finamente regulado. Por ejemplo, es crítico que la cohesión se pierda en el momento adecuado, para que cada cromátide pueda migrar a una célula hija sin errores. En general, se observa que primero se pierde la cohesión en los centrómeros, y a medida que los microtúbulos van "tirando" de los quinetocoros se va perdiendo la cohesión en los brazos. La separación se lleva a cabo mediante la degradación de las cohesinas. La última fase de la mitosis es la telofase, en la que los cromosomas vuelven a descondensarse y se forma la envoltura nuclear alrededor de cada uno de los nuevos núcleos que se han formado en cada polo de la célula. Terminada la mitosis, el proceso de división celular se completará con la citoquinesis, en la que los componentes celulares se reordenan y se reorganiza el citoesqueleto para facilitar la divisón física de la célula en dos células hijas. La Figura 2.8 contiene un video que ilustra las principales fases de la mitosis. Dada la importancia de la separación de las cromátides hermanas en anafase, se ha investigado mucho en torno a su regulación. Se sabe que la degradación de las cohesinas se lleva a cabo por dos mecanismos distintos: fosforilación (mediada por la quinasa Polo) de algunos componentes, y proteolisis de otros. Las

27 CAPÍTULO 2: EL ADN EN EL NÚCLEO 19 proteínas implicadas en la proteolisis de la cohesinas se llaman separinas (ó separasas). Se ha comprobado que las separinas son capaces de romper el complejo cohesina porque degradan la proteína SCC1 (una cohesina) durante el comienzo de la anafase, permitiendo la separación de las cromátides por la fuerza que ejercen los microtúbulos. Cómo se activan las separinas en el momento exacto de la anafase? Esto se ha resuelto gracias a la identificación de las securinas, proteínas que inhiben la acción proteolítica que ejercen las separinas sobre las cohesinas. Por tanto, durante la mitosis las securinas están unidas a las separinas y así inhiben su acción, de modo que el complejo cohesina permanece intacto y las cromátides permanecen unidas. La disociación de las cohesinas se produce por la degradación súbita de las securinas al comienzo de la anafase, de manera que las separinas quedan libres y pueden cortar por proteolisis el complejo cohesina. El evento crucial, por tanto, es la degradación de securinas, degradación que está mediada por un complejo proteico llamado APC (Anaphase Promoting Complex) que posee actividad ubiquitina-protein-ligasa y promueve la degradación de diversas proteínas al comienzo de la anafase. Lógicamente, estos procesos no deben comenzar hasta que todos los quinetocoros están correctamente unidos a los microtúbulos del huso, pues de lo contrario la segregación de las cromátides no sería correcta. Por tanto, existe también un mecanismo de señalización que detecta si todos los quinetocoros han sido correctamente unidos por microtúbulos y envía una señal de activación del APC, para que dé comienzo la pérdida de cohesión. En la Figura 2.9 se explica el mecanismo de degradación de las cohesinas. Gametogénesis y meiosis En organismos de reproducción sexual, la formación de los gametos implica un modo de división celular diferente al de las células somáticas. Los gametos deberán poseer una sola copia de cada cromosoma, de modo que el cigoto resultante de la unión del gameto masculino y del gameto femenino en la fertilización sea diploide (con un cromosoma de origen paterno y otro cromosoma de origen materno en cada par cromosómico). Para obtener un número haploide (n) de cromosomas en los gametos, el proceso de formación de los mismos (gametogénesis) tiene unas características especiales. La principal peculiaridad es la existencia de un tipo distinto división celular en el que una célula diploide (2n) replica su ADN una vez (duplicando su contenido total en ADN de 2C a 4C) pero experimenta dos divisiones cromosómicas; esto tiene como consecuencia que los gametos masculino (espermatozoide) y femenino (oocito) llevan un número haploide de cromosomas (n) y un contenido total de ADN igual a C (una cromátide por cromosoma). Este modo de división celular se denomina meiosis, y tiene además otras características muy importantes para la transmisión de la variabilidad genética. En ambas líneas germinales, masculina o femenina, la gametogénesis comienza cuando los gonocitos experimentan una serie de divisiones mitóticas típicas en las que las células van madurando hasta llegar a formar las gonias (espermatogonias u oogonias, respectivamente) y los gametocitos primarios, que son células diploides (2n). A partir de este momento, las células replican su ADN en la fase S y a continuación entran en meiosis, en vez de dividirse por mitosis. En la Figura 2.10 se presenta un esquema de la gametogénesis.

28 20 GENÉTICA HUMANA GAMETOGÉNESIS Gametocitos Primarios 2n / 4C Gametocitos Secundarios n / 2C Espermatocitos Secundarios Gametos Oocito Secundario Corpúsculo Polar Primario n / C Espermatozoides Ovulo Corpúsculo Polar Secundario La meiosis incluye en realidad dos distintas divisiones cromosómicas, por lo que suele separarse en dos fases llamadas meiosis I (ó primera división meiótica) y meiosis II (segunda división meiótica). La meiosis I es la más importante de las dos, y comienza con una profase larga, complicada y claramente distinta de la profase de la mitosis. Esta profase de la meiosis I (llamada, por tanto, profase I) comienza con la condensación de la cromatina que, no lo olvidemos, se había replicado en la fase S precedente. Ambas cromátides están íntimamente unidas formando un único filamento, que se une por sus extremos a la membrana nuclear. Esta primera parte de la profase I se llama leptoteno. En la siguiente etapa, llamada cigoteno, los cromosomas homólogos se emparejan longitudinalmente con gran exactitud, de manera que las secuencias de cada uno de los dos homólogos quedan perfectamente alineadas. La unión entre los cromosomas de cada par se hace progresivamente más fuerte, dando lugar a un fenómeno que se conoce como sinapsis. La sinapsis se mantiene gracias a la formación del complejo sinaptonémico. La profase I continúa con la siguiente etapa, paquiteno, en la que los cromosomas se condensan todavía más y cada par de homólogos apacece como un bivalente (una estructura formada por dos cromosomas) ó tétrada (por estar formada por cuatro cromátides). De todas formas, el evento más importante de la etapa de paquiteno es el intercambio de material genético entre cromosomas homólogos, a través del proceso de recombinación que estudiaremos más adelante. En la siguiente etapa, la de diploteno, desaparece el complejo sinaptonémico y los cromosomas homólogos comienzan a separarse. Recordemos que hasta este momento la célula es diploide (2n) con contenido 4C de ADN, al tener dos cromátides por cromosoma. Durante la separación de los cromosomas homólogos en diploteno, las dos cromátides de cada cromosoma permanecen todavía unidas entre sí. Sin embargo, debido al intercambio de material genético precedente, la separación pone de manifiesto los puntos en los que se produjo un sobrecruzamiento, ya que esas regiones forman "puentes" que mantienen unidos a los dos homólogos de cada par e impiden la separación total.

29 CAPÍTULO 2: EL ADN EN EL NÚCLEO 21 Estos puntos se denominan quiasmas, y han de resolverse de algún modo para que la separación de los cromosomas pueda completarse. Por tanto, la profase I termina con una etapa corta denominada diaquinesis, en la que la cromatina alcanza su grado máximo de condensación y los cromosomas aparecen más cortos y gruesos. Tras la profase I, los espermatocitos primarios entran ahora en metafase I, en la cual desaparece la membrana nuclear, se forma el huso y los microtúbulos traccionan por los quinetocoros. Esto hace que los bivalentes, que llevan los cromosomas parcialmente separados (unidos únicamente por los quiasmas), se orienten en el ecuador de la célula. Debido a esta configuración, los cromosomas homólogos se sitúan en la placa metafásica con los centrómeros apuntando cada uno hacia uno de los polos de la célula. En la anafase I, la tracción de los microtúbulos y la activación del Complejo Promotor de la Anafase permiten la separación total de cada cromosoma homólogo hacia uno de los polos, fenómeno llamado disyunción. Finalmente, en la telofase I se han formado ya dos grupos de cromosomas en cada polo de la célula: cada uno de estos grupos consta de un número haploide (n) de cromosomas, cada uno de los cuales posee dos cromátides (contenido total de ADN igual a 2C). La meiosis I termina con la citoquinesis, la división física de las dos células hijas. Esta última fase es diferente en la línea germinal masculina y femenina, porque así como las células hijas del espermatocito primario son iguales, en el caso de la línea femenina una de las dos células hijas se lleva casi todo el citoplasma mientras que la otra es mucho menor. Por tanto, en la espermatogénesis cada esperamatocito primario da lugar a dos espermatocitos secundarios, mientras en la oogénesis cada oocito primario da lugar a un oocito secundario y a un corpúsculo polar de primer orden. La segunda división meiótica, ó meiosis II, es prácticamente igual a una mitosis. La única diferencia estriba en que la célula que se divide es haploide, mientras que en el caso de la mitosis la célula es diploide. Por tanto, esta división celular va a separar las dos cromátides que componen cada cromosoma de un gametocito secundario, para generar gametos con un número haploide de cromosomas (n), cada uno de los cuales está formado por una sola cromátide (contenido total de ADN igual a C). Como decíamos al principio, esto asegura que la fecundación da lugar a un cigoto diploide (2n) con contenido de ADN igual a 2C, al recibir un complemento cromosómico de cada gameto. El modo en que se completa la meiosis es también diferente en ambos sexos. Así como la espermatogénesis discurre de un modo continuo desde que se alcanza la madurez sexual, la oogénesis se detiene en profase I, de manera que un alto número de oocitos primarios permanecen en un estado prolongado de diploteno, llamado dictioteno. Estos oocitos sólo proseguirán su maduración al llegar la madurez sexual, cuando con cada ciclo menstrual un oocito culmina la meiosis I y completa también la meiosis II para dar un oocito secundario (óvulo) y un segundo corpúsculo polar. La Figura 2.11 incluye un video en el que se muestran esquemáticamente las distintas fases de la meiosis. Es importante fijarse en un hecho distintivo de la anafase de la meiosis I, que no comparten ni la anafase de la meiosis II ni la anafase de la mitosis. Este hecho consiste en que los cromosomas homólogos se separan pero, al mismo tiempo, las dos cromátides de cada cromosoma, por la acción de unas moléculas llamadas shugoshinas, deben permanecer unidas por los centrómeros. Esto se consigue porque las cohesinas centroméricas no son degradadas por las separasas. Las shugoshinas se unen específicamente a los centrómeros y, por su asociación con una fosfatasa, impiden la fosforilación de las cohesinas a ese nivel, lo cual a su vez impide que las cohesinas sean degradadas por las separasas.

30 22 GENÉTICA HUMANA Después, en la meiosis II, la ausencia de shugoshinas permite una segunda ola de activación de separasas que finalmente llevará a la separación completa de las dos cromátides de cada cromosoma homólogo. Al margen de lo dicho en relación con la reducción del número total de cromosomas en los gametos, la gran importancia de la meiosis reside en que es uno de los principales mecanismos de creación de variabilidad genética. Esto sucede a dos niveles, primero por la segregación aleatoria de los cromosomas de cada progenitor a los gametos, y en segundo lugar por el intercambio de material genético que tiene lugar durante los procesos de recombinación. Respecto a lo primero, es fácil comprender que cada división meiótica producirá gametos con distintas combinaciones de los cromosomas que estaban en la célula diploide original, ya que la segregación se produce al azar. Para entender esto es útil imaginarse todos los cromosomas de una célula diploide como la suma de dos conjuntos haploides, el paterno y el materno. Así, cada pareja de cromosomas homólogos consta de un homólogo de origen paterno y otro de origen materno. Cuando los homólogos se separan en la meiosis, no pasan todos los de origen paterno a una de las células hijas, y todos los de origen materno a la otra; por el contrario, se distribuyen aleatoriamente. Como los homólogos pueden tener pequeñas diferencias en los alelos presentes para algunos genes, el resultado es que cada gameto lleva una combinación única de cromosomas de origen paterno y materno mezclados. La variabilidad que se puede generar por este sencillo mecanismo es altísima, porque con 23 parejas de cromosomas el número de combinaciones posibles es igual a 2 23, ó lo que es lo mismo Por lo que respecta al segundo tipo de variabilidad introducida durante la meiosis, en la especie humana se ha calculado que se producen unos 55 sobrecruzamientos por célula, porque ese es el número medio de quiasmas que se observan. Esto supone una media de al menos 2 sobrecruzamientos por par cromosómico, incluidos los cromosomas sexuales. La presencia de estos quiasmas es importante para mantener los bivalentes unidos hasta anafase I, y asegurar que la disyunción se produce de modo correcto. Pero además, es probable que el número total de eventos de recombinación sea todavía mayor al número de quiasmas, porque no todas las recombinaciones producen un sobrecruzamiento (como se verá en el apartado siguiente). Por tanto, el grado de intercambio de material genético entre cromátides de cromosomas homólogos es bastante alto, y hace que los cromosomas que finalmente llegan a un gameto sean ligeramente distintos a los cromosomas que estaban presentes en la célula inicial. Como resultado de esto, la variabilidad genética generada durante la meiosis es alta, y por eso la probabilidad de que dos individuos tengan dos descendientes genéticamente idénticos es prácticamente nula. Esto es precisamente lo que persigue la reproducción sexual: generar descendientes distintos a sus progenitores y distintos entre sí. Recombinación a nivel molecular Uno de los temas más importantes en genética es la caracterización de los mecanismos moleculares por los que se produce intercambio de material genético entre cromátides durante la meiosis. Distintos modelos han intentado explicar cómo dos moléculas de ADN homólogas pueden entrecruzarse e intercambiar material genético. El paso inicial común a todos los modelos propuestos es el alineamiento preciso de ambas moléculas, precisamente debido a que son cadenas de ADN homólogas, es decir, pertenecientes a cromosomas homólogos y por tanto con la misma secuencia de nucleótidos. En realidad, hoy sabemos que ambas moléculas no son absolutamente idénticas, ya que pueden existir diferencias alélicas en su secuencia (por ejemplo, pequeñas diferencias de un nucleótido). En cualquier caso, el alineamiento de dos secuencias homólogas es un requisito imprescindible para que se inicie el proceso de recombinación, que se denomina por eso recombinación homóloga. Dicho alineamiento, como es lógico, se produce durante la profase I de la meiosis merced al complejo sinaptonémico que mantiene estrechamente unidos los cromosomas

31 CAPÍTULO 2: EL ADN EN EL NÚCLEO 23 homólogos en toda su longitud. Es lógico pensar que dicha configuración permite que dos moléculas de ADN de secuencia homóloga se mantengan en contacto. Los primeros modelos de recombinación proponían que, tras el alineamiento, ambas moléculas de ADN sufren una mella en una de sus cadenas, exactamente en la misma posición, y esto deja dos cadenas "libres" que se intercambian entre sí y se unen a la molécula homóloga por complementariedad de bases. Dado que la generación de dos mellas simultáneas en la misma posición es un evento muy improbable, Meselson y Radding propusieron otro modelo en el que una sola mella en una de las dos moléculas es suficiente para iniciar el proceso de recombinación, ya que la cadena libre puede invadir la doble hélice homóloga. Los estudios llevados a cabo en distintas especies de eucariotas en los últimos años han demostrado que la recombinación se inicia por la aparición de una rotura completa de una de las dos moléculas homólogas, es decir, una rotura bi-catenaria (de las dos cadenas de una doble hélice). Dichas lesiones, llamadas DSB (Double-Strand Break en inglés), se generan con cierta frecuencia en el ADN celular en respuesta a diversas causas; parece comprobado que la creación específica de un DSB durante profase I es el proceso iniciador de la recombinación. Según el modelo actual de recombinación homóloga, en este proceso intervienen una serie de complejos proteicos: Complejo RAD50, formado por las moléclulas MRE11, RAD50 y NBS1. El complejo RAD52, que incluye varios componentes (RAD51, RAD52, RAD54, RAD55 y RAD57 entre otros). La molécula RPA (la misma proteína A de la replicación). Tras la creación de un DSB, los extremos libres son procesados mediante la actividad exonucleasa del complejo RAD50, que actúa en dirección 5 3 y por tanto genera extremos libres más largos en la hebra 3'. Este extremo protruyente se recubre de RPA, RAD51 y otras moléculas del complejo RAD51 para formar un filamento nucleo-proteico. Este filamento tiene la capacidad de invadir la doble hebra homóloga, abriendo en ella una burbuja, y se empareja a la cadena complementaria que discurre en dirección antiparalela. A partir de este extremo 3' se extiende la cadena usando la hebra complementaria como molde, al tiempo que también se extiende también el otro extremo que había quedado libre. Tras una corta extensión, los extremos libres se unen por acción de una ligasa y esto genera dos estructuras en las que una hebra salta de una molécula de ADN a la molécula homóloga. Dichas estructuras se denominan estructuras de Holliday, que fue el primero en proponer su existencia. Es importante tener en cuenta que si las dos moléculas de ADN no son inicialmente idénticas en su secuencia, durante el proceso de recombinación se pueden formar moléculas híbridas, en las que ambas cadenas no son idénticas. Dichas moléculas de ADN se llaman heteroduplex, y son muy importantes porque los desemparejamientos son corregidos por un mecanismo de reparación que se estudiará en otro capítulo; dicha corrección hace que una de las dos cadenas se modifique para hacerse perfectamente complementaria a la otra, en un proceso llamado conversión génica. Como veremos en otras partes de este texto, la conversión génica es un mecanismo que da lugar a varias enfermedades genéticas en humanos. Las estructuras de Holliday dan lugar unas estructuras cruciformes formadas por dos moléculas de ADN, llamadas también estructuras chi, que han de resolverse de algún modo para permitir la separación de las dos cromátides. La resolución de las estructuras de Holliday puede hacerse según un plano vertical o según un plano horizontal, y es precisamente el tipo de resolución que se lleva a cabo lo que determina el tipo de moléculas que se generan. Por ejemplo, si las dos estructuras de Holliday se resuelven según planos distintos, las moléculas resultantes van a dar lugar a un sobrecruzamiento (la configuración que da lugar a los quiasmas que se ven en la meiosis); en cambio, cuando las dos estructuras de Holliday se resuelven

32 24 GENÉTICA HUMANA según el mismo plano se producirá recombinación sin sobrecruzamiento. A su vez, cada una de estas dos posibilidades puede darse con ó sin conversión génica, dependiendo de la presencia de heteroduplex y del modo en que se reparan. La Figura 2.12 muestra esquemáticamente el modelo de recombinación iniciado por una rotura bicatenaria en uno de los cromosomas homólogos, así como la resolución de las estructuras de Holliday y los posibles resultados de los procesos de recombinación. C G T A v h G C G C h/h h/v C G T A C G T A SI conversión G C G C G C G C NO conversión NO sobrecruzamiento SI sobrecruzamiento Curiosamente, el modelo de recombinación iniciado por una rotura bicatenaria en una cadena es fruto de los estudios de reparación de este tipo de lesiones en eucariotas. Como veremos en otro capítulo, las roturas bicatenarias son un tipo frecuente de agresión al ADN, y son reparados en células somáticas precisamente por un mecanismo de recombinación homóloga que tiene lugar durante la fase S del ciclo celular. En los últimos años se ha visto que este mismo mecanismo explica también las predicciones acerca de la recombinación durante la meiosis, y que de hecho la maquinaria proteica responsable es básicamente la misma. Por tanto, hoy en día se considera como un mismo mecanismo que se ha adaptado a dos funciones celulares importantes como la reparación del ADN y la generación de variabilidad genética durante la formación de los gametos. Más recientemente, se ha sugerido que la recombinación homóloga también puede tener otra función importante: la reiniciación de la replicación del ADN. A menudo, la horquilla de replicación se para prematuramente durante la síntesis de ADN y toda la maquinaria replicativa se desensambla; antes se pensaba que estas horquillas interrumpidas se reinician por el ensamblaje de un nuevo complejo de replicación en ese punto, pero cada vez hay más datos a favor de la hipótesis de que la replicación se reinicia en esas horquillas por un fenómeno de recombinación homóloga. Dicha recombinación podría darse entre las dos cromátides hermanas idénticas (la cromátide con la horquilla interrumpida y la que se ha originado por la replicación hasta ese punto), que sería lo normal, o bien puede darse entre cromátides de cromosomas homólogos, en cuyo caso se originaría un fenómeno de recombinación homóloga con posible sobrecruzamiento. De hecho, algunos autores han sugerido que,

33 CAPÍTULO 2: EL ADN EN EL NÚCLEO 25 originalmente, la principal función del mecanismo de recombinación fue precisamente la reparación de horquillas de replicación interrumpidas.

34 26 GENÉTICA HUMANA

35 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 27 Capítulo 3. Técnicas básicas de genética molecular. Tecnología del ADN recombinante: métodos y usos más frecuentes. Enzimas de restricción. Amplificación in vitro de ADN (PCR). Secuenciación del ADN. Técnicas básicas de hibridación de ácidos nucleicos. Microarrays. Tecnología del ADN recombinante: métodos y usos más frecuentes A principios de los años 1970 se desarrollaron una serie de técnicas que dieron lugar a lo que se llamó "ingeniería genética", "clonación molecular" ó "tecnología del ADN recombinante". Básicamente, esta tecnología nació como respuesta a la necesidad de obtener grandes cantidades de un gen ó genes, o incluso genomas completos, para poder llevar a cabo los estudios que permitiesen obtener la secuencia de nucleótidos de un gen concreto, estudiar sus mutaciones, analizar su función, etc. El nombre de clonación molecular sugiere precisamente la idea de un número grande de copias idénticas, y se utilizaba ya en biología para designar poblaciones de bacterias o células idénticas ("clones"). Al aplicarlo a la obtención de copias idénticas de un ácido nucleico, se convirtió en clonación molecular. El primer experimento que mostró la posibilidad de propagar un fragmento de ADN de eucariotas en una bacteria fue la clonación de fragmentos del ADN ribosomal de Xenopus laevis dentro de la bacteria E. coli. Desde entonces, la tecnología del ADN recombinante se ha utilizado con con éxito en muchos campos, desde aplicaciones con fines industriales (dando lugar a la Biotecnología), hasta la detección de alteraciones genéticas, pasando por la modificación genética de organismos, la terapia génica y un largo etcétera. En este capítulo recordaremos los principios generales de las técnicas básicas de biología molecular; otras tecnologías más específicas utilizadas en Genética Humana, como el diagnóstico molecular de alteraciones genéticas ó la terapia génica, se verán con más detalle en los capítulos correspondientes. En líneas generales, la obtención de grandes cantidades de un fragmento específico de ADN (es decir, de un gran número de copias idénticas) se lleva a cabo en varios pasos: i) obtención de un pequeño número de copias de dicho fragmento, habitualmente mediante la digestión del ADN celular con algún enzima que corte específicamente el genoma en el punto deseado; ii) la inserción de esas copias en un "vector de clonación", que es un fragmento de ADN con unas propiedades especiales que le permiten multiplicarse dentro de un huésped apropiado; iii) la propagación del nuevo fragmento "recombinante" (es decir, el fragmento híbrido formado por la unión del inserto y el vector) dentro del huésped, obteniendo un gran número de copias del mismo. Esta metodología puede también aplicarse a genomas completos, de forma que es posible cortar un genoma en pequeños fragmentos y clonar cada uno de esos fragmentos por separado; la colección completa de clones que representan un genoma se denomina genoteca (ó biblioteca genómica). Aunque las genotecas pueden representar genomas completos, también es habitual crear genotecas de fragmentos genómicos (un cromosoma, por ejemplo, o una región cromosómica de interés) cuando no sea posible clonar ese fragmento debido a su gran tamaño. También es posible construir genotecas especializadas, en las que los fragmentos insertados en los vectores tienen una naturaleza específica; por ejemplo, son muy comunes las genotecas de ADNc, en las que cada clon lleva un ADN complementario (una copia en ADN de un ARN mensajero). Figura 3.1 Estrategia general de clonación molecular de un fragmento de ADN en un vector para su propagación en bacterias.

36 28 GENÉTICA HUMANA Por tanto, en toda estrategia de clonación molecular son necesarios tres elementos básicos: un inserto, un vector y un huésped. Como hemos dicho, el inserto es el fragmento de ADN que queremos obtener en grandes cantidades, para después proceder a estudiarlo. Por lo que respecta al huésped, lo más habitual es que se trate de alguna cepa de la bacteria Escherichia coli, especialmente modificada para permitir el crecimiento de vectores con gran eficacia y fidelidad. Respecto a los vectores de clonación, existe una gran variedad de posibilidades, cada una con características distintas que los hacen adecuados para aplicaciones concretas. Los primeros vectores utilizados fueron los plásmidos, que son elementos bacterianos extracromosómicos, circulares, que se replican dentro de la bacteria huésped con independencia de la replicación del cromosoma bacteriano. Los plásmidos utilizados en clonación molecular son variaciones de plásmidos nativos, que han sido modificados con el objeto de conseguir que se repliquen con mayor eficacia (hasta cientos de copias por bacteria). Además, también se ha creado en ellos una región que se puede cortar fácilmente con enzimas de restricción (ver más adelante) para introducir en ella el fragmento de ADN de interés (es decir, el inserto). También se ha introducido en ellos el gen de resistencia a algún antibiótico, que permita seleccionar las bacterias que llevan el plásmido dentro: cuando al cultivo en el que crecen las bacterias se añade el antibiótico, sólo crecerán aquellas que tienen el plásmido y expresan los genes del mismo. Los plásmidos tienen una capacidad limitada, ya que permiten albergar insertos de unas 5-10 kilobases de tamaño, como máximo. La necesidad de clonar fragmentos de mayor tamaño hizo que se desarrollasen otros tipos de vectores derivados del genoma del fago lambda, un virus bacteriófago que infecta bacterias introduciendo en ellas el genoma viral. Modificando el genoma nativo del fago lambda, se han creado diversos vectores de clonación con una capacidad mayor que la de los plásmidos (permiten albergar insertos de tamaños en torno a las 15 kilobases), que también se replican en bacterias con gran eficacia. La necesidad de clonar fragmentos todavía mayores llevó a desarrollar otros tipos de vectores. Por ejemplo, los cósmidos son vectores artificiales con características de plásmidos y de fagos, y tienen una capacidad de unas 40 kilobases. Posteriormente aparecieron vectores derivados de los cromosomas de levaduras, incluyendo secuencias necesarias para la replicación y la estabilidad de los brazos cromosómicos. Estos vectores se denominan Cromosomas Artificiales de Levaduras (en inglés YAC, Yeast Artificial Chromosome), crecen dentro de levaduras y tienen una gran capacidad porque pueden albergar insertos de hasta 2 megabases (2x10 6 pares de bases). Como veremos más adelante, los vectores tipo YAC fueron muy importantes para crear los primeros mapas del genoma humano, pero tienen algunos inconvenientes en su manejo ya que los insertos a veces sufren alteraciones a medida que se multiplican dentro de las levaduras. Por tanto, se desarrollaron otros vectores con menos capacidad pero mucho más estables y de manejo más fácil, como son los vectores derivados del fago P1 o del mismo cromosoma bacteriano. Estos vectores se denominan, respectivamente PAC (del inglés, P1-phage Artificial Chromosome) y BAC (Bacterial Artificial Chromosome); crecen también dentro de bacterias y son capaces de albergar insertos de tamaños entre kilobases. Aunque existen muchos otros tipos de vectores que se utilizan en técnicas de clonación molecular, estos son los más usados en Genética humana, y aparecerán en otros Capítulos de este texto. El proceso general de clonación molecular se desarrolla en varios pasos. En primer lugar, es necesario preparar el inserto y el vector de modo adecuado. Esto supone cortarlos de modo que los extremos libres del inserto puedan unirse a los extremos del vector. De hecho, como los vectores suelen ser circulares es necesario abrirlos en un lugar específico en el que introducir el inserto. Todos estos cortes se llevan a cabo con unas enzimas especiales llamada enzimas de restricción, cuya característica principal es precisamente la capacidad de cortar el ADN en regiones específicas. Debido a la importancia de las enzimas de restricción en ingeniería genética, les dedicaremos el siguiente apartado de este capítulo; por ahora, es suficiente comprender que constituyen las "tijeras" moleculares que nos permiten realizar cortes específicos en el inserto y en el vector para que ambos tengan extremos compatibles que se puedan unir. El siguiente paso es, precisamente, la unión de inserto y vector para formar la molécula "recombinante" o híbrida. Esta unión la realiza un enzima denominada ADN ligasa, habitualmente procedente del fago T4. Este enzima

37 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 29 tiene la capacidad de catalizar la formación de enlaces fosfo-di-éster entre el grupo 5' fosfato y el grupo 3' hidroxilo de dos cadenas nucleotídicas yuxtapuestas, y por tanto puede unir dos moléculas de ADN bicatenario cuyos extremos sean compatibles. Tras la reacción de ligación se obtiene una molécula circular de ADN conteniendo el inserto dentro del vector, y capaz de replicarse dentro de un huésped apropiado merced a las secuencias específicas del vector. Por tanto, el siguiente paso del proceso de clonación molecular consiste en la introducción de la molécula recombinante en el huésped, habitualmente E. coli. Este proceso se denomina transformación, y puede hacerse por métodos químicos o físicos. El método químico más empleado es el "golpe de calor" en una solución de cloruro de calcio, tras el cual las bacterias son capaces de permitir el acceso de moléculas de ADN a su interior. Este proceso es muy ineficaz, ya que sólo una bacteria de cada 500 ó cada 1000 incorporará la molécula de ADN recombinante con éxito; sin embargo, las bacterias se multiplican varios órdenes de magnitud cuando crecen en cultivo, por lo que en teoría basta que la transformación sea eficaz en tan sólo unas pocas bacterias para que podamos crecerlas en condiciones de selección (utilizando antibióticos específicos dependiendo del tipo de vector que usemos) y obtener una población en la que todas las bacterias contienen la molécula de ADN recombinante. Los métodos físicos son más eficaces que los químicos, y se basan en la apertura de poros en la pared bacteriana mediante la aplicación de un shock eléctrico, por lo que la técnica se denomina electroporación. Al final del proceso, por tanto, contamos con una población bacteriana compuesta por millones de bacterias, cada una de las cuales lleva varios cientos de copias de una molécula recombinante que contiene un fragmento específico de ADN (el inserto original). Utilizando métodos sencillos de extracción de ADN de las bacterias, es posible obtener preparaciones muy puras que contienen millones de copias del fragmento, y esto nos permite llevar a cabo cualquier tipo de análisis o de estudios funcionales. La Figura 3.2 incluye enlaces a animaciones que muestran el proceso de transformación y la obtención de alto número de copias de moléculas recombinantes. ADN GENÓMICO GENOTECA

38 30 GENÉTICA HUMANA Enzimas de restricción En los años 1950 se descubrió que algunos bacteriófagos (virus que infectan y destruyen bacterias) podían infectar algún tipo concreto de bacterias pero no otros, debido a que algunas bacterias eran capaces de digerir el ADN del fago y por tanto impedían su crecimiento. Como el fago ve "restringido" el rango de huéspedes que puede infectar, a dicho sistema se le llamó sistema de restricción. Posteriormente se descubrió que dicha restricción se lleva a cabo gracias a unas enzimas del tipo endonucleasas, que digieren el ADN de doble cadena tras el reconocimiento y unión a secuencias específicas en el genoma invasor. Por tanto, dichas enzimas reciben el nombre genérico de enzimas de restricción. Las enzimas de restricción tienen gran importancia para la supervivencia de las bacterias, y por ello son muy abundantes y aparecen en todos los géneros de bacterias que se han estudiado. El descubrimiento de las primeras enzimas de restricción de tipo II en los años 1970 fue clave para el desarrollo de las tecnologías del ADN recombinante. Las enzimas de restricción se clasifican en 3 tipos: tipo I, tipo II y tipo III. Las enzimas de tipo I y las de tipo III son complejos multiproteicos que reconocen secuencias específicas de ADN asimétricas, y digieren al ADN en otra región inespecífica alejada de la secuencia de reconocimiento, bastante alejadas en el caso de las tipo I (desde 50 hasta varios miles de pares de bases) o menos alejadas en el caso de las tipo III (unos 25 pares de bases). De todas formas, las enzimas de restricción de interés en ingeniería genética son las de tipo II, que están codificadas por un único gen bacteriano y que suelen actuar en forma de dímeros. Su característica principal es que el corte endonucleolítico tiene lugar dentro de la misma secuencia de reconocimiento por la que se unen al ADN, llamadas también "dianas" ó "sitios" de restricción. Hoy en día se conocen más de 3000 endonucleasas de restricción de tipo II, que reconocen más de 200 dianas distintas. Las enzimas que reconocen la misma diana pero proceden de bacterias distintas se denominan isosquizómeros; es importante conocer su existencia para no confundir endonucleasas que tienen la misma secuencia de reconocimiento. En este sentido, es importante conocer la nomenclatura de estas enzimas, que depende del nombre de la cepa bacteriana de la que se aislan. Por ejemplo, las enzimas de restricción purificadas a partir de Escherichia coli se denominan "EcoXX": las tres primeras letras (en cursiva) designan la especie, y uno ó más caracteres en mayúscula (letras ó numeros romanos, nunca en cursiva) designan la cepa o distinguen varias enzimas de una misma bacteria. Por lo general, las dianas de reconocimiento de las enzimas tipo II tienen una longitud de 4 a 8 pares de bases. Lógicamente, el número de posibles sitios de corte para una endonucleasa de restricción varía inversamente a la longitud de la diana de reconocimiento, ya que por azar es más fácil encontrar secuencias de cuatro nucleótidos que de ocho, por poner un ejemplo. Esto es importante a la hora de predecir si un enzima concreto presentará muchas ó pocas dianas en un fragmento de ADN. Una característica importante de las enzimas de tipo II es que las secuencias de reconocimiento son idénticas cuando se leen en dirección 5' 3' en cada una de las dos cadenas de la doble hélice. Es decir, las dianas de reconocimiento de las enzimas tipo II son secuencias palindrómicas. Existen algunas excepciones a esta regla general, sobre todo cuando las dianas de reconocimiento tienen alguna posición degenerada, es decir, que puede ser ocupada por dos ó más nucleótidos indistintamente. Finalmente, una característica común a la mayoría de las enzimas tipo II es que cortan la cadena de ADN dentro de la secuencia de reconocimiento. Dependiendo del sitio exacto donde corten, los extremos libres generados por el corte pueden ser de varios tipos. En primer lugar, si la secuencia de reconocimiento está constituida por un número par de nucleótidos y el corte se produce exactamente en el centro, los extremos serán "romos", es decir, las dos cadenas de la molécula de ADN tendrán la misma longitud. En cambio, en otras enzimas el punto de corte está desplazado respecto del eje de simetría de la secuencia de reconocimiento; dada la naturaleza palindrómica de dicha secuencia, esto genera extremos libres en los que una de las dos cadenas de la doble hélice es más larga que la otra, que se denominan extremos cohesivos. En las enzimas que generan extremos cohesivos, se distinguen

39 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 31 además dos tipos según cuál de las dos cadenas de la molécula de ADN es más larga, la cadena 5' ó la 3'; así se habla de extremos cohesivos con "salientes" 5' ó 3', respectivamente. El tipo de extremos que genera cada enzima es un factor importante en los experimentos de clonación molecular, porque las ligasan sólo pueden unir extremos que sean compatibles, y además los extremos cohesivos habitualmente son ligados con mucha mejor eficacia que los extremos romos. En la Figura 3.3 se muestran ejemplos de dianas de restricción con extremos romos y cohesivos, así como una animación del proceso de corte. AluI NlaIII Sau3AI TCGACAGCTGACGCATGTATAGCTAGCGATCTAGC AGCTGTCGACTGCGTACATATCGATCGCTAGATCG 5 GACAG CTGAC CTGTC GACTG 5 5 AGC GATCTAG TCGCTAG ATC 5 Extremos romos Extremos cohesivos (salientes 5 ) 5 ACGCATG TAT TGC GTACATA 5 Extremos cohesivos (salientes 3 ) Técnicas básicas de hibridación de ácidos nucleicos El desarrollo del concepto de hibridación entre moléculas de ácidos nucleicos ha tenido gran importancia en el desarrollo de la ingeniería genética, como veremos al hablar de algunas técnicas concretas en otros apartados de este Capítulo. En sentido general, hibridación se refiere al proceso por el que dos cadenas de ácidos nucleicos que son complementarias se unen para dar una molécula bicatenaria. Las cadenas originales pueden ser de ADN ó de ARN, de modo que la hibridación puede ser ADN-ADN ó ADN-ARN (es más infrecuente trabajar con dobles cadenas de ARN). La hibridación es un proceso con una cinética que se puede estudiar por las curvas de desnaturalización del ADN. Cuando una doble hélice se desnaturaliza hasta la separación completa de ambas cadenas y se retiran las condiciones desnaturalizantes, las cadenas vuelven a reasociarse buscando las regiones complementarias: a mayor número de nucleótidos complementarios, la renaturalización es más rápida (y la desnaturalización más difícil). Como hemos visto, la desnaturalización se realiza habitualmente por calor; si medimos el porcentaje de moléculas desnaturalizadas a medida que aumentan la temperatura, obtenemos una curva sigmoidea que permite calcular la temperatura a la cual el 50% de las moléculas están desnaturalizadas. Dicha temperatura se conoce como temperatura de fusión, abreviada Tm (de "melting" en inglés). Un fragmento

40 32 GENÉTICA HUMANA de ADN tendrá una Tm característica que dependerá de su tamaño y de la composición de bases: como los pares entre citosina y guanina forman tres puentes de hidrógeno frente a los 2 que forman los pares adenina-timina, un fragmento con muchos pares G:C será más estable y más difícil de desnaturalizar, por lo que su Tm será más alta que la de un fragmento rico en pares A:T. Estas propiedades de desnaturalización e hibridación de dobles hélices de ADN han sido explotadas para desarrollar métodos de laboratorio que permitan identificar la naturaleza de fragmentos de ácidos nucleicos en mezclas complejas. Por ejemplo, la digestión de ADN celular total con un enzima de restricción produce miles de fragmentos de distintos tamaños en el tubo de reacción; en esas circunstancias, es posible identificar cuál de esos fragmentos es portador de una secuencia específica utilizando técnicas de hibridación. Para ello, se añade a la mezcla otro pequeño fragmento de ADN que represente la región que queremos identificar, se desnaturalizan todos los fragmentos y se dejan hibridar libremente. La mayor parte de las cadenas complementarias se reasociarán para reconstruir los fragmentos originales; en cambio, la presencia de pequeñas cadenas que son perfectamente complementarias con una región de un fragmento grande permitirá la formación de híbridos entre la cadena pequeña y la correspondiente cadena larga complementaria. De hecho, esta reacción se ve favorecida respecto de la reasociación de cadenas largas entre sí, precisamente porque los fragmentos pequeños hibridan más rápidamente. Por tanto, un pequeño fragmento de ADN es capaz de identificar los fragmentos de una mezcla compleja que contienen secuencias complementarias al mismo. Por este motivo, estos pequeños fragmentos se denominan sondas ("probe" en inglés), y suelen estar constituídas por moléculas de ADN de varios cientos de pares de bases. De todas formas, en un tubo de ensayo no se ven las moléculas de ADN, por lo que una sonda de ADN no será de gran utilidad si no es fácilmente detectable. Por este motivo, las sondas utilizadas en biología molecular llevan algún tipo de marcaje que permita detectar su presencia: marcaje con algún isótopo radioactivo, con un fluorocromo o con una molécula con actividad enzimática detectable por alguna reacción química. La utilización de sondas de ADN marcadas ha sido uno de los pilares básicos de la ingeniería genética en los últimos decenios, y su utilización sigue estando muy extendida; de hecho, algunas de las tecnologías más recientes, como los microarrays de ADN, se basan todavía en la hibridación de sondas con fragmentos "diana". La Figura 3.4 muestra el proceso de hibridación de una sonda sobre una molécula complementaria de ADN. Aunque los fenómenos de hibridación se dan en solución, la utilización más habitual de sondas de ADN es la detección de fragmentos de ácidos nucleicos que han sido previamente inmovilizados sobre un soporte sólido. El ejemplo más sencillo es la detección de un fragmento específico de ADN celular que ha sido digerido con un enzima de restricción. La separación de los fragmentos generados por la digestión puede hacerse fácilmente mediante electroforesis en gel de agarosa o de acrilamida, sustancias porosas en la que la velocidad de migración electroforética varía en función del tamaño de los fragmentos. Una vez que los fragmentos han sido separados, el uso de una sonda marcada nos permitirá detectar el fragmento o fragmentos que contienen la secuencia de la sonda, ya que ésta hibridará específicamente en esas regiones. Para llevar a cabo de modo sencillo la reacción de hibridación entre la sonda y los fragmentos digeridos que se han separado en el gel, Edwin Southern ideó un método sencillo para transferir todos los fragmentos del gel a un soporte sólido de nitrocelulosa o de nylon, más resistente y fácilmente manejable que un gel. La transferencia crea una réplica del gel en el soporte sólido (llamado filtro, por utilizarse inicialmente papel de filtro), ya que mantiene la posición relativa que tenían los fragmentos en el gel. Tomando nombre de su creador, la transferencia de fragmentos de ADN de un gel a un filtro se denomina transferencia southern; cuando los fragmentos son de ARN, en vez de ADN, las condiciones en que se realiza la transferencia

41 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 33 cambian un poco, y se denomina transferencia northern (juego de palabras con "Southern", que significa "sureño"; "northern" es "norteño"). Posteriormente, esta técnica también se aplicó a las proteínas, tomando entonces el nombre de transferencia western ("occidental"). La Figura 3.5 ilustra el proceso de electroforesis en gel de agarosa, así como la transferencia de fragmentos a una membrana rígida. Los métodos de transferencia de ácidos nucleicos a soporte sólido junto con la hibridación con sondas marcadas han sido y siguen siendo muy utilizados en biología molecular. Estos mismos principios se han combinado también con las técnicas clásicas de citogenética para el estudio de cromosomas, dando lugar a las técnicas de citogenética molecular que veremos en un capítulo posterior. Otras aplicaciones de estas técnicas al diagnóstico de alteraciones genéticas en Genética humana serán abordadas en los capítulos correspondientes. Amplificación in vitro de ADN (PCR) Aunque las técnicas de clonación molecular proporcionan altas cantidades de un fragmento de ADN, son técnicas laboriosas, con incubaciones largas: un experimento típico de clonaje lleva unos dos días. Hacia finales de los años 1980 se describió una metodología nueva que permitía amplificar selectivamente una región concreta de ADN, de modo que partiendo de cantidades iniciales pequeñísimas (teóricamente, una sola copia del fragmento) podrían obtenerse varios miles de millones de copias. El método se desarrolla en un periodo de pocas horas y no incluye ningún paso de digestión, ligación ni transformación, sino que se basa en la acción cíclica de una polimerasa de ADN que amplifica selectivamente la región de interés y ninguna otra. Por este motivo, el método se conoce como reacción en cadena de la polimerasa (abreviado PCR, en inglés Polymerase Chain Reaction). El punto central de la técnica de PCR es la síntesis de ADN desde un punto concreto, repetida durante un número elevado de veces (ciclos). Por tanto, hay dos elementos esenciales de la técnica: i) conseguir que la amplificación se limite exclusivamente a la región genómica de interés, y ii) utilizar algún tipo de polimerasa que permita repetir el proceso de síntesis de ADN muchas veces. Por lo que respecta al primer punto, la técnica utiliza algo que ya era conocido, como es la capacidad de las polimerasas de ADN de catalizar la síntesis de ADN a partir del extremo 3' libre de un oligonucleótido que está unido a una cadena complementaria más larga, la cual actúa como molde de la síntesis. Este proceso, habitual en la replicación del ADN celular, puede reproducirse en el laboratorio utilizando pequeñas moléculas de ADN complementarias a una región concreta de una doble cadena más larga. Como es sabido, una de las formas de desnaturalizar el ADN (es decir, separar las dos cadenas de una doble hélice) es mediante calor; como veremos en el siguiente apartado, la temperatura necesaria para alcanzar dicha desnaturalización depende de la secuencia de la molécula, pero a partir de los ºC la práctica totalidad de las moléculas estarán desnaturalizadas. Si se desnaturaliza una molécula de ADN, obtendremos dos cadenas libres; al dejar enfriar la preparación, ambas moléculas vuelven a unirse por complementariedad de bases hasta que el ADN se re-naturaliza por completo. Este proceso es lento, por lo que si la re-naturalización se lleva a cabo en presencia de pequeños oligonucleótidos cuya secuencia es complementaria a alguna porción de la molécula larga original, estas pequeñas moléculas se unirán rápidamente a la región complementaria de la molécula larga antes de que ésta llegue a re-naturalizarse. El resultado es que cada una de las cadenas originales se mantiene monocatenaria excepto en la región en que se ha unido el oligonucleótido. En esa región, una polimerasa de ADN puede sintetizar a partir del extremo 3' libre de la molécula pequeña,

42 34 GENÉTICA HUMANA usando como molde la secuencia de la molécula grande. Por este motivo, las moléculas cortas que inician la síntesis de ADN se llaman cebadores (primers en inglés). Si utilizamos dos cebadores, cada uno de ellos complementario a cada una de las dos cadenas de la molécula original de ADN, habrá dos procesos de síntesis simultáneos en direcciones opuestas, y al final tendremos dos cadenas bicatenarias de ADN con la misma secuencia que la molécula original. Es fácil ver que, precisamente, es la posición de los cebadores la que determina cuál región de la molécula larga se va a amplificar, ya que sólo la secuencia que queda comprendida entre los dos cebadores va a ser amplificada. El video de la Figura 3.6 muestra la desnaturalización, unión y extensión de un cebador sobre una región específica de ADN. Los elementos necesarios para llevar a cabo una reacción de PCR, por tanto, son el ADN molde original que se quiere amplificar, los cebadores, la polimerasa de ADN y nucleótidos libres que se incorporan a la cadena naciente durante la síntesis. Por lo que respecta al ADN molde, una de las grandes ventajas de la PCR es que puede utilizarse ADN relativamente impuro, e incluso es posible usar células o bacterias completas, sangre impregnada en papel de filtro, etc. En cualquier caso, la pureza del ADN molde asegura un buen funcionamiento de la reacción. Además, las cantidades necesarias son pequeñas, no deben superar los ng por reacción; se estima que con estas cantidades de ADN genómico total se puede amplificar un gen que esté en una sola copia en el genoma. Los cebadores son oligonucleótidos sintéticos monocatenarios, con un grupo hidroxilo 3' a partir del que se sintetiza la nueva cadena de polinucleótidos. La característica más crucial de un cebador es su especificidad, es decir, que sólo se pueda unir a una región concreta del ADN molde. Esto va a asegurar que sólo se amplifique la región de interés; por el contrario, si los cebadores se unen inespecíficamente en zonas distintas a la deseada, la PCR produce resultados difícilmente interpretables. Esto es especialmente importante cuando el ADN molde representa un genoma completo, o fragmentos cromosómicos grandes. Para asegurar este parámetro, se utilizan cebadores con una tamaño mínimo de 17 nucleótidos, ya que se estima que esta longitud es suficiente para reconocer una sola secuencia en un genoma eucariota. En efecto, la probabilidad de encontrar por azar una secuencia de 17 nucleótidos es 4 17 = 1,7 x Como los genomas de mamíferos tienen en torno a 3 x 10 9 nucleótidos, esto supone que un cebador de 17 nucleótidos en teoría puede identificar una secuencia única dentro de un genoma de ese tamaño. Evidentemente, pueden utilizarse cebadores más largos, dependiendo de otros factores que se comentarán más adelante, pero los cebadores utilizados en reacciones de PCR típicas están en un rango de tamaños entre los 17 y 25 nucleótidos. La polimerasa de ADN utilizada es la responsable de la extensión de la nueva cadena de ADN a partir de un cebador. El tipo de polimerasa utilizado viene determinado por las características de la propia reacción de PCR. Como la reacción ha de someterse a numerosos ciclos de desnaturalización-renaturalización, la actividad enzimática de la polimerasa se destruye con cada etapa de calentamiento para desnaturalizar el ADN, por lo que sería necesario añadirla nuevamente al comienzo de cada ciclo. Esta dificultad se ha superado por el descubrimiento de polimerasas de ADN que son termoestables, es decir, pueden soportar elevadas temperaturas durante largo tiempo sin perder su actividad. Las bacterias que viven en aguas termales, como la especie Thermus aquaticus, sobreviven en temperaturas cercanas a los 100 ºC y contienen polimerasas termoestables. De ahí que la polimerasa más frecuentemente utilizada en las reacciones de PCR se denomine polimerasa Taq, para indicar su origen. La polimerasa Taq requiere la presencia de ión magnesio como cofactor, por lo que todas las soluciones utilizadas deben llevar este elemento. La temperatura óptima de polimerización de la Taq es de 72 ºC: a esa temperatura se incorporan unos 100 nucleótidos por segundo. Además, la Taq carece de la actividad exonucleasa 3' 5' que tienen otras polimerasas. Finalmente, los nucleótidos libres, necesarios para sintetizar las nuevas cadenas, tienen una buena resistencia al calor y su vida media es de más de 40 ciclos de calentamiento. Como se trata de sintetizar ADN, se utilizan desoxi-nucleótidos trifosfato (datp,

43 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 35 dctp, dgtp y dttp), que pueden incorporarse al extremo 3' de una cadena creciente por su grupo fosfato 5'. Teniendo en cuenta todo lo dicho hasta el momento, podemos esquematizar una reacción de PCR como un proceso cíclico, repetitivo, en el que cada uno de los ciclos está constituido por 3 fases: desnaturalización, hibridación y extensión. La fase de desnaturalización, como su nombre indica, consiste en someter la reacción a una temperatura de 94 ºC durante 1 minuto, para asegurar que todas las moléculas de ADN molde se han desnaturalizado y están en estado monocatenario. Realmente, la desnaturalización es prácticamente instantánea cuando toda la mezcla alcanza esa temperatura, pero la inercia térmica hace que haya que mantener la temperatura de desnaturalización durante unos segundos. No es bueno prolongarla demasiado, porque esto daña el ADN molde y reduce la actividad de la Taq. La siguiente fase de cada ciclo debe permitir la hibridación de los cebadores con sus secuencias complementarias en el ADN molde, y por eso se llama fase de hibridación. En este sentido, "hibridar" es formar una molécula bicatenaria de ADN a partir de la unión de dos moléculas monocatenarias que tienen secuencias complementarias. Para llevar esto a cabo, es necesario disminuir la temperatura de la reacción, de modo que los cebadores se unan a sus dianas pero las cadenas largas de la molécula original no lleguen a reasociarse entre sí. La temperatura a la que se realiza la hibridación depende de la secuencia de los cebadores, pero suele estar entre 55ºC y 65ºC, y se mantiene en torno a 1 minuto. La última etapa de un ciclo típico se denomina fase de extensión, porque en ella la polimerasa extiende los dos cebadores tomando como molde las secuencias de las cadenas originales, incorporando los desoxi-nucleótidos que están presentes en la mezcla de reacción. Por la temperatura óptima de la polimerasa, esta fase se realiza a 72ºC, durante un tiempo variable dependiendo de la longitud del fragmento amplificado (entre 30 segundos y 2 minutos, en condiciones estándar). Una reacción típica de PCR consta de ciclos como el descrito. Además, suele ir precedida por un breve periodo de desnaturalización de unos 3 a 5 minutos, para asegurar que todo el ADN está desnaturalizado antes del primer ciclo, y una fase final de extensión (unos 5 a 10 minutos a 72ºC) para extender todas las moléculas que hayan quedado incompletas. Es fácil ver que, teóricamente, en cada ciclo se duplica el número de moléculas de ADN de la región específica que queremos amplificar; por tanto, el número de moléculas presentes en un ciclo dado es de 2 n, siendo n el número de ciclo. Por ejemplo, si partimos de una sola molécula inicial de ADN, tras 10 ciclos tendremos copias, tras 20 ciclos tendremos copias, y tras 30 ciclos tendremos de copias de la molécula original. De todas formas, no todas las moléculas serán idénticas, porque en cada ciclo se generan moléculas que llevan cadenas largas que sobrepasan el límite de uno de los cebadores. Estas moléculas aumentan en progresión aritmética (se crean dos con cada ciclo), mientras que los fragmentos específicos comprendidos por los dos cebadores aumentan exponencialmente a partir del tercer ciclo. Por ejemplo, en una PCR de 35 ciclos tendremos copias (2 35 ), de las que 70 corresponden a moléculas largas y el resto corresponden al fragmento de interés. Este aumento exponencial se observa también experimentalmente, cuando se cuantifica la cantidad de ADN total después de cada ciclo; tras una fase inicial más lenta, tiene lugar una fase de aumento exponencial (una línea recta cuando se representa en escala logarítmica), y una fase final (a partir del ciclo 32-35, más o menos) en la que se alcanza una meseta y la amplificación se detiene por agotamiento de los reactivos y pérdida de actividad de la polimerasa. La Figura 3.7 lleva a una animación que muestra los primeros ciclos de una PCR y permite calcular el número de moléculas que se generan por ciclo. Lógicamente, la realización de una reacción de PCR requiere un equipamiento apropiado que permita llevar a cabo los ciclos de modo automático. Inicialmente, se utilizaban baños separados, cada uno a una temperatura distinta (desnaturalización, hibridación y extensión) y los investigadores debían pasar los tubos

44 36 GENÉTICA HUMANA de reacción de un baño a otro a los tiempos apropiados. Pronto se desarrollaron máquinas que tienen una placa metálica, con capacidad para un alto número de tubos, cuya temperatura puede variarse con gran rapidez y precisión, estando todo el proceso controlado por un microprocesador. Estas máquinas, llamadas termocicladores (ó cicladores térmicos), permiten programar las condiciones de tiempo, temperatura, número de ciclos, etc, de modo que el operador sólo tiene que introducir los tubos y esperar al final de la reacción, que suele durar en torno a los minutos con los termocicladores modernos. Las aplicaciones de la técnica de PCR han sido múltiples desde su aparición; a lo largo de este libro veremos su uso en la detección de alteraciones genéticas que causan enfermedades. La descripción de los posibles usos en diferentes estrategias de análisis genético y en biotecnología, está más allá del objetivo de este apartado, en el que se ha pretendido únicamente introducir en esta técnica a aquellos que no la conocen. En cualquier caso, es importante reseñar una de las variantes más utilizadas, como es la amplificación de fragmentos de ARN mensajero. En este caso, en vez de utilizar ADN como molde para la amplificación, se usa una molécula de ADN que es copia de un ARNm, obtenida por un proceso que se llama retrotranscripción: gracias a la actividad transcriptasa reversa de la polimerasa de algunos virus (una ADN polimerasa dependiente de ARN), se puede sintetizar una molécula de ADN complementaria a una molécula de ARN. Por tanto, si queremos amplificar selectivamente un ARNm, es preciso obtener primero un ADN complementario (llamado ADNc) haciendo una retrotranscripción del ARNm, y después ese ADNc ya se puede amplificar por PCR como cualquier otro fragmento de ADN. Por este motivo, esta variante de la técnica se llama RT-PCR (retrotranscripción-pcr). Es una técnica muy utilizada y de gran interés cuando se quiere trabajar con las secuencias de los genes ya procesados, prescindiendo de los intrones, y supuso un gran avance porque hasta su aparición era muy difícil estudiar ARN mensajeros. Secuenciación del ADN Desde el descubrimiento de la estructura del ADN y del código genético, una de las herramientas más importantes para identificar genes y predecir su función ha sido la determinación de la secuencia de nucleótidos que constituye cada gen. En las últimas décadas, la tecnología de secuenciación del ADN ha sido determinante para poder llevar a cabo los distintos "proyectos genoma", cuya finalidad es obtener la secuencia completa de nucleótidos del genoma completo de una especie. Hoy en día, además, un aspecto crucial de la investigación genética es la determinación de pequeñas variaciones interindividuales, lo que requiere la secuenciación de una misma región en distintos individuos. Por tanto, los métodos actuales de determinación de la secuencia de nucleótidos de un fragmento de ADN son muy variados, y los desarrollos tecnológicos recientes han dado lugar a un gran abanico de técnicas diseñadas para responder a distintas necesidades. De todas formas, todas las tecnologías son de algún modo tributarias del método original ideado por Fred Sanger y Alan Coulson a finales de los años Este método se conoce como el método de "terminación de cadenas" ó "di-desoxi", porque se basa en la interrupción del proceso de extensión de un cebador, dando lugar a cadenas de todas las posibles longitudes, puesto que cada una ha sido interrumpida en una posición distinta; la separación de las cadenas de distintos tamaños y la detección de cuál nucleótido llevan en su extremo 3' nos permite deducir la secuencia de la molécula original. El primer elemento de toda reacción de secuenciación es, lógicamente, el fragmento de ADN cuya secuencia queremos leer; precisamente, este fragmento sirve como molde para la síntesis de ADN a partir de un cebador específico que se une a él por complementariedad de bases, y esto es lo que nos va a permitir deducir la secuencia de nucleótidos del fragmento. Aunque inicialmente era necesario convertir el fragmento de ADN a su forma monocatenaria, clonándolo un tipo especial de vectores, hoy en día puede utilizarse ADN de doble cadena, bien sea en forma de plásmidos (cuyo inserto queremos secuenciar) o como

45 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 37 productos de PCR. Al igual que en el caso de la PCR, otro elemento necesario es el cebador que va a iniciar la síntesis de ADN desde el punto donde queremos empezar a leer la secuencia del fragmento original. Nótese que aquí sólo vamos a utilizar un cebador (en vez de dos, como en la PCR) ya que no queremos amplificar una región, sino simplemente sintetizar nuevas cadenas de ADN a partir de un punto concreto. Como toda reacción de síntesis de ADN, también es necesaria la presencia de una polimerasa de ADN que tenga buena procesividad y fidelidad (es decir, que no introduzca errores en la nueva cadena). El punto clave de este método de secuenciación está en los nucleótidos libres presentes en la reacción, que se van a ir incorporando a la nueva cadena sintetizada por la polimerasa a partir del extremo 3' del cebador; además de 2'-desoxi-nucleótidos típicos en su forma tri-fosfato, este método incorpora a la mezcla de reacción unos nucleótidos especiales que actúan como "terminadores" de la síntesis. Los terminadores son nucleótidos modificados químicamente que carecen además del grupo hidroxilo 3' por el que crece la cadena, de ahí su nombre de di-desoxi-ntp (abreviado como ddntp), ya que corresponden a la forma 2',3'-di-desoxi de cada nucleótido tri-fosfato. La Figura 3.8 contiene enlaces a animaciones y videos que ilustran el método original de secuenciación de Sanger. La reacción de secuenciación, una vez que tenemos los distintos componentes mezclados en cantidades adecuadas, procede del siguiente modo. En primer lugar, el fragmento a secuenciar se desnaturaliza para separar las dos cadenas y permitir que el cebador acceda a su región complementaria específica. Tras permitir la hibridación del cebador con la cadena molde respectiva, la polimerasa comienza a extender el cebador incorporando nucleótidos complementarios a los de la cadena molde. Como en la reacción están presentes desoxi-ntps y didesoxi-ntps, en cada posición es posible incorporar uno u otro. En el caso de incorporar un dntp, la cadena seguirá extendiéndose normalmente, ya que el nuevo nucleótido proporciona el grupo hidroxilo 3' necesario para formar un nuevo enlace fosfo-di-éster con el grupo fostato de un nuevo nucleótido; en cambio, si el nucleótido incorporado es un ddntp, la síntesis de la cadena terminará en esa posición, ya que no existe el grupo hidroxilo 3' necesario para continuar la elongación. Lógicamente, esto sucederá para cada posición, de modo que mientras la síntesis avanza (porque se han incorporado dntps) en cada nueva posición existe la posibilidad de que la cadena se termine en ese punto. Al final, tendremos una colección de fragmentos de todos los posibles tamaños, con una diferencia de longitud de 1 nucleótido; cada fragmento estará terminado por el nucleótido complementario al que estaba en la cadena molde original en esa posición. Cuando la reacción de secuenciación ha sido completada, sólo nos resta separar de alguna forma todos los fragmentos de los distintos tamaños y ver en qué nucleótido está terminado cada uno de ellos, de modo que así podremos reconstruir la secuencia original. Los métodos para separar los fragmentos y leer el nucleótido terminal han cambiado bastante desde la descripción original del método. Hoy en día, lo más habitual es utilizar terminadores marcados con algún fluorocromo específico: se trata de ddntps que llevan unido un grupo químico que produce fluorescencia cuando es excitado por una luz de una determinada longitud de onda. Como cada terminador lleva un fluorocromo distinto, es fácil saber en qué nucleótido terminó una cadena concreta, dependiendo del tipo de fluorescencia que produzca. Para la separación de los fragmentos se utilizan técnicas de electroforesis capilar, en la que la mezcla de reacción va pasando por unos finos capilares que contienen una matriz porosa capaz de resolver fragmentos de ADN que se diferencian en tamaños de tan sólo un nucleótido. De este modo, cuando la reacción de secuenciación ya completada pasa por el capilar, los fragmentos más pequeños pasan más facilmente y salen del capilar antes que los fragmentos mayores, que tienen más dificultad para atravesar los poros y por eso quedan retenidos temporalmente. El resultado es que todos los fragmentos de la mezcla de reacción van saliendo del capilar ordenados por tamaños, comenzando por el más corto, con diferencias de tamaño un solo nucleótido. A la salida del capilar se sitúa una fuente de luz

46 38 GENÉTICA HUMANA (habitualmente un láser) que excita los fluorocromos y produce un tipo de fluorescencia específico de cada ddntp, lo cual es detectado por un dispositivo especial. Así, viendo el orden en que van apareciendo los cuatro distintos colores correspondientes a los cuatro nucleótidos, podemos saber la secuencia de la cadena que se ha sintetizado, que será exactamente la secuencia complementaria a la cadena molde original. El video de la Figura 3.9 muestra con detalle el método moderno de secuenciación con terminadores fluorescentes y separación de los fragmentos mediante electroforesis capilar. Aunque en la actualidad se están desarrollando metodologías nuevas más rápidas y baratas, en dispositivos miniaturizados que permiten determinar la secuencia de un fragmento en segundos, el método de secuenciación de Sanger ha tenido una influencia crucial en el desarrollo de la biología molecular y la genética moderna. Microarrays La cuantificación del nivel de expresión de un gen, la intensidad con la que se transcribe, puede medirse utilizando las técnicas explicadas en los apartados precedentes. Inicialmente se utilizaba la técnica de Northern blot, en la que la intensidad de la señal obtenida es proporcional a la cantidad de ARNm presente en la muestra. Más recientemente se han desarrollado técnicas de PCR cuantitativa que consiguen cuantificar la cantidad de ARNm presente en la muestra: utilizando ADNc (ADN complementario) como molde, se puede realizar RT-PCR cuantitativa para determinar la abundancia relativa del ARNm y comparar varios tejidos o condiciones experimentales. Con la llegada de los grandes proyectos de secuenciación, se planteó la posibilidad de determinar la expresión génica a nivel genómico, es decir, analizar el perfil de expresión de todos los genes de un genoma en distintas situaciones, para así identificar los genes implicados en distintos procesos fisiológicos o en el desarrollo de enfermedades. La cuantificación de la expresión de miles de genes es impractible por los métidos tradicionales, por lo que se desarrolló una metodología nueva que permitiese hacer este tipo de experimentos a bajo coste y en poco tiempo. Dicha tecnología se conoce como la tecnología de microarrays, también llamados a veces "chips" de ADN, porque se basa en la utilización de unos dispositivos sólidos miniaturizados en los que se puede medir la expresión de miles de genes a la vez. Aunque existen distintos tipos de microarrays en función de la tecnología de fabricación, el fundamento de todos ellos es la hibridación de una mezcla de dos clases de ADNc, marcados con fluorocromos distintos, sobre una fase sólida que contiene miles de sondas inmobilizadas, cada una de ellas específica para un gen distinto. Por tanto, a diferencia de los experimentos tradicionales de hibridación sobre filtros, en los que el ADN está fijado sobre la fase sólida y la sonda está presente en la solución de hibridación, en la tecnología de microarrays son las sondas las que están inmobilizadas sobre el soporte sólido, y son los ADNc los que "buscan" las sondas complementarias a su secuencia e hibridan con ellas. De modo general, un microarray es un portaobjetos de vidrio al que se han adherido, por métodos físicos o químicos, sondas de ADN en posiciones fijas y ordenadas, cada una ocupando un punto ó "spot". Cada punto contiene entre moléculas de una sonda concreta, que puede ser de distintos tamaños y que debería reconocer específicamente un solo gen del genoma.

47 CAPÍTULO 3: TÉCNICAS BÁSICAS DE GENÉTICA MOLECULAR 39 La Figura 3.10 muestra ejemplos de varios tipos de microarrays, cómo se fabrican y una imagen de hibridación. Aunque los microarrays fueron originalmente diseñados para realizar estudios de expresión génica a escala genómica, también se pueden utilizar para detectar pequeñas deleciones o duplicaciones en un genoma. En este caso se habla de microarrays genómicos, en los que las sondas son fragmentos de un genoma. Por ejemplo, un microarray genómico humano tendrá varios miles de sondas que representan todo el genoma humano ordenado en los distintos puntos del array; la hibridación se realiza con una mezcla de dos ADN genómicos, con la finalidad de detectar regiones genómicas que estén en distinto número de copias en uno de los genomas respecto al otro. En cualquier caso, la metología experimental es similar en los distintos tipos de microarrays. En primer lugar es necesario obtener los ADN que se van a hibridar sobre el microarray (ADNc si se van a hacer estudios de expresión génica o ADN genómico total si se trata de microarrays genómicos). Cada uno de las dos muestras que se van a comparar es marcada con un fluorocromo distinto, habitualmente uno que da fluorescencia verde y otro con fluorescencia roja. A continuación se realiza la reacción de hibridación y se detecta la fluorescencia que emite cada punto del microarray. Dependiendo de la intensidad de la fluorescencia de cada color en cada punto, es posible deducir si el gen representado por esa sonda se expresa o no en las muestras. Lógicamente, un experimento con microarrays genera cantidades masivas de datos, al tratarse de miles de puntos analizados simultáneamente; por ello, las herramientas de análisis de imagen y de procesamiento de los datos con bastante sofisticadas. Gracias a esto, los estudios de microarrays están permitiendo avanzar en el diagnóstico de enfermedades, ya que permiten detectar "firmas" de expresión específicas para enfermedades concretas. Estas "firmas" son patrones característicos formados por los genes que tienen su expresión más alterada en un proceso concreto; al detectar el subgrupo de genes que se alteran con mayor intensidad, podemos utilizar esa información para diagnosticar si un individuo sufre ese mismo proceso. En algunos casos, la utilización de estas "firmas" moleculares ha ayudado a distinguir procesos que antes se agrupaban juntos, identificando enfermos que tienen distintas posibilidades de respuesta a tratamientos, distinta supervivencia, etc. La Figura 3.11 nos lleva a unas animaciones que muestran cómo se lleva a cabo y se interpreta un experimento con microarrays. Actualmente se están generando bases de datos que archivan los resultados de múltiples estudios de microarrays, con lo que es posible acceder a esos datos y elaborarlos para obtener información sobre los niveles de expresión de un gen en distintos tipos celulares y en distintas condiciones experimentales. El análisis de estos datos permitirá establecer cómo varían los patrones de expresión génica de un genoma en distintos procesos metabólicos y fisiológicos, así como también en diversas situaciones patológicas. Así podremos identificar las variaciones típicas de los distintos tipos de cáncer, de enfermedades cardiovasculares, neurodegenerativas, etc; esto, a su vez, permitirá identificar nuevas dianas terapéuticas para restablecer esos patrones de expresión alterados.

48 40 GENÉTICA HUMANA

49 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 41 B. EL GENOMA HUMANO En tres temas se cubre la organización general del genoma humano y la relación entre estructura y función, además de prestar atención a las bases moleculares del cambio genético y a los mecanismos correctores de los errores introducidos en la secuencia. CAPÍTULO 4. LA GEOGRAFÍA DEL GENOMA HUMANO Historia y desarrollo del Proyecto Genoma Humano. Estructura del Genoma Humano. El ADN repetitivo. El genoma mitocondrial. Historia y desarrollo del Proyecto Genoma Humano En 1986, el Departamento de Energía de los Estados Unidos lideró la Iniciativa del Genoma Humano, tras varios años de contactos y reuniones, y puso en marcha el mayor proyecto biomédico de la historia con el objetivo final de conseguir la secuencia completa del genoma humano en el año El Proyecto Genoma Humano comenzó oficialmente en Estados Unidos en octubre de 1990, siguiendo un plan a cinco años para desarrollar las herramientas que permitiesen conseguir esa meta. Estas herramientas eran principalmente la construcción de mapas genéticos (de ligamiento) y de mapas físicos (de clones) de todo el genoma humano, al tiempo que se desarrollaba la tecnología necesaria para realizar secuenciación a gran escala. La estrategia general consistió en construir mapas genéticos y físicos e integrarlos, para aumentar cada vez más en resolución desde el cromosoma hasta la secuencia de ADN. Los mapas genéticos describen la organización cromosómica de caracteres (un rasgo fenotípico, una enfermedad) o de marcadores genéticos, mediante estudios de ligamiento genético. El concepto de ligamiento genético y la forma en que se cuantifica son objeto del Capítulo 11. Si el lector no está familiarizado con la construcción de mapas de ligamiento, se aconseja estudiar el Capítulo 11 antes de seguir leyendo. La Figura 4.1 explica cómo son los mapas físicos y los mapas de ligamiento genético, y su utilización en el Proyecto Genoma Humano. Los primeros éxitos de mapeo genético en humanos fueron los que consiguieron asociar un carácter a un cromosoma, como por ejemplo el ligamiento del daltonismo al cromosoma X, o ligamiento del grupo sanguíneo Duffy al cromosoma 1. Este último fue el primer rasgo hereditario mapeado a un autosoma (en 1968) gracias a que, en una familia concreta, se observó que este rasgo se heredaba junto con un heteromorfismo del cromosoma 1. Esto puso de manifiesto la utilidad de contar con marcadores de ADN que estuviesen distribuidos por todo el genoma, fuesen fáciles de estudiar en un número alto de individuos

50 42 GENÉTICA HUMANA y tuviesen una posición cromosómica conocida, ya que así se podrían realizar estudios de ligamiento genético en familias que padecen una determinada enfermedad genética para determinar si esa enfermedad está en ligamiento con alguno de estos marcadores, lo que facilitaría la identificación del gen responsable. Distancia en centimorgans (cm) DS16C4 DS16B3 DS16A2 DS16A1 MAPA GENÉTICO DE LIGAMIENTO 4 marcadores posicionados por estudios de ligamiento STS 8 STS 6 STS 4 STS 7 STS 5 STS 3 STS 1 STS 2 MAPA FÍSICO 8 marcadores tipo STS cuya posición es conocida Distancia física en pares de bases (bp) Los tipos de marcadores más utilizados en estudios de ligamiento en Genética Humana son: Polimorfismos de Longitud de Fragmentos de Restricción (en inglés, las siglas son RFLP). Un RFLP es un polimorfismo originado por un cambio de un nucleótido que crea o destruye una diana de restricción, de manera que encontraremos alelos con esa diana y alelos sin ella. Por tanto, un RFLP es por definición un marcador bialélico (sólo hay dos alelos posibles). La presencia o ausencia de esa diana hace que los fragmentos originados por la digestión del ADN con esa enzima de restricción sean de distinto tamaño. En general, un polimorfismo tipo RFLP puede detectarse de dos modos: a) digerir directamente el ADN genómico, separar los fragmentos en un gel, hacer un Southern blot e hibridarlo con una sonda específica para detectar cada uno de los fragmentos polimórficos; b) amplificar la región del polimorfismo mediante PCR y digerir directamente el producto de PCR para separar los fragmentos en un gel. Los marcadores tipo VNTR (acrónimo inglés de Número Variable de Repeticiones en Tándem") son polimorfismos originados por pequeñas secuencias de ADN que están repetidos en tándem. El número de repeticiones es diferente en los distintos individuos de la población, por lo que en principio pueden existir más de dos alelos distintos para cada marcador (aunque cada individuo sólo lleve dos alelos, en la población general pueden existir más). Los marcadores en los que la secuencia repetida es corta (2 a 4 nucleótidos) se denominan también microsatélites ó STR ( Short Tandem Repeats", Repeticiones Cortas en Tandem), y están homogéneamente distribuidos por todo el genoma. Los marcadores en los que la secuencia repetida es más larga (decenas a cientos de nucleótidos) se denominan minisatélites, y han sido muy importantes en los estudios de genética forense ya que permiten establecer una huella genética única para cada individuo. Los minisatélites son más abundantes hacia las regiones teloméricas de los cromosomas, y debido a su tamaño en principio deben detectarse mediante Southern blot e hibridación. En cambio, los marcadores de tipo microsatélite

51 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 43 pueden detectarse mediante PCR y están distribuidos uniformemente por el genoma, por lo que su análisis es más rápido y sencillo y proporcionan mayor información. Los SNP (pronunciado snip ) son polimorfismos de un solo nucleótido ( Single Nucleotide Polymorphisms ) en los que el simple cambio de un nucleótido en una secuencia genómica da lugar a distintos alelos. Lógicamente, para cada posición sólo puede haber cuatro alelos como máximo (A, C, G ó T), aunque lo habitual es que un SNP tenga dos alelos en la población general. Se estima que, como promedio, hay al menos un SNP cada pares de bases, de los cuales un porcentaje importante son polimorfismos codificantes (es decir, cambian un aminoácido en la proteína codificada por el gen) y constituyen la principal fuente de variabilidad genética inter-individual, puesto que dos individuos cualesquiera tienen alrededor de un 0,1% de sus nucleótidos distintos. La gran ventaja de los SNP sobre los demás tipos de marcadores, además de ser tan abundantes y estar muy uniformemente distribuidos por todo el genoma humano, es la posibilidad de analizarlos mediante métodos automatizables a gran escala, como los microarrays, de manera que se pueden determinar cientos ó miles de SNPs a la vez en un mismo experimento. La Figura 4.2 ilustra los tipos de marcadores más utilizados en la construcción de mapas de ligamiento genético en humanos. El objetivo inicial del PROYECTO GENOMA era crear un mapa genético (de ligamiento) con marcadores distribuidos por todo el genoma con una distancia media de 1 cm entre marcadores. Los mapas genéticos se basaron en un primer mapa publicado en 1987, hecho con 393 marcadores tipo RFLP agrupados en 23 grupos de ligamiento, con una distancia media entre marcadores superior a 10 cm. El primer mapa genético de todo el genoma fue el realizado por un centro de investigación francés llamado Généthon en 1992, e incluía 803 marcadores tipo microsatélite. Los mapas físicos, en cambio, reconstruyen la estructura de un segmento de ADN, determinando los tipos y orden relativo de las distintas secuencias que lo componen, sus tamaños, y las distancias entre ellas. Para la construcción de mapas físicos se utiliza un tipo de marcador distinto, que veremos más adelante. Lógicamente, el mapa físico de mayor resolución posible es la secuencia completa de ese segmento (resolución de 1 nucleótido), pero también es posible realizar mapas de menor resolución (un ejemplo, mapas de restricción). El tipo de marcador utilizado en la creación de mapas físicos se denominó STS (Sequence-Tagged Site = Sitio Etiquetado por su Secuencia). Un STS es un pequeño fragmento de ADN (unos pocos cientos de pares de bases) de secuencia y localización genómica conocidas, fácilmente amplificable mediante PCR. Durante años se habían identificado un buen número de marcadores STS, mediante la secuenciación parcial de clones previamente mapeados por otros métodos. Además, los microsatélites utilizados en la creación de mapas de ligamiento también pueden convertirse fácilmente en STS, leyendo la secuencia que flanquea las repeticiones del microsatélite. Gracias a esto, hoy contamos con una lista ordenada de STS que están distribuidos por todo el genoma humano, cuya secuencia y condiciones de amplificación mediante PCR son fácilmente accesibles a todo investigador. El PROYECTO GENOMA se propuso inicialmente conseguir mapas de marcadores tipo STS distribuidos por todo el genoma y con una distancia media entre marcadores en torno a 0.1 Mb (es decir, 100kb). Utilizando estos marcadores STS, se pudieron construir mapas físicos, es decir mapas compuestos por clones de bibliotecas genómicas, capaces de albergar insertos de gran tamaño. Existen distintos vectores de este tipo, entre los que destacan los vectores tipo YAC (Yeast Artificial Chromosome), PAC (P1-phage Artificial chromosome) y BAC (Bacterial Artificial Chromosome). Cada uno de estos vectores de clonación

52 44 GENÉTICA HUMANA tiene características específicas, ventajas e inconvenientes. En concreto, los YAC son los vectores que permiten albergar un mayor tamaño de inserto (hasta 2 Megabases), pero son bastante inestables (tienden a perder fragmentos del inserto cuando se replican) y tienen un porcentaje relativamente alto de clones quiméricos (es decir, clones en los que el inserto está en realidad formado por dos fragmentos procedentes de cromosomas distintos). Los PACs y BACs, en cambio, sólo permiten clonar insertos de unas 100 a 150 kilobases de tamaño (por lo que son necesarios muchos más clones para cubrir completamente un segmento genómico determinado), pero en cambio son muy estables y el porcentaje de quimerismo es muy pequeño. Aunque los YACs han sido el vector principalmente utilizado al principio de los años 90, hoy en día han sido desplazados por PACs y BACs. La Figura 4.3 explica la utilización de marcadores STS para crear un contig de clones que cubran una región del genoma. DS16C4 DS16B3 DS16A2 DS16A1 STS 8 STS 6 STS 4 STS 7 STS 5 STS 3 STS 1 STS 2 CONTIG: conjunto de clones solapantes que cubren una región del genoma La secuenciación de cada clon permite reconstruir la secuencia original de esa región genómica GGAGACTACGGAGATTACCTACGGGACTACAGAAGGAGACTACGGAGAGTACCTACGGGACTGTCT Los primeros mapas físicos del genoma humano estaban compuestos por contigs de YACs que cubrían parcialmente el genoma humano, siendo el mejor ejemplo el mapa creado también por Généthon en Este mapa supuso un avance enorme porque aunque no cubría muchas regiones genómicas sirvió como punto de partida para elaborar mapas más completos con vectores más fiables y manejables, como BACs y PACs. El PROYECTO GENOMA hizo una revisión de sus objetivos en 1993, teniendo en cuenta los progresos realizados en los 3 años anteriores, y estableció nuevas metas para los siguientes 5 años ( ). En resumen, estos nuevos objetivos fueron: conseguir un mapa genético con resolución de 2 a 5 cm entre marcadores. conseguir un mapa físico con STS espaciados regularmente cada 0.1 Mb (lo que significaba identificar y localizar la posición de como mínimo unos STS).

53 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 45 desarrollar nuevas tecnologías para la identificación de genes a partir de ADN genómico. desarrollar nuevas tecnologías de secuenciación y completar 80 Mb de secuencia confirmada para todos los organismos que estaban siendo secuenciados por los distintos proyectos. Potenciar la genómica comparada: completar las secuencias de E. coli, S. cerevisiae y C. elegans, y comenzar los proyectos de secuenciación de los genomas de Drosophila y de ratón. Cuando en 1998 se revisaron los avances realizados en esos cinco años, con el fin de diseñar un nuevo plan quinquenal, los resultados habían sido realmente prometedores: en Septiembre de 1994 se publicó un mapa genético de todo el genoma humano integrado por marcadores tipo microsatélite y marcadores tipo RFLP, con una distancia media entre marcadores de 0.7 cm. Esto superaba en más de 3 años el objetivo propuesto inicialmente. Por su parte, Généthon publicó en 1995 otro mapa físico de YACs que estaba formado por 255 contigs (con un tamaño medio de 10 Mb cada contig) y cubría el 75% del genoma humano. Durante esos años se continuaron desarrollando nuevos marcadores tipo STS, hasta llegar en 1998 a un mapa que contenía STS (casi el doble de los inicialmente propuestos). Por lo que respecta a la secuenciación, en octubre de 1998 se había obtenido un total de 180 Mb de secuencia del genoma humano (6% del total), además de 111 Mb de secuencia de otros organismos, muy por encima de lo previsto en el plan Además, se había completado la secuencia de E. coli y de S. cerevisiae, éste último el primer organismo eucariota en ser secuenciado totalmente. Esto fue posible gracias a importantes avances en la tecnología de secuenciación, que se hizo progresivamente más rápida, fiable y barata. Posteriormente, en diciembre de 1998, se completó la secuencia de C. elegans, el primer organismo multicelular secuenciado en su totalidad con un genoma de unas 97 Mb. Por tanto, en 1998 el PROYECTO GENOMA se fijó un nuevo plan de objetivos hasta el año 2003, en el que se incluían 6 metas concretas: 1. Completar la secuencia del genoma humano para 2003 (año que coincidía con el 50º aniversario del descubrimiento de la doble hélice por Watson y Crick), creando un primer borrador de trabajo en el Este objetivo se aceleró enormemente por la competencia de la empresa privada Celera Genomics (también iniciativa de Craig Venter), que se propuso secuenciar todo el genoma humano, utilizando una estrategia distinta al consorcio internacional del PROYECTO GENOMA, con el fin de obtener la propiedad intelectual y poder explotar esa información con fines comerciales. A pesar de los problemas suscitados inicialmente por la fuerte competencia entre ambos proyectos, el 26 de junio de 2000 se produjo el anuncio oficial de que se había alcanzado un primer borrador del 87% de la secuencia del genoma humano. Este primer borrador fue publicado el 15 de Febrero de 2001 en las revistas Nature (el mapa del Consorcio Internacional) y Science (el mapa de Celera Genomics). La Figura 4.4 muestra el proceso general de utilizado por el Consorcio Internacional para la secuenciación del Genoma Humano. 2. Continuar el desarrollo y la innovación de las tecnologías de secuenciación. Como ya se ha comentado, éste ha sido un factor determinante en el avance del PROYECTO GENOMA. 3. Estudiar la variación en el genoma humano. Como hemos visto, los SNP se encuentran en el genoma humano a razón de 1 por cada kilobase, como promedio, y representan las diferencias genéticas entre individuos de una misma especie. Como se verá en el Capítulo 11, la creación de mapas densos de SNP permitirá llevar a cabo estudios de asociación para detectar los genes que están implicados en

54 46 GENÉTICA HUMANA enfermedades complejas, debidas a alteraciones en muchos genes siendo la contribución de cada gen a la enfermedad pequeña y, por tanto, difíciles de detectar por otros métodos de ligamiento paramétrico. 4. Desarrollar tecnología para la genómica funcional, es decir, identificar todos los genes y determinar cuál es la función de cada gen. La gran revolución en las estrategias de identificación de regiones codificantes (es decir, genes) comenzó con la idea de Craig Venter de secuenciar al azar y a gran escala fragmentos de ADNc de bibliotecas obtenidas a partir de diversos tejidos. Estos fragmentos de secuencia se denominaron "Etiquetas de Secuencia Expresada" (EST, Expressed Sequence Tags), ya que en el fondo cada una representa un fragmento de un ARNm (una secuencia expresada en un tejido concreto). En pocos años, la base de datos de EST creció de manera exponencial, con cientos de miles de secuencias expresadas procedentes de distintas bibliotecas de ADNc. Como algunos de estos EST proceden de un mismo ARNm, se creó una colección no redundante llamada UNIGENE que agrupa los EST por familias, siemdo cada familia representativa de un único ARNm. Poco después comenzaron también proyectos internacionales para mapear secuencias de UNIGENE, de manera que en 1994 se publicó un primer mapa con la localización de EST correspondientes a genes distintos, y en 1998 se publicó un segundo mapa de EST, que representaban genes distintos. Cuando se conozca el catálogo completo de genes de nuestro genoma, será necesario estudiar la expresión de cada gen en distintos tejidos y en distintas situaciones fisiológicas y patológicas, en respuesta a distintos factores ambientales, etc. Lógicamente, esto será el objeto de la investigación biomédica de buena parte del siglo XXI. 5. Genómica Comparada. El análisis comparado de los genomas de varias especies es de gran utilidad para identificar mecanismos biológicos conservados durante la evolución (por lo que son especialmente importantes), estructura y función de genes ortólogos, etc. Aunque el plan para se propuso conseguir la secuencia completa del genoma de Drosophila para el año 2002, esta meta se cumplió en abril del año 2000 gracias a la colaboración de laboratorios y Universidades con Celera Genomics, descifrando unas 120 Mb de secuencia que comprenden la práctica totalidad de la eucromatina de este insecto. El nuevo gran reto ahora es conseguir la secuencia completa del genoma de otras especies de mamíferos: el primer borrador completo del genoma de ratón se obtuvo en 2002 y el del genoma de chimpancé en Implicaciones éticas, legales y sociales del PROYECTO GENOMA. Es importante tener consciencia de la influencia que va a tener el Proyecto Genoma y sus aplicaciones sobre los individuos y las sociedades. Cuestiones como el diagnóstico de enfermedades que no tienen tratamiento, la extensión de una mentalidad eugenésica que lleve a la discriminación por razón de deficiencias genéticas, el diagnóstico prenatal de alteraciones genéticas que confieren predisposición a sufrir enfermedades que se manifestarán en la edad adulta, la detección de rasgos psicológicos con base genética, la confidencialidad de la información genética de los individuos (y la posible discriminación laboral) serán una constante en los debates sociales de este siglo, y es importante llevar a cabo una labor de divulgación seria para que la sociedad pueda discutir de modo sosegado y bien fundamentado las bases éticas sobre las que sostener las aplicaciones biomédicas de la biotecnología en los años que se avecinan. 7. Desarrollo de herramientas bioinformáticas (bases de datos y herramientas de análisis de datos) que puedan ser compartidas por la comunidad científica. Será especialmente importante el desarrollo de herramientas informáticas que permitan identificar exones y predecir la estructura de genes en grandes

55 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 47 secuencias genómicas, así como plataformas de genómica funcional para el análisis de la expresión de miles de genes a la vez. 8. Formación en genómica: favorecer que científicos y académicos se dediquen a la investigación genómica y a divulgar y aumentar el conocimiento público de los distintos aspectos del PROYECTO GENOMA. Finalmente, la primera versión esencialmente completa del genoma humano fue anunciada oficialmente el 14 de abril de 2003, cubriendo un total de Mb (92.3% del total estimado del genoma humano) con un 99.99% de fiabilidad en cada posición secuenciada. El análisis de la secuencia publicada permite hacerse una idea bastante aproximada de la estructura de nuestro genoma, su composición y algunas de sus características funcionales, como se explica a continuación. Estructura del genoma humano y variación inter-individual El genoma humano nuclear tiene un tamaño aproximado de Mb (megabases), es decir tres mil doscientos millones de pares de bases. Esta cifra total incluye unas Mb de eucromatina y unas 250 Mb de heterocromatina (formada, como veremos, por ADN satélite). Esta cifra se refiere al genoma haploide, de manera que las células somáticas (diploides) contienen el doble. La Figura 4.5 muestra una visión general de los distintos tipos de secuencias que constituyen el genoma humano. Una primera clasificación del genoma humano distingue, por un lado, los genes y secuencias relacionadas con genes (exones, intrones, regiones no traducidas que contienen elementos reguladores, etc), y por otro todo el ADN que está entre los genes, llamado ADN extragénico o de relleno y que no codifica ninguna proteína ni contiene ningún elemento funcional. Curiosamente, la mayor parte del genoma humano (un 70%) está formada por este último, de forma que sólo un 30% del genoma humano incluye secuencias relacionadas con genes. Lo más sorprendente es que de este 30% sólo un 5% está constituído por ADN codificante (exones), siendo el resto ADN no-codificante asociado a genes. Por tanto, resulta que sólo un 1,5-2% del total del genoma humano es ADN codificante. El ADN extragénico está formado, sobre todo, por los componentes repetitivos del genoma humano que se explicarán más adelante, aunque también hay secuencias únicas o en bajo número de copia. Desde la publicación del primer borrador del Genoma Humano en febrero de 2001, podemos dar unos valores promedio estimados a partir de los datos publicados: Se estima que el genoma humano contiene en torno a los genes. Alrededor de un 50% del genoma humano está constituido por ADN repetitivo. Se puede estimar la densidad media de genes es de 1 gen cada 100 kb, aunque existen regiones ricas en genes (algunas zonas del cromosoma 19, por ejemplo) y otras regiones que son muy pobres en genes (como el cromosoma Y). Por tanto, se puede deducir una frecuencia media de 10 genes por cada Mb de secuencia. El tamaño promedio de un gen humano es de kb, aunque hay grandes diferencias de unos genes a otros.

56 48 GENÉTICA HUMANA El número de exones que forman un gen es muy variable (desde genes que tienen un solo exón hasta algunos genes con 100 exones ó más), pero podemos establecer un valor promedio de 7-8 exones por gen. El tamaño medio de un exón es de 150 nucleótidos. Por lo que respecta a los intrones, en cambio, existe una enorme variabilidad de tamaños, y no es infrecuente encontrar en casi todos los genes algún intrón de gran tamaño. El tamaño medio de un ARNm es de 1,8-2,2 kb incluyendo las regiones no-traducidas flanqueantes. La longitud media de una región codificante es de 1,4 kb. Una de las características más evidentes del borrador de nuestro genoma es su heterogeneidad. En efecto, la secuencia no es uniforme, sino que muchas de sus características (riqueza en C+G frente a A+T, riqueza en genes, etc) se distribuyen heterogéneamente, con regiones de gran abundancia flanqueadas por regiones en que esos parámetros son más escasos. Así por ejemplo, el contenido medio de G+C del genoma humano es del 41%, menor de lo teóricamente esperado. Además, si el genoma se divide en "ventanas" de 20 kb se observan regiones con valores muy alejados del promedio, con una dispersión 15 veces mayor de lo que sería esperable si la distribución fuese uniforme. La distribución de %G+C de estas ventanas no se ajusta a una distribución normal, sino que está desviada hacia valores bajos. Además, se ha comprobado que los genes tienden a concentrarse en las ventanas más ricas en G+C. Esto se conocía ya de antiguo, y de hecho se había acuñado el término isocoro para designar las regiones genómicas que son homogéneas en cuanto al contenido en G+C y que pueden separarse mediante gradientes de densidad. Se distinguen isocoros L e isocoros H, según su contenido en G+C sea bajo (Low) ó alto (High), y dentro de cada isocoro hay varios subgrupos. La tabla que se presenta a continuación resume algunas características importantes de los distintos isocoros: Isocoro % GC % del genoma Contenido Genes % Mb ADN Densidad de genes L ,860 1 cada 130 kb L H cada 100 kb H H cada 35 kb Como puede apreciarse, existe una relación directa entre el contenido de una región genómica en nucleótidos G+C y su riqueza en genes. Es decir, hay en el genoma humano unas regiones con mayor riqueza de genes, regiones que a su vez son las que tienen un mayor porcentaje de nucleótidos G+C. Otro hallazgo inesperado en nuestro genoma ha sido la presencia de mayor número de duplicaciones del que se había estimado hasta entonces. De hecho, el análisis muestra alrededor de un 5% de duplicaciones segmentarias, definidas como dos ó más segmentos cromosómicos >1 kb con >90% de identidad de secuencia; dicho nivel de homología corresponde a una antigüedad de unos 40 millones de años. Las duplicaciones intracromosómicas (las copias están en el mismo cromosoma) tienen un tamaño medio de unas 100 kb, mientras que las duplicaciones intercromosómicas (entre cromosomas distintos) son más pequeñas (10-50 kb). Las duplicaciones segmentarias son más frecuentes en regiones centroméricas y cerca de los telómeros (donde pueden llegar a constituir un 25% de la secuencia). Los centrómeros, en concreto, están flanqueados por regiones ricas en duplicaciones intercromosómicas procedentes de regiones

57 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 49 eucromáticas de otros cromosomas, que se han ido transponiendo a zonas pericentroméricas a una velocidad de 6-7 eventos por millón de años durante la evolución de primates. Las duplicaciones intracromosómicas pueden dar lugar a alteraciones genómicas, como veremos más adelante. La Figura 4.6 muestra esquemáticamente los tipos de duplicaciones segmentarias. El análisis de la secuencia también ha mostrado la alta cantidad de pseudogenes que hay en el genoma humano. Como su nombre indica, los pseudogenes son versiones incorrectas de genes, que contienen diversos tipos de mutaciones y habitualmente no se transcriben. Se dividen en pseudogenes no procesados y pseudogenes procesados. Los primeros son copias de un gen, habitualmente originadas por duplicación del gen original y posteriores mutaciones que hacen que la copia pierda su capacidad codificante. Contienen exones e intrones, pero que carecen de promotor y habitualmente tienen codones de parada prematuros. En cambio, los pseudogenes procesados son copias del ARN mensajero de un gen, que se ha retrotranscrito e insertado en otra posición del genoma (de ahí que se denominen también retropseudogenes). No tienen intrones, y tampoco tienen capacidad codificante por la ausencia de promotor y por la presencia de codones de parada. Se han identificado unos pseudogenes en el genoma humano, de los que la mayor parte (unos 8.000) son pseudogenes procesados. En total, se estima que el número de pseudogenes en nuestro genoma puede llegar a unos De todas formas, todos los pseudogenes detectados se originan a partir de tan sólo unos genes funcionales, de modo que la mayor parte de los genes no tienen ningún pseudogen en el genoma. La Figura 4.7 muestra la estructura de los distintos tipos de pseudogenes. Recientemente se han encontrado 481 segmentos >200 pares de bases totalmente conservados (100% de identidad sin gaps) en rergiones ortólogas de humano, rata y ratón, y la gran mayoría están también conservados en pollo y perro (95 and 99% de identidad, respectivamente). Muchas también están conservadas en pez. Estos "elementos ultraconservados" se solapan con exones de genes implicados en el procesamiento de ARN, y también son abundantes en intrones de genes relacionados con el desarrollo o con la regulación de la transcripción. Junto con las más de 5000 secuencias >100 nucleótidos que están totalmente conservadas en los 3 mamíferos secuenciados, estos fragmentos constituyen una nueva clase de elementos genéticos cuya función está por determinar, pero el hecho de que están más conservados que las proteínas indica que deben jugar algún papel importante. También es importante dedicar unas líneas a describir la presencia de genes que dan lugar a microarn. Como es sabido, el estudio del mecanismo de interferencia de ARN ha llevado a la identificación de ARN interferentes endógenos en los genomas de eucariotas, incluido el genoma humano. Estos ARN se denominan microarn (miarn) y se transcriben a partir de genes con un promotor de ARN-polimerasa II. Estos genes tienen un segmento palindrómico, de modo que el ARNm primario forma un pri-miarn que contiene una horquilla de ARN bicatenario; este pri-miarnm es procesado dentro del núcleo de la célula por una ARNasa tipo III llamada DROSHA y esto da lugar a un pre-miarn, una ARN bicatenario con forma de horquilla de unos 70 nucleótidos de tamaño. El pre-miarn sale del núcleo y es procesado en el citoplasma por Dicer, originando un miarn de unos 22 nucleótidos. Éste entra a formar parte del complejo RISC (denominado mirisc para los miarn) y regula la expresión de genes diana mediante degradación de sus mensajeros o por represión de la traducción. Actualmente se han identificado más de 300 genes de miarn en el genoma humano, y se calcula que puede haber en torno a 500. La mayoría de estos genes se localizan en intrones de genes codificantes, y además están bastante conservados en primates. Dado

58 50 GENÉTICA HUMANA que cada uno de estos miarn puede regular la expresión de varios genes diana, se estima que hasta un 20-30% de todos los genes del genoma humano pueden estar regulados por miarn, lo que les confiere una extraordinaria importancia. La secuenciación del genoma humano ha permitido también estudiar la variación genética interindividual, es decir, las diferencias genéticas que están en la base de las diferencias fenotípicas entre individuos. Esto tiene gran relevancia médica, porque muchas de estas variantes pueden ser también causa de la distinta susceptibilidad a desarrollar enfermedades o la diferente respuesta a fármacos que tienen personas distintas. Uno de los tipos más importantes de variabilidad genética es el constituido por los cambios en un nucleótido de la secuencia, conocidos como hemos visto con el nombre de SNP. Uno de los objetivos del PROYECTO GENOMA HUMANO era el estudio de la diversidad genética, y esto ha cristalizado en otro proyecto internacional denominado Proyecto HapMap que se propone precisamente identificar los SNP más frecuentes en el genoma humano en individuos de diferentes grupos étnicos. En octubre de 2005, el Proyecto Hapmap publicó un primer mapa que contiene SNP con una distancia media entre ellos de 5 kb, con una frecuencia del alelo más frecuente igual ó superior al 5% (es decir, presentes en al menos el 5% de la población). Todos estos SNP fueron genotipados en 269 individuos de cuatro grupos raciales: 90 de raza yoruba, de Nigeria; 90 caucasianos de Utah; 45 de raza han, de China; y 44 japoneses. La segunda fase de este Proyecto se propone genotipar otros 5 millones de SNP. La inspección de estos mapas permite hacerse una idea de la variación en el genoma, tanto entre individuos como entre distintos grupos raciales. Además, estos datos han permitido comprobar que esta variación se agrupa en bloques, de modo que todos los SNP de un mismo bloque se heredan juntos. En un capítulo posterior veremos la importancia de estos bloques para estudiar la asociación de SNP concretos con la susceptibilidad a padecer enfermedades. La Figura 4.8 muestra la estructura de los haplotipos formados por los alelos de varios SNP cercanos. Otro tipo de variación que se ha descubierto al analizar la secuencia del genoma humano es la originada por diferencias en el número de copias de grandes segmentos genómicos. Al analizar genomas de distintos individuos, se ha visto que existen unas regiones genómicas de tamaño grande (entre 10 y 50 kilobases) cuyo número de copias en el genoma es diferente de unos individuos a otros. Este tipo de variaciones, llamadas LCV (Large-scale Copy number Variations) ó CNP (Copy Number Polymorphisms) pueden ser deleciones ó repeticiones en tandem. Una característica de todas estas regiones es que están flanqueadas por duplicaciones segmentarias, y esto hace pensar que la variación en el número de copias es el resultado de reordenaciones entre esos elementos flanqueantes. Aunque su papel biológico todavía no está claro, los CNP pueden tener importancia en la variación genética inter-individual que explica las diferencias en la predisposición a desarrollar enfermedades. Finalmente, se ha catalogado también otro tipo de variación consistente en polimorfismos de inserción/deleción pequeños (de tamaños entre 1 nucleótido a 10 kb). Se han detectado varios cientos de miles, y se estima que en total hay alrededor de 1,5 millones de estos polimorfimos en el genoma humano. Aunque se distribuyen por todo el genoma, se ha visto que en algunas regiones son especialmente frecuentes. Muchos de ellos están dentro de genes, y pueden causar alteraciones cuando afectan al promotor o a la región codificante (exones). El ADN Repetitivo

59 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 51 Como hemos visto al principio de este Capítulo, hasta un 50% del Genoma Humano está constituido por ADN repetitivo, antiguamente conocido como "ADN basura". Por su importancia, a continuación estudiamos con mayor detalle su composición y los distintos tipos de secuencias que lo forman. Ya se ha mencionado que podemos encontrar ADN repetitivo tanto en el ADN codificante (en los genes y secuencias relacionadas) como en el ADN no-codificante, pero la mayor parte se encuentra en el ADN no-codificante. Quizás el único ejemplo de ADN repetitivo codificante que merece la pena reseñar es el correspondiente al ADN ribosomal, que se concentra en los brazos cortos de los cromosomas acrocéntricos (13, 14, 15, 21 y 22) y está formado por tres genes que dan lugar a los tres ARN ribosomales de 5,8S, de 18S y de 28S. Los tres genes están juntos formando un bloque que mide unas 13 kilobases. Estos bloques se encuentran repetidos unas 50 veces, separados entre sí por un espaciador intergénico que mide unas 30 kilobases. En conjunto, el ADN ribosomal ocupa un tamaño de unas 2 Megabases. En el ADN no-codificante, tanto intragénico (es decir, intrones y otras regiones no-codificantes relacionadas con genes) como extragénico, podemos encontrar diversos tipos de elementos repetidos. En general, se trata de una secuencia de ADN que se repite en el genoma cientos o miles de veces. Estas repeticiones pueden encontrarse en tándem (es decir, seguidas una detrás de otra) o dispersas. El ADN repetido en tandem se divide en varios grupos según el tamaño total que origina la repetición: El genoma humano contiene en total unas 250 Mb de ADN satélite (llamado así porque al separar el ADN genómico en gradientes de densidad aparece como 3 bandas "satélites" de la banda principal). El ADN satélite está formado por la repetición de una secuencia de ADN miles de veces en tandem, es decir unas copias pegadas a otras. Esto da lugar a regiones repetidas con tamaños que van desde 100 kb hasta varias megabases. Por ejemplo, el ADN Satélite 1 es una secuencia de 42 nucleótidos, mientras que en el Satélite 2 la secuencia repetida es (ATTCCATTCG) y en el Satélite 3 se repite el pentámero (ATTCC). Un tipo de ADN satélite muy importante es el ADN alfoide ó Satélite alfa, en el que la secuencia repetida tiene un tamaño de 171 nucleótidos, y que forma parte del ADN de los centrómeros de los cromosomas humanos. Otros tipos de ADN satélite son el Satélite beta (repetición de 68 nucleótidos) y el Satélite gamma (repetición de 220 nucleótidos), que también se encuentran en la cromatina centromérica de varios cromosomas. El ADN de tipo Minisatélite está formado por secuencias de 6-25 nucleótidos que se repiten en tándem hasta dar un tamaño total entre 100 nucleótidos y 20 kb. Un ejemplo de ADN Minisatélite es la repetición que forma los telómeros de los cromosomas humanos, en los que el hexanucleótido (TTAGGG) se repite miles de veces en tándem dando lugar a bloques de 5-20 kb de tamaño. Algunas repeticiones de este tipo son polimórficas, y dan lugar a los marcadores de tipo VNTR que hemos mencionado en un apartado anterior. El ADN de tipo Microsatélite está formado por secuencias de 2, 3 ó 4 nucleótidos que se repiten hasta dar bloques con un tamaño total habitualmente no superior a 150 nucleótidos. Hay repeticiones de este tipo por todo el genoma humano, y muchas de ellas son muy útiles como marcadores genéticos porque el número de repeticiones varía entre individuos. Ejemplos de ADN microsatélite son los dinucleótidos (CA), ó las repeticiones de trinucleótidos (CAG). El ADN repetido disperso está formado por secuencias que se repiten miles de veces en el genoma humano, pero no en tándem sino de manera dispersa. Este tipo de repeticiones constituyen un 45% de todo el genoma humano, y se clasifican en función del tamaño de la unidad repetida:

60 52 GENÉTICA HUMANA Los SINE (Short Interspersed Nuclear Elements, elementos nucleares dispersos cortos) suponen un 13% del genoma humano. Son secuencias cortas repetidas miles de veces en el genoma humano de forma dispersa. El principal SINE es la familia de elementos Alu, que es específica de primates y constituye un 10% de nuestro genoma. Un elemento Alu está formado por una secuencia de nucleótidos, con unas copias por genoma y una repetición cada 4 kb como promedio. Es un elemento relativamente rico en guaninas+citosinas (56% de contenido en CG, mientras que el contenido promedio del genoma humano es del 41%). Se localiza predominantemente en la bandas R de los cromosomas humanos. Está flanqueado por pequeñas repeticiones directas (en la misma orientación). Su estructura es la de un dímero no idéntico, ya que el segundo monómero es 30 nucleótidos mayor que el primero. Contiene colas poli-a al final de cada monómero, y se transcribe por la ARN polimerasa III a partir de un promotor interno, pero no codifica ninguna proteína. Actúa como un retrotransposón, ya que puede copiarse e insertarse en otras regiones del genoma. Los LINE (Long Interspersed Nuclear Elements, o elementos nucleares dispersos largos) constituyen un 20% del genoma humano. Son secuencias con un tamaño de varias kilobases, agrupados en distintas familias. El principal LINE es el llamado LINE-1 ó L1, formado por una secuencia de unas 6 kb repetida unas 800,000 veces en el genoma (aunque muchos de estos elementos no están completos, sino truncados y les falta la parte 5 ), llegando a constituir alrededor de un 15% del genoma. Estos elementos, al contrario que los SINE, no son ricos en guaninas+citosinas (tienen un 42% de citosinas+guaninas, que es cercano al contenido promedio del genoma humano) y se localizan predominantemente en las bandas G de los cromosomas. Un elemento L1 codifica dos proteínas: una ARN-binding protein en el marco de lectura ORF1 y una proteína con actividad endonucleasa y retrotranscriptasa en el marco de lectura ORF2. Está flanqueado por unas pequeñas repeticiones directas (en la misma orientación) y termina en una cola poli-a. Los elementos LINE son retrotransposones, puesto que pueden copiarse a sí mismos a través de un intermediario ARN y transponerse a otras localizaciones genómicas. Según el modelo más aceptado, el elemento se transcribe por la ARN polimerasa II a partir de un promotor interno, sus productos proteicos se unen a la cola poli-a de su propio ARN mensajero y el complejo se inserta en el ADN genómico por la acción combinada de la endonucleasa (que corta dentro de regiones ricas en AT que llevan la secuencia LINE Nuevo LINE (copia en otra localización) transcripción ARNm Reparación Unión de las proteínas a su propio ARNm traducción Rotura endonucleolítica Retrotranscripción

61 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 53 TTTT A) y de la retrotranscriptasa. Las proteínas codificadas por los LINE son utilizadas también para la retrotransposición de elementos SINE y de pseudogenes procesados, por lo que pueden jugar un importante papel como elemento modificador del genoma. De hecho se ha visto que la secuencia propia de los L1 tiene la propiedad de inhibir la transcripción, de ahí que los niveles de ARNm y proteínas codificadas por los L1 en las células sea muy bajo. Lo más interesante es que también pueden modificar la transcripción de los genes en cuyos intrones hay abundancia de estos elementos: un 80% de los genes humanos tienen L1 en sus intrones, y la densidad en L1 correlaciona negativamente con los niveles de expresión de estos genes. Por tanto, su papel tanto en la evolución de genomas como en la regulación génica le confieren una gran importancia. Se acabó el mito del "ADN basura". La Figura 4.9 ilustra el mecanismo de retrotransposición de los LINE. Los HERV (retrovirus endógenos humanos), representan copias de los retrovirus humanos que se han ido integrando en el genoma humano en el curso de la evolución y con frecuencia son el origen de proto-oncogenes celulares. Habitualmente representan copias truncadas del genoma de estos virus, y constituyen alrededor de un 8% del genoma (hay unas copias). Como habitualmente conservan alguna de las repeticiones terminales largas de estos genomas, se denominan también repeticiones tipo LTR (Long Terminal Repeat). Nuestro genoma también contiene unas copias de elementos repetidos originados por transposones ADN, lo que supone un 3% del total del genoma. Estos elementos contienen el gen (habitualmente truncado) de la transposasa, flanqueado por repeticiones invertidas. De entre las distintas familias que existen cabe destacar el tipo MER1 ó MER2 y los elementos mariner (Hsmar2), responsables de algunas reordenaciones cromosómicas importantes en patología humana. La Figura 4.10 muestra la estructura de los distintos tipos de repeticiones dispersas del genoma humano. Es importante hacer algún comentario sobre la movilidad de los retroelementos dispersos. Tanto los LINE como los Alu que estén completos pueden, en teoría, copiarse e insertarse en otra posición del genoma a través de un intermediario ARNm. De hecho, esto sucede habitualmente, aunque por fortuna con muy baja frecuencia. Se calcula que 1 de cada nuevos nacimientos lleva una inserción nueva de un Alu o de un L1, que pueden ser causa de enfermedades por diversos mecanismos. Esta tasa de nuevas inserciones es mucho más baja que en otros mamíferos. Por lo que respecta a los L1, se calcula que existen actualmente unos 5000 elementos completos en el genoma humano, de los cuales unos 90 son activos (capaces de retrotransposición). El potencial patogénico de estos elementos viene dado por la propia capacidad de insertarse aleatoriamente en el genoma (e interrumpir genes), por la desregulación de la expresión de genes cercanos (por los elementos promotores de los LINE y SINE), pero sobre todo por recombinación ilegítima entre copias de Alu o L1 que están en localizaciones cromosómicas distintas. Curiosamente, los elementos Alu causan este tipo de recombinación con más frecuencia que los L1, especialmente en algunos genes que sufren duplicaciones o deleciones por recombinación entre secuencias Alu. Para finalizar, es interesante tener una visión de conjunto de la localización de los distintos tipos de elementos repetidos en el genoma humano, representados sobre un cariotipo convencional. Como ya se ha dicho, el ADN ribosomal se localiza en el brazo corto de los cromosomas acrocéntricos. El satélite alfa

62 54 GENÉTICA HUMANA puede verse en todos los centrómeros. El satélite beta, en cambio, está en localización pericentromérica en los cromosomas acrocéntricos y en la constricción secundaria del cromosoma 1. El satélite gamma es pericentromérico en los cromosomas 8 y X. El satélite 1 está en los centrómeros de los cromosomas 3 y 4, además de encontrarse también en el brazo corto de los cromosomas acrocéntricos (distal al ADN ribosomal). El satélite 2 es pericentromérico en los cromosomas 2 y 10, además de formar la constricción secundaria de los cromosomas 1 y 16. Finalmente, el satélite 3 está en la constricción secundaria de los cromosomas 9 e Y, así como en el brazo corto de los cromosomas acrocéntricos (proximal al ADN ribosomal). Los elementos dispersos se encuentran distribuidos por todo el genoma, siendo los LINE más abundantes en bandas G y los elementos SINE más abundantes en bandas R (bandas G claras); microsatélites y minisatélites también están dispersos, aunque éstos últimos tienden a concentrarse en torno a los telómeros. En la Figura 4.11 se ven dos ejemplos de la distribución de elementos repetidos de tipo satélite en cromosomas humanos. El genoma mitocondrial La mitocondria es un orgánulo de probable origen endosimbióntico que se ha adaptado a su nicho intracelular: para aumentar su tasa de replicación y asegurar la transmisión a las células hijas después de cada división mitótica, el genoma de las mitocondrias de mamíferos se ha ido reduciendo de tamaño hasta alcanzar las pb en el caso del genoma mitocondrial humano. Las mitocondrias son las verdaderas centrales térmicas de nuestro organismo ya que en ellas tiene lugar la fosforilación oxidativa (OXPHOS), es decir, la respiración celular acoplada a la producción de energía en forma de ATP. El funcionamiento del sistema OXPHOS tiene, además, importancia médica por la generación de especies reactivas de O 2 (Reactive Oxygen Species, ROS) y por la regulación de la muerte celular programada o apoptosis. Las proteínas incluidas en el OXPHOS se localizan dentro de la membrana mitocondrial interna, e incluyen: (1) Componentes de la cadena transportadora de electrones (Cadena respiratoria mitocondrial, CRM); (2) ATPasa de membrana; (3) Translocador de nucleótidos de Adenina (ANT). El ADNmt humano es una molécula circular de pares de bases. El número de moléculas de ADNmt por célula varía entre unos pocos cientos en los espermatozoides a unas copias en el oocito, pero en la mayor parte de los tejidos el rango está comprendido entre unas y copias por célula, con 2-10 moléculas de ADN por mitocondria. Este genoma contiene información para 37 genes: Genes que codifican las 2 subunidades 12S y 16S del ARNr (ARN ribosomal) de la matriz mitocondrial. Los genes para los 22 ARNt (ARN transferente), requeridos para la síntesis de proteínas mitocondriales en la misma matriz mitocondrial. Genes que codifican 13 polipéptidos que forman parte de los complejos multienzimáticos del sistema OXPHOS. En concreto, en el genoma mitocondrial se codifican 7 subunidades del Complejo I, 1 subunidad del Complejo III, 3 subunidades del Complejo IV, y 2 subunidades de la ATPasa (Complejo V).

63 CAPÍTULO 4: GEOGRAFÍA DEL GENOMA HUMANO 55 Es importante no perder de vista que el resto de las subunidades polipeptídicas de estos complejos, así como el Complejo II completo, están codificados en el genoma nuclear, de manera que no todas las enfermedades mitocondriales están necesariamente causadas por alteraciones en el ADN mitocondrial. La Figura 4.12 muestra los complejos proteicos de la membrana de la mitocondria que están codificados por genes del propio genoma mitocondrial. La característica estructural más sorprendente del ADNmt es que los genes se encuentran situados uno a continuación del otro, sin apenas intrones ni regiones no codificantes entre los genes. Al contrario que el genoma nuclear, en el que las regiones no codificantes son mayoritarias, el ADN mitocondrial sólo posee un 3% de secuencias no codificantes. Veintiocho de los genes mitocondriales (2 ARNr, 14 ARNt y 12 polipéptidos) se encuentran en una de las cadenas (cadena H ó pesada), mientras que los 9 genes restantes (1 polipéptido y 8 ARNt) están en la cadena complementaria (cadena L ó ligera). La única zona del ADNmt que no codifica ningún gen es la región del bucle de desplazamiento (bucle-d), localizada alrededor del origen de replicación de la cadena H. Esta región contiene también los promotores de la transcripción y los elementos reguladores de la expresión génica. Otra de las peculiaridades de la organización genética del ADNmt es que los genes de los ARNt se distribuyen entre los genes de los ARNr y los codificantes de proteínas; esta disposición tiene consecuencias muy importantes para el procesamiento del ARN. Para la replicación del ADNmt hacen falta dos orígenes diferentes, uno para cada cadena (O H y O L). Ambos orígenes de replicación están muy separados, haciendo que el proceso sea unidireccional y asimétrico. La síntesis del ADN se inicia en O H y es realizada por una polimerasa específica de la mitocondria, la DNApol, que alarga un ARN iniciador fruto del procesamiento de un transcrito primario que se sintetiza a partir del promotor L. La replicación continúa de modo unidireccional hasta alcanzar O L, momento en el cual comienza la síntesis de la segunda cadena del ADN, alargando también un pequeño iniciador de ARN. La Figura 4.13 muestra la estructura del ADN mitocondrial. En la transcripción del ADNmt intervienen una polimerasa de ARN, al menos un factor de transcripción implicado en la iniciación (mttfa), y uno de terminación (mterf). Las dos cadenas del ADNmt se transcriben completamente a partir de tres puntos de iniciación diferentes, dos para la cadena pesada (H1 y H2) y uno para la cadena ligera (L), originando tres moléculas policistrónicas que se procesan posteriormente por cortes endonucleolíticos precisos en los extremos 5 y 3 de las secuencias de los ARNt, para dar lugar a los ARNr, ARNt y ARNm maduros. De esta forma los ARNt, situados entre los genes de los ARNr y ARNm, actúan como señales de reconocimiento para los enzimas de procesamiento. En particular, la cadena H se transcribe mediante dos unidades de transcripción solapadas en la región de los ARNr: la primera de estas unidades comienza delante del gen para el ARNt Phe (lugar de iniciación H1), termina en el extremo 3 del gen para el ARNr 16S y es responsable de la síntesis de los ARNr 12S y 16S, del ARNt Phe y del ARNt Val. El factor de terminación (mterf) se une a una secuencia situada en el gen del ARNt Leu y provoca la terminación de esta unidad. La segunda unidad de transcripción comienza cerca del extremo 5 del gen del ARNr 12S (lugar de iniciación H2) y transcribe la casi totalidad de la cadena pesada; el procesamiento de este ARN policistrónico origina los ARNm de 12 péptidos y los otros 12 ARNt codificados en esta cadena. La transcripción de la cadena ligera comienza cerca del extremo 5 del ARN 7S (en el bucle-d) y da lugar al iniciador de la replicación de la cadena pesada, 8 ARNt y 1 péptido (ND6). La síntesis de las proteínas mitocondriales tiene lugar en ribosomas específicos de la mitocondria, cuyos componentes están codificados en el ADNmt (ARNr 12S y 16S) y en el genoma nuclear (84 proteínas ribosomales). En este sistema de traducción se sintetizan las trece proteínas codificadas en el ADNmt

64 56 GENÉTICA HUMANA utilizando un código genético que difiere ligeramente del código genético universal. Así, UGA codifica el aminoácido triptófano (Trp) en vez de ser un codón de terminación, y los codones AUA y AUU se utilizan también como codones de iniciación. La biogénesis de la mitocondria depende de la expresión coordinada de los genomas mitocondrial y nuclear, pero hasta ahora se conoce muy poco acerca de los mecanismos que regulan la interacción de ambos sistemas genéticos. La expresión del ADNmt parece estar regulada por el factor de iniciación de la transcripción mttfa, codificado en el genoma nuclear. Este factor podría ser el responsable tanto de los niveles de ARN como del número de copias de ADNmt, ya que la replicación depende de la síntesis de un iniciador de ARN a partir del promotor de la cadena ligera. La regulación de la relación entre los ARNr y los ARNm mitocondriales se realiza fundamentalmente mediante la selección del lugar de iniciación de la transcripción de la cadena pesada, que a su vez está relacionada con el factor mtterf (que causa terminación de la transcripción después de la síntesis de los ARNr) y con el procesamiento de los ARN primarios. Asimismo, la actividad transcripcional puede estar regulada por estímulos hormonales, especialmente por hormonas tiroideas que actúan tanto de un modo indirecto (por activación de genes nucleares) como directamente sobre el propio ADNmt.

65 CAPÍTULO 5: EL GENOMA HUMANO EN ACCIÓN 57 CAPÍTULO 5. EL GENOMA HUMANO EN ACCIÓN La secuencia influye en el estado funcional de la cromatina. Modificaciones epigenéticas y su importancia en la regulación del estado funcional de la cromatina. Relación entre secuencia, estructura y función de la cromatina: territorios cromosómicos. La secuencia influye en el estado funcional de la cromatina Como ya se ha dicho, el grado de empaquetamiento no es uniforme a lo largo de todo el genoma. De hecho, en el núcleo en interfase siempre se distinguió una cromatina denominada eucromatina, poco condensada, y otra llamada heterocromatina, con un mayor grado de condensación. Hoy sabemos que estas categorías morfológicas tienen un correlato funcional, ya que la eucromatina es transcripcionalmente más activa mientras que los genes incluidos en heterocromatina tienen un bajo nivel de expresión. La heterocromatina, a su vez, puede ser de dos tipos: constitutiva, que nunca se transcribe y se localiza en los centrómeros y en la constricción secundaria de algunos cromosomas; ó facultativa, que en el fondo es un tipo de eucromatina que se heterocromatiniza en situaciones concretas, como es el caso del cromosoma X inactivo en las mujeres. Además de estas dos grandes categorías de cromatina, es importante comprender que dentro de las regiones eucromáticas la cromatina tampoco es totalmente homogénea, como queda reflejado, por ejemplo, en su distinta repuesta a varias tinciones. Este comportamiento es precisamente la base del patrón de bandas característico de cada cromosoma y que permite la creación del cariotipo convencional. Como veremos en un capítulo posterior, la tinción con un colorante llamado Giemsa produce unas bandas oscuras (bandas G) separadas por bandas claras (bandas R). La tinción con otra sustancia llamada Quinacrina (que se une específicamente a regiones ricas en adeninas y timinas) produce un patrón de bandas similar a las bandas G, mientras que la tinción con Cromomicina-A (que se une preferentemente a regiones ricas en guaninas y citosinas) genera un patrón similar a las bandas R. Por tanto, las peculiaridades morfológicas de la cromatina son debidas, al menos en parte, a diferencias en la secuencia de nucleótidos del genoma; el modelo del andamio (scaffold) que vimos en el Capítulo 2 permite explicar esta relación, ya que las bandas G representan regiones con un mayor grado de empaquetamiento del ADN, lo que implica una mayor densidad de las regiones de unión al andamio (llamadas SAR). Como las SAR son relativamente ricas en adenina y timina, esto explica que estas regiones genómicas se tiñan más intensamente por Quinacrina y Giemsa, mientras las bandas R, más ricas en guanina y citosina, tienen un menor grado de empaquetamiento, menor densidad de SAR y se tiñen débilmente por estos colorantes. Por tanto, las distintas bandas del cariotipo reflejan no sólo diferencias en la condensación de la cromatina, sino también diferencias en su composición: ya hemos visto que el genoma humano tiene un contenido medio en G+C del 41%, pero que esto no se distribuye de manera uniforme por todo el genoma. A su vez, las diferencias en condensación y en composición de las distintas regiones de cromatina se correlacionan con otra variable importante: la riqueza en genes y su actividad transcripcional. Por ejemplo, se estima que un 80% de los genes se localizan en bandas R (las más ricas en nucleótidos G+C), que son las menos condensadas. También se ha observado que, en general, las bandas R son de replicación temprana, mientras que las bandas G son de replicación más tardía. Como se recordará del Capítulo 2, la replicación del ADN en eucariotas comienza en muchos orígenes de replicación durante la fase S del ciclo celular, pero no todos los orígenes de replicación comienzan a funcionar a la vez: hay unos orígenes que siempre comienzan al principio de la fase S (replicación temprana) y otros que van comenzando a funcionar más tarde (replicación tardía). Asimismo, se sabe que los genes constitutivos (housekeeping en

66 58 GENÉTICA HUMANA inglés), que son los que se expresan en todos los tejidos, se replican temprano; por el contrario, los genes que están en regiones heterocromáticas (el cromosoma X inactivo, por ejemplo) son de replicación más tardía. Parece por tanto que regiones con alta densidad de genes, ricas en C+G y descondensadas se replican antes que regiones silenciadas ó con baja densidad de genes. Otro aspecto que diferencia los distintos tipos de bandas es la acetilación de las histonas. Como se verá a continuación, se ha podido comprobar que la acetilación de las histonas que forman los nucleosomas lleva a la formación de una cromatina más abierta, que permite mejor el acceso de factores de transcripción y la expresión de los genes contenidos en esas regiones. Esto se debe a que las colas amino-terminales de las histonas interaccionan con más fuerza entre sí y con el ADN cuando los grupos épsilon-amino de las lisinas están en su forma des-acetilada; la acetilación relaja esas interacciones y descondensa parcialmente la fibra de 30 nm y la unión del ADN con los nucleososmas. Curiosamente, se ha comprobado que las histonas de las bandas G están menos acetiladas que las histonas de las bandas R. Esto ayudaría también a explicar la menor condensación de la cromatina en las bandas R, y nos proporciona un mecanismo para entender por qué las bandas R se replican antes y son más activas transcripcionalmente: por un lado, no necesitan descondensarse para que se lleve a cabo la replicación, y por otro constituyen unos dominios en los que el ADN es más accesible a los factores de transcripción. Figura 5.1 La acetilación de colas amino-terminales de las histonas influye en la condensación de la cromatina. En resumen, es importante darse cuenta de que los mecanismos básicos de regulación de la expresión génica estudiados en el Capítulo 1 están sometidos a un nivel superior de regulación, dependiente de la situación de un gen dentro del genoma y del estado funcional de la cromatina en que se encuentra, que a su vez está influido por el tipo de secuencias que la componen. Generalizando, podemos resumir las principales características de los dos estados de cromatina más frecuentes, representados por los dos tipos principales de bandas citogenéticas (banda G, oscuras, y bandas R, claras): Bandas G Bandas R Densidad en genes Baja Alta Porcentaje de G+C Bajo Alto Replicación Tardía Temprana Composición Ricas en A+T Ricas en G+C Acetilación Histonas Baja Alta Repeticiones predominantes LINE SINE Modificaciones epigenéticas y su importancia en la regulación del estado funcional de la cromatina Es muy importante comprender que los aspectos estructurales y funcionales se integran en un modelo "dinámico", según el cual una región de cromatina estará en un estado más o menos favorable a la expresión génica dependiendo del tipo de secuencias que la forman y también de las modificaciones epigenéticas a ese nivel. Por modificaciones epigenéticas se entienden todos aquellos cambios que sufre la cromatina pero que no afectan a la secuencia de nucleótidos: por eso no son modificaciones "genéticas", sino que están "por encima" (que es lo que significa epi en griego). En los últimos años se ha comprobado

67 CAPÍTULO 5: EL GENOMA HUMANO EN ACCIÓN 59 experimentalmente la gran importancia que tienen los mecanismos que regulan la actividad de la cromatina mediante cambios epigenéticos. Para entender esto, es importante recordar que la actividad transcripcional basal en eucariotas es esencialmente restrictiva, en el sentido de que los promotores están en estado inactivo hasta que se ponen en marcha por la acción de los elementos llamados activadores y el ensamblaje del complejo basal de transcripción. Para que estos factores proteicos se unan a sus dianas en el ADN es necesario que la cromatina de esa región esté relativamente descondensada, para exponer más fácilmente la doble hélice y permitir el acceso de factores proteicos. De hecho, los genes que son transcripcionalmente activos se asocian habitualmente con sitios hipersensibles a DNAsa I, regiones cortas (unos pocos cientos de pares de bases) formadas por ADN que no está asociado a nucleosomas, precisamente porque se encuentra unido a factores de transcripción. La Figura 5.2 ilustra esquemáticamente la distinta accesibilidad a una región de cromatina dependiendo del grado de condensación. Los nucleosomas son, por tanto, un elemento fundamental para mantener este estado basal restrictivo, al impedir el acceso de la maquinaria transcripcional a los promotores. La represión transcripcional mediada por nucleosomas se debe tanto a las interacciones directas del octámero de histonas con el ADN, como a las interacciones que se originan entre nucleosomas vecinos para dar lugar a la fibra de cromatina. Como hemos visto más arriba, las colas N-terminales de las histonas de los nucleosomas quedan libres hacia fuera, y son las regiones más susceptibles de ser modificadas químicamente para variar su carga y alterar las interacciones, tanto entre histonas y ADN como entre nucleosomas vecinos. Por tanto, si conseguimos relajar alguna de estas interacciones conseguiremos favorecer la transcripción de los genes que están incluidos en esas regiones. Esta relajación se puede conseguir gracias a que las colas N-terminales de las histonas tienen una serie de aminoácidos (lisinas y serinas, principalmente) que pueden sufrir modificaciones covalentes del tipo acetilación, metilación ó fosforilación, y que van a ser cruciales en la regulación de estos fenómenos. A su vez, estos cambios se coordinan con otras modificaciones epigenéticas que sufre la propia cadena de ADN en forma de metilación de algunos nucleótidos concretos, y en su conjunto ambos procesos constituyen un importante mecanismo de regulación de la actividad transcripcional. A continuación veremos por separado las modificaciones epigenéticas que sufre la cromatina, por una parte, y el ADN por otra. A. Modificación de la cromatina. Para superar la represión basal debida a la presencia de nucleosomas y facilitar la expresión de un gen, los activadores de la transcripción pueden potenciar la actividad transcripcional alterando, en primer lugar, la propia estructura de la cromatina: aunque el activador no se una directamente al promotor de un gen, puede reclutar distintas actividades modificadoras de la cromatina cuya acción sea conferir a esa región un estado que facilite la transcripción. Estas actividades pueden ser de varios tipos: complejos proteicos implicados en el remodelamiento nucleosomal: son capaces de mover los nucleosomas de su posición para dejar expuesta una región promotora y permitir la expresión génica. Este tipo de actividad está mediada por complejos multiproteicos con actividad ATPasa, de los cuales el primero en ser aislado fue el complejo SWI/SNF (primero se identificó en levaduras, después en humanos). Este complejo desestabiliza el nucleosoma al romper los contactos del ADN con el octámero, que queda libre para moverse y asociarse con una región vecina de la molécula de ADN. Todos los remodeladotes de nucleosomas pertenecen a la familia SNF2 de ATPasas, y pueden dividirse en 7 subgrupos dependiendo de los dominios proteicos que contienen.

68 60 GENÉTICA HUMANA En la Figura 5.3 se ilustra el movimiento de nucleosomas por la acción de remodeladotes de la cromatina. complejos implicados en la acetilación de histonas: el factor Gcn5 de levadura fue el primer activador transcripcional con actividad acetilasa de histonas descubierto, en Posteriormente se vio que otros co-activadores de la transcripción de mamíferos también poseían actividad acetil-transferasa, factores tales como p300, CBP (CREB-BP) y P/CAF, de ahí que hoy en conozcan en conjunto con el nombre de HAT (Histone AcetylTransferase). Éstos actúan como factores de transcripción integradores de diversas vías de transducción de señales implicadas en el control del ciclo celular y de los procesos de diferenciación, reparación y apoptosis. Otros activadores transcripcionales con actividad HAT son el factor de transcripción TAF II250 (que forma parte del complejo TFIID), SRC-1 y ACTR (coactivadores de receptores nucleares). Al igual que la acetilación de las histonas conduce a la activación transcripcional, la des-acetilación de las histonas crea una estructura cromatínica más condensada que favorece el silenciamiento de la transcripción de los genes incluidos en la esa región genómica. En este sentido, se ha comprobado que los factores HDAC1 y HDAC2 (Histone De-Acetylase), cuya función es des-acetilar las histonas, están presentes en el complejo Sin3-NcoR, un co-represor transcripcional que regula la expresión de genes importantes en el ciclo celular y en el desarrollo embrionario. En conjunto, acetilasas y des-acetilasas actúan sobre los mismos aminoácidos de las colas amino-terminales de las histonas H3 y H4, especialmente las lisinas 9, 14, 18 y 23 de la histona H3 y las lisinas 5, 8, 12 y 16 de la histona H4. En la figura 5.1 ya se ha visto el posible mecanismo por el que la des-acetilación de las histonas favorece la compactación de nucleosomas vecinos e impide la transcripción en esa región. De hecho, se ha comprobado que la des-acetilación de la lisina 16 en la histona H4 provoca la condensación de la fibra de 10 nm, mientras que la acetilación de este residuo impide la formación de la fibra de 30 nm y permite la interacción con co-activadores de la transcripción. otras modificaciones muy importantes son la fosforilación de la histona H3 en la serina 10 y la metilación de las lisinas 4, 9, 27, 36 y 79 en la histona H3 y de la lisina 20 de la histona H4, metilación catalizada por unos complejos proteicos que tienen actividad metil-transferasa. Se ha comprobado que estas modificaciones actúan en coordinación con la acetilación, estableciendo lo que ahora se conoce como el "Código de Histonas". Según este código, una región se comportará como eucromatina ó como heterocromatina dependiendo de las modificaciones epigenéticas de las histonas que conforman los nucleosomas de la región; las regiones limítrofes, en las que se da una transición de un tipo de cromatina al otro, muestran características propias de ambos tipos de cromatina, y son capaces de unir complejos proteicos llamados aisladores (en inglés "insulator"), que forman una especie de barrera física e impiden que un tipo de cromatina se extienda más allá del límite de la región e invada la región vecina. De modo general, el código de histonas establece que una región de eucromatina se caracteriza por tener la lisina 4 de la histona H3 metilada (con uno, dos o tres grupos metilo), y las lisinas 9 y 14 de la misma histona acetiladas. Se ha comprobado que esta configuración tiene la propiedad de unirse a un dominio proteico llamado "bromodominio", que está presente en muchos activadores de la transcripción. Una región con estas características puede heterocromatinizarse si sufre una cascada de alteraciones: la pérdida de la metilación de la lisina 4, la desacetilación progresiva de las lisinas 9 y 14, y finalmente la metilación de la lisina 9 constituyen una marca de heterocromatina, a la que se unen proteínas que contienen un dominio de silenciamiento llamado "cromodominio" que recluta factores de silenciamiento como la proteína HP1 (proteína de heterocromatina-1). Estas interacciones están influidas también por la fosforilación de la serina 10 de la histona H3; por ejemplo, dicha fosforilación generada por la quinasa Aurora B inhibe la unión de HP1 con la lisina 9 metilada durante la mitosis.

69 CAPÍTULO 5: EL GENOMA HUMANO EN ACCIÓN 61 La Figura 5.4 ilustra el concepto del Código de histonas y su utilidad para definir distintas regiones de cromatina. Chromo Me Ac Me T-K-Q-T-A-R-K-S-T-G-G-K-A 4 9 P 14 Ac Bromo B. La metilación del ADN juega un papel fundamental en el mantenimiento del silenciamiento transcripcional. El ADN de vertebrados se metila en el carbono 5 de las citosinas que están en el dinucleótido CpG (la "p" indica el grupo fosfato que une una citosina con una guanina, en dirección 5' 3'). Curiosamente, la abundancia de este dinucleótido en el genoma de vertebrados es sólo un 25% de lo esperado, es decir, el porcentaje normalizado de este dinucleótido es de 0,25. En efecto, si el contenido en C+G del genoma es del 41%, la probabilidad esperada de encontrar un dinucleótido CpG es (0,205 x 0,205) = 0,042 (o sea, 4,2%); en cambio, la frecuencia observada de este dinucleótido está en torno al 1% en el genoma humano, de ahí que el porcentaje normalizado sea 1/4 = 0,25. Además, los dinucleótidos CpG no están distribuidos homogéneamente a lo largo del genoma, sino que son más abundantes en los genes, tanto en los exones como, sobre todo, alrededor del inicio de la transcripción. Pues bien, los dinucleótidos CpG que tienen metilada la citosina son los que están distribuidos a lo largo de la secuencia de genes. Por el contrario, los dinucleótidos CpG que no están metilados que tienden a concentrarse en regiones que se denominan islas CpG. Aunque estas islas se han definido tradicionalmente como las regiones de un tamaño igual o superior a 500 pb, con un contenido total de G+C superior a 55% y con un cociente de dinucleótidos CpG observados frente a esperados superior a 0,6 (criterios de Takai-Jones), hoy en día se pueden definir por su porcentaje normalizado de CpG. De hecho, el análisis de todos los promotores del genoma humano identifica dos tipos de genes: los que tienen un promotor con un porcentaje normalizado de CpG en torno al 0,61 y los que tienen un promotor con un porcentaje normalizado de CpG en torno al 0,23. Los primeros constituyen un 70% de todos los promotores, y corresponden a los genes constitutivos ó domésticos ("housekeeping" en inglés). Por el contrario, los promotores con bajo porcentaje normalizado de CpG constituyen un 30% del total de los promotores, y corresponden a los genes que se expresan en tejidos específicos. Los promotores que contienen una isla CpG están habitualmente hipometilados en la línea germinal, lo cual les protege frente a las transiciones C T que sufren las citosinas metiladas. En la Figura 5.5 se representa la distribución de dinucleótidos CpG a lo largo de un gen, mostrando el concepto de isla CpG.

70 62 GENÉTICA HUMANA La metilación del ADN está catalizada por unas metil-transferasas específicas de las citosinas que forman parte de dinucleótidos CpG, y se conocen básicamente dos tipos de estas metil-transferasas de ADN. Las DNMT3A y DNMT3B son responsables de la metilación de novo, es decir, la metilación de dinucleótidos CpG que no estaban previamente metilados. En cambio, la DNMT1 (ADN-metil-transferasa-1) es responsable de mantener la metilación durante la replicación. En efecto, dado que en la doble cadena de ADN un dinucleótido CpG tiene realmente dos citosinas metilables (ya que existe un CpG en cada una de las cadenas de la doble hélice), un sitio totalmente metilado tendrá realmente dos citosinas metiladas. Tras la replicación del ADN, ambas dobles hélices conservarán una cadena con el CpG metilado (la proveniente de la molécula original), mientras que la cadena de nueva síntesis estará sin metilar. Esto genera dinucleótidos CpG hemi-metilados, es decir, metilados en una de las citosinas pero no en la otra; la DNMT1 tiene la función de re-metilar precisamente estos dinucleótidos para restablecer el estado inicial de metilación completa que tenía la molécula original. La Figura 5.6 muestra el proceso de re-metilación de dinucleótidos CpG que han quedado hemi-metilados tras la replicación. Numerosos estudios han mostrado el significado biológico de la metilación del ADN: 1) es un importante mecanismo epigenético de silenciamiento génico a nivel transcripcional, y permite mantener el silenciamiento de ciertos genes durante los procesos de diferenciación celular; 2) la metilación es un mecanismo de defensa frente a elementos móviles del genoma, cuyos promotores están habitualmente silenciados por metilación; y 3) la metilación es un mecanismo estabilizador de la cromatina, especialmente de la heterocromatina pericentromérica, ya que la des-metilación de este tipo de cromatina conduce a la aparición de reordenamientos cromosómicos severos. Los mecanismos moleculares por los que la metilación conduce al silenciamiento transcripcional pueden ser múltiples: impidiendo la unión de factores de transcripción al promotor. Por ejemplo, algunos factores de transcripción generales como Sp1, CREB, E2F ó NF-kB se unen a dominios que contienen CpG, y esta unión disminuye cuando estos dominios están metilados. Sin embargo, éste mecanismo no se puede aplicar de modo general a todos los genes. mediante la unión específica de represores transcripcionales al ADN metilado. Existen varias proteínas de unión a los dinucleótidos CpG metilados, denominadas genéricamente MeCP ("Methyl-Cytosine binding Protein") ó MDB ("Methyl Binding Domain"), que forman parte de complejos con actividad represora de la transcripción. Por ejemplo, MeCP-2 es una proteína que contiene un dominio de unión a dinucleótidos CpG metilados, así como otro dominio por el que se une a un represor transcripcional llamado Sin3. Curiosamente, Sin3 reprime la transcripción a través de su unión con HDAC2 (que, como ya hemos visto, des-acetila las lisinas de la histona H3). De esta manera, la represión transcripcional debida a la metilación de los dinucleótidos CpG se produce gracias a la asociación entre metilación del ADN y acetilación de la cromatina, ya que el dominio de represión transcripcional de MeCP-2 es capaz de reclutar el complejo Sin3-NCoR-HDAC2 y así iniciar un foco de cromatina hipoacetilada en una región específica del genoma. Esto explica que las regiones en las que el ADN está metilado sean capaces de silenciar genes cercanos (aunque éstos no tengan sus dinucleótidos CpG metilados), al englobarlos en una región genómica silenciada por des-acetilación.

71 CAPÍTULO 5: EL GENOMA HUMANO EN ACCIÓN 63 El video incluido en la Figura 5.7 ilustra la interacción entre metilación del ADN y modificación de las histonas. Una propiedad muy importante del silenciamiento por metilación es que es reversible: se ha comprobado que los promotores que han sido silenciados por metilación pueden reactivarse si se des-metila esa región. Un mecanismo posible para explicar esta reactivación es la pérdida de la metilación durante la replicación: esto sucedería si ciertos factores de transcripción ó activadores nucleares consiguieran unirse a sus promotores inmediatamente después de la replicación y antes de que actúe la DNMT1 de mantenimiento en los sitios hemi-metilados. Una vez que se estabiliza el complejo basal de transcripción sobre esa región, éste atraería algunos componentes con actividad HAT, que a su vez actuarían manteniendo la cromatina abierta y permitiendo la transcripción. Esto, además, impediría la acción de la DNMT1 y terminaría por eliminar la metilación en esa región tras varios ciclos de replicación. Este mecanismo se conoce como des-metilación pasiva. Otro mecanismo alternativo para explicar la reexpresión de genes silenciados por metilación, sobre todo en células diferenciadas que ya no se replican, es la desmetilación activa, aunque todavía no se ha aislado de modo concluyente ninguna des-metilasa de ADN. En resumen, la metilación del ADN constituye un importantísimo mecanismo epigenético de regulación de la expresión génica, debido a su interacción con los mecanismos que modifican la estructura de la cromatina. El mantenimiento de los patrones de metilación explica también que las modificaciones epigenéticas sean heredadas establemente tras la replicación del ADN. Además, como ya se ha mencionado, la metilación tiene importantes implicaciones biológicas, y por tanto la alteración de los procesos normales de metilación de la cromatina puede perturbar procesos fisiológicos importantes. En primer lugar, por ser un mecanismo fundamental en el silenciamiento de retrovirus endógenos, transposones y ADN satélite, las alteraciones en la metilación de estos elementos puede provocar numerosas anomalías genéticas. Además, la metilación es la base molecular de los fenómenos de impronta genómica (imprinting) que se estudiarán más adelante, y es un mecanismo fundamental en la regulación de la expresión génica durante el desarrollo embrionario. De hecho, el embrión sufre una onda de des-metilación genómica global en la fase de mórula de 8 células, seguida por la re-metilación gradual que vuelve a fijar los patrones de metilación en la fase de blastocisto. También la inactivación del cromosoma X en mujeres es un proceso básicamente controlado por procesos de metilación, acetilación y silenciamiento. Por tanto, cada vez está más claro que la des-regulación de las modificaciones epigenéticas de la cromatina está en la base de algunas enfermedades humanas. El caso más claro es el de una enfermedad neurológica hereditaria llamada Síndrome de Rett, en el que se han identificado mutaciones en el gen que codifica la proteína de unión a metil-citosinas MECP2. Probablemente, esto origine un exceso de ruido transcripcional por falta de silenciamiento global de muchos genes, con efectos más marcados en el cerebro que en otros órganos. Por otra parte, el papel de la metilación en cáncer también está cobrando cada vez más importancia, ya que se ha visto que muchos tipos de tumores tienen alteraciones importantes en los procesos de metilación de la cromatina: la desaminación de citosinas metiladas (debida habitualmente a la acción de una citidíndesaminasa, ó bien por desaminación hidrolítica espontánea) provoca un cambio de Citosina por Timina, haciendo que los dinucleótidos CpG metilados sean puntos calientes (hotspots) para la generación de mutaciones de este tipo. De hecho, se ha estimado que el 30% de las mutaciones encontradas en tumores en el gen TP53 (que codifica la proteína p53, un supresor tumoral importante) son transiciones C T que tienen lugar dentro de dinucleótidos CpG.

72 64 GENÉTICA HUMANA se ha comprobado que durante el proceso de iniciación tumoral hay una hipometilación global del genoma de la célula pre-maligna, lo que provoca un aumento en la inestabilidad genómica y la aparición de anomalías cromosómicas. Por ejemplo, los ratones en los que el gen DNMT1 ha sido inactivado muestran una elevada tasa de deleciones o duplicaciones de regiones cromosómicas. Además, algunos oncogenes concretos se sobreexpresan en algunos tumores por des-metilación de sus promotores (por ejemplo el oncogén BCL2). Del mismo modo, se ha identificado una enfermedad (Síndrome ICF, siglas de Inmunodeficiencia, inestabilidad Centromérica y defectos Faciales) en la que los pacientes tienen mutaciones en el gen DNMT3B, que codifica una metil-transferasa que metila específicamente los satélites centroméricos 2 y 3; la desmetilación de esas regiones de heterocromatina provoca fusiones entre cromosomas. En conjunto, estos datos sugieren que la metilación es un mecanismo muy importante para mantener la estabilidad del genoma. al mismo tiempo, la hipermetilación puntual de algunos genes supresores tumorales, con el consiguiente silenciamiento y pérdida de función, es un mecanismo muy frecuente de generación de distintos tipos de cáncer. Por ejemplo, el gen RB1 está frecuentemente metilado en un tipo de tumores llamados retinoblastomas esporádicos. También es frecuente la hipermetilación (y silenciamiento) del gen supresor tumoral p16 en varios tipos de tumores; la hipermetilación del gen VHL (Von Hippel- Lindau) en 20% de los carcinomas de células renales esporádicos; la inactivación, por hipermetilación, del gen de reparación de desemparejamientos hmlh1 en tumores de colon esporádicos que muestran inestabilidad de microsatélites. En conjunto, se estima que en tejido tumoral hasta un 10% de las islas CpG están metiladas, en contraste con células normales en las que este porcentaje es mucho más bajo. por su parte, algunos complejos con actividad modificadora de la cromatina se han asociado también con el desarrollo de cáncer. Por ejemplo, el gen AIB1, que tiene actividad acetilasa de histonas, está amplificado en cáncer de mama y por tanto se expresa a niveles más altos de lo normal. Por otro lado, el co-activador transcripcional CBP, que también funciona como una acetilasa de histonas, está fusionado con el gen MOZ ó con el gen MLL en pacientes con leucemia mieloide aguda; esta fusión hace que la actividad acetilasa esté aumentada en determinadas células de la médula ósea y esto desencadena la leucemia. Además, otro co-activador transcripcional con actividad acetilasa de histonas (la proteína p300) está mutado en cáncer colorrectal y delecionado en el 80% de los glioblastomas, un tipo de tumor cerebral. Lo mismo puede decirse de los complejos con actividad desacetilasa de histonas (HDAC): ya hemos visto que la supresión de Myc y la unión de Rb con el factor de transcripción E2F dependen en gran medida de su unión con complejos que tienen actividad desacetilasa. Además, se ha demostrado que algunas oncoproteinas virales como HPV E7 ó el antígeno T de SV40 inactivan el gen RB1 al impedir su unión con complejos que tienen actividad HDAC. Finalmente, las translocaciones asociadas con la leucemia promielocítica producen fusiones entre factores de transcripción que interaccionan con diversas acetilasas y des-acetilasas de histonas, con complejos remodeladores de la cromatina y con proteínas que tienen actividad metil-transferasa de histonas.

73 RXR RAR RXR RAR RXR CAPÍTULO 5: EL GENOMA HUMANO EN ACCIÓN 65 La Figura 5.8 muestra la regulación de la transcripción de un gen que responde al ácido retinoico, mostrando la importancia de los complejos modificadores de la cromatina y su alteración en un tipo de leucemia. Gen que responde al Ácido Retinoico Translocación con Proteína de fusión PML/RARa Sin3 Sin3 Sin3 NCOR HDAC NCOR HDAC NCOR HDAC HAT PML/RAR Ac Ac Ac Ac Ausencia de ligando Desacetilación (Represión) Unión del ligando (ácido retinoico) Acetilación (Transcripción) Forma anómala del receptor Impide unión del ligando Considerando todos los ejemplos citados en los párrafos anteriores, podemos concluir que los procesos que regulan la metilación de la cromatina están implicados en la iniciación y progresión tumoral; esto, además, abre nuevas posibilidades terapéuticas en muchos tipos de cáncer, ya que el estado de metilación es potencialmente modificable mediante fármacos. Relación entre secuencia, estructura y función de la cromatina: territorios cromosómicos Al ocuparnos de los mecanismos que regulan la función del genoma a nivel global, es importante tener en cuenta el nivel superior de organización de un genoma dentro del núcleo. En los últimos años se ha puesto en evidencia que distintas regiones de la fibra de cromatina tienden a ocupar posiciones concretas en el núcleo, dependiendo de la secuencia subyacente, del estado transcripcional de los genes de esa región y de sus modificaciones epigenéticas, del tiempo de replicación del ADN implicado, etc. Por tanto, cada vez está más claro que si queremos tener una imagen completa de cómo se regula la función del genoma, no podemos ignorar aspectos estructurales tales como la composición en nucleótidos o la posición dentro del núcleo. Uno de los aspectos más intrigantes de la biología genómica de los últimos años es la organización espacial de la cromatina dentro del núcleo de la célula eucariota, dando lugar a lo que se han denominado "territorios cromosómicos". Este concepto ha venido a completar la imagen del núcleo eucariota como una estructura compartimentalizada, en la que distintas regiones contienen maquinarias específicas que llevan a cabo funciones concretas. Esta noción debe integrarse con la presencia de dominios cromatínicos definidos y más o menos estables a lo largo de la vida de una célula. Diversos estudios han mostrado de

74 66 GENÉTICA HUMANA forma convincente que la cromatina correspondiente a cada uno de los cromosomas tiende a ocupar unas posiciones concretas en el núcleo en interfase, y que esas posiciones tienden a mantenerse durante el ciclo celular. Por ejemplo, la posición de un cromosoma concreto dentro del núcleo está relacionada con el tamaño del cromosoma y con su riqueza en genes, que como hemos visto se correlaciona también con la secuencia de nucleótidos subyacente. En general, se considera que los cromosomas pequeños tienden a localizarse hacia el interior del núcleo; igualmente, cromosomas ricos en genes tienden a ocupar posiciones centrales. También existen datos que muestran que las regiones pobres en genes y en secuencias Alu se asocian con la periferia del núcleo, dejando la cromatina rica en genes en el interior. De todas formas, todavía se desconoce cómo se establecen estos territorios y cómo se mantienen tras la mitosis. En la Figura 5.9 se ilustra el concepto de territorio cromosómico. La replicación del ADN y la transcripción génica son dos procesos que tienen lugar dentro del núcleo y que exigen una remodelación importante de la fibra de cromatina para permitir el acceso de las maquinarias proteicas que los llevan a cabo. Además, se ha visto que ambos procesos no tienen lugar al azar, en cualquier lugar del núcleo, sino en compartimentos especializados a los que acuden las fibras de cromatina que están en la vecindad. Se habla así de "fábricas de replicación" ó de "fabricas de transcripción", regiones nucleares ocupadas por regiones genómicas que se replican o transcriben simultáneamente aunque pertenezcan a territorios cromosómicos distintos. Lógicamente, las asas de cromatina que ocupan una fábrica determinada tendrán una configuración similar, en cuanto al grado de condensación de la cromatina, la secuencia de nucleótidos, la riqueza en genes, etc; esto explica que el genoma se organice como un mosaico de regiones que comparten características similares, ya que esas regiones podrían interaccionar dentro del núcleo al situarse en una misma fábrica de replicación o de transcripción. Por ejemplo, se ha visto que en el genoma humano existen unas regiones llamadas RIDGES (Regions of IncreaseD Gene Expression, en inglés) en las que son más abundantes los genes que se transcriben activamente, y son regiones ricas en G+C, pobres en repeticiones tipo LINE y con densidad génica alta. Junto a éstas, se observan también regiones con poca densidad en genes, bajo nivel transcripcional y relativamente pobres en G+C, que se llaman por tanto anti-ridges. Pues bien, los genes presentes en RIDGES tienden a localizarse, dentro del núcleo, en torno a las fábricas de transcripción. Lo mismo sucede con los genes de replicación temprana, que se asocian significativamente con las fábricas de replicación nucleares. Por tanto, los modelos actuales postulan que los genes que son replicados o transcritos residen en regiones cromatínicas relativamente descondensadas, las cuales salen de sus propios territorios cromosómicos hacia fábricas de replicación o transcripción vecinas. En esas fábricas, por tanto, pueden interaccionar regiones alejadas de un mismo cromosoma, o incluso asas de cromatina de territorios cromosómicos distintos; esto permite explicar, en el caso de la transcripción, la acción de potenciadores de la expresión que actúan a larga distancia ó incluso en trans. Como es lógico, en todas estas interacciones son importantes las modificaciones epigenéticas de la cromatina y del ADN que hemos estudiado en este Capítulo, que en el fondo constituyen la base molecular que permite los fenómemos de condensación y descondensación necesarios para la replicación, transcripción y desplazamiento físico de las asas de cromatina. Conjugando todos estos elementos, obtenemos una visión dinámica de la cromatina nuclear en la que que la estructura del núcleo se integra con la función y secuencia del genoma. Esta visión es mucho más rica que los modelos anteriores, que no tenían en cuenta todos estos factores, y además permite explicar mucho mejor la regulación fina de la expresión génica durante el desarrollo embrionario ó la diferenciación celular. La otra cara de la moneda es que se trata de procesos tremendamente complicados y, por ello, potencialmente frágiles, de modo que pequeñas perturbaciones en estos mecanismos pueden dar lugar a alteraciones genéticas y enfermedades humanas. En este sentido, el cáncer es un ejemplo típico de proceso complejo de des-regulación de la

75 CAPÍTULO 5: EL GENOMA HUMANO EN ACCIÓN 67 diferenciación celular, en el que se observan importantes alteraciones epigenéticas y una fuerte desorganización de la estructura nuclear.

76 68 GENÉTICA HUMANA

77 CAPÍTULO 6: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 69 CAPÍTULO 6: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS Variación en el ADN: polimorfismos y mutaciones. Mecanismos de reparación del ADN en humanos. Enfermedades causadas por alteraciones en los mecanismos de reparación. Variación en el ADN: polimorfismos y mutaciones La variación observable en los individuos se debe en gran medida a la variación genética, sobre la que se añade la variación producida por la influencia del ambiente. La variación genética se debe a la presencia de cambios genéticos heredables (de una célula a sus células hijas), que además son transmitidos a la siguiente generación si afectan a la línea germinal (pero no son transmitidos si solamente afectan a células somáticas). Como es sabido, un gen localizado en un locus puede presentarse en formas diferentes debidas a variaciones en la secuencia. Cada forma alternativa se denomina alelo, y el porcentaje de individuos de la población general que presenta cada alelo se denomina frecuencia alélica. Cuando un locus se presenta, al menos, en dos formas alélicas y la frecuencia alélica del alelo más raro es del 1% o mayor, ese locus se llama locus polimórfico, y esa variación se denomina polimorfismo. La variación interindividual garantiza la adaptación de una especie a condiciones ambientales cambiantes, a expensas de producir algunos individuos con mutaciones más graves, que desencadenan una enfermedad. En humanos, la variación entre individuos se genera principalmente durante el proceso de reproducción sexual (por recombinación meiótica). Además, durante la vida de un individuo se van introduciendo muchas nuevas mutaciones en el genoma de sus células, aunque sólo un pequeño porcentaje de estos cambios afectan a las células germinales y quedan fijados en el genoma de la especie. La tasa de nuevas mutaciones es resultado del equilibrio entre mutación y reparación de las mutaciones. En efecto, en cada división celular se incorporan 6x10 9 nucleótidos, y se estima que se producen unas divisiones celulares durante la vida media de un individuo: por tanto, un sistema sin errores debería tener una exactitud de 6x10 26, lo que es virtualmente imposible. De hecho, se sabe que la ADN polimerasa produce un error cada 10 4 nucleótidos incorporados, aunque está dotada de un sistema de edición que mejora esta tasa hasta Además, los sistemas de detección y reparación de errores consiguen que, al final, la replicación del ADN celular sólo origine un error cada nucleótidos. De hecho, se estima que en una célula somática aparecen unas 10-7 mutaciones por gen por división, es decir, 1 mutación por cada 300 divisiones celulares (asumiendo un total de genes). Esta es una tasa extremadamente baja (insuficiente para explicar todas las mutaciones que se producen en cáncer, por ejemplo), lo que implica la existencia de sistemas celulares de reparación del ADN que se ocupan de reparar la inmensa mayoría de las mutaciones introducidas en el genoma, contribuyendo a mantener una fidelidad alta. Además, muchas de estas mutaciones serán silenciosas porque no afectan a ADN codificante; otras, las más dañinas, sufrirán una fuerte presión selectiva y su frecuencia alélica será muy baja. Como se ve, la presencia de polimorfismos y mutaciones en las poblaciones humanas es resultado del juego entre mutación-reparación-selección. Mecanismos de reparación del ADN en humanos. Enfermedades causadas por alteraciones en los mecanismos de reparación A. Reparación de desemparejamientos entre nucleótidos normales.

78 70 GENÉTICA HUMANA Los mecanismos de reparación mencionados actúan reparando tipos específicos de daño al ADN. Los desemparejamientos entre bases normales pueden originarse por la tautomería de las bases (la forma imina de Citosina empareja con Adenina, o la forma enólica de Timina empareja con Guanina), por desaminación de citosinas metiladas (las citosinas metiladas de los dinucleótidos CpG se desaminan a Timina), y principalmente por los errores de la ADN polimerasa durante la replicación del ADN. También se producen desemparejamientos durante la formación de heteroduplexes en los procesos de recombinación. Además, el deslizamiento de la cadena nueva sobre la cadena molde durante la replicación también puede producir bucles de inserción/deleción (IDLs=bucles de inserción/deleción). Todos estos tipos de desemparejamiento se corrigen por el sistema MMR (mismatch repair), cuyos componentes conocidos en humanos son hmlh1, hmsh2, hmsh3, hmsh6, hpms1, hmlh3 y hpms2 (homólogos de MutS y MutL de E. coli). Estas subunidades actúan como heterodímeros hmsh2/hmsh6, que reconocen tanto los bucles (loops) de inserciones/deleciones de 1 a 8 nucleótidos como los desemparejamientos simples de una base; o bien actúan como heterodímeros hmsh2/hmsh3, que reconoce sólo bucles. Cada uno de estos dímeros, a su vez, actúa junto con los homólogos de MutL, que son hmlh1/hpms2 y hmlh1/hpms1 (recientemente se ha descrito también hmlh1/hmlh3). En concreto, los heterodímeros hmsh2/hmsh6 junto con hmlh1/hpms2 reparan los desemparejamientos simples, mientras que cualquiera de los dos complejos (hmsh2/hmsh3 ó hmsh2/hmsh6) en combinación con hmlh1/hpms2 son capaces de reparar stem-loops (tallo-bucle) producidos por IDLs, como se muestra en la figura. La Figura 6.1 muestra algunos ejemplos de desemparejamientos entre nucleótidos normales y el funcionamiento del sistema de reparación de desemparejamientos MMR. En E. coli, este sistema actúa uniéndose al desemparejamiento y a una base metilada adyacente, corta la cadena no metilada (recién sintetizada) hasta una distancia de 1-2 kb del mismatch, una endonucleasa corta los nucleótidos contenidos en el asa, y la polimerasa rellena el hueco. En mamíferos el mecanismo no está todavía totalmente explicado, pero se ha encontrado una proteína (MBD4 ó MED1) que se une a metilcitosinas, tiene actividad N-glicosilasa y forma complejos con MLH1, además de modular el sistema de MMR. Cuando hay defectos en este proceso de reparación aparecen errores durante la replicación del ADN, errores que se pueden ver al analizar secuencias repetidas cortas tipo Microsatélite. Por tanto, los defectos en el sistema de reparación de desemparejamientos dan lugar al fenómeno conocido como Inestabilidad de Microsatélites (MIN= Microstallite INstability) o "fenotipo mutador". Se conocen algunas enfermedades debidas a mutaciones en componentes de estos sistemas de reparación. Por ejemplo, 90% de los pacientes con cáncer colo-rectal no-polipósico hereditario (HNPCC ó Síndrome de Lynch) tienen mutaciones en uno de los genes hmsh2, hmlh1, hpms1, hpms2 o hmsh6, de forma los individuos que han heredado una mutación en uno de los alelos tienen una alta probabilidad de sufrir una segunda mutación en el otro alelo en alguna de sus células somáticas, por lo que el riesgo global de desarrollar este tipo de cáncer es del 80-85% (o del 75% a los 55 años) en estos sujetos. Estos tumores muestran inestabilidad de microsatélites, pero además la inestabilidad también afecta a genes que tienen repeticiones en sus secuencias codificantes (BAX, TGFBRII). Son las mutaciones en estos genes las que a menudo llevan al desarrollo de neoplasias. Curiosamente, los pacientes homocigotos para mutaciones en MLH1 (dos mutaciones en la línea germinal) desarrollan en la infancia neoplasias hematológicas además de otros tumores (neurofibromatosis, meduloblastoma), lo que sugiere la existencia de genes implicados en la hematopoyesis y en el control del crecimiento celular que son dianas del sistema MMR. B. Reparación de nucleótidos dañados.

79 CAPÍTULO 6: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 71 Otros sistemas detectan la presencia de bases anormales tales como, por ejemplo, los uracilos que aparecen por la des-aminación de una citosina. En general, estas modificaciones están debidas a la acción de mutágenos (benzopirenos del tabaco, agentes alquilantes, diversos agentes químicos de la dieta, el daño causado por especies reactivas de oxígeno, así como las alteraciones debidas a la radiación ultravioleta. Los procesos químicos que con mayor frecuencia provocan mutaciones son 1) las oxidaciones por radicales libres, especialmente la formación de 8-oxoguanina, que se empareja con T en vez de C (se calcula que se forman unas al día en cada célula) y 2) las reacciones hidrolíticas, ya que la molécula de ADN sufre una hidrólisis espontánea lenta que hace que se pierdan unas purinas al día en un genoma humano, con la consiguiente creación de otros tantos sitios apurínicos. También la radiación UV produce sitios apurínicos, pero sobre todo provoca dímeros de pirimidinas. La Figura 6.2 muestra la estructura de algunos nucleótidos anormales y la formación de lesiones por acción de la luz ultravioleta. En general, todas estas lesiones son graves, ya que impiden la replicación correcta del ADN y, a la larga, llevan a la muerte celular. Podemos generalizar diciendo que las lesiones del ADN producidas por la presencia de nucleótidos anormales se corrigen por cuatro mecanismos: reversión directa, BER (Base Excision Repair), NER (Nucleotide Excision Repair) ó por polimerasas capaces de pasar por encima de la lesión. Figura 6.3 Visión general de los mecanismos de reparación de lesiones que incluyen nucleótidos dañados. A continuación se ve con más detalle cada uno de estos mecanismos: 1. Al contrario que otras especies, la reversión directa por enzimas fotoreactivadoras no existe en humanos. Nuestro único recurso en este sentido consiste en un enzima llamado MGMT (metil-guanina metil-transferasa), que puede eliminar el metilo introducido por agentes alquilantes en la guanina (el cual daría lugar a transiciones G A, pues la O 6 -metilguanina se empareja con Timina). 2. La reparación por escisión de bases (BER) elimina las bases que han sufrido ataques hidrolíticos (desaminación, por ejemplo) por ROS o la 8-oxo-guanina producida por el tabaco. El paso crítico en este tipo de reparación es la rotura del enlace N-glicosídico que une la base al esqueleto desoxi-ribosa-fosfato, catalizado por ADN glicosilasas (específicas para determinados tipos de lesión: UDG, OGG, etc). Posteriormente, el sitio AP (apurínico ó apirimidínico) es roto por una AP endonucleasa que cataliza la incisión del enlace fosfodiester en posición 5 al sitio AP. La escisión del azúcar se completa con la eliminación del residuo desoxi-ribosa-fosfato por la acción de una desoxi-ribosa-fosfodiesterasa que corta el otro enlace fosfodiéster. Finalmente, se rellena el hueco mediante la acción de ADN pol y una ADN ligasa. Este mecanismo de reparación parece necesario para la viabilidad, ya que el ratón knock-out para ADN pol es letal embrionario. Un proceso paralelo es crucial en la diversificación de los genes de las inmunoglobulinas, ya que los linfocitos B expresan un enzima llamado AID (Activation-Induced Deaminase) que desamina citosinas y las convierte en uracilos; dichos uracilos crean sitios AP que pueden ser procesados por un complejo llamado RAD50 (que veremos más adelante) que tienen una actividad liasa que rompe el esqueleto desoxi-ribosa-fosfato y rompe el ADN. Dichas roturas son necesarias para que los genes de la inmunoglobulinas se reordenen y puedan dar lugar a la diversidad necesaria para una adecuada respuesta inmune.

80 72 GENÉTICA HUMANA El video de la Figura 6.4 muestra el funcionamiento del sistema de reparación por escisión de bases (BER). 3. La reparación por escisión de nucleótidos (NER) elimina fotoproductos producidos por UV y otros aductos que confieren estructuras anormales a la cadena de ADN. El mecanismo de actuación de este sistema de reparación no está totalmente claro, pero se sabe que requiere la formación de un complejo entre XPC (proteína que es esencial para NER) y RPA (proteína de unión a ADN monocatenario) con la región lesionada. Sobre este foco también se unen XPA y el complejo TFIIH (que contiene, entre otras, las proteínas XPB (ERCC3) y XPD (ERCC2), ambas con actividad helicasa necesaria para llevar a cabo NER). El paso clave es la creación de dos incisiones, flanqueando la lesión, en la cadena de ADN que está dañada: una incisión tiene lugar 3 a 9 bases en dirección 3 de la lesión y la otra incisión se produce 16 a 25 bases en dirección 5 de la lesión, comprendiendo unas bases en total. En mamíferos, la incisión 3 la lleva a cabo una nucleasa llamada XPG, y la incisión 5 la realiza el heterodímero XPF/ERCC1. Tras las incisiones y eliminación de la región dañada, tiene lugar la resíntesis de esa región mediante la acción de un holoenzima que contiene PCNA y DNApol o. La Figura 6.5 incluye un video que muestra esquemáticamente el funcionamiento del sistema de reparación por escisión de nucleótidos (NER). Un aspecto especialmente interesante es la relación del NER con la transcripción, a través de la presencia de XPB y XPD en TFIIH (que es uno de los factores de transcripción generales), dando lugar al concepto de Reparación acoplada a la transcripción (TCR=Transcription-Coupled Repair). De hecho, se ha comprobado que el daño por UV se repara con más eficacia y más rápido en la cadena que se transcribe y en genes transcripcionalmente activos. También se ha visto que ciertos tipos de daño oxidativo puede repararse por TCR incluso cuando el NER no funciona. Además de los citados XPB y XPD, otras dos proteínas con actividad helicasa (CSA y CSB) son responsables de TCR, y también se ha implicado a hmlh1 en TCR. Las mutaciones que destruyen el sistema TCR dan lugar a una enfermedad llamada Síndrome de Cockayne. Las mutaciones en genes que codifican otras proteínas asociadas con NER dan lugar a varias enfermedades (Xeroderma pigmentosum, Tricotiodistrofia), que en su conjunto cursan con fotosensibilidad e inestabilidad cromosómica, y aumento del riesgo de aparicion de melanoma (un tipo de cáncer de piel). Finalmente, algunos pacientes tienen una variante de Xeroderma Pigmentosum sin defectos en NER (llamada XP variante, ó XP-V), que está debida a mutaciones en el gen humano homólogo del gen RAD30 de levadura. Este gen codifica la polimerasa eta (Pol ), que puede replicar el ADN correctamente incluso en la presencia de dímeros de pirimidinas. 4. Respecto al último mecanismo de reparación de nucleótidos dañados (es decir, las polimerasas capaces de "saltarse" la lesión), recientemente se ha visto que Pol (polimerasa zeta) ó Pol (polimerasa eta) son capaces de sintetizar ADN frente a dímeros TT. Sin embargo, así como Pol suele introducir dos Adeninas, Pol introduce bases incorrectas y por tanto es un mecanismo de reparación de baja fidelidad. C. Reparación de roturas de la doble hebra del ADN. La creación de roturas bicatenarias del ADN (DSB=Double-Strand Breaks) es un paso necesario para la recombinación homóloga en meiosis y mitosis, y para la reordenación V(D)J de genes de las inmunoglobulinas y receptores de células T. Además, este tipo de roturas aparecen durante la replicación del ADN y también son causadas por diferentes agentes genotóxicos: radiación ionizante (rayos X), ROS originados por el metabolismo celular. Los DSB se reparan por dos vías principales, en diferentes fases del ciclo celular: Fusión no homóloga de extremos (NHEJ), que funciona sobre todo en G1/S (antes de la

81 CAPÍTULO 6: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 73 replicación del ADN) y Recombinación homóloga (HR), que teóricamente actuaría en S/G2, cuando ya hay dos cromátides hermanas (de manera que se utiliza la doble hebra homóloga como molde para la reparación). La Figura 6.6 muestra las posibilidades de respuesta celular a la aparición de roturas bicatenarias en el ADN (DSB) y sus efectos. 1. Recombinación Homóloga: como ya hemos comentado en el Capítulo 2, la maquinaria responsable del mecanismo molecular de recombinación meiótica se utiliza también para reparar DSB a partir de una cromátide hermana. El mecanismo general es bien conocido, e incluye el procesamiento de los extremos mediante una exonucleasa 5 3 para dejar extensiones 3 libres, invasión de la doble hebra homóloga por parte del filamento de ADN monocatenario recubierto de proteínas, síntesis de nuevo ADN usando la cadena homóloga como molde, ligación y resolución de la recombinación. Da lugar a conversión génica con ó sin sobrecruzamiento, según sea la resolución de las estructuras de Holliday). RAD51 (homólogo del gen RecA, que en E. coli es fundamental en la respuesta SOS) forma filamentos sobre el extremo monocatenario de ADN que resulta de la digestión de los extremos libres, y es necesario para que se pueda realizar la invasión de la cadena libre a la doble cadena homóloga. RAD51 es indetectable en G1 y se expresa en S/G2. Los ratones RAD51 -/- son letales embrionarios y sus células muestran inestabilidad cromosómica. Una línea celular de pollo, en la que RAD51 está bajo el control de un promotor represible, muestra inestabilidad cromosómica y muerte celular cuando se reprime la expresión de RAD51, lo que refuerza la necesidad de este gen para la viabilidad celular. Hay otros genes implicados en reparación de DSB que tienen cierta homología con RAD51 y que podrían modular la acción de éste. Por ejemplo, se ha visto que la ausencia del gen XRCC2 (20% de homología con Rad51) disminuye la eficacia de la recombinación homóloga en la reparación de DSB, pero no es letal; lo mismo podría suceder con RAD55 o RAD57. Por otra parte, se ha comprobado en levadura que la proteína RPA altera la eficacia con la que se forman los filamentos de RAD51. RAD52 parece actuar como el portero del mecanismo de recombinación homóloga. Esta proteína interacciona con RPA y con RAD51, favoreciendo la formación del filamento de RAD51 en presencia de RPA. Como el ratón RAD52 -/- no es letal (sólo se observa una ligara disminución en la eficacia de recombinación homóloga), se postula la existencia de genes homólogos de RAD52 complementen la ausencia de éste. La expresión del complejo RAD50 no varía durante el ciclo celular, por lo que debe regularse posttraduccionalmente (mediante fosforilación o por compartimentalización en el núcleo). Este complejo tiene actividad 5 3 exonucleasa, y parece transducir señales de daño de ADN hacia la parada del ciclo celular. Experimentos de irradiación en bandas han mostrado, mediante anticuerpos monoclonales contra un componente de este complejo, que RAD50 se asocia a los DSB muy pronto tras la irradiación. En humanos, los pacientes con el llamado "Síndrome de Roturas de Nimega" tienen mutaciones en un componente de este complejo llamado NBS1, muestran sensibilidad a radiación ionizante e inestabilidad cromosómica, y las células de estos pacientes no son capaces de formar focos después de la irradiación con rayos X ultrablandos; por tanto, lo más probable es que la proteína NBS1 sea responsable de dirigir el complejo RAD50 a los lugares de daño del ADN. Una observación muy interesante es la implicación de BRCA1 y BRCA2 (genes mutados en ciertos tipos de cáncer de mama familiar) con la reparación de DSB, ya que se ha visto que las proteínas codificadas por estos genes interaccionan con RAD51, bien directamente (BRCA2) o de manera indirecta (BRCA1). ambas son proteínas nucleares que se expresan en S/G2, funcionan como activadores transcripcionales, y los

82 74 GENÉTICA HUMANA ratones knock out de ambas son letales embrionarios. En cambio, un ratón que lleva una copia de BRCA2 truncada (BRCA2 tr/tr ) sufre linfomas del timo, alta inestabilidad cromosómica y estimulación de la vía de señalización de p53. BRCA1 se fosforila tras daño al ADN, y se ha descrito la asociación de BRCA1 con el complejo RAD50 en el momento del ciclo celular en que BRCA1 está fosforilado (S/G2). Por otra parte, en estudios de colocalización tras irradiación similares a los descritos arriba, se ha visto que BRCA1 está presente en focos nucleares que contienen RAD50 en unas células o en focos que contienen RAD51 en otras células, pero no hay células en las que se asocie con ambos a la vez. Una hipótesis atractiva es que durante la reparación de DSB por recombinación homóloga BRCA1 coopera con RAD50 en el procesamiento de los extremos del ADN dañado y que, mediante la interacción entre BRCA1 y BRCA2 (que se asocia físicamente a RAD51), facilita el acoplamiento con los procesos de recombinación mediados por RAD51. La Figura 6.7 ilustra la presencia de focos de reparación en células que han sido previamente irradiadas para generar roturas bicatenarias (DSB) en el ADN. 2. Fusión no homóloga de extremos (NHEJ): El proceso general de reparación es similar pero sin recombinación, ya que en este caso no existe una doble cadena homóloga: simplemente se fusionan los extremos libres. Tras la generación del DSB, los extremos libres también son procesados por una nucleasa; posteriormente se procede a la unión de los mismos y a la ligación, perdiéndose siempre algunas bases en la región de unión. Este mecanismo tiene lugar fisiológicamente en linfocitos, donde es responsable de la reordenación de segmentos V(D)J de los genes de inmunoglobulinas. Un componente principal de este sistema es el complejo ADN-PK (DNAPK), una serina/treonina kinasa nuclear que consta de una subunidad catalítica (DNAPKcs) y de un heterodímero de unión a ADN llamado KU (que a su vez se compone de KU70 y KU80). El complejo ADN-PK se asocia a los extremos rotos, ayuda al alineamiento de los extremos y facilita su ligación. Este sistema de reparación es importante, sobre todo en células del sistema inmune, y de hecho las mutaciones en el gen que codifica la DNAPKcs provocan la enfermedad llamada Inmunodeficiencia Combinada Severa (SCID). Además, el complejo ADN-PK fosforila y activa una nucleasa llamada Artemis, que es la responsable de llevar a cabo el procesamiento de los extremos libres para que se puedan religar. Este último paso, la unión de los extremos ya procesados, es realizado por una ligasa (ADN ligasa IV) que actúa junto con XRCC4, una fosfoproteina nuclear que también es sustrato de ADN-PK in vitro. El video de la Figura 6.8 muestra, paso a paso, el funcionamiento del sistema de reparación por fusión de extremos (NHEJ). Es muy interesante la asociación que se ha encontrado en levaduras entre Ku70 y proteínas silenciadoras de la transcripción de telómeros (Sir2, Sir3 y Sir4), sugiriendo la posibilidad de que Ku reclute proteínas Sir a los DSB para inducir un estado de cromatina condensada que evite la transcripción o replicación y facilite el proceso de reparación, o bien evite que los extremos libres de ADN puedan interaccionar con otras moléculas de ADN. Dado que la disrupción de Ku o del complejo RAD50 lleva al acortamiento de telómeros en levaduras, es lógico pensar que Ku se una al ADN telomérico e interaccione con Sir4 para inhibir la replicación a ese nivel. Tradicionalmente se ha considerado que el principal mecanismo de reparación de DSB en mamíferos es la fusión de extremos (NHEJ), ya que se ha visto que la frecuencia de recombinación homóloga en mitosis es

83 CAPÍTULO 6: ORIGEN DE LA VARIACIÓN GENÉTICA EN HUMANOS 75 muy baja. Esto es lo contrario de lo que sucede en levaduras, donde el principal mecanismo de reparación de DSBs es la recombinación homóloga. Actualmente, en cambio, esto está en discusión. Por un lado, parece que la recombinación mitótica en mamíferos es más alta de lo que se creía: del orden de 10-4 a 10-5 ; por otro lado, los ratones incapaces de llevar a cabo NHEJ (DNAPK -/-) no son letales, mientras que los ratones incapaces de recombinación homóloga (RAD51-/- ó los RAD54-/-) sí son letales. Esto indica que HR puede de alguna forma complementar la ausencia de NHEJ, pero en cambio NHEJ no puede complementar la ausencia de HR en células somáticas. D. Mecanismos de reparación presentes en mitocondrias. Un tema reciente en patología genética humana es la alteración de los mecanismos de reparación del ADN mitocondrial. Tradicionalmente se ha considerado que las mitocondrias de mamíferos no son capaces de llevar a cabo ningún tipo de reparación, ya que los dímeros de pirimidinas no son reparados con eficacia. Esto explicaría además la mayor tasa de mutaciones del ADN mitocondrial (ADNmt) respecto al ADN nuclear. Hoy se sabe que hay ciertos tipos de daño que sí pueden repararse en mitocondrias (por ejemplo, los sitios AP originados por daño oxidativo) y en general parece que las mitocondrias de organismos superiores son capaces de llevar a cabo BER pero no NER ni MMR. El tipo de daño que puede repararse mediante BER va a estar limitado por la presencia de ADN glicosilasas en la mitocondria, y hasta el momento se ha demostrado la presencia de uracil-adn-glicosilasa (UDG) y de 8-oxo-guanina-glicosilasa (OGG). Además, otras glicosilasas tienen señales de localización mitocondrial en sus extremos N-terminal. Una diferencia del BER que se lleva a cabo en mitocondrias con el BER nuclear es que la polimerasa presente en mitocondrias es la ADN pol, que además posee actividad liasa (fosfodiesterasa). También existe dentro de la mitocondria una actividad ADN ligasa, que al parecer se origina a partir del gen de la ADN ligasa III por un codón de iniciación alternativo que crea una señal de localización mitocondrial.

84 76 GENÉTICA HUMANA C. LA TRANSMISIÓN DE LOS CARACTERES HEREDITARIOS Esta Sección incluye 6 temas en los que se tratan los aspectos fundamentales del mendelismo y sus principales excepciones, dando paso al estudio del ligamiento genético, la genética de caracteres cuantitativos y de las enfermedades multifactoriales, así como unas nociones de genética de poblaciones y evolución. Capítulo 7. Genética mendeliana. Planteamiento experimental de Mendel. Monohibridismo: primera ley de Mendel. Cruzamiento de prueba. Dihibridismo: segunda ley de Mendel. Redescubrimiento del trabajo de Mendel. Teoría cromosómica de la herencia. A finales del siglo XIX, las observaciones de Gregor Mendel sentaron las bases biológicas de la herencia, dando lugar a lo que hoy conocemos como Genética. Es muy importante estudiar el desarrollo histórico de las ideas en torno a la herencia, para poner en el contexto adecuado las ideas propuestas por Mendel y comprender la gran novedad que supusieron en su momento. Ya los antiguos habían observado que muchos caracteres pasan de padres a hijos, y se habían preguntado cómo podría ser esto. Hipócrates fue el primero en elaborar una teoría, llamada pangénesis, según la cual cada parte del cuerpo produce algún tipo de partícula que es recogida en lo que él denominó semen (hoy diríamos gametos) y transmitida a la descendencia. La pangénesis fue criticada por Aristóteles, que la desechó por varias razones. En primer lugar, constató que en ocasiones unos individuos tienen rasgos más parecidos a abuelos o ancestros remotos que a sus padres, lo que no encaja bien con el hecho de que la herencia se transmita únicamente de padres a hijos. Además, también observó que a veces se transmiten caracteres que aún no se poseen en el momento de tener descendencia (como la tendencia a tener canas o la calvicie, por ejemplo). Por otro lado, apuntó el hecho fácilmente comprobable de que las mutilaciones en animales y plantas no se heredan. Esto es algo fundamental, porque Aristóteles admitía como hecho cierto la herencia de los caracteres adquiridos, algo universalmente aceptado hasta muchos siglos después. Como la pangénesis no podía explicar estas discrepancias, el Filósofo propuso que lo que se hereda no son los rasgos en sí mismos, sino la potencialidad de producirlos. Hoy en día esto nos parece un concepto evidente, y se asemeja extraordinariamente a la idea de gen que actualmente tenemos, pero en su tiempo fue una propuesta revolucionaria a la que no se le dio toda la importancia que requería. No hay que olvidar que algunas nociones básicas como la existencia de gametos, la meiosis o la reproducción sexual eran totalmente desconocidas, por lo que era difícil formular teorías que explicasen la transmisión de caracteres a lo largo de generaciones sucesivas. Mendel no podría haber explicado sus resultados sin comprender un concepto básico que hoy expresaríamos diciendo que, tanto en animales como en plantas, un gameto masculino y un gameto femenino se unen para formar un cigoto. En este sentido, un avance fundamental fue la demostración de que las plantas superiores tienen reproducción sexual, siendo el polen el elemento masculino. Fue un botánico llamado Kölreuter, un siglo antes de Mendel, el que elaboró y sistematizó el trabajo sobre híbridos en plantas: modos de polinización, la obtención de híbridos con caracteres intermedios entre los progenitores (aunque un

85 CAPÍTULO 7: GENÉTICA MENDELIANA 77 pequeño porcentaje de la descendencia expresa un rasgo que sólo se encuentra en uno de los progenitores), etc. Además, pocos años antes de Mendel ya se había propuesto la idea de que un solo grano de polen es suficiente para fecundar una planta, aunque este concepto todavía sería objeto de debate durante algún tiempo. En 1859, Charles Darwin publica El Origen de las especies, proponiendo la evolución de las especies mediante un proceso de selección natural. Sin embargo, Darwin no pudo proponer una explicación biológica coherente porque no conocía las bases biológicas de la variación y de la herencia. Darwin aceptaba la pangénesis porque era la teoría que mejor explicaba la herencia de caracteres adquiridos (lo cual le ayudaba a explicar la selección natural) y llamó gémulas a las partículas somáticas que un individuo transmite a su descendencia. En su libro The Variation in Animals and Plants under Domestication, de 1868, Darwin recoge las ideas más prevalentes en ese momento, y reconoce la existencia de dos tipos de variación: variación continua (caracteres cuantitativos) y variación discontinua (caracteres cualitativos). Sin embargo, consideraba que esta última era relativamente rara y no tenía tanta importancia como la variación continua, que podía modificarse mediante selección y por tanto era más útil para explicar el concepto de selección natural. Aunque parece que Darwin llegó a recibir una copia de los trabajos de Mendel publicados 2 años antes, nunca llegó a leerlos y por tanto no pudo comprender la importancia de la variación discontinua. Planteamiento experimental de Mendel Gregor Mendel nació el 22 de julio de 1822 en Heinzendorf. Hijo de labradores, se hizo sacerdote agustino en En 1850 suspendió el examen que le permitiría enseñar ciencias naturales, por lo que se marchó a Viena a estudiar física, química, zoología y botánica durante dos años. En 1853 se traslada al monasterio de los agustinos en Brno (en lo que hoy es la república Checa) y allí comienza a hacer sus experimentos con plantas. En 1865 presenta sus resultados y conclusiones en la reunión de la Sociedad de Historia Natural de Brno, que son publicados un año después en las Actas de dicha Sociedad en un artículo que lleva el título de Versuche über Pflanzenhybriden (Experimentos sobre Híbridos de Plantas). En 1868 fue nombrado abad del monasterio, por lo que desde entonces no pudo dedicar tanto tiempo a sus experimentos. Murió el 6 de enero de 1884 a causa de una glomerulonefritis. Fruto de sus observaciones trabajando con híbridos de plantas, Mendel llegó al convencimiento de que el único modo de comprender las bases biológicas de la transmisión de caracteres hereditarios era mediante el estudio de variaciones discontinuas, es decir, aquellos caracteres que se presentan únicamente en dos formas alternativas. Como explica en su artículo, considera que es necesario: 1) determinar con exactitud el número de las diferentes formas que aparecen en la descendencia de los híbridos; 2) agrupar estas formas por separado en las distintas generaciones; 3) describir sus relaciones matemáticas exactas. Por ejemplo, en el artículo original de 1866 dice...entre los numerosos experimentos hechos hasta el momento, ninguno ha sido realizado de manera que sea posible determinar el número de las diferentes formas en que aparecen los descendientes de híbridos, o agrupar estas formas con certeza según generaciones separadas, o determinar exactamente sus relaciones estadísticas Gracias a esta aproximación metodológica, que le supuso analizar unas plantas, Mendel pudo observar que las proporciones obtenidas en la descendencia de las distintas clases de híbridos se mantenían y se repetían para varios caracteres distintos. Esto le permitió elaborar una teoría que explicase cómo podrían darse esas proporciones y llevar a cabo experimentos concretos que validasen las predicciones formuladas por dicha teoría. Veamos con más detalle la manera en que desarrolló sus experimentos.

86 78 GENÉTICA HUMANA Monohíbridos: primera Ley de Mendel Mendel escogió la planta del guisante Pisum sativum (aunque había cultivado y estudiado también otras especies) porque es fácilmente cultivable, tiene un ciclo corto y los cruzamientos son fáciles de controlar. Seleccionó 7 caracteres que mostraban variación claramente discontinua, es decir, representados cada uno por dos formas alternativas en líneas puras. Estas líneas puras eran el resultado de autofecundar plantas durante varias generaciones, hasta conseguir que esos caracteres se mantuviesen constantes. Los 7 caracteres fueron: Guisantes rugosos/lisos Guisantes amarillos/verdes Vainas en posición axial/terminal Vainas hinchadas/arrugadas Vainas verdes/amarillas Flores violetas/blancas (o la envuelta de la semilla gris/blanca, respectivamente) Tallo de la planta alto/enano La Figura 7.1 contiene enlaces a recursos educativos que ilustran los conceptos básicos del mendelismo. En primer lugar, Mendel llevó a cabo cruces monohíbridos, es decir, para cada uno de los siete caracteres por separado cruzó plantas que se comportaban como variedades puras. Observó que sólo una de las dos formas alternativas estaba presente en el 100% de la F1 (la primera generación filial), mientras que la otra forma había desaparecido. Curiosamente, al autofecundar individuos de la F1, observó que esa forma desaparecida volvía a aparecer en la F2. Lo más importante, y esta fue la aportación más novedosa de Mendel, estableció las proporciones en que se daba cada una de las formas en cada generación (en la F1 y en la F2). Por ejemplo, al analizar la forma del guisante, cruzó la variedad pura que producía guisantes rugosos con la variedad pura que producía guisantes lisos. En la F1 todas las plantas producían guisantes lisos, pero al autofecundar estas plantas de la F1 observó que en la F2 resultante había guisantes lisos y guisantes rugosos, lo que supone una relación de 2,96:1 lisos frente a rugosos. Al repetir esto para los siete caracteres, observó que se repetía el mismo fenómeno, siendo las proporciones obtenidas muy parecidas y siempre en torno a una relación 3:1, por lo que Mendel concluyó que se trataba de un fenómeno general que debía tener una explicación coherente. Mendel razonó que estos datos numéricos podrían explicarse suponiendo que cada carácter está controlado por un factor que puede presentarse en dos formas alternativas. Por ejemplo, habría un factor responsable de la forma del guisante, con una forma que produce guisantes lisos y otra forma que produce guisantes rugosos. Además, cada planta debería tener dos copias de ese factor, que podrían ser idénticas o distintas (por ejemplo, podría haber plantas con dos copias de la forma que produce plantas rugosas, o con una copia de cada forma). En las variedades puras iniciales, cada planta tendría dos copias idénticas: las plantas con guisantes lisos tendrían dos copias de la forma que produce guisantes lisos, las plantas con guisantes rugosos tendrían dos copias de la forma que produce guisantes rugosos. Con estos presupuestos, si cada planta pasa a la descendencia sólo una de sus copias, todas las plantas de la F1 tendrían una copia de cada progenitor, por lo que todas tendrían una copia del factor que produce guisantes lisos y otra copia del factor que produce guisantes rugosos. Ahora bien, si uno de los factores domina sobre el otro, todas las plantas de esta generación serían iguales (por ejemplo, si el factor que produce guisantes lisos domina sobre el factor que produce guisantes rugosos, todos los guisantes de la F1 serían lisos, como de hecho sucedía). Así

87 CAPÍTULO 7: GENÉTICA MENDELIANA 79 pues, si estos factores se transmiten a la descendencia de forma totalmente aleatoria, la F2 resultante de autofecundar plantas de la F1 (que tienen dos copias distintas del factor), estaría compuesta por 25% de plantas con las dos copias idénticas e iguales a las de una de las variedades puras iniciales, 25% de plantas con dos copias idénticas iguales a las de la otra variedad pura inicial, y el 50% de plantas con dos copias distintas (como las plantas de la F1). Como una copia domina sobre la otra, realmente veríamos 75% de las plantas con la forma de una de las variedades inciales (la que estaba presente en la F1) y 25% de las plantas con la forma de la otra variedad inicial (la que había desaparecido en la F1). Es decir, veríamos una proporción 3:1 tal y como Mendel había encontrado experimentalmente. Como hemos visto, para que esta explicación sea coherente han de darse varias condiciones que se han marcado en negrita en el párrafo anterior. Estas condiciones constituyen los 3 principios que Mendel propuso que debían cumplirse para poder explicar las proporciones encontradas, y que a veces se agrupan en lo que se conoce como Primera Ley de Mendel: i) los factores que determinan la herencia se encuentran en dos formas alternativas y cada individuo lleva dos copias (idénticas o distintas), de las cuales sólo una se transmite a la descendencia; ii) cada una de esas dos copias tiene la misma probabilidad de pasar a la descendencia, es decir, se transmiten de modo totalmente aleatorio; iii) una de las formas de cada factor domina sobre la otra, de modo que cuando las dos copias son distintas, el carácter se manifiesta como si las dos copias fuesen iguales para la forma dominante. Lógicamente, en la nomenclatura moderna podemos expresar estos conceptos de un modo mucho más preciso, pero en la época de Mendel esta nomenclatura todavía no existía. Hoy podemos decir que los factores unitarios de los que hablaba Mendel son lo que llamamos genes; las formas distintas que puede presentar cada gen se llaman alelos (o formas alélicas); la transmisión de uno de los dos alelos a la descendencia se conoce como segregación; los distintos tipos de parejas que se pueden dar son los tres posibles genotipos (dos homocigotos y un heterocigoto). Por tanto, hoy diríamos que un carácter fenotípico está controlado por un gen que se presenta en dos formas alélicas alternativas, una dominante y otra recesiva. Las variedades puras iniciales son homocigotos para cada uno de los alelos, las plantas de la F1 son todas heterogicotos y sólo manifiestan el carácter determinado por el alelo dominante; las plantas de la F2 son 25% homocigotos dominantes, 50% heterocigotos y 25% homocigotos recesivos (es decir, hay una relación genotípica 1:2:1). Los homocigotos dominantes y los heterocigotos son fenotípicamente idénticos, por lo que encontraremos una relación fenotípica 3:1 en la F2. Para expresar esto de un modo más gráfico, hoy en día usamos una letra para indicar cada forma alélica y representamos los cruces de manera esquemática. Por ejemplo, podemos designar el alelo que produce guisante lisos como R y el alelo que produce guisantes rugosos como r, siendo R dominante sobre r. Las dos variedades puras iniciales serían homocigotos, RR en el caso de las que producen guisantes lisos y rr las que producen guisantes rugosos. El cruce inicial se puede representar como RR X rr. Si cada alelo segrega al azar, cada alelo R puede combinarse con un alelo r, pero en la descendencia (generación F1) todas las plantas tendrán genotipo Rr. Como R es dominante, su fenotipo será de guisantes lisos. Al cruzar plantas de la F1 entre sí, tendremos cruces del tipo Rr X Rr. Ahora tenemos cuatro posibles combinaciones de alelos en la descendencia (RR, Rr, rr y rr), cada una de ellas con la misma probabilidad de producirse. Es decir, en la F2 tendremos 25% de plantas con genotipos RR, 25% con genotipo Rr, 25% con genotipo rr y 25% con genotipo rr. Como los genotipos Rr y rr son iguales desde el punto de vista funcional (heterocigotos, da igual el orden), tendremos un 25% de homocigotos dominantes (RR), 50% de heterocigotos (Rr) y 25% de homocigotos recesivos (rr). Como R es dominante, los heterocigotos y los homocigotos RR son idénticos (todos producen guisantes lisos), y por tanto el 75% de las plantas producirán guisante lisos y el 25% rugosos. Es muy útil utilizar métodos gráficos para representar los cruzamientos, porque eso simplifica el cálculo de las proporciones genotípicas en la descendencia. El método más sencillo es quizás el de los cuadrados de Punnett (ideados por Reginald Punnett), que consisten en

88 80 GENÉTICA HUMANA representar los alelos de un progenitor en horizontal y los del otro progenitor en vertical, formando unas cuadrículas que se rellenan con los genotipos resultantes. Los enlaces de la Figura 7.2 ayudan a comprender gráficamente las proporciones genotípicas y fenotípicas del cruce monohíbrido. También se puede utilizar un método ramificado, tanto para calcular los genotipos como los fenotipos. Por ejemplo, en un cruce del tipo Rr X Rr estableceríamos la probabilidad de cada alelo de uno de los progenitores (½ R y ½ r, en este caso) y después, para cada uno de ellos, establecemos la probabilidad de cada alelo del otro progenitor. Al tratarse de sucesos independientes, las probabilidades se multiplican para calcular la probabilidad de cada genotipo en la descendencia. Así, en nuestro ejemplo, ½ R (del primer progenitor) puede combinarse por igual con cualquiera de los alelos del segundo progenitor (con ½ R ó con ½ r). Por tanto, podríamos representarlo esquemáticamente de modo ramificado: ½ R ½ R = ½ X ½ = ¼ RR ½ r = ½ X ½ = ¼ Rr ½ r ½ R = ½ X ½ = ¼ rr ½ v = ½ X ½ = ¼ rr Como Rr y rr son iguales, tenemos las proporciones genotípicas ¼ RR, ½ Rr y ¼ rr, o lo que es lo mismo 1:2:1. Impresiona bastante seguir el razonamiento de Mendel, cómo a partir de una simple proporción fenotípica deduce los principios generales que la explican. De todas formas, esto no era más que una hipótesis plausible, por lo que Mendel se propuso diseñar los experimentos que pudiesen confirmar las predicciones que se derivaban de su teoría. Para ello hizo dos tios de experimentos. Por un lado, llevó a cabo cruzamientos prueba, que es un tipo de retrocruzamiento (cruzar una planta con uno de sus progenitores). El cruzamiento prueba consiste en fecundar una planta de la F1 con el progenitor homocigoto recesivo, es decir, con la variedad pura cuyo fenotipo desaparecía en la F1. Si los postulados son ciertos, este cruzamiento entre un heterocigoto y un homocigoto recesivo debería dar descendencia con 50% de plantas heterocigotos y 50% homocigotos recesivos. Siguiendo con el ejemplo de la forma del guisante, si r es el alelo recesivo y R el dominante, tendríamos que todas las plantas de la F1 son Rr. Si hacemos el cruzamiento prueba con plantas rr, tendríamos un cruce Rr X rr en el que el 50% de la descendencia será Rr y el 50% será rr: es decir, la mitad de los guisantes serán lisos (R domina sobre r) y la mitad rugosos. La otra comprobación que hizo Mendel fue autofecundar plantas de la F2. Como hemos visto, 25% de éstas deberían ser RR (guisantes lisos), 50% Rr (también lisos) y 25% rr (rugosos). Al autofecundar plantas rugosas (rr), todos los guisantes resultantes deberían ser también rugosos. En cambio, de todas las plantas de la F2 con guisantes lisos un tercio deberían ser homocigotos y dos tercios heterocigotos. Por eso, al autofecundar plantas con guisantes lisos, un tercio de los cruces deberían ser RR X RR y dar descendencia con 100% de guisantes lisos en la F3; dos tercios de los cruces deberían ser del tipo Rr X Rr y dar descendencia en las proporciones fenotípicas 3:1 típicas de este cruce. Pues bien, en todos los casos Mendel encontró que las proporciones encontradas experimentalmente se ajustaban perfectamente a lo esperado, para todos los caracteres estudiados. Con esto, concluyó que los principios propuestos eran correctos y explicaban la transmisión hereditaria de la variación discontinua.

89 CAPÍTULO 7: GENÉTICA MENDELIANA 81 La Figura 7.3 ilustra las pruebas utilizadas para confirmar la validez de los postulados de la primera ley de Mendel. F 2 ALTAS ENANAS 50% Tt 25% TT 25% tt 3 : 1 autofecundación Tt X tt TT X tt tt X tt F 3 100% TT 50% Tt 25% TT 25% tt 3 : 1 100% tt Segunda Ley de Mendel: dihíbridos y trihíbridos No contento con lo que había encontrado al analizar de cada uno de los caracteres por separado, Mendel se preguntó qué sucedería al estudiarlos conjuntamente. En primer lugar llevó a cabo cruces dihíbridos, es decir, entre plantas que se comportaban como variedades puras para dos caracteres distintos a la vez. Por ejemplo, estudió el color y la forma del guisante, obteniendo plantas con guisantes amarillos y lisos simultáneamente, y plantas con guisantes verdes y rugosos. Estas plantas podían considerarse variedades puras para ambos caracteres, porque siempre se daban esas mismas combinaciones de forma y color. Al cruzar plantas de ambas variedades puras, Mendel observó que en la F1 todos los guisantes eran iguales: amarillos y lisos a la vez; es decir, manifestaban los dos caracteres dominantes. La autofecundación de estas plantas de la F1 dio como resultado una F2 con proporciones de 9/16 de dobles dominantes (amarillos/lisos), 3/16 para cada uno de las dos combinaciones de un dominante con un recesivo (3/16 amarillos/rugosos y 3/16 verdes/lisos) y 1/16 de dobles recesivos (verdes/rugosos). Al analizar estos resultados, Mendel se dio cuenta de que éste sería precisamente el resultado esperado si consideramos el cruce dihíbrido como dos cruces monohíbridos independientes. En estas circunstancias, cada planta de la F1 produciría cuatro posibles tipos de gametos: si denominamos R/r a los alelos liso/rugoso y V/v a los alelos amarillo/verde, las plantas de la F1 (con guisantes amarillos y lisos) serían heterocigotos para ambos caracteres con genotipo VvRr.

90 82 GENÉTICA HUMANA Por tanto, cada una de estas plantas puede transmitir cuatro posibles combinaciones alélicas: VR, Vr, vr y vr. De este modo, al cruzar dos plantas de la F1 tendríamos 16 posibles tipos de cruces: VR X VR Vr X VR vr X VR vr X VR VR X Vr Vr X Vr vr X Vr vr X Vr VR X vr Vr X vr vr X vr vr X vr VR X vr Vr X vr vr X vr vr X vr Podemos calcular fácilmente los genotipos resultantes de cada cruce usando cuadrados de Punnett ó con el método ramificado genotípico (VR X VR tendrá descendencia con genotipo VVRR, etc.). Como algunos cruces son idénticos (por ejemplo, los dos que están en negrita), podemos agrupar los genotipos resultantes y obtenemos 9 posibles genotipos distintos en la descendencia, en las siguientes proporciones: 1/16 VVRR, 2/16 VVRr, 2/16 VvRR, 4/16 VvRr, 1/16 VVrr, 2/16 Vvrr, 1/16 vvrr, 2/16 vvrr y 1/16 vvrr. Debido a la dominancia del liso y del amarillo, estos 9 genotipos dan lugar solamente a 4 fenotipos en las siguientes proporciones: 9/16 amarillos/lisos, 3/16 amarillos/rugosos, 3/16 verdes/lisos y 1/16 verdes/rugosos. Esto lo vemos muy bien usando el método ramificado fenotípico: si la probabilidad de amarillos:verdes en la F2 es de 3:1, observaremos ¾ amarillos y ¼ verdes. Ahora bien, si de cada uno de estos hay ¾ lisos y ¼ rugosos, al final las probabilidades de cada fenotipo se pueden calcular: ¾ amarillos ¾ lisos = 9/16 amarillos y lisos ¼ rugosos = 3/16 amarillos y rugosos ¼ verdes ¾ lisos = 3/16 verdes y lisos ¼ rugosos = 1/16 verdes y rugosos Pues bien, éstas fueron precisamente las proporciones que Mendel encontró al realizar estos cruces, la proporción fenotípica 9:3:3:1 de dobles dominantes : dominante/recesivo : recesivo/dominante : doble recesivo. Dado que sus resultados se ajustaban al modelo teórico, Mendel formuló su cuarto principio -- también conocido hoy como la Segunda Ley-- que establece que las parejas de factores segregan no sólo al azar, sino además de manera independiente para caracteres distintos. La Figura 7.4 contiene un enlace que ayuda a comprender los cruces dihíbridos. Mendel también quiso comprobar este postulado realizando cruzamientos prueba de las plantas de la F2 con el progenitor doble homocigoto recesivo. Por ejemplo, los 9/16 de plantas con guisantes amarillos y lisos de la F2 son el resultado de sumar todas las plantas con cuatro genotipos distintos: VVRR (1/16), VVRr (2/16), VvRR (2/16) y VvRr (4/16). Es decir, de todas las plantas de la F2 con guisantes amarillos y lisos, 1/9 serán VVRR, 2/9 serán VVRr, 2/9 serán VvRR y 4/9 serán VvRr. Cómo saber los genotipos de estas plantas? Al igual que en el monohibridismo, mediante los cruzamientos prueba de cada una de ellas con una variedad pura doble homocigota recesiva (vvrr). Mendel predijo cómo debería ser la descendencia resultante de cada uno de estos cruces. Por ejemplo, al cruzarse los dobles homocigotos dominantes de la F2 (VVRR) con una planta vvrr darán un 100% de descendencia de tipo doble heterocigoto VvRr y por tanto con fenotipo amarillo y liso. Las plantas con genotipo VVRr en la F2 darán, en cambio, dos tipos posible de gametos (VR y Vr), por lo que el cruce prueba VVRr X vvrr dará como resultado un 50% de plantas VvRr y un 50% de plantas Vvrr (o, lo que es lo mismo, 50% con guisantes amarillos y lisos y 50%

91 CAPÍTULO 7: GENÉTICA MENDELIANA 83 con guisantes amarillos y rugosos). Lo mismo puede hacerse para los otros dos cruzamientos prueba, los de plantas VvRR y VvRr y calcular las proporciones fenotípicas esperadas en la descendencia. Pues bien, cuando Mendel hizo todos estos cruces de prueba, comprobó que los resultados obtenidos coincidían con las predicciones de su modelo, por lo que concluyó que este cuarto postulado era también cierto. Mendel todavía fue más lejos y demostró que estos principios se cumplían también al cruzar plantas que se comportaban como variedades puras para tres factores a la vez (cruce trihíbrido). El cruce de una variedad pura triple dominante con otra triple recesiva dará como resultado 100% de triples heterocigotos en la F1 (todos manifiestan los tres fenotipos dominantes). Para calcular la descendencia resultante de la autofecundación de éstos, hay que tener en cuenta que cada planta producirá 8 tipos posibles de gametos. Por ejemplo, para tres genes A, B y C con alelos dominante (mayúscula) o recesivo (minúscula), cada triple heterocigoto (AaBbCc) dará lugar a gametos del tipo ABC, ABc, AbC, Abc, abc, abc, abc, ó abc. Si hacemos un cuadrado de Punnett para calcular los genotipos resultantes y sus proporciones, vemos que el cruce AaBbCc X AaBbCc origina 64 combinaciones diferentes. Usando el método ramificado genotípico ó fenotípico, vemos que todas estas posibles combinaciones se pueden agrupar en 27 genotipos distintos, que dan lugar a 8 fenotipos diferentes en proporciones 27:9:9:9:3:3:3:1. Una vez más, lo que Mendel encontró se correspondía exactamente con lo que debería suceder de acuerdo con sus postulados. La Figura 7.5 muestra el diagrama ramificado genotípico de un cruzamiento trihíbrido. Lógicamente, es fácil darse cuenta que la interpretación de los resultados aumenta notablemente al estudiar varios caracteres a la vez, ya que las posibles combinaciones de genotipos (y, por tanto, de fenotipos) son mayores. En cualquier caso, hay una regla sencilla para calcular el número de posibles gametos, genotipos y fenotipos que se pueden generar al estudiar cualquier número de genes simultáneamente. Si n es el número de caracteres distintos que estudiamos, cada uno de ellos controlado por un gen con dos alelos, el número de gametos posible será 2 n, el número de posibles genotipos es 3 n, y el número de posibles fenotipos es también 2 n. Así, para tres genes tendríamos 8 gametos posibles que originan 64 combinaciones agrupadas en 27 genotipos y 8 fenotipos distintos. Redescubrimiento del trabajo de Mendel Como hemos visto, Mendel comenzó sus experimentos en 1856, leyó los resultados en la reunión de la Sociedad de Historia Natural de Brno en 1865, y el trabajo fue publicado el año siguiente. En el período que transcurre entre 1866 y el 1900, la figura más influyente fue sin duda August Weismann, un discípulo de Darwin. En primer lugar, Weismann creía que la pangénesis no era correcta, y diseñó experimentos para probarlo. Por ejemplo, cortó la cola de ratones durante 22 generaciones sucesivas, comprobando que el tamaño de la cola no disminuía al nacer. Además, teniendo en cuenta los avances científicos de esos años, Weismann reconoció la existencia de células germinales, la importancia del núcleo y la existencia de cromosomas. Su gran contribución fue la elaboración de la teoría del germoplasma como material hereditario. Frente a la creencia en las gémulas de origen somático, Weismann propuso que la herencia se transmite únicamente a través de las células germinales y que las unidades hereditarias residen en los cromosomas. Lógicamente, esas ideas eran bastante teóricas y no tenían comprobación experimental, pero prepararon el camino para que a principios del siglo XX pudiesen comprenderse los trabajos de Mendel.

92 84 GENÉTICA HUMANA Se sabe que del artículo original de Mendel se imprimieron 40 copias, aunque sólo hay constancia de 3 que fueron enviadas a sus maestros y colegas. De todas formas, la Sociedad de Historia Natural de Brno enviaba sus Actas a unas 130 bibliotecas de toda Europa y América, por lo que sus hallazgos tuvieron una difusión adecuada. Sin embargo, llama la atención que durante años nunca fuesen citados, probablemente porque no fueron comprendidos del todo. La clave para que se prestase atención al trabajo original de Mendel fue una referencia de Focke en 1881, que en una revisión de la literatura sobre hibridaciones en plantas cita el artículo de Mendel (bajo el epígrafe Pisum ) y dice que Mendel creyó haber encontrado relaciones numéricas constantes. Esta frase llamó la atención de Karl Correns, que había llegado independientemente a las conclusiones mendelianas en 1899 haciendo hibridaciones en varias especies. Al leer la alusión de Focke a las relaciones numéricas constantes, Correns citó el trabajo original de Mendel y fue probablemente fue el primero en comprender su verdadero alcance. Al mismo tiempo, en el año 1900, Hugo de Vries publicó 3 artículos en los que también llegaba a conclusiones parecidas, encontrando la relación 3:1 en varias especies distintas. En uno de esos trabajos se cita también el artículo de Mendel (aunque no se citaba en la versión original francesa, se cita en la versión posterior en alemán: parece que de Vries no había tenido noticia del trabajo de Mendel, pero incluyó la referencia al saber que Correns lo citaba en su artículo). Tshermak también publicó dos artículos en 1900 llegando a conclusiones mendelianas, pero con resultados más limitados que los dos anteriores. William Bateson era un zoólogo de Cambridge que ya en 1894 era consciente de la importancia de estudiar la variación discontinua con una aproximación más matemática. En mayo de 1900 dio una conferencia en la Royal Horticultural Society en Londres, describiendo los resultados de Mendel y su confirmación por De Vries, y se convirtió en el defensor más entusiasta del mendelismo. Junto a Reginald Punnett fue desarrollando los principios de la herencia según las leyes mendelianas. Poco a poco los principios de Mendel se fueron confirmando en otras plantas y en animales, y así se fue introduciendo y fijando la nomenclatura que utilizamos hoy en día. Por ejemplo, Bateson acuñó el término genética (del griego genetikos) al usarlo por vez primera en una carta del 18 de abril de 1905, dirigida a Adam Sedgewick. También inventó los términos homocigoto, heterocigoto ó alelomorfo (hoy reemplazado por alelo). Johannsen, otro botánico del que hablaremos más adelante, introdujo en 1909 los términos gen, genotipo y fenotipo. Dónde están los factores unitarios? La teoría cromosómica de la herencia La aceptación de las leyes de Mendel a principios del siglo XX supuso que se iniciara la búsqueda de las bases celulares de la herencia, es decir, dónde residen los factores que controlan los caracteres hereditarios, cuál es la naturaleza de los distintos alelos, en qué estructuras se transmiten de una generación a la siguiente, etc. Hacia el año 1900, los conocimientos de Citología en plantas y animales permitían aventurar alguna hipótesis al respecto. Por ejemplo, se sabía que el núcleo de las células contiene una sustancia (cromatina) que se condensa en forma de cromosomas. Se aceptaba que cada especie tiene un número fijo de cromosomas, definido por el número de cromosomas presente en los gametos, y que en especies de reproducción sexual los gametos tienen una copia de cada cromosoma, mientras que las células somáticas tienen dos copias. También se había observado (al menos en plantas) que la reducción en el número de cromosomas se produce en las últimas fases de la formación de los gametos. En esos primeros años del siglo, por tanto, era generalmente aceptado que el material hereditario residía en los cromosomas, aunque la naturaleza amorfa y estática de la cromatina no permitía explicar cómo podría ser esto. De hecho, algunas cuestiones citológicas que entonces se creían ciertas distaban mucho de la realidad. Por ejemplo, existía la creencia general de que los cromosomas formaban un largo filamento continuo (el espirema ) que se dividía transversalmente al final de la interfase, de modo que todos

93 CAPÍTULO 7: GENÉTICA MENDELIANA 85 los cromosomas eran esencialmente iguales unos a otros excepto por su tamaño. Aunque también se había observado la meiosis, se pensaba que en la división reductora los cromosomas se dividían transversalmente, estando unidos por los extremos. En general, la mecánica de estos procesos no estaba clara y esta falta de detalle no permitía establecer las bases citológicas de los principios mendelianos de transmisión de la herencia. Aunque ya Correns y Cannon habían propuesto en los primeros años del siglo XX la hipótesis de que los genes (los factores de Mendel) residen en los cromosomas, sus modelos eran poco claros. El citólogo que dio mayor impulso a este campo fue sin duda Theodor Bovery, que en 1902 llegó a la conclusión de que los cromosomas no son equivalentes, sino que son distintos unos de otros y todos son necesarios para dar lugar a un embrión viable. En sus estudios con embriones monospérmicos y polispérmicos de erizo de mar, pudo observar formas anormales de desarrollo embrionario cuando el número de cromosomas no era el adecuado. Además, esto le llevó a formular la teoría cromosómica del cáncer, que tanta influencia tendría en años posteriores. Peor la mayor evidencia experimental de que los procesos citológicos permitían explicar las leyes de Mendel la produjo Walter Sutton en Sutton era un estudiante de Medicina que dedicó sus primeros años a estudiar cromosomas de células somáticas de saltamontes, demostrando irrefutablemente por primera vez que los cromosomas se presentan en pares homólogos en las células somáticas y que los gametos tienen una sola copia, procedente de uno de los progenitores. En un trabajo de 1903 ( The chromosomes in heredity ) elabora más esta teoría mostrando que distintos pares cromosómicos se orientan al azar en el huso meiótico, y así sugirió que la división reduccional no era transversal sino longitudinal. Todos estos procesos permitían explicar perfectamente lo que Mendel había propuesto: la segregación al azar de factores que están en parejas, de las que sólo una copia pasa a la descendencia. De hecho, Sutton escribió en uno de sus trabajos: I may finally call attention to the probability that the association of paternal and maternal chromosomes in pairs and their subsequent separation during the reducing division may constitute the physical basis of the Mendelian law of heredity. A pesar de la clarividencia de sus afirmaciones y de su evidente interés por la ciencia, Sutton no terminó su doctorado, sino que se hizo médico y se dedicó a la cirugía. En cualquier caso, su contribución permitió explicar la base física de la herencia y el comportamiento de los factores mendelianos, dando lugar a la teoría cromosómica de la herencia. De todas formas, no todos aceptaban fácilmente que los factores mendelianos viajasen en los cromosomas. La demostración formal no llegaría hasta años más tarde gracias al trabajo de Morgan, Sturtevant, Muller y Bridges en la mosca Drosophila melanogaster. Durante años, estos genetistas fueron estableciendo la posición de los genes responsables de distintos caracteres en los cromosomas de la mosca. Vieron que algunos caracteres se comportaban como si viajasen juntos, porque no segregaban al azar, y llamaron a este fenómeno ligamiento. Establecieron así varios grupos de ligamiento y demostraron que coincidían con los 3 pares de autosomas que tiene la Drosophila, es decir, que los genes se localizan en los cromosomas y se agrupan de modo lineal. En 1916 publicaron The Mechanism of Mendelian Heredity, que se conviertió en el primer tratado detallado de las leyes mendialanas, sus excepciones y sus bases citológicas. Aún así, la aceptación no fue unánime, y mendelistas tan brillantes como Bateson mostraban sus reservas. Por ejemplo, en una revisión sobre The Mechanism of Mendelian Heredity que hace el propio Bateson en 1916, dice: it is inconceivable that particles of chromatin or of any other substance, however complex, can possess those powers which must be assigned to our factors The supposition that particles of chromatin, indistinguisable from each other and indeed almost homogeneous under any known test, can by their material nature confer all the properties of life surpasses the range of even the most convinced materialism. Evidentemente, en aquellos años no se conocía la naturaleza química de la cromatina y era impensable que pudiese estar compuesta por una molécula como el ADN, tan simple en su estructura pero tan rica en su capacidad codificante y en sus funciones.

94 86 GENÉTICA HUMANA En cualquier caso, hacia 1920 la citología y la genética se habían encontrado definitivamente. El mendelismo podía ya explicarse sobre la base de la teoría cromosómica, es decir: i) los dos alelos de cada gen se localizan en la misma posición (locus) en cromosomas homólogos, y segregan al azar a los gametos gracias a la separación de los cromosomas durante la meiosis; ii) genes distintos segregan de manera independiente (4º postulado de Mendel) porque se localizan en cromosomas distintos. Además, estos conceptos se fueron ampliando progresivamente con las nociones de recombinación e intercambio de material genético entre cromosomas homólogos, ligamiento, etc.

95 CAPÍTULO 8: HERENCIA RELACIONADA CON EL SEXO 87 Capítulo 8. Herencia relacionada con el sexo. Cada sexo tiene distinta constitución cromosómica. Los genes situados en el cromosoma X muestran un modo especial de herencia. Determinación genética del sexo en humanos. Compensación de dosis: hipótesis de Lyon. Estructura de los cromosomas sexuales humanos. Cada sexo tiene distinta constitución cromosómica En 1891, Hermann Henking describió un corpúsculo en el núcleo de las células de insectos machos de la especie Pyrrhocoris (un tipo de chinche). Dicho corpúsculo se formaba durante la meiosis, y Henking lo denominó "cuerpo X" por su naturaleza desconocida. Cuando se observó la meiosis con detenimiento, se comprobó que 22 de los 23 cromosomas de esta especie se emparejaban durante la meiosis para formar 11 parejas, pero otro cromosoma quedaba condensado y daba lugar al "cuerpo X" en uno de los polos en algunas células. Al reconocerse que se trataba de un cromosoma, dicho corpúsculo pasó a llamarse cromosoma X. A principios del siglo XX, en 1905, Edmund B. Wilson y una de sus estudiantes de doctorado, Nettie M. Stevens, comprobaron que el número de cromosomas X difiere entre machos y hembras. Estudiando insectos del género Protenor (saltamontes) y el Lygaeus turicus, observaron que cada sexo tiene configuraciones cromosómicas distintas, y llegaron a la conclusión de que el sexo está determinado por el número de cromosomas X presentes en las células. En Protenor comprobaron que las hembras tienen dos ejemplares de este cromosoma (XX) y en cambio los machos sólo tienen uno (XO). A este tipo de determinación cromosómica del sexo le llamaron modo XX/XO. En Lygaeus, en cambio, vieron que la situación era ligeramente distinta, ya que las hembras son XX y los machos tienen además de un cromosoma X otro cromosoma más pequeño llamado cromosoma Y. A este tipo de configuración le llamaron modo XX/XY. Estas observaciones pusieron de manifiesto el hecho fundamental de que uno de los sexos produce dos clases distintas de gametos: con ó sin cromosoma X en el caso del modo Protenor; con cromosoma X ó con cromosoma Y, en el modo Lygaeus. Al sexo que produce gametos distintos se le llama, por tanto, sexo heterogamético. Aunque lo más habitual es que el sexo heterogamético sea el masculino, como en la especie humana, esto no siempre es así. Por ejemplo, en muchas especies de aves el sexo heterogamético es el femenino, y siguen un modo distinto de determinación cromosómica del sexo, que se llama ZZ/ZW. En humanos se sigue el modo XX/XY, mientras que en la mosca Drosophila melanogaster, a pesar de que tiene un cromosoma Y, se sigue el modo XX/XO. Los genes situados en el cromosoma X muestran un modo especial de herencia Como hemos visto, en el laboratorio de Tomas H. Morgan, conocido como la "Fly Room" ("Habitación de las Moscas"), se establecieron los principios del mendelismo estudiando diversos caracteres y mutaciones en Drosophila. Morgan observó en 1910 que en el caso de la mutación white del ojo de Drosophila a veces no se cumplían las proporciones mendelianas esperadas. Observó que el patrón de herencia de esta mutación dependía del sexo del progenitor que transmitía la mutación. Así, el cruce entre un mutante white macho y una hembra silvestre daba una F1 con 100% de ojos silvestres (rojo ladrillo) y una F2 con la proporción 3:1 (rojo:blanco), que sería la proporción esperada si el alelo silvestre (rojo) es dominante sobre el mutante white. En cambio, el cruce recíproco, en el que la mutación white estaba en el progenitor

96 88 GENÉTICA HUMANA hembra, daba una F1 con una proporción 1:1 en la que todos los machos tenían ojos blancos. Además, esta misma proporción se repetía en la F2, teniendo el 50% los machos ojos blancos. Basándose en la teoría cromosómica de la herencia de Sutton y Boveri y, sobre todo, en la hipótesis propuesta por Stevens y Wilson pocos años antes, Morgan concluyó que el gen de esta mutación (el locus white) estaba localizado en el cromosoma X de Drosophila. Si esto era cierto, las hembras llevarían dos copias del gen y sólo manifiestarían el fenotipo cuando ambos alelos están mutados (es decir, la mutación sería recesiva y sólo se manifestaría en homocigosis). Los machos, en cambio, sólo llevan un cromosoma X; está situación se describe como hemicigosis (un solo alelo, en vez de los dos que suele ser habitual en genes autosómicos), y por eso se dice que los machos son hemicigotos para todos los genes del cromosoma X. En estas circunstancias, los machos siempre manifestarán el fenotipo aunque sea recesivo, ya que el único alelo que tienen es el alelo mutante. La Figura 8.1 ilustra los cruces entre moscas con ojos de color silvestre (rojo ladrillo) y moscas con la mutación white (ojos blancos). También se muestra un ejemplo de herencia ligada al cromosoma X en humanos. Este hallazgo constituyó el primer ejemplo de ligamiento de un carácter a un cromosoma concreto, y además fue decisivo para respaldar la teoría cromosómica de la herencia. Todos los caracteres controlados por genes situados en el cromosoma X siguen este tipo de herencia, que pasó a llamarse "ligada al sexo". Sin embargo, un nombre más adecuado es el de "ligada al cromosoma X", ya que hay caracteres cuya herencia está influida por el sexo sin estar controlados por genes situados en ninguno de los cromosomas sexuales. Por ejemplo, existen rasgos controlados por genes autosómicos que sólo se expresan en un sexo por razones hormonales. Dichos caracteres, influidos o limitados por el sexo, pueden confundirse a veces con caracteres ligados al cromosoma X. Aunque la herencia ligada al X puede ser de tipo recesivo ó dominante, lo más frecuente es la de tipo recesivo, que se caracteriza porque sólo los individuos hemicigotos (XY) manifiestan el fenotipo recesivo, ya que las hembras (XX) son habitualmente heterocigotos. Como veremos más adelante, la herencia ligada al X recesiva es muy importante en Genética Humana, y tiene unas características que permiten reconocerla y proporcionar un consejo genético muy valioso. Determinación genética del sexo en humanos El hallazgo de que el sexo está determinado por el tipo de cromosomas sexuales que se heredan puso en marcha la búsqueda de los mecanismos por los que estos cromosomas influyen en la determinación del sexo. Estos mecanismos se fueron conociendo gracias a los trabajos de Calvin Bridges, un discípulo de Morgan. Bridges demostró que el sexo de Drosophila viene determinado por el número total de cromosomas X que están presentes, ó más exactamente por el cociente entre el número de cromosomas X y el número de autosomas. Esta especie tiene 3 pares de autosomas y un par de cromosomas sexuales, por lo que habitualmente el cociente X/autosomas de las moscas hembra es igual a 1 (2 copias del cromosoma X y 2 copias de cada autosoma) y el de los machos es igual a 0,5 (1 cromosoma X y dos copias de cada autosoma). Sin embargo, Bridges estudió el sexo de moscas con diferentes composiciones cromosómicas y encontró que las moscas XXY son hembras normales (cociente=1), mientras que las moscas XO son machos estériles (cociente=0,5). Esto le llevó a concluir que el cromosoma Y en Drosophila no tiene genes necesarios para la determinación del sexo masculino, pero sí genes necesarios para la fertilidad de los machos. Esta misma conclusión se confirmaba al estudiar la progenie de moscas con 3 cromosomas X y con un número variable de autosomas. Bridges observó que un cociente X/autosomas=1 produce hembras

97 CAPÍTULO 8: HERENCIA RELACIONADA CON EL SEXO 89 normales y fértiles; un cociente >1 produce metahembras infértiles; un cociente=0.5 corresponde a machos; un cociente=0.33 produce metamachos infértiles. Otros cocientes intermedios producen moscas con genitales ambiguos y estériles, denominados intersex. Por tanto, la conclusión fue que los genes que determinan el sexo en Drosophila están en los autosomas, pero el cromosoma X debe tener algún gen necesario para determinar el sexo femenino cuando está en doble dosis génica. Aunque no es el momento de explicar a fondo el proceso genético de determinación del sexo en Drosophila, nos sirve para introducir esta cuestión en relación con nuestra propia especie. En mamíferos, la determinación del sexo tiene su origen embriológico en la diferenciación de la gónada primitiva indiferencia bien hacia la gónada femenina (ovario) ó hacia la gónada masculina (testículo). En el caso de que se inicie la vía de diferenciación testicular, éste órgano comienza a producir Sustancia Inhibitoria Mülleriana (en las células de Sertoli) y andrógenos (en las células de Leydig), que determinan el desarrollo de los caracteres sexuales secundarios. Lo fundamental, por tanto, es la diferenciación inicial de la gónada primitiva en los primeros momentos del desarrollo embrionario. Desde que se conoció la implicación del cromosoma Y en la determinación del sexo por el modo XX/XY, se postuló que el cromosoma Y debía contener algún factor necesario para la diferenciación de la gónada primitiva hacia testículo, y se denominó TDF (testis-determining factor) a ese hipotético factor cuya identidad permaneció oculta durante años. Posteriormente se descubrió ZFY ("Zinc-finger on the Y"), un gen del cromosoma Y que codifica un factor de transcripción del tipo dedo de zinc, y se pensó que podía ser el buscado TDF. Sin embargo, la búsqueda del gen responsable del desarrollo sexual masculino concluyó en 1993, al comprobarse que ratones hembras en los que se había insertado en uno de los cromosomas X una copia de un gen llamado Sry (localizado en el cromosoma Y) eran fenotípicamente machos. SRY ("Sex-determining Region on the Y") es el gen iniciador de una cascada en la que también participan otros genes del cromosoma Y junto con otros genes localizados en autosomas. Básicamente, el proceso comienza cuando la cresta genital es poblada por células del mesonefros y del saco vitelino, que aportan las células somáticas y germinales respectivamente. La cresta genital se desarrolla hacia la gónada indiferenciada por acción de dos factores de transcripción llamados WT1 ("Wilms Tumor 1") y SF1 ("Steroidogenic Factor 1"). A partir de este momento, la diferenciación hacia ovario o testículo será fruto de la acción de diversos genes. Si SRY está presente (como sucede en individuos con un cromosoma Y) la acción de éste factor de transcripción y de otro llamado SOX9 hace que la gónada primitiva se desarrolle hacia testículo. Éste, a su vez, producirá factores que inhiben el desarrollo de los conductos de Müller, estabilizan el desarrollo de los conductos de Wolff y promueven el desarrollo de los genitales externos masculinos. Otros genes implicados son MIS-R, el receptor de andrógenos, INSL3 y LGR8. En ausencia de SRY, como ocurre en mujeres con dos cromosomas X, los genes DAX1 y WNT4 promueven la diferenciación de la gónada primitiva hacia tejido ovárico; la ausencia del receptor androgénico y la presencia de WNT4 promueven la regresión de los conductos de Wolff y el desarrollo de las estructuras derivadas de los conductos de Müller. Por tanto, en el desarrollo sexual intervienen gran cantidad de genes que actúan a distintos niveles de la vía, y mutaciones en cualquiera de ellos puede dar lugar a alteraciones en el desarrollo sexual y por tanto a varones con cariotipo XX ó a mujeres con constitución cromosómica XY. En la Figura 8.2 se muestra esquemáticamente la vía de determinación del sexo en humanos.

98 90 GENÉTICA HUMANA Cresta genital (gónada indiferenciada) WT1 Células somáticas (mesonefros) Células germinales (saco vitelino) SF1 WNT4 DAX1 SOX9 SRY OVARIO TESTÍCULO WNT4 AR MIS-R Conductos Regresión de de Müller conductos de Wolff Genitales externos Conductos Regresión de de Wolff conductos de AR Müller Genitales externos Compensación de dosis: hipótesis de Lyon La distinta dotación cromosómica de ambos sexos supone que las mujeres (XX) tienen doble dosis génica de los genes presentes en el cromosoma X, respecto de los varones XY. El distinto número de cromosomas X que lleva cada tipo de gameto (uno en el gameto femenino y ninguno en el masculino), plantea una cuestión fundamental: cómo es posible que la distinta dosis de los genes contenidos en el cromosoma X no provoque grandes problemas en varones? De hecho, mujeres con un solo cromosoma X (cariotipo 45,X0) desarrollan el Síndrome de Turner. Por qué no sucede esto en varones, que tienen un solo cromosoma X? Murray Barr describió en 1949 que las células femeninas se podían distinguir por la presencia en su núcleo de un corpúsculo de cromatina, pegado a la pared interna del núcleo, que pasó a conocerse como corpúsculo de Barr. Posteriormente, se comprobó que el corpúsculo de Barr se ajusta a la llamada "regla (n 1)", según la cual el número de corpúsculos de Barr de una célula es igual al número de cromosomas X que posee esa célula (n) menos 1. Estas observaciones se completaron cuando Susumu Ohno demostró en 1959 que el corpúsculo de Barr corresponde a un cromosoma X condensado en forma de heterocromatina y propuso que uno de los dos cromosomas X está inactivo en células somáticas, de manera que sólo se expresan los genes del cromosoma X que permanece activo. En 1961 Mary Lyon formuló la hipótesis de que dicha inactivación se lleva a cabo al azar en fases precoces del periodo embrionario, y queda fijada una vez que se establece. Según esta hipótesis, todas las células hijas procedentes de una célula en la que se ha producido la inactivación tendrán el mismo patrón de inactivación que la célula original. Esta hipótesis permitía explicar la expresión de algunos rasgos ligados al cromosoma X, tales como el color del pelaje en los gatos, en el que las gatas (que se conocen como gatas calico) muestran a veces manchas o bandas de color negro, naranja y blanco, mientras los gatos macho son de color totalmente negro o totalmente naranja. El proceso de inactivación también explicaría el patrón en mosaico de algunas enfermedades dermatológicas causadas por genes que están en el cromosoma X, como la displasia

99 CAPÍTULO 8: HERENCIA RELACIONADA CON EL SEXO 91 ectodérmica anhidrótica (fenómeno ya descrito por Darwin en 1875). El estudio de las isoformas de glucosa-6-fosfato deshidrogenasa en fibroblastos aislados de mujeres permitió confirmar la hipótesis de Lyon, al observarse la presencia de una sola isoforma en las células de mujeres heterocigotas (que deberían tener dos isoformas distintas). Hoy en día, el fenómeno de inactivación temprana y aleatoria de un cromosoma X en mujeres es universalmente aceptado, y se conoce también con el nombre de "Lyonización" en honor a Mary Lyon. Mediante este mecanismo, las células somáticas femeninas tienen uno de sus cromosomas X en estado inactivado, es decir, transcripcionalmente silenciado y altamente compactado en forma de heterocromatina. La inactivación del X se realiza al azar mediante un mecanismo de recuento que determina el cociente entre el número de cromosomas X y el número de autosomas. Si se detecta más de un cromosoma X, el proceso continúa con la inactivación, inicialmente temporal e inestable, de todos los cromosomas X menos uno. Finalmente, el proceso termina con el silenciamiento estable y definitivo de esos cromosomas. Aunque los mecanismos moleculares que regulan estos procesos no se entienden completamente, se conocen las regiones cromosómicas implicadas y los genes más importantes en el proceso de inactivación, como se describe a continuación. Los procesos de inactivación se ejecutan gracias un locus multifuncional denominado XIC, que está localizado en Xq13 y que contiene los elementos necesarios para el recuento del número de cromosomas X, para la elección del X que será silenciado y para el propio mecanismo de silenciamiento. Este locus incluye el gen XIST, un gen de 32 kb que se transcribe en un ARN de 19 kb, es procesado y poliadenilado pero no se traduce. XIST es necesario para iniciar el silenciamiento del cromosoma X, pero no para los mecanismos de contaje, elección ni para el posterior mantenimiento del estado silenciado. En XIC también se encuentra el mecanismo de contaje y posiblemente un mecanismo de elección, que dependen del locus XCE. La Figura 8.3 muestra un ejemplo del fenómeno de inactivación del X. También se incluye un esquema del locus XIC. XIC Xist Tsx Brx Cdx4 TsiX Xce Todos estos procesos comienzan en los estadios iniciales del desarrollo embrionario. Así, en la mórula de 4-8 células se detecta expresión de XIST a bajo nivel en ambos cromosomas X, tanto en el de origen paterno (Xp) como en el de origen materno (Xm). A partir de ese momento, XIST deja de expresarse en uno de los cromosomas X (en el caso de embriones XX), o en el único cromosoma X (en embriones XY). Por tanto, la expresión inicial de XIST es transitoria y sólo se estabiliza en torno a la fase de blastocisto en uno de los dos cromosomas X (en aquél que quedará finalmente inactivado). Recientemente se ha descubierto un gen antisentido, denominado TSIX, cuyo transcrito se solapa parcialmente con el ARN codificado por

100 92 GENÉTICA HUMANA XIST. Curiosamente, TSIX sigue un patrón de expresión similar a XIST: inicialmente se expresan ambos alelos, pero al comienzo de la inactivación únicamente se expresa el alelo del cromosoma X que permanecerá activo. Esto sugiere que la expresión de TSIX juega un papel importante en la expresión transitoria de XIST y en la elección del cromosoma que finalmente será inactivado. En este proceso participa el factor CTCF, que se une a la región de metilación diferencial cercana a TSIX. Dicha unión sólo se produce cuando esa región está des-metilada, y tiene dos posibles efectos: o bien impide la acción de un enhancer sobre XIST (porque CTCF es un elemento aislador ó insulator); ó bien estimula la transcripción de TSIX, con el consiguiente silenciamiento de XIST. Tras la elección, tiene lugar el proceso de iniciación del silenciamiento, seguida de otros cambios que permiten mantener el estado silenciado. En este proceso, el ARN codificado por XIST recubre todo el cromosoma y desencadena los cambios que caracterizarán al cromosoma X inactivo: metilación de las islas CpG, desacetilación de las histonas, replicación tardía en la fase S, presencia de una histona especial (macroh2a) en vez de H2A. Recientemente también se ha visto que la lisina 27 de la histona H3 está metilada en el cromosoma X inactivo. En cambio, el ARN codificado por XIST no llega a estabilizarse en el X que permanecerá activo, y finalmente el propio gen XIST se silencia y deja de expresarse. Lógicamente, en un embrión XY sólo hay expresión baja y transitoria de XIST en el cromosoma X de origen materno, que nunca se inactiva porque el mecanismo de contaje detecta la presencia de un solo cromosoma X. El video de la Figura 8.4 sirve para ilustrar el proceso de inactivación del cromosoma X. Mary Lyon también ha propuesto que la propagación del estado inactivado a partir del XIC se ve facilitada por la presencia de elementos distribuidos a lo largo de todo el cromosoma X y que actuarían como "estaciones repetidoras" del proceso de inactivación. Unos elementos que podrían cumplir esta función son los LINE, que son especialmente abundantes en el cromosoma X respecto a los autosomas (forman un 30% de la secuencia de este cromosoma). Además, al estudiar pacientes con translocaciones entre el cromosoma X y un autosoma, se ha comprobado que la inactivación del X se propaga a los autosomas pero sólo parcialmente, y que esta propagación es directamente proporcional a la riqueza en LINEs de cada autosoma. La secuenciación del cromosoma X apoya esta hipótesis, ya que se ha comprobado que los LINE se distribuyen a lo largo del X de manera coherente con la inactivación: son especialmente abundantes en las zonas que flanquean el XIC y disminuyen en abundancia en las regiones más distales del brazo corto, precisamente la región donde la inactivación es más débil. Es muy importante tener claro que la inactivación del cromosoma X no es completa, es decir, no afecta a todos los genes del cromosoma. De hecho, se estima que sólo un 65% de los genes presentes en el cromosoma X se inactivan; un 20% de los genes se inactivan sólo parcialmente (es decir, no están inactivados en todas las células) y un 15% escapan totalmente al proceso de inactivación. Esto quiere decir que, para esos genes, existen dos copias funcionales en mujeres XX pero sólo existe una copia en varones XY. Para evitar las diferencias de dosis génica en estos casos, algunos de estos genes que escapan a la inactivación tienen un gen homólogo funcional en el cromosoma Y, lo que hace que ambos sexos tengan la misma dosis génica funcional. Se piensa que el fenotipo de mujeres X0 con Síndrome de Turner se debe precisamente a la disminución de dosis de todos o algunos de los genes que escapan la inactivación, ya que estas pacientes sólo tienen una dosis funcional de estos genes (cuando deberían tener dos). Estructura de los cromosomas sexuales humanos

101 CAPÍTULO 8: HERENCIA RELACIONADA CON EL SEXO 93 Lo que ahora conocemos como cromosomas X e Y, formaban una pareja de autosomas hace aproximadamente 300 millones de años. Los datos más recientes apoyan la "ley de Ohno" (formulada por Susumu Ohno en 1967), que dice que el primer paso en el proceso de creación del dimorfismo de los cromosomas sexuales fue la fijación del gen responsable del desarrollo del sexo masculino en uno de los cromosomas (el que se convertiría en el futuro cromosoma Y) y su pérdida en el otro cromosoma del par (el futuro X). Después, la limitación progresiva de recombinación entre ellos condujo a una evolución separada de ambos cromosomas: el Y perdió material rápidamente por la falta de recombinación, sufrió varias duplicaciones y se quedó con pocos genes, de los cuales un gran porcentaje tienen homólogos en el X. El cromosoma X, en cambio, se conservó mejor gracias a la existencia de recombinación entre las dos copias presentes en mujeres, y fue evolucionando progresivamente desde metaterios (mamíferos sin placenta, como los marsupiales) a euterios (mamíferos con placenta). Al final, en el cromosoma X actual conserva una región del autosoma ancestral de prototerios (mamíferos que ponen huevos), además de otra región añadida después de la separación de los metaterios. Actualmente, ambos cromosomas sexuales sólo se recombinan entre ellos en las dos pequeñas regiones pseudoautosómicas que están en los extremos de cada brazo. La reciente secuenciación completa del cromosoma X en el año 2005 ha aclarado la estructura de los cromosomas X e Y: En el cromosoma X se pueden distinguir: Dos regiones pseudoautosómicas PAR1 y PAR2, por las que se recombinan los cromosomas X e Y (al menos una recombinación en PAR1 es necesaria en la meiosis masculina). PAR1 (en Xp e Yp) tiene un tamaño de 2,7 Mb, mientras que PAR2 (en el extremo del brazo largo de ambos cromosomas) mide 330 kb. Una gran región conservada (XCR, "X-conserved region") que ocupa la mayor parte del brazo largo del cromosoma X. Esta es la secuencia más antigua y representa los restos del autosoma original de prototerios del que se originaron los cromosomas X e Y actuales. Una pequeña porción de ésta región se encuentra transpuesta al cromosoma Y (XTR, "X-transposed region"), calculándose que dicha transposición tuvo lugar hace 5 millones de años, después de la separación de humanos y chimpancés. Una región "añadida" (XAR, "X-added region") más joven que XCR, al parecer incorporada al cromosoma X a partir de otro autosoma hace unos 100 millones de años en mamíferos placentarios (euterios). Esta región representa la mayor parte del brazo corto del cromosoma X actual. Algunos fragmentos de la porción más distal de este brazo, cercanos a la PAR1, están también presentes en el cromosoma Y, distinguiéndose hasta 12 bloques de homología entre ambos cromosomas. De los aproximadamente genes que hay en el cromosoma X, 54 tienen un homólogo funcional en el Y: 24 de ellos están en PAR1, 5 en PAR2 y 25 en las regiones no-recombinantes de ambos cromosomas. De éstos 25, 15 están en la XAR y 3 en XTR; los 7 genes restantes se localizan en la XCR y por eso se piensa que descienden del autosoma ancestral. La Figura 8.5 muestra la estructura de los cromosomas X e Y humanos.

102 Genes que escapan a la inactivación XCR XAR 94 GENÉTICA HUMANA PAR1 XTR PAR1 XTR XTR PAR2 El cromosoma Y es el más peculiar de todos los cromosomas humanos, ya que de sólo 23 Megabases (de un total estimado de 50 Mb) están formadas por eucromatina. Por ello, este cromosoma es también el más pobre en genes. La peculiar estructura del cromosoma Y actual se debe a su comportamiento durante la meiosis: lógicamente, no puede quedar sin emparejar durante la meiosis, y de hecho se empareja con el cromosoma X a través de las dos regiones pseudoatosómicas que contiene en los extremos del brazo corto y del brazo largo, respectivamente. El resto del cromosoma Y no se recombina nunca, y por esto ha ido acumulando mutaciones y degenerando con el tiempo. La región eucromática del Y comprende unas 22 Mb (el resto del cromosoma es heterocromatina) y está constituida por 3 tipos de secuencias: i) un bloque de 3,4 Mb fruto de una transposición procedente del X (XTR, región transpuesta desde el X); ii) un total de 8,6 Mb de secuencias derivadas del cromosoma X, que representan las regiones derivadas del cromosoma ancestral; y iii) un total de 10,2 Mb de regiones palindrómicas, distribuidas en 7 bloques. En total, en el cromosoma Y sólo se han encontrado 158 unidades transcripcionales, entre las que destacan 27 genes que tienen homólogos claros en el cromosoma X. De éstos, 13 están degenerados y se han convertido en pseudogenes; los 14 restantes son auténticos genes que se expresan en varios tejidos, con la excepción de SRY (que sólo se expresa en células germinales masculinas). Todos estos genes se localizan fundamentalmente en las regiones derivadas del X. Por el contrario, en las regiones palindrómicas hay unos 60 genes, agrupados en 9 familias, que sólo se expresan en el tejido testicular y que no tienen un homólogo claro en el cromosoma X: estos genes parecen codificar proteínas necesarias para la fertilidad masculina. Por lo que respecta al papel de las regiones palindrómicas, parecen tener una importancia clave en el mantenimiento de la secuencia y estructura del cromosoma Y: la recombinación entre los brazos de cada palíndromo y la conversión de secuencias entre ellos evita la rápida degeneración que tendría lugar por la ausencia de recombinación entre los cromosomas X e Y en esta región.

103 CAPÍTULO 9: MODIFICACIONES DE LAS PROPORCIONES MENDELIANAS 95 Capítulo 9. Modificaciones de las proporciones mendelianas. Modo de estimar si se cumplen las proporciones mendelianas esperadas. Desviaciones de las proporciones mendelianas para un carácter: dominancia incompleta, codominancia, alelos múltiples, alelos letales. Interacción génica y epistasia. Ya desde el inicio de los experimentos con plantas, diversos naturalistas habían encontrado proporciones fenotípicas en la F2 de monohíbridos o dihíbridos que no se correspondían con lo que cabría esperar según las leyes mendelianas (3:1 y 9:3:3:1, respectivamente). Como acabamos de ver, la búsqueda de las causas de estas desviaciones permitió descubrir la herencia ligada al sexo en los caracteres controlados por genes situados en el cromosoma X. Además, se descubrieron fenómenos como el multialelismo o la interacción génica en aquellos caracteres que están controlados por más de un gen. Aunque todas estas situaciones dan lugar a proporciones fenotípicas distintas a las esperadas por las leyes de Mendel, el análisis detallado de lo que sucede viene a confirmar que, efectivamente, los postulados mendelianos también explican estas situaciones. Modo de estimar si se cumplen las proporciones mendelianas esperadas Antes de pasar al estudio de estas cuestiones, es imprescindible estudiar la metodología empleada para poder afirmar con fiabilidad si unas proporciones fenotípicas dadas se apartan significativamente de lo esperado según las leyes mendelianas. Lógicamente, los porcentajes esperados nunca se cumplen perfectamente porque el tamaño de las muestras no es lo suficientemente grande. Por ejemplo, en un cruce moníbrido típico en el que analizamos 100 plantas en la F2, esperaríamos encontrar 75 con el fenotipo dominante y 25 con el fenotipo recesivo. Sin embargo, lo más probable es que nunca encontremos exactamente estos números, sino 74 y 26, ó 77 y 23, por ejemplo. En el caso de especies con generaciones menos numerosas, como sucede en las familias humanas, las desviaciones pueden ser todavía mayores debido al pequeño número de individuos que se estudia. Por tanto, es imprescindible contar con un método cuantitativo que nos permita concluir con certeza estadística si los porcentajes encontrados se ajustan a lo esperado. El método utilizado es el cálculo del Chi cuadrado, un estadístico que se ajusta a una distribución concreta y que permite calcular la bondad del ajuste de unas proporciones a un modelo teórico. El método calcula la probabilidad de que la diferencia observada entre las proporciones experimentales y las proporciones teóricas sea atribuible al azar. La hipótesis nula es que las proporciones teóricas se cumplen y la diferencia es explicable por el azar, sobre todo cuando el tamaño de la muestra es pequeño. Si el estadístico 2 (chi cuadrado) supera un cierto valor, se puede rechazar la hipótesis nula con una fiabilidad específica (5%, 1%, 0,1%) y por tanto se puede afirmar que las proporciones fenotípicas experimentales se alejan significativamente de las esperadas según el modelo teórico. Es fácil comprender la mecánica de este razonamiento con un ejemplo. En un cruce monohíbrido típico analizamos 1000 individuos de la F2 y encontramos 760 con el fenotipo dominante y 240 con el fenotipo recesivo. Esto se aparta de los 750:250 que esperaríamos encontrar si este carácter se heredase de forma mendeliana, pero tenemos que comprobar si esta desviación es atribuible al azar (de modo que si hubiésemos analizado individuos las proporciones hubiesen sido más cercanas al 3:1 teórico), ó si efectivamente este carácter no sigue las leyes de Mendel. El primer paso es el cálculo del estadístico 2 con arreglo a la fórmula 2 = [(O - E) 2 / E], siendo O el número de casos observados y E el número de casos

104 96 GENÉTICA HUMANA esperados para cada categoría. En nuestro ejemplo, para el fenotipo dominante esperaríamos encontrar 750 casos, pero hemos encontrado 760. Así, calculamos ( ) 2 / 750 = 0,133. Hacemos lo mismo para el fenotipo recesivo: ( ) 2 / 250 = 0,4. Ahora podemos obtener el sumatorio, de modo que 2 = 0, ,4 = 0,533. El último paso es comprobar este valor en una tabla que represente los valores máximos del 2 a los que se puede rechazar la hipótesis nula con distintos niveles de probabilidad y para varios grados de libertad. Si buscamos en una de estas tablas, vemos que para 1 grado de libertad se puede rechazar la hipótesis nula, con un error del 5%, cuando el valor del 2 es igual o superior a 3,841. Como el valor calculado por nosotros es inferior, no podemos rechazar la hipótesis nula y, por tanto, las proporciones experimentales no se apartan significativamente de lo esperado según un modelo mendeliano de herencia. En cambio, si hubiésemos obtenido 780 dominantes y 220 recesivos, el 2 resultante sería de 4,8. Como este valor rebasa el valor de la tabla para un grado de libertad y p=0,05 (3,841) pero es inferior al valor de la tabla para p=0,025 (5,024), podríamos rechazar la hipótesis nula con un nivel de confianza del 95% (p<0,05) y afirmar que las proporciones obtenidas no se ajustan a un modelo mendeliano de herencia. El número de grados de libertad siempre es igual al número total de clases menos uno: como en nuestro caso sólo teníamos dos clases fenotípicas, hemos utilizado 1 grado de libertad. En el caso de un cruce dihíbrido, en el que tendremos 4 clases fenotípicas distintas en la F2, deberíamos calcular el 2 total y buscar en la tabla el valor correspondiente para 3 grados de libertad. La Figura 9.1 muestra el uso del 2 para estimar si unas proporciones fenotípicas se ajustan a las esperadas según las leyes mendelianas. Otra consideración previa a los temas que vamos a tratar en este capítulo hace referencia a la manera de nombrar los diferentes alelos de cada gen. Es bastante evidente que al principio cada genetista utilizaba distintas nomenclaturas, y se tardó un tiempo en alcanzar un consenso sobre la notación de los alelos. Aunque hoy en día se pueden utilizar distintas formas de denominar los alelos, podemos dar unas reglas generales. Como ya vimos al explicar los experimentos de Mendel, lo más habitual es denominar los alelos con la letra inicial del carácter recesivo (por ejemplo, vimos que los alelos para el color del guisante se llamaban V y v por ser ésta la inicial de "verde", que es el carácter recesivo). Así, podemos utilizar una sola letra tanto para el alelo dominante (poniéndola en mayúscula) como para el recesivo (en minúscula). En otros casos, se estudian mutaciones respecto a un carácter normal, y hay que establecer nombres para los alelos que causan las mutaciones y para el alelo normal. Un buen ejemplo es el color del ojo de Drosophila, para el que hay un alelo que causa el color normal rojo ladrillo y otros alelos mutantes que dan lugar a ojos de distintos colores. En general, a los alelos normales se les denomina alelos "silvestres" o "salvajes", porque son los que se encuentran en la naturaleza. Cada alelo mutante se representa por una o varias letras que describen la mutación (br para "brown", ojos marrones, por ejemplo) y el alelo salvaje se representa entonces por esas mismas letras añadiendo el superíndice +. Por ejemplo, una mosca heterocigota para la mutación "brown" tendría un genotipo br + /br. En ocasiones se eliminan las letras del alelo silvestre, dejando únicamente el +. Así, el genotipo anterior también podría representarse como +/br. Dependiendo del estado dominante o recesivo del alelo mutante, éste se representa con mayúsculas o minúsculas, respectivamente. En los casos en que no hay dominancia ó en las series alélicas (en las que hay varios alelos para un mismo carácter y las relaciones de dominancia entre ellos son complejas) se suelen utilizar superíndices para designar los distintos alelos, como por ejemplo en el color del plumaje de patos "Mallard". Para este carácter hay 3 alelos denominados M, M R y m d, siendo la dominancia: M R (Restricted) > M (Mallard) > m d (Dusky). En el caso concreto de la Genética Humana, las recomendaciones actuales indican que los alelos se designen mediante un número o una letra, precedido por un asterisco, a continuación del símbolo del gen. Por ejemplo, la variante Constant Spring de la hemoglobina alfa-2 se puede denominar HBA2*0001 (alelo 0001 del gen HBA2).

105 CAPÍTULO 9: MODIFICACIONES DE LAS PROPORCIONES MENDELIANAS 97 Modificaciones de las proporciones mendelianas al estudiar un carácter Como hemos visto, tras los trabajos de Bateson, Morgan y muchos otros genetistas los principios mendelianos se aceptaron como algo de aplicación general. Sin embargo, también desde el principio se reconocieron excepciones que no podían ser explicadas por estos principios, al menos aparentemente. Por ejemplo, observaciones en plantas habían revelado casos en los que la F1 de un cruce monohíbrido tenía un fenotipo intermedio entre el dominante y el recesivo de los progenitores, y ese fenotipo intermedio estaba presente también en el 50% de la F2. Este era el caso del color de la flor en algunas especies, en las que al cruzar una variedad pura de flores rosas con otra variedad pura de flores blancas se obtenía en la F1 un 100% de flores rosas (color intermedio entre el rojo y el blanco). En la F2 resultante de la autofecundación de flores de la F1 se obtenían 25% de flores rojas, 50% de flores rosas y 25% de flores blancas. Es fácil darse cuenta de que estas proporciones fenotípicas de la F2 (1:2:1) coinciden con las proporciones genotípicas esperadas, en vez de las proporciones fenotípicas 3:1 que son habituales en este tipo de cruces. Estos resultados sugieren que no se está cumpliendo la condición de dominancia completa de un alelo sobre el otro, de modo que los heterocigotos muestran un fenotipo distinto (un poco menos fuerte ) que los homocigotos dominantes. La explicación para esta dominancia débil está en que el carácter fenotípico obedece a efectos de dosis, es decir, el fenotipo depende de la dosis en que aparece el alelo dominante. En el ejemplo del color de las flores, podemos imaginar que el alelo recesivo da lugar a flores blancas (cuando se trata de plantas homocigotos recesivos) porque no produce ninguna cantidad de pigmento rojo; el alelo que da lugar al color rojo hace que se produzca una cantidad determinada de pigmento rojo, y por tanto la presencia de dos alelos rojos (homocigoto dominante) tendrá como resultado flores más rojas que la presencia de un sólo alelo rojo (heterocigoto rojo/blanco), en cuyo caso las flores serán de un color rojo débil o rosa. Este fenómeno se denomina dominancia incompleta ó semidominancia, y es muy común en caracteres fenotípicos que son el resultado de la acción de algún enzima, ya que la actividad enzimática total dependerá del número de alelos capaces de producir el enzima correspondiente. Otra circunstancia que puede modificar las proporciones fenotípicas mendelianas por relaciones anómalas entre alelos es la co-dominancia, en la que cada uno de los alelos da lugar a un producto funcional que se expresa con independencia del otro. En estas condiciones, el heterocigoto tendrá un fenotipo distinto a cualquiera de los dos homocigotos, que también serán distintos entre sí. Por eso, las proporciones fenotípicas de la F2 serán también del tipo 1:2:1, como en el caso anterior. Un ejemplo típico de codominancia en un carácter codificado por un gen es el grupo sanguíneo MN en la especie humana. El locus que codifica este carácter puede presentarse en dos formas alélicas llamadas L M y L N, las cuales codifican unas glicoproteínas de la membrana de los eritrocitos que dan lugar a los antígenos M y N respectivamente. Los individuos homocigotos L M /L M tienen fenotipo M, los homocigotos L N /L N tienen fenotipo N, y los heterocigotos L M /L N tienen fenotipo MN. Por tanto, un cruzamiento entre heterocigotos L M /L N X L M /L N producirá proporciones fenotípicas 1:2:1 (25% MM, 50% MN, 25% NN). En el fondo, se trata de la misma situación que veíamos para la dominancia incompleta, con la diferencia de que aquí los dos alelos producen una proteína funcional y por tanto ambos son igualmente dominantes. Poniéndolo en los mismos términos del ejemplo anterior, sería como una planta con un alelo que produce un pigmento que genera flores de color rojo y otro alelo que produce un pigmento para el color amarillo: todas las plantas de la F1 serán de color naranja (heterocigotos) y en la F2 se producirán 25% de flores rojas, 50% naranjas y 25% amarillas.

106 Concentración de enzima 98 GENÉTICA HUMANA Los videos de la Figura 9.2 ilustran los conceptos de codominancia y dominancia incompleta. A A A a a a Aunque en especies diploides cada individuo sólo tiene dos alelos en cada locus autosómico, esto no quiere decir que esos dos alelos sean los dos únicos alelos posibles que se pueden encontrar en la naturaleza para ese carácter. De hecho, para muchos rasgos fenotípicos es habitual que haya más de dos alelos posibles, sobre todo si se incluyen todos los alelos mutantes que se pueden encontrar. Este fenómeno se conoce como alelismo múltiple y el conjunto de alelos se denomina serie alélica. La presencia de alelos múltiples es otro motivo por el que en ocasiones las proporciones mendelianas no se cumplen. El ejemplo más ilustrativo en genética humana es el del grupo sanguíneo ABO, originado por unos antígenos de la membrana de los eritrocitos. Estos antígenos están derivados de la sustancia H, que es una glicoproteína de membrana que termina con los residuos N-acetil-glucosamina Galactosa Fucosa ( NacGlu-->Gal-->Fucosa). El antígeno 0, codificado por el alelo I O ó i, mantiene intacta la sustancia H; el antígeno A, codificado por el alelo I A, añade un resto N-acetil-galactosamina a la Galactosa de la sustancia H, y el antígeno B, codificado por el alelo I B, añade una galactosa a la galactosa de la sustancia H. Los alelos I A e I B son codominantes entre sí, pero lógicamente ambos son dominantes sobre I O ya que éste no produce ningún antígeno distinto a la sustancia H. Teniendo en cuenta estas relaciones de dominancia, esta serie alélica puede dar lugar a 4 posibles fenotipos (A, B, AB y O) a partir de una gran variedad de genotipos. Por ejemplo, el cruce entre un individuo de fenotipo A y otro de fenotipo B puede dar lugar a distintos tipos de descendencia, dependiendo de los genotipos de los progenitores. Si el cruce es del tipo I A I A X I B I B toda la descendencia serán heterocigotos I A I B con fenotipo (grupo sanguíneo) AB. Sin embargo, si se trata de un cruce I A I O X I B I O (en el que los progenitores también son de grupo sanguíneo A y B respectivamente) la descendencia tendrá proporciones fenotípicas ¼ A, ¼ B, ¼ AB y ¼ O. Estos porcentajes, a primera vista, pueden confundir y llevar a pensar que este carácter no se hereda de forma mendeliana. El análisis detallado de cada tipo de cruzamiento confirma que también se cumplen los postulados de Mendel, aunque la presencia de más de dos alelos distintos, con diferentes

107 CAPÍTULO 9: MODIFICACIONES DE LAS PROPORCIONES MENDELIANAS 99 relaciones de dominancia entre sí, puede confundir la interpretación de las proporciones halladas en la descendencia. La Figura 9.3 muestra la estructura de los grupos sanguíneos ABO y las consecuencias del alelismo múltiple. N-Acetilgalactosamina FENOTIPO A Alelo I A (añade N-acetilgalactosamina) Fucosa Galactosa N-Acetilglucosamina Alelo i (no añade nada) FENOTIPO O Sustancia H Alelo I B (añade galactosa) Galactosa FENOTIPO B La última situación en la que no se obtienen las proporciones mendelianas esperadas cuando se estudia un carácter fenotípico es aquella en la que uno de los alelos es letal, es decir, impide el desarrollo embrionario de los individuos que llevan una o dos copias de ese alelo. Cuando la letalidad se produce sólo en individuos homocigotos para ese alelo, se habla de un alelo letal recesivo, mientras que si basta con la presencia de un sólo alelo para causar letalidad se habla de letal dominante. Un ejemplo típico de alelos letales es el del locus que controla el pelaje amarillo de ratones, estudiado por Cuenot en Al alelo que produce un pelaje normal se le llama agouti (ó agutí) en referencia a un roedor de ese nombre que vive en Sudamérica. El pelaje agutí normal se debe a que cada pelo tiene pequeñas bandas transversales negras y amarillas, de modo que la apariencia final es de un pelaje castaño. Además del alelo agutí normal (A) y de su correspondiente recesivo a, existe un alelo que origina un pelaje de color comletamente amarillo (A Y ), que es dominante respecto al alelo agutí A. Por tanto, los cruces entre un ratón agutí y otro amarillo, o entre dos ratones agutí, producen las proporciones mendelianas esperadas en al descendencia. Por ejemplo, el cruce AA X A Y A (ratón agutí con ratón amarillo) tendrá una descendencia con 50% de ratones agutí y 50% amarillos. En cambio, los cruces entre ratones amarillos tienen descendencia con 1/3 de ratones agutí y 2/3 de ratones amarillos, lo cual no se corresponde con las proporciones fenotípicas esperadas. Si el cruce fuese del tipo A Y A X A Y A, en la descendencia deberíamos encontrar ¼ AA, ¼ A Y A Y y ½ A Y A, lo cual se debería traducir en ¾ amarillos y ¼ agutí (proporción 3:1 típica). La explicación reside precisamente en que el alelo A Y es letal recesivo, y provoca la muerte embrionaria de ratones homocigotos A Y A Y. Por eso, al descontar el 25% de ratones A Y A Y nos quedamos sólo con descendencia de

108 100 GENÉTICA HUMANA genotipos AA ó A Y A y de ahí las proporciones encontradas. El alelo amarillo (A Y ) es, por tanto, un ejemplo de un alelo letal, recesivo en cuanto a la letalidad pero dominante en cuanto al carácter fenotípico que controla (el color amarillo del pelaje). En el caso de humanos es más difícil descubrir genes con alelos letales, porque habitualmente no tienen otro efecto fenotípico que permita reconocerlos. A veces se ven proporciones ligeramente distintas a las esperadas, y en esos casos se sospecha que uno de los alelos es subvital o subletal, es decir, que causa cierta mortalidad durante el desarrollo embrionario. Al llegar al final de este apartado, es muy importante recordar que todas las posibles desviaciones de las proporciones fenotípicas mendelianas que hemos visto hasta ahora están causadas por problemas en los alelos de un único gen que controla un carácter fenotípico, bien por falta de dominancia completa, por la existencia de múltiples alelos o por la presencia de alelos letales. Por eso las hemos agrupado bajo el epígrafe de modificaciones del monohibridismo, porque son situaciones que surjen al analizar un único gen. Modificaciones del dihibridismo. Interacción génica y epistasia En ocasiones, cuando se estudian dos caracteres fenotípicos también se obtienen proporciones distintas a las esperadas según los principios mendelianos, que predicen una descendencia con proporciones 9:3:3:1 al cruzar dos individuos heterocigotos para cada uno de los caracteres. Lógicamente, las circunstancias estudiadas en el apartado anterior también afectarán a estas proporciones si uno de los genes que analizamos está sujeto a codominancia, dominancia incompleta, letalidad, etc. Por ejemplo, podemos considerar dos caracteres distintos tales como el grupo sanguíneo ABO (cuyo sistema alélico ya ha sido explicado) y el albinismo. Éste último es un carácter mendeliano controlado en ratones por un solo gen, con un alelo silvestre A y un alelo recesivo a que provoca albinismo en homocigotos aa. Si cruzamos ratones dobles heterocigotos Aa/I A I B, la descendencia no se ajustará a las proporciones típicas 9:3:3:1, sino que obtendremos ratones pigmentados con grupo sanguíneo A, B ó AB, y también ratones albinos con cualquiera de los tres grupos sanguíneos. Las proporciones fenotípicas serán 3:6:3:1:2:1, que en el fondo es una modificación de la relación 9:3:3:1. La razón de este fenómeno es que los alelos que determinan el grupo sanguíneo son co-dominantes (los alelos I A y I B ) y por eso se distorsionan las proporciones fenotípicas esperadas. Habitualmente, las anomalías en las proporciones del dihibridismo se detectan cuando se estudia un carácter fenotípico que está controlado por dos ó más genes, debido a un fenómeno llamado interacción génica. En efecto, aunque cada gen por separado se comporte de acuerdo a los principios mendelianos y los genotipos sean los esperados, puede suceder que las proporciones fenotípicas sean aberrantes porque ambos genes están controlando un mismo carácter y la acción de uno enmascara los genotipos del otro. La interacción génica no significa que ambos genes o sus productos interaccionen directamente, sino que participan en una misma vía o proceso biológico (como puede ser la generación de un pigmento en varios pasos metabólicos, por ejemplo). Si cada gen actúa a distintos niveles de esa vía, uno de ellos puede afectar la expresión del otro y dar lugar a proporciones fenotípicas inesperadas en la descendencia. El principal obstáculo que nos encontramos para interpretar las proporciones es que, si únicamente estamos analizando un carácter fenotípico, es imposible saber a priori si dicho carácter está controlado por un gen o por varios. En efecto, en el caso de dos caracteres era fácil porque podíamos agrupar la descendencia en las cuatro posibles categorías fenotípicas que surjen al considerar dos caracteres a la vez, pero aquí estamos observando un carácter solamente. La pista que nos indica el número de genes implicados es el denominador de las proporciones fenotípicas encontradas: si éstas se expresan en dieciseisavos, podemos suponer que nos encontramos ante un carácter fenotípico controla por dos genes, si son sesentaycuatroavos se tratará de 3 genes, etc.

109 CAPÍTULO 9: MODIFICACIONES DE LAS PROPORCIONES MENDELIANAS 101 Los efectos de la interacción génica pueden ser básicamente de dos tipos: la aparición de fenotipos nuevos (que no estaban presentes en los progenitores) y la modificación de las proporciones típicas del dihibridismo. Por lo que respecta al primero, recordemos que según los principios mendelianos el carácter recesivo de uno de los progenitores desaparece en la F1 y reaparece en el 25% de la F2. En cambio, si un carácter está controlado por dos genes distintos, a veces el resultado es que en la F2 aparecen fenotipos nuevos que no estaban presentes en la F1 ni en los progenitores. Tal es el caso, por ejemplo, del color del pimiento Capsicum annuum, que es un rasgo fenotípico determinado por dos loci: uno de ellos determina la producción o no de pigmento rojo, con un alelo R que produce pigmento rojo y es dominante sobre el alelo r que no produce pigmento. El otro gen controla la degradación de la clorofila (de color verde), con un alelo dominante C que degrada la clorofila para dar un color amarillento (sin pigmento), y un alelo recesivo c que no degrada la clorofila y por tanto da el color verde típico. En estas circunstancias, un cruce de variedades puras RRCC (de color rojo) X rrcc (de color verde) da lugar al 100% de plantas RrCc (de color rojo) en la F1. Hasta aquí todo parecería indicar que el color del pimiento está controlado por un solo gen. En cambio, el cruce RrCc X RrCc produce en la F2 unas proporciones genotípicas con 9/16 R_C_ de color rojo, 3/16 R_cc de color marrón (por la presencia simultánea del rojo y el verde), 3/16 rrc_ de color amarillento por la ausencia de pigmentos y 1/16 rrcc de color verde. Esto va contra los principios del monohibridismo mendeliano típico, ya que tenemos cuatro fenotipos distintos. Aunque esto podría sugerir la presencia de alelos múltiples para un solo locus, las proporciones encontradas para las cuatro clases fenotípicas (expresadas en dieciseisavos) sugieren que este carácter está controlado por dos loci. Otro ejemplo de este fenómeno es el color de los ojos de la Drosophila, en el que el tipo silvestre de color rojo ladrillo está controlado por dos genes: brown (marrón) y scarlet (escarlata). El locus brown tiene un alelo silvestre bw + dominante sobre el recesivo marrón (br) y el locus scarlet tiene un alelo silvestre st + dominante sobre el recesivo (st) que produce ojos de color rojo escarlata. Las moscas con ojos de color silvestre tienen un genotipo bw + bw + /st + st +. Al cruzar una mosca mutante con ojos de color marrón (bwbw/st + st + ) con otra de ojos escarlata (bw + bw + /stst), toda la F1 es doble heterocigótica (bw + bw/st + st) y por tanto con ojos del color silvestre rojo ladrillo. En la F2 resultante del cruce entre moscas de la F1, se obtiene un nuevo fenotipo (ojos de color blanco) en 1/16 del total, y proporciones 9:3:3:1 de los fenotipos silvestre, marrón, escarlata y blanco respectivamente. Nuevamente, la presencia de 4 clases fenotípicas expresadas en dieciseisavos nos alerta sobre la presencia de dos loci controlando este carácter. De hecho, lo que sucede es que el locus brown controla la producción de un pigmento de color rojo brillante llamado drosopterina, mientras que el locus scarlet controla la producción de otro pigmento de color marrón llamado xantomatina. En situaciones normales, el color silvestre es el resultado de la mezcla de ambos pigmentos. En cambio, mutaciones en el locus brown hacen que no se produzca drosopterina y el único pigmento del ojo sea la xantomatina (de ahí el color marrón del ojo). Las mutaciones en el locus scarlet hacen que no se produzca xantomatina, siendo el color del ojo rojo escarlata por la presencia de drosopterina. Los dobles mutantes recesivos (1/16) del total de la F2, carecen de ambos pigmentos y por tanto tienen ojos de color blanco. El otro efecto de la interacción génica es la distorsión de las proporciones mendelianas esperadas al analizar un carácter. Dicha distorsión puede ser debida a la presencia de dos genes que controlan dicho carácter, de modo que uno de los genes enmascara la expresión del otro. Este fenómeno se conoce con el nombre de epistasia y puede ser de distintos tipos, como veremos a continuación. Al gen que modifica la expresión del otro se le denomina gen epistático, y al gen cuya expresión es modificada se le denomina gen hipostático. Un buen ejemplo para entender la epistasia, utilizando los grupos sanguíneos humanos, es el llamado fenotipo Bombay. Como se recordará, los isoantígenos A y B resultan de la adición de N-acetil-galactosamina ó de galactosa, respectivamente, a la sustancia H. Por tanto, sólo los individuos que tienen sustancia H en la membrana de los eritrocitos pueden expresar antígenos A ó B. La

110 102 GENÉTICA HUMANA producción de sustancia H (la adición de la última fucosa a la cadena glicosídica) está controlada por otro locus distinto que presenta un alelo dominante H (produce sustancia H completa) y otro alelo recesivo h (no la produce). Por tanto, los individuos homocigotos hh no producirán sustancia H y no podrán expresar ningún isoantígeno aunque tengan alelos I A ó I B para el locus del sistema ABO. Este fenómeno se encontró por primera vez en una mujer del grupo O hija de padres A y AB, lo cual es imposible según la herencia del sistema ABO. Esta mujer, casada con un individuo del grupo A (genotipos posibles I a i ó I A I A ) tuvo descendencia del grupo A, B y AB, lo cual también es impsible si ella fuese realmente del grupo O (genotipo ii). La explicación es que la mujer en realidad tenía genotipo I B i y por tanto debería ser del grupo B, pero como es homocigota para el alelo recesivo h y no produce sustancia H su fenotipo es del grupo O. Podemos imaginar un cruce entre individuos dobles heterocigotos para el grupo ABO y para la sustancia H, del tipo I A I B /Hh X I A I B /Hh. Según el locus ABO, la descendencia debería ser ¼ del grupo A, ¼ del grupo B y ½ del grupo AB. Sin embargo, al tener en cuenta el locus H vemos que ¼ de cada una de esas categorías serán homocigotos hh (sin sustancia H) y por tanto del grupo O. Al considerar ambos loci, las proporciones fenotípicas serán 3/16 del grupo A, 6/16 del grupo AB, 3/16 del grupo B y 4/16 del grupo O, lo cual se desvía de las proporciones esperadas 9:3:3:1. Como vemos, la presencia de un gen epistático (el que controla la producción de sustancia H) enmascara la expresión del locus ABO (que en este ejemplo es el gen hipostático) porque ambos genes están implicados en procesos bioquímicos que interaccionan en un mismo carácter fenotípico. Como las proporciones fenotípicos se expresan en dieciseisavos, esto nos alertaría inmediatamente sobre la presencia de dos genes interactuando de modo epistático aunque no supiésemos nada de la existencia de la sustancia H. La Figura 9.4 muestra un ejemplo del fenotipo Bombay. En general, la epistasia puede ser recesiva o dominante, según el gen epistático deba estar en homocigosis o no, respectivamente, para enmascarar la expresión del gen hipostático. A su vez, la epistasia puede ser simple (uno de los genes es epistático sobre el otro) ó doble (ambos loci son epistásicos el uno sobre el otro). Veamos algunos ejemplos de los tipos de epistasia más comunes: Epistasia simple recesiva: Ya vimos que el color del pelaje de ratones está controlado por el gen agutí, con un alelo A dominante sobre a, de forma que los ratones A- (AA ó Aa) son de fenotipo agutí y los ratones aa tienen pelaje negro (carecen de las pequeñas bandas amarillas). Existe otro gen que controla la presencia o no de pigmentación, con alelo dominante C (pigmentación) y un alelo recesivo C a que impide cualquier tipo de pigmentación. Los ratones de genotipo homocigoto recesivo C a C a son, por tanto, albinos, mientras que los ratones C- (CC ó CC a ) son del color especificado por el locus agutí. La F1 de un doble homocigoto dominante CC/AA (agutí) con un doble homocigoto recesivo aa/c a C a (albino) son todos heterocigotos dobles de pelaje agutí (genotipo Aa/CC a ). La F2 resultante de cruzar ratones de la F1 muestra una proporción 9:4:3 (agutí:albino:negro) por epistasia de C sobre A. En este caso, hablamos de epistasia recesiva porque el alelo C a es recesivo (sólo C a C a modifica el fenotipo determinado por A). El ejemplo anterior del fenotipo Bombay es también una epistasia de este tipo, pero al ser codominantes los grupos sanguíneos los 9/16 se descomponen en 6/16 y 3/16 (de ahí las proporciones 3:6:4:3 que veíamos). La epistasia simple recesiva es muy común entre genes que actúan a distintos pasos de una misma vía metabólica, y por eso es frecuente en enfermedades del metabolismo. Por ejemplo, cuando la producción de un pigmento se lleva a cabo en dos pasos metabólicos, de modo que el producto de la primera reacción es el sustrato de la segunda reacción, las mutaciones que afectan al enzima responsable de la primera reacción serán epistáticas sobre el gen que controla el segundo paso.

111 CAPÍTULO 9: MODIFICACIONES DE LAS PROPORCIONES MENDELIANAS 103 Epistasia simple dominante: en este caso el alelo del gen epistático es dominante, y basta con una sola copia para que enmascare el efecto del gen hipostático. Un ejemplo típico es el color de la calabaza común, en el que intervienen un gen que controla el primer paso metabólico en la producción de un pigmento. El alelo normal (w) permite la reacción química, pero es recesivo frente al alelo W que impide dicha reacción. El producto de este primer paso es el sustrato de una segunda reacción controlada por otro gen (con alelos Y e y) que da lugar al color final de la calabaza. Las plantas con genotipo ww para el primer gen (es decir, se lleva a cabo el primer paso de la vía) pueden ser amarillas (genotipos YY ó Yy para el segundo gen) ó verdes (genotipo yy). En cambio, basta la presencia de un alelo W en el primer locus para que todas las plantas sean blancas, porque no se completa la primera reacción y no hay pigmentación. En este tipo de espistasia, la F2 resultante del cruce de dobles heterocigotos muestra proporciones fenotípicas 12:3:1, con 12/16 del fenotipo determinado por el alelo dominante del gen epistático. Epistasia doble recesiva: este tipo de epistasia fue observada por primera vez Bateson y Punnett al estudiar el color de las flores de Lathyrus odoratus (guisante oloroso). Vieron que al cruzar dos flores blancas todas las plantas de la F1 eran púrpuras y en la F2 aparecía una proporción 9:7 de púrpuras:blancas. Las proporciones en dieciseisavos confirman la presencia de dos loci P y Q que controlan este carácter. La proporción 9:7 se puede explicar si consideramos que ambos genes tienen un alelo dominante (P ó Q) y otro recesivo (p ó q) y actúan sobre dos pasos sucesivos en la vía metabólica que genera el pigmento de las flores. Si el pigmento que da el color púrpura sólo se produce cuando están presentes al menos un alelo dominante de cada uno de los genes implicados, la descendencia de un cruce del tipo PPqq x ppqq (en el que ambas plantas tienen flores blancas), será del 100% de dobles heterocigotos PpQq en la F1 (todas con flores púrpuras, pues tienen un alelo dominante de cada par génico). El cruce de estas plantas dará en la F2 9/16 de plantas con genotipo homocigoto recesivo para alguno de los dos genes (blancas); el resto serán púrpuras por tener genotipos con un alelo dominante para ambos genes. Se denomina doble recesiva porque la presencia de cualquiera de los dos homocigotos recesivos para uno de los genes es epistático sobre el otro gen. Otros tipos de espistasia. Se conocen muchos otros ejemplos de epistasia en las que las relaciones entre el gen epistático y el hipostático pueden ser distintas. Por ejemplo, cuando un fenotipo requiere la presencia de al menos un alelo dominante para cualquiera de los dos loci que controlan un carácter, el fenotipo alternativo aparecerá únicamente en individuos dobles homocigotos, y las proporciones obtenidas en la F2 de un cruce entre dobles heterocigotos serán 15:1. Este tipo de epistasia se denomina doble dominante porque los dos alelos epistáticos son dominantes de modo recíproco, y es típica de genes que se han originado por duplicación a partir de un gen ancestral y controlan un mismo carácter fenotípico. Otra situación distinta es la que origina epistasia doble dominante/recesiva, debida a la supresión dominante de un gen sobre el efecto del otro y que produce proporciones fenotípicas 13:3. El video de la Figura 9.5 ilustra el concepto de epistasia. Como conclusión a este capítulo, conviene recordar que todas las desviaciones que hemos visto de las proporciones fenotípicas esperadas según los principios mendelianos no invalidan las conclusiones de Mendel, sino que en el fondo las confirman. Sin embargo, estas excepciones sirven para recordarnos que los caracteres hereditarios que están controlados por un solo locus con dos alelos son, en realidad, una minoría. Curiosamente, los 7 caracteres descritos por Mendel en su artículo original cumplían estos requisitos, pero la mayor parte de los rasgos genéticos son más complejosy están sometidos

112 104 GENÉTICA HUMANA a alguno de los fenómenos descritos (codominancia, alelismo múltiple, interacción, etc). Como veremos más adelante, los rasgos de mayor importancia en Genética Humana están controlados por dos ó más genes, y generan muchas veces variación fenotípica contínua. Aunque las leyes de Mendel son todavía aplicables incluso en estos casos, la interpretación se complica tremendamente al aumentar el número de loci, al aparecer alelos mutantes y al añadirse los efectos de la interacción entre los genes y el ambiente.

113 CAPÍTULO 10: GENÉTICA DE LOS CARACTERES CUANTITATIVOS 105 Capítulo 10. Genética de los caracteres cuantitativos: experimentos de Johannsen, Nilsson-Ehle y East. Modelo poligenes-ambiente y enfermedades multifactoriales. Heredabilidad en sentido amplio y en sentido restringido. Cálculo de la heredabilidad en Genética humana. Genética de los caracteres cuantitativos Hemos visto que Mendel se centró en el estudio de caracteres cualitativos (es decir, caracteres que sólo aparecen en dos posibles formas alternativas), que generan un tipo de variación llamada variación discontinua. Sin duda alguna, la gran intuición de Mendel fue que sólo el estudio de la variación discontinua le permitiría desentrañar las leyes de la herencia y los factores implicados en la misma. Sus experiencias le habían mostrado que este tipo de caracteres eran los únicos que reaparecían en la F2 después de haber desaparecido en la F1. Por el contrario, los caracteres cuantitativos o continuos (que admiten muchos valores posibles y en los que los valores individuales se agrupan en torno a una media, como el caso la altura de una planta, el peso de los frutos, etc) no mostraban este comportamiento. La importancia de esta decisión fue extraordinaria, sobre todo teniendo en cuenta que la teoría prevalente en ese momento era contraria a esta manera de pensar. Por ejemplo, Darwin daba preferencia a los caracteres cuantitativos respecto a los cualitativos (que consideraba de menor importancia) y aceptaba una teoría llamada pangénesis. Según esta teoría, la herencia sería el resultado de la mezcla de gémulas, unas partículas somáticas que de algún modo llegarían a la descendencia y determinarían que los caracteres de la descendencia fuesen intermedios a lo encontrado en ambos progenitores. Esto curioso que Darwin no se fijase en la importancia de la variación discontinua, porque de hecho un modelo de herencia basado en caracteres cualitativos favorecía más su teoría evolutiva. Probablemente fue muy importante la influencia del pensamiento de Francis Galton, que estaba convencido de que los caracteres cuantitativos constituyen la base de la variación entre individuos y no entendía que éstos pudiesen ser explicados por medio de variaciones discontinuas. De hecho, Galton había estudiado el tamaño de la planta del guisante y había encontrado evidencias de variación continua (una F1 con altura intermedia a la de ambos progenitores). Estos experimentos tenían sus antecedentes en Kölreuter, un botánico que en 1766 había hecho numerosos cruces en plantas y había encontrado caracteres (como la altura de la planta Nicotiana, por ejemplo) que mostraban variación continua. No es de extrañar, pues, que se generase una fuerte controversia a principios del siglo XX entre los partidarios del mendelismo y los biometricistas (discípulos de Galton, defensores de la variación continua). Por desgracia, la influencia de Galton y la aplicación de las ideas de los biometricistas a sujetos humanos ocasionaron una de las páginas más oscuras de la Genética a principios del siglo XX, ya que cristalizaron en el movimiento eugenésico, que floreció en los Estados Unidos de la mano de Charles Davenport en el laboratorio de Cold Spring Harbor. Con la idea de mejorar la raza humana mediante apareamientos selectivos, los eugenistas pretendían eliminar de la sociedad rasgos "negativos" como la criminalidad, el analfabetismo o la prostitución; su presión fue suficiente para que el gobierno de los Estados Unidos aprobase entre 1910 y 1939 legislación eugenésica en tres áreas: restricción de la inmigración europea; impedir matrimonios entre individuos de razas distintas; esterilización de los individuos "genéticamente infradotados". El auge del movimiento nazi con la aplicación de la "solución final" contribuyó al descrédito del movimiento eugenista americano, llevando al cierre de su principal laboratorio en Por desgracia, muchas de las leyes aprobadas siguieron vigentes durante años, y la esterilización de los deficientes mentales continuó en Estados Unidos hasta los años 1970; para entonces, unos norteamericanos habían sido esterilizados sin consentimiento propio o de los responsables legales.

114 106 GENÉTICA HUMANA En la Figura 10.1 se puede encontrar un enlace a los archivos del movimiento eugenésico americano. Las disputas en torno a las bases genéticas de la variación continua se resolvieron por los experimentos de varios genetistas en las primeras décadas del siglo XX. El primero en abordar la utilización de metodología estadística en el estudio de la variación continua fue el botánico danés Johannsen, que tuvo una gran importancia en la Genética (a él se deben los términos gen, genotipo y fenotipo, por ejemplo). En sus trabajos, que se extendieron de 1903 a 1909, intentó estudiar el efecto de la herencia y del ambiente sobre la variación, siguiendo la idea inicial de Galton de nature versus nurture. Johannsen estudió sobre todo el peso de las alubias de Phaseolus vulgaris en una cepa comercial y detectó la presencia de variación continua, con alubias de distintos pesos que se agrupaban en torno a un valor medio. Autopolinizando durante varias generaciones, consiguió líneas puras para minimizar el efecto genético y estudió la F1. A pesar de tratarse de líneas puras, los pesos de las semillas de cada una de estas líneas siguen una distribución normal, con valores ligeramente distintos. Al plantar semillas de pesos diferentes (pero todas procedentes de una misma línea pura y por tanto genéticamente iguales), encontró que el peso medio de la progenie de las distintas semillas era idéntico (no significativamente distinto) y coincidía con la media de pesos de la línea pura original. Por ejemplo, en su línea pura número 13 las semillas se distribuían en torno a un peso medio de 0,45g, pero había semillas de pesos mayores y menores a esta media, como es lógico. Al plantar algunas de estas semillas y estudiar el peso de la alubia en la progenie, encontró que una semilla de 0,28g producía alubias con un peso medio de 0,45g, una semilla de 0,48g producía alubias con un peso medio de 0,43g, y una semilla de 0,58g producía plantas que daban alubias con un peso medio de 0,46g. Esto demostraba la presencia de factores genéticos (responsables de que el peso medio de las alubias sea igual a la media del peso de las semillas originales, como es de esperar en una línea pura); pero además también demostraba la presencia de otros factores (presumiblemente ambientales) que hacen que las semillas no sean todas idénticas, sino que el peso varíe en torno a un valor medio. Además, cada línea pura tenía un peso medio de alubia característico, con una media que se repetía en la F1 aunque se plantasen semillas con pesos dispares. Fue, por tanto, Johannsen el primero en sugerir experimentalmente que la variación continua podría explicarse por una combinación de factores genéticos y ambientales. La Figura 10.2 explica los experimentos de Johannsen. De todas formas, esto no demostraba que los factores genéticos implicados en la herencia de caracteres continuos fuesen de tipo mendeliano. Algunos biometricistas, sobre todo el matemático Pearson, seguían negando la posibilidad de que los factores mendelianos pudiesen explicar la variación continua. Sin embargo, Bateson y Yule elaboraron en 1906 una argumentación matemática para explicar que la presencia de varios factores mendelianos con dominancia incompleta puede originar la variación continua de los caracteres cuantitativos. De todas formas, la demostración experimental de esto no llegaría hasta los estudios de Herman Nilsson-Ehle en Nilsson-Ehle tenía varias líneas puras de trigo, en las que estudió caracteres cuantitativos con variación continua, tales como el color de las espigas. En sus líneas, las espigas tenían colores que iban desde el blanco al rojo oscuro pasando por estadíos intermedios (rojo claro, rojo). Cruzó en primer lugar una planta de espiga blanca con una de color rojo claro y obtuvo F1 en la que todas las espigas eran de color intermedio ( rosa ); en la F2 obtuvo tres clases fenotípicas con proporciones 1:2:1, siendo ¼ de plantas con espigas blancas, ½ espigas rosas y ¼ espigas de color rojo claro. En principio, como ya hemos visto al hablar del mendelismo, estas proporciones pueden explicarse perfectamente mediante un modelo mendeliano de dominancia incompleta del rojo sobre el blanco. Sin embargo, cuando cruzó plantas de espigas blancas con plantas de espigas rojas (más oscuras que el rojo

115 CAPÍTULO 10: GENÉTICA DE LOS CARACTERES CUANTITATIVOS 107 claro ) obtuvo 5 clases de plantas: 1/16 rojas, 4/16 intermedio entre rojo y rojo claro, 6/16 rojo claro, 4/16 rosa y 1/16 blancas. Estas proporciones (1:4:6:4:1) sugieren un modelo de dos pares génicos con epistasia doble dominante (15:1) y dominancia incompleta (todos los rojos suman 15). De hecho, el cruce de plantas de espiga blanca con plantas de color rojo oscuro dio lugar a 7 clases fenotípicas, con proporciones expresadas en sesentaycuatroavos: 1/64 de plantas con espigas blancas y el resto de las plantas con espigas de 6 clases de rojos (rojo claro, rojo y rojo oscuro más las categorías intermedias entre cada una de estas tres). Estas proporciones y el número de clases fenotípicas sugieren un modelo de epistasis triple dominante: tres loci con dominancia incompleta (y efecto aditivo de dosis), y el resultado fenotípico es la distribución del color de la espiga como una variable continua. Esta fue la primera demostración experimental de que un carácter controlado por varios genes puede mostrar variación continua aunque cada uno de los genes se herede de forma mendeliana, si cada uno de ellos tiene un pequeño efecto aditivo sobre el carácter fenotípico. Faltaba por demostrar que la variación debida a efectos ambientales puede ser responsable de las diferencias observadas entre individuos con genotipos idénticos. La demostración formal no llegaría hasta los estudios de Edward East en 1916, nuevamente con plantas. Estudiando la longitud de la corola en dos líneas puras de Nicotiana longiflora, vio que la F1 mostraba un tamaño intermedio a los fenotipos parentales, con arreglo a una distribución normal. En la F2, el valor medio se mantenía pero la varianza se ampliaba notablemente, aunque sin llegar a los valores extremos que se veían en las clases parentales. Esto se explica porque las plantas de la F1 son heterocigotos para todos los genes que intervienen en el tamaño de la flor, de modo que las plantas de la F2 tendrán varias combinaciones distintas de genotipos y de ahí la mayor dispersión de los resultados. De hecho, East observó que la F3 resultante de cruces seleccionados (entre plantas de la F2 que tenían el mismo tamaño de corola) reproducía exactamente el tamaño de las plantas cruzadas, con una dispersión de tamaños debida a factores ambientales. Por ejemplo, cruzó inicialmente dos variedades puras de 40 mm y 93 mm de media, respectivamente. En la F1, el tamaño medio de corola fue de 64 mm (con valores entre 61 y 67 mm). En la F2 resultante de cruzar dos plantas de la F1 se mantuvo el tamaño medio de corola (67 mm) pero aumentó la dispersión (valores entre 52 y 82 mm), indicando la presencia de nuevos genotipos que están originando tamaños distintos. Al cruzar dos plantas de esta F2 que tenían corolas del mismo tamaño (58mm), vio que la descendencia tenía un tamaño medio cercano a 58 mm; al cruzar dos plantas de 70 mm obtuvo una descendencia con tamaño medio cercano 70 mm, etc. Es decir, comprobó que efectivamente hay factores genéticos responsables de los distintos tamaños medios en los distintos cruces, al tiemp que los factores ambientales son los responsables de la dispersión de valores que se observa en las plantas que tienen un mismo genotipo. Con estos experimentos, East pudo demostrar el efecto simultáneo de la variación genética y la variación ambiental, cuyos efectos combinados contribuyen a crear variación continua. El video de la Figura 10.3 ilustra los experimentos de H. Nilsson-Ehle y de E. East.

116 108 GENÉTICA HUMANA Línea pura A Línea pura B Longitud corola (x): 40 mm 94 mm F F F Por tanto, un par de décadas después del re-descubrimiento de Mendel se había llegado a la explicación de cómo los principios mendelianos, que afectan a caracteres discretos (variación discontinua) pueden dar lugar a variación continua de caracteres cuantitativos: cuando un carácter fenotípico está controlado por dos ó más genes y los efectos de cada gen sobre ese carácter se suman. Esto se conoce como herencia poligénica. En estos casos, es de gran interés determinar el número de loci que intervienen. Lo más habitual, es determinar el porcentaje de individuos de la F2 que tienen valores en torno a cualquiera de los dos parentales. Así, para un solo gen esto sería ¼, para dos loci sería 1/16, para 3 loci sería 1/64, etc. Se puede ver que esto es igual a (¼) n, donde n es el número de loci distintos. Por ejemplo, ya vimos que el experimento de Nilsson-Ehle sugería 3 loci (1/64=[¼] 3 ), mientras que en el experimento de East ninguna de las 444 flores de la F2 tenía una corola de tamaño similar a la media de los progenitores, por lo que el número de poligenes debe ser al menos superior a 4 ([¼] 4 =1/256). Modelo poligenes-ambiente y enfermedades multifactoriales. Hemos visto cómo se llegó a explicar la variación continua por la acción de varios genes sobre un mismo carácter (herencia poligénica), y cómo la existencia de variación ambiental añadida hace que las diferencias entre las clases fenotípicas se suavicen y la variación sea más gradual. A la combinación de herencia poligénica con la variación introducida por factores ambientales se le llama herencia multifactorial, para indicar la multiplicidad de factores que intervienen en la expresión del carácter fenotípico. En el campo de la Genética Humana la herencia multifactorial es de gran importancia, porque la mayoría de los fenotipos y muchas enfermedades, llamadas también enfermedades complejas, siguen este tipo de herencia. De hecho, las enfermedades multifactoriales o complejas son las más importantes desde el punto de vista epidemiológico, por lo que actualmente son objeto de investigación con el fin de identificar los factores genéticos y ambientales implicados. Fruto del trabajo de estos últimos años, se ha detectado un alto

CÓDIGO GENÉTICO Y SÍNTESIS DE PROTEÍNAS

CÓDIGO GENÉTICO Y SÍNTESIS DE PROTEÍNAS CÓDIGO GENÉTICO Y SÍNTESIS DE PROTEÍNAS Sumario Mitosis y meiosis Código genético y síntesis de proteínas: 1. Concepto de gen 2. Estructura del ADN 3. La replicación del ADN 4. La transcripción 5. La traducción

Más detalles

ÁCIDOS NUCLEICOS. Por: Wilfredo Santiago

ÁCIDOS NUCLEICOS. Por: Wilfredo Santiago ÁCIDOS NUCLEICOS Por: Wilfredo Santiago Ácidos Nucleicos Formados por subunidades llamadas nucleótidos; pueden ser un solo nucleótido o una cadena larga de nucleótidos. Ácidos Nucleicos Nucleótidos individuales:

Más detalles

III. Material genético. b. Composición y estructura del RNA.

III. Material genético. b. Composición y estructura del RNA. III. Material genético b. Composición y estructura del RNA. RNA (ácido ribonucléico) Polímero de nucleótidos La pentosa de los nucleótidos es la Ribosa: en la posición 2' del anillo del azúcar hay un grupo

Más detalles

Biología Profundización

Biología Profundización UNIDAD 1: GENÉTICA SUB-UNIDAD 2: TRANSCRIPCIÓN Y TRADUCCIÓN Biología Profundización En esta sesión tú podrás: - Conocer el proceso transcripcional y post-transcripcional. - Reconocer los sucesivos procesos

Más detalles

1. Cuáles son las diferencias en los componentes químicos del ADN y ARN?

1. Cuáles son las diferencias en los componentes químicos del ADN y ARN? ACTIVIDADES TEMA 4 - BIOTECNOLOGÍA 1. Cuáles son las diferencias en los componentes químicos del ADN y ARN? Las cadenas de ADN están formadas por fosfato y desoxirribosa y la del ARN por fosfato y ribosa.

Más detalles

ADN ARN Proteínas. La información genética es portada por el ADN y se hereda con él.

ADN ARN Proteínas. La información genética es portada por el ADN y se hereda con él. Todos los organismos contienen información que les permite coordinar sus procesos. Esta información, a fin de poder ser transferida a la descendencia, esta asentada en una molécula capaz de replicarse,

Más detalles

Preguntas de selectividad en Andalucía. Ácidos nucleicos. Análisis e interpretación de imágenes, esquemas, figuras...

Preguntas de selectividad en Andalucía. Ácidos nucleicos. Análisis e interpretación de imágenes, esquemas, figuras... Año 2001 Describa las funciones más relevantes de los nucleótidos. Cite un ejemplo de nucleótido que participe en cada una de ellas [1,5]. Explique las funciones de los distintos tipos de RNA que participan

Más detalles

TEMA 4: DEL DESCUBRIMIENTO DE LOS ÁCIDOS NUCLEICOS A LA BIOTECNOLOGÍA

TEMA 4: DEL DESCUBRIMIENTO DE LOS ÁCIDOS NUCLEICOS A LA BIOTECNOLOGÍA TEMA 4: DEL DESCUBRIMIENTO DE LOS ÁCIDOS NUCLEICOS A LA BIOTECNOLOGÍA EL ADN, LA MOLÉCULA DE LA HERENCIA El ADN (ácido desoxirribonucleico) es la molécula portadora de la información genética que forma

Más detalles

IES Pando Departamento de Biología y Geología 1

IES Pando Departamento de Biología y Geología 1 IES Pando Departamento de Biología y Geología 1 2 Células en diversos estadios del ciclo celular en la raíz de ajo. 3 Diversos aspectos del núcleo durante el ciclo celular Ciclo celular 4 Repartición del

Más detalles

Identificación varietal en vid por técnicas de Biología Molecular. Lic. Luciana Garcia Lic. Carolina Chiconofri

Identificación varietal en vid por técnicas de Biología Molecular. Lic. Luciana Garcia Lic. Carolina Chiconofri Identificación varietal en vid por técnicas de Biología Molecular. Lic. Luciana Garcia Lic. Carolina Chiconofri OBJETIVO Desarrollar un banco de datos a partir de plantas de origen indudable y del uso

Más detalles

Qué es un gen? EXPRESION GÉNICA 01/05/2013

Qué es un gen? EXPRESION GÉNICA 01/05/2013 Qué es un gen? Es una secuencia de nucleótidos en la molécula de ADN, equivalente a una unidad de transcripción. Contiene la información, a partir de la cual se sintetiza un polipéptido, una enzima, un

Más detalles

J. L. Sánchez Guillén. IES Pando - Oviedo Departamento de Biología y Geología 1

J. L. Sánchez Guillén. IES Pando - Oviedo Departamento de Biología y Geología 1 J. L. Sánchez Guillén IES Pando - Oviedo Departamento de Biología y Geología 1 LOS ÁCIDOS NUCLEICOS CONCEPTO: Químicamente, los ácidos nucleicos son polímeros constituidos por la unión mediante enlaces

Más detalles

Tema 8. Funcionamiento del DNA (I)

Tema 8. Funcionamiento del DNA (I) Tema 8. Funcionamiento del DNA (I) Genética CC. Mar 2004-05 Objetivos Transcripción RNAs y procesamiento Genética CC Mar 2004/5 D. Posada, Universidad de Vigo 2 1 Dogma Central de la Biología Molecular

Más detalles

ARN mensajero. Síntesis y procesamiento. Corte y empalme. Capping. Poliadenilación. Estabilidad. Genética 1 er Curso. Facultad de Medicina TEMA 0-3

ARN mensajero. Síntesis y procesamiento. Corte y empalme. Capping. Poliadenilación. Estabilidad. Genética 1 er Curso. Facultad de Medicina TEMA 0-3 Facultad de Medicina Genética 1 er Curso TEMA 0-3 EXPRESIÓN GÉNICA: TRANSCRIPCIÓN Y TRADUCCIÓN ARN mensajero. La transcripción en eucariotas. Ribosomas. La traducción. ARN mensajero Apartados Síntesis

Más detalles

GUÍA N 1: MATERIAL GENETICO Y REPLICACIÓN DE ADN

GUÍA N 1: MATERIAL GENETICO Y REPLICACIÓN DE ADN SUBSECTOR PROFESOR NIVEL AÑO UNIDAD SEMESTRE Biología Iris Gaete IVº medio Hum 2016 Información Génica y Proteínas I GUÍA N 1 MATERIAL GENETICO Y REPLICACIÓN DE ADN Nombre Curso I. ESTRUCTURA DEL MATERIAL

Más detalles

REGULACIÓN TRANSCRIPCIONAL DE LA EXPRESIÓN GENICA

REGULACIÓN TRANSCRIPCIONAL DE LA EXPRESIÓN GENICA REGULACIÓN TRANSCRIPCIONAL DE LA EXPRESIÓN GENICA Niveles de organización de los seres humanos Biología Molecular Básica e Ingeniería Genética T.M. Claudia Troncoso M. Regulación expresión génica Diversidad

Más detalles

GENES Y MANIPULACIÓN GENÉTICA

GENES Y MANIPULACIÓN GENÉTICA GENES Y MANIPULACIÓN GENÉTICA El ADN, material de los genes La información que controla la aparición de los caracteres hereditarios se localiza en el interior del núcleo celular y se transmite de célula

Más detalles

2. Los organizadores nucleares aportan información para la síntesis de: a- ARNm b- ARNr c- ARNt d- Histonas

2. Los organizadores nucleares aportan información para la síntesis de: a- ARNm b- ARNr c- ARNt d- Histonas CBC UBA 2º Parcial Biología (54) Paseo Colon Apellido y Nombre:... DNI...Comisión Nº... Lea atentamente cada pregunta con sus opciones de respuesta. Marque en su grilla la opción correspondiente a la respuesta

Más detalles

LA REVOLUCIÓN GENÉTICA: DESVELANDO LOS SECRETOS DE LA VIDA

LA REVOLUCIÓN GENÉTICA: DESVELANDO LOS SECRETOS DE LA VIDA LA REVOLUCIÓN GENÉTICA: DESVELANDO LOS SECRETOS DE LA VIDA YA DEBERÍAS SABER Todos los seres vivos tenemos células. Nuestras células son eucariotas (núcleo verdadero) Todas tienen: membrana, citoplasma

Más detalles

Genómica y transcriptómica para la generación de datos en Evolución

Genómica y transcriptómica para la generación de datos en Evolución recuadro Genómica y transcriptómica para la generación de datos en Evolución Gabriela Bedó Genómica. Sus objetivos Compilar todas las secuencias de un organismo Establecer la localización de los genes

Más detalles

cromátidas centrómero cromosoma

cromátidas centrómero cromosoma núcleo en interfase fibra de cromatina cromátidas centrómero cromosoma 2n = 46 cromátidas cromosomas homólogos Los genes están formados por genes alelos segmentos de ADN y se encuentran situados en los

Más detalles

GENÉTICA: Herencia, Expresión génica, Replicación, biotecnología Selectividad: herencia

GENÉTICA: Herencia, Expresión génica, Replicación, biotecnología Selectividad: herencia GENÉTICA: Herencia, Expresión génica, Replicación, biotecnología Selectividad: herencia 5 JUN9.- Existen caracteres que no se comportan típicamente como los Mendelianos y sus patrones de herencia muestran

Más detalles

PREGUNTAS TEST CORRESPONDIENTES A LOS TEMAS 1 AL 5

PREGUNTAS TEST CORRESPONDIENTES A LOS TEMAS 1 AL 5 PREGUNTAS TEST CORRESPONDIENTES A LOS TEMAS 1 AL 5 Las preguntas de test que le adjuntamos corresponden a exámenes de las últimas convocatorias. Una vez que finalicen el estudio de los cinco primeros capítulos,

Más detalles

Genoma bacteriano. Cromosoma circular 1 ó 2 moléculas/bacteria

Genoma bacteriano. Cromosoma circular 1 ó 2 moléculas/bacteria ADN Dogma BC Genoma bacteriano Cromosoma circular 1 ó 2 moléculas/bacteria Plásmidos: Ciculares ó Lineales 1 a 600 moléculas por bacteria Cromosoma lineal 1 ó 2 moléculas/bacteria Es haploide (n). Formado

Más detalles

Bases moleculares de la herencia

Bases moleculares de la herencia Bases moleculares de la herencia I. Que moléculas son las portadoras de la información hereditaria? III. Como se preserva y trasmite la información hereditaria? V. Como se expresa esta información. Dogma

Más detalles

SESIÓN 7 DUPLICACIÓN Y TRANSMISIÓN DE LA INFORMACIÓN CONTENIDA EN EL ADN

SESIÓN 7 DUPLICACIÓN Y TRANSMISIÓN DE LA INFORMACIÓN CONTENIDA EN EL ADN SESIÓN 7 DUPLICACIÓN Y TRANSMISIÓN DE LA INFORMACIÓN CONTENIDA EN EL ADN I. CONTENIDOS: 1. Centro de control celular. 2. ADN: su estructura y función. 3. ADN y síntesis proteica. II. OBJETIVOS: Al término

Más detalles

Capítulo 13 REPLICACIÓN DEL ADN

Capítulo 13 REPLICACIÓN DEL ADN REPLICACIÓN DEL ADN La reproducción necesita la correcta y precisa transmisión de la información genética de padres a hijos, por lo que resulta imprescindible la previa replicación o duplicación del ADN

Más detalles

La división celular. .Interfase

La división celular. .Interfase .Interfase La división celular El conjunto de procesos propios de la interfase hacen posible el mantenimiento o el incremento de las estructuras celulares, lo que conlleva, en principio, un incremento

Más detalles

PCR gen 18S ARNr humano

PCR gen 18S ARNr humano PCR gen 18S ARNr humano Ref.PCR18S 1.OBJETIVO DEL EXPERIMENTO El objetivo de este experimento es introducir a los estudiantes en los principios y práctica de la Reacción en Cadena de la Polimerasa (PCR)

Más detalles

7.012 Serie de ejercicios 5

7.012 Serie de ejercicios 5 Nombre Grupo 7.012 Serie de ejercicios 5 Pregunta 1 Al estudiar los problemas de esterilidad, usted intenta aislar un hipotético gen de conejo que explique la prolífica reproducción de estos animales.

Más detalles

Anomalías Cromosómicas

Anomalías Cromosómicas 12 Unique Grupo de apoyo para enfermedades cromosómicas raras del Reino Unido Teléfono: + 44 (0) 1883 330766 Email: info@rarechromo.org www.rarechromo.org Anomalías Cromosómicas Orphanet Información gratuita

Más detalles

Veamos rápidamente el ciclo celular

Veamos rápidamente el ciclo celular Replicación del adn Veamos rápidamente el ciclo celular Fase G1: Fase de crecimiento celular. Fase G2: la célula ya duplicó su material genético, y se prepara para la mitosis. Fase M: fase de división

Más detalles

Practica la genética Ficha didáctica del profesorado Bachillerato

Practica la genética Ficha didáctica del profesorado Bachillerato Ficha didáctica del profesorado Bachillerato www.eurekamuseoa.es Extracción de ADN Cuál es la función de cada uno de los ingredientes utilizados para realizar la disolución tampón para la visualización

Más detalles

Qué sabemos de la naturaleza física del gen?

Qué sabemos de la naturaleza física del gen? LAS BASES MOLECULARES DE LA HERENCIA - Genes como entidades abstractas - Se duplican y pasan a la generación siguiente - De algún modo controlan los caracteres hereditarios HERENCIA DE LOS GENES ANÁLISIS

Más detalles

Reacción en cadena de la polimerasa (PCR)

Reacción en cadena de la polimerasa (PCR) Dr. Alejandro Leal Reacción en cadena de la polimerasa (PCR) La reacción en cadena de la polimerasa (PCR, por sus siglas en inglés de "polymerase chain reaction") es un método de amplificación in vitro

Más detalles

Nuevos paneles de PCR Real Time: El diagnóstico molecular más rápido, fiable y eficaz

Nuevos paneles de PCR Real Time: El diagnóstico molecular más rápido, fiable y eficaz IDEXX VetLab Suite IDEXX SNAP Tests Laboratorio de Referencia IDEXX Nuevos paneles de PCR Real Time: El diagnóstico molecular más rápido, fiable y eficaz Obtenga respuestas definitivas con la IDEXX RealPCR

Más detalles

Genética de las Neurofibromatosis

Genética de las Neurofibromatosis Genética de las Neurofibromatosis Cuaderno núm. 3 El texto de este cuaderno, ha sido cedido por The Neurofibromatosis Association (UK) y traducido por la Asociación Catalana de las Neurofibromatosis (Barcelona

Más detalles

BIOTECNOLOGÍA. 1.- Ingeniería Genética, ADN recombinante

BIOTECNOLOGÍA. 1.- Ingeniería Genética, ADN recombinante BIOTECNOLOGÍA 1.- Ingeniería Genética, ADN recombinante Técnica del ADN recombinante: es la más usada en ingeniería genética, esta basada en el uso de las enzimas de restricción o endonucleasas de restricción

Más detalles

LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA

LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA AULA DE MAYORES Y DE LA EXPERIENCIA F.Córdoba, R.Torronteras, A.Canalejo Departamento de Biología Ambiental y Salud Pública LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA Tema 1.3. Los sistemas

Más detalles

Tema 17: PROCESAMIENTO POST-TRANSCRIPCIONAL

Tema 17: PROCESAMIENTO POST-TRANSCRIPCIONAL Tema 17: PROCESAMIENTO POST-TRANSCRIPCIONAL Tipos de ARN: ARNm, ARNr, ARNt, ARNhn, ARNsn, ARNsc Procesamiento en procariotas Procesamiento en eucariotas ARNm: Adición de caperuza y poli(a) Edición Splicing

Más detalles

Herencia Ligada al Cromosoma X

Herencia Ligada al Cromosoma X 12 Su clínica local: www.aegh.org/docs/encuesta-aegh-2005-centros-y-personasde-contacto.pdf Herencia Ligada al Cromosoma X www.aegh.org/docs/encue sta-aegh-2005-servicios-degenetica-clinica.pdf Elaborado

Más detalles

Anomalías Cromosómicas

Anomalías Cromosómicas 12 Teléfono: + 44 (0) 1883 330766 Email: info@rarechromo.org www.rarechromo.org Anomalías Cromosómicas Orphanet Información gratuita sobre enfermedades raras, ensayos clínicos, medicamentos y enlaces a

Más detalles

GENÉTICA MENDELIANA EL GEN. El gen Mendeliano es una unidad de función, estructura, transmisión, mutación y evolución, que se distribuye ordenada y linealmente en los cromosomas. A nivel genético el gen

Más detalles

App para realizar consultas al Sistema de Información Estadística de Castilla y León

App para realizar consultas al Sistema de Información Estadística de Castilla y León App para realizar consultas al Sistema de Información Estadística de Castilla y León Jesús M. Rodríguez Rodríguez rodrodje@jcyl.es Dirección General de Presupuestos y Estadística Consejería de Hacienda

Más detalles

Técnicas de ADN recombinante: la manipulación genética

Técnicas de ADN recombinante: la manipulación genética Técnicas de ADN recombinante: la manipulación genética A partir de los años 70 se desarrollaron las herramientas de la biología molecular o la ingeniería genética o lo que se ha llamado técnicas del ADN

Más detalles

GUIA DE LABORATORIO PRACTICA 8 EXTRACCIÓN ADN PROGRAMA DE ENFERMERIA CURSO INTEGRADO DE PROCESOS BIOLOGICOS

GUIA DE LABORATORIO PRACTICA 8 EXTRACCIÓN ADN PROGRAMA DE ENFERMERIA CURSO INTEGRADO DE PROCESOS BIOLOGICOS GUIA DE LABORATORIO PRACTICA 8 EXTRACCIÓN ADN PROGRAMA DE ENFERMERIA CURSO INTEGRADO DE PROCESOS BIOLOGICOS Leidy Diana Ardila Leal Docente. INTRODUCCIÓN En esta práctica se va a realizar la extracción

Más detalles

TEMA 4 CMC BIOTECNOLOGÍA

TEMA 4 CMC BIOTECNOLOGÍA Conceptos Tema 4 TEMA 4 CMC BIOTECNOLOGÍA Células eucariotas: Células con núcleo. Núcleo: Un compartimento en el interior de la célula que alberga el material genético. Citoplasma: En una célula eucariota,

Más detalles

La meiosis consta de dos divisiones sucesivas de la célula con una única replicación del ADN. El producto final son cuatro células con n cromosomas.

La meiosis consta de dos divisiones sucesivas de la célula con una única replicación del ADN. El producto final son cuatro células con n cromosomas. 8) LA MEIOSIS LA MEIOSIS: CONCEPTO La meiosis es un mecanismo de división celular que permite la obtención a partir de células diploides (2n) de células haploides (n) con diferentes combinaciones de genes.

Más detalles

INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas

INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas 1 INTRODUCCIÓN. Una visión global del proceso de creación de empresas Cuando se analiza desde una perspectiva integral el proceso de

Más detalles

Los elementos químicos más abundantes en los seres vivos son: Agua y proteínas. Carbono, oxígeno, hidrógeno, nitrógeno, fósforo y azufre.

Los elementos químicos más abundantes en los seres vivos son: Agua y proteínas. Carbono, oxígeno, hidrógeno, nitrógeno, fósforo y azufre. Los elementos químicos más abundantes en los seres vivos son: Agua y proteínas. Carbono, oxígeno, hidrógeno, nitrógeno, fósforo y azufre. Glúcidos, lípidos, proteínas, ácidos nucleicos. Oxígeno, calcio,

Más detalles

Área Académica de: Química. Programa Educativo: Licenciatura de Química en Alimentos. Nombre de la Asignatura: Biología celular

Área Académica de: Química. Programa Educativo: Licenciatura de Química en Alimentos. Nombre de la Asignatura: Biología celular Área Académica de: Química Línea de Investigación Programa Educativo: Licenciatura de Química en Alimentos Nombre de la Asignatura: Biología celular Tema: Introducción Ciclo: Agosto-Diciembre 2011 Profesor(a):

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles

Qué es un Análisis Genético?

Qué es un Análisis Genético? 12 Qué es un Análisis Genético? Elaborado a partir de folletos originales de Guy s and St Thomas Hospital, London. Enero de 2008 Este trabajo se ha realizado bajo el auspicio de EuroGentest, Contrato Nº

Más detalles

Herencia Ligada al Cromosoma X

Herencia Ligada al Cromosoma X 12 Herencia Ligada al Cromosoma X Elaborado a partir de folletos originales de Guy s and St Thomas Hospital, Londres y London IDEAS Genetic Knowledge Park. Enero de 2008 Este trabajo se ha realizado bajo

Más detalles

Técnicas descritas en el curso 7.28

Técnicas descritas en el curso 7.28 Técnicas descritas en el curso 7.28 Técnica: Clase 1 Experimento de incorporación de dntps Ensayo de extensión del cebador Ensayo de unión en filtro Electroforesis en gel Análisis de ADN Helicasa Polaridad

Más detalles

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual Introducción Algunas de las personas que trabajan con SGBD relacionales parecen preguntarse porqué deberían preocuparse del diseño de las bases de datos que utilizan. Después de todo, la mayoría de los

Más detalles

CUESTIONES TEMA 4: La revolución genética y la biotecnología.

CUESTIONES TEMA 4: La revolución genética y la biotecnología. CUESTIONES TEMA 4: La revolución genética y la biotecnología. 1. El ADN no puede salir del núcleo: Cómo logra llevar a los ribosomas que están en el citoplasma la información que porta? 2. El individuo

Más detalles

Glosario de Biología Sintética

Glosario de Biología Sintética Glosario de Biología Sintética Abstracción: proceso mental que consiste en extraer, desde varios objetos o conceptos a priori distintos, el principio o las reglas comunes a ambos. Este proceso permite

Más detalles

Tipos de células madre

Tipos de células madre Biología Bachillerato IES Fuentesnuevas 1 CÉLULAS MADRE O TRONCALES (STEM CELLS) Las células madre son células que tienen capacidad de renovarse continuamente por sucesivas divisiones por mitosis y de

Más detalles

Bases moleculares de la herencia

Bases moleculares de la herencia Bases moleculares de la herencia i. Qué moléculas son las portadoras de la información hereditaria? ii. Cómo se preserva y trasmite la información hereditaria? iii. Cómo se expresa esta información? Dogma

Más detalles

QUÉ ES BIOLOGÍA MOLECULAR Y BIOTECNOLOGÍA. Julio A. Carrasco Vallejo Julio 2014

QUÉ ES BIOLOGÍA MOLECULAR Y BIOTECNOLOGÍA. Julio A. Carrasco Vallejo Julio 2014 QUÉ ES BIOLOGÍA MOLECULAR Y BIOTECNOLOGÍA Julio A. Carrasco Vallejo Julio 2014 Definiciones Biología Molecular: Estudio de los flujos de información genética en una célula Biotecnología: Uso de sistemas

Más detalles

BIOLOGÍA-GEOLOGÍA 4º E.S.O. CRITERIOS DE EVALUACIÓN, CALIFICACIÓN Y CONTENIDOS MÍNIMOS

BIOLOGÍA-GEOLOGÍA 4º E.S.O. CRITERIOS DE EVALUACIÓN, CALIFICACIÓN Y CONTENIDOS MÍNIMOS BIOLOGÍA-GEOLOGÍA 4º E.S.O. CRITERIOS DE EVALUACIÓN, CALIFICACIÓN Y CONTENIDOS MÍNIMOS 1. CRITERIOS DE EVALUACIÓN UNIDAD 1: LA CÉLULA UNIDAD DE VIDA 1.1. Conocer los principales hitos en el estudio de

Más detalles

III INFORMACIÓN CELULAR

III INFORMACIÓN CELULAR III INFORMACIÓN CELULAR POR QUÉ ES NECESARIA LA INFORMACIÓN CELULAR? En toda célula, tanto procariota como eucariota, se dan complejos procesos metabólicos y fisiológicos con la finalidad de obtener materiales

Más detalles

FISIOLOGÍA GENERAL Jesús Merino Pérez y María José Noriega Borge

FISIOLOGÍA GENERAL Jesús Merino Pérez y María José Noriega Borge REPLICACIÓN DEL ADN INTRODUCCIÓN La unidad básica de información en los seres vivos es el gen, definido en células eucariotas como un segmento de ADN que lleva la información necesaria para la síntesis

Más detalles

PROGRAMAS MATERIAS. MAYORES 25 AÑOS Biología

PROGRAMAS MATERIAS. MAYORES 25 AÑOS Biología 1 PROGRAMAS MATERIAS. MAYORES 25 AÑOS Biología Para superar esta prueba, el alumno deberá demostrar tener conocimientos básicos de Biología a nivel de LOGSE. PRESENTACIÓN. La Biología es la ciencia que

Más detalles

Asesoramiento genético para el estudio del cáncer de mama y ovario hereditario

Asesoramiento genético para el estudio del cáncer de mama y ovario hereditario Asesoramiento genético para el estudio del cáncer de mama y ovario hereditario Cuándo debemos sospechar que un cáncer puede ser hereditario? El cáncer es una enfermedad muy frecuente, es fácil que en una

Más detalles

ÁCIDOS NUCLEICOS. By Manuel Maria Morato Victor Barrios

ÁCIDOS NUCLEICOS. By Manuel Maria Morato Victor Barrios ÁCIDOS NUCLEICOS By Manuel Maria Morato Victor Barrios Los ácidos nucleicos son grandes polímeros formados por la repetición de monómeros denominados nucleótidos, unidos mediante enlaces fosfodiéster.

Más detalles

CAPÍTULO 13 DIVISIÓN CELULAR

CAPÍTULO 13 DIVISIÓN CELULAR DIVISIÓN CELULAR 1. FISIÓN BINARIA Ocurre en procariontes: tras la duplicación del ADN, se segregan las moléculas hijas y se divide el citoplasma. Bacteria en Fisión Binaria Esquema de la Fisión Binaria

Más detalles

Creación de Funciones de Conducción

Creación de Funciones de Conducción Creación de Funciones de Conducción Requerimientos Para el desarrollo de esta actividad se requiere que: Contemos con un robot BoeBot armado con placa Arduino. Repetición En estos momentos habremos notado

Más detalles

1.4.1.2. Resumen... 1.4.2. ÁREA DE FACTURACIÓN::INFORMES::Pedidos...27 1.4.2.1. Detalle... 1.4.2.2. Resumen... 1.4.3. ÁREA DE

1.4.1.2. Resumen... 1.4.2. ÁREA DE FACTURACIÓN::INFORMES::Pedidos...27 1.4.2.1. Detalle... 1.4.2.2. Resumen... 1.4.3. ÁREA DE MANUAL DE USUARIO DE ABANQ 1 Índice de contenido 1 ÁREA DE FACTURACIÓN......4 1.1 ÁREA DE FACTURACIÓN::PRINCIPAL...4 1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA...4 1.1.1.1. ÁREA DE FACTURACIÓN::PRINCIPAL::EMPRESA::General...4

Más detalles

ACERCA DEL COACHING. Acerca del Coaching www.innovacionagil.com info@innovacionagil.com Página 1/5

ACERCA DEL COACHING. Acerca del Coaching www.innovacionagil.com info@innovacionagil.com Página 1/5 ACERCA DEL COACHING Qué es Coaching? En inglés, la palabra Coaching hace referencia a entrenar, aunque este significado es tan sólo una referencia, pues no es del todo correcto cuando nos referimos a la

Más detalles

CENTENARIA Y BENEMÈRITA ESCUELA NORMAL DEL ESTADO DE QUERETARO ANDRES BALVANERA UNIDAD JALPAN SEMINARIO DE ANALISIS Y TRABAJO DOCENTE

CENTENARIA Y BENEMÈRITA ESCUELA NORMAL DEL ESTADO DE QUERETARO ANDRES BALVANERA UNIDAD JALPAN SEMINARIO DE ANALISIS Y TRABAJO DOCENTE CENTENARIA Y BENEMÈRITA ESCUELA NORMAL DEL ESTADO DE QUERETARO ANDRES BALVANERA UNIDAD JALPAN SEMINARIO DE ANALISIS Y TRABAJO DOCENTE DOCENTE: Edith Rangél Ángeles ALUMNA: Castañeda Valladares Lizei Marlene

Más detalles

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia.

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia. APUNTES PARA EL CURSO PROCESOS COGNITIVOS: RESOLUCIÓN DE PROBLEMAS Y TOMA DE DECISIONES Elaborado por Vicente Sisto Campos. Se trata de la confluencia de la capacidad analítica del equipo de identificar

Más detalles

Genética molecular (II)

Genética molecular (II) Genética molecular (II) ESTRUCTURA DE UN GEN Cada molécula de ADN está formada por una sucesión de genes. Desde un punto de vista molecular un gen es una unidad de transcripción (desde el punto de vista

Más detalles

Práctica del paso de generación de Leads

Práctica del paso de generación de Leads Práctica del paso de generación de Leads La parte práctica de este módulo consiste en poner en marcha y tener en funcionamiento los mecanismos mediante los cuales vamos a generar un flujo de interesados

Más detalles

TEMA 40 Herencia Cuantitativa

TEMA 40 Herencia Cuantitativa TEMA 40 Herencia Cuantitativa 40.1.- Introducción. Los caracteres que Mendel estudió eran lo que se conocen como genes cualitativos, que marcan características fenotípicas muy diferentes según el alelo

Más detalles

Capítulo VI. Diagramas de Entidad Relación

Capítulo VI. Diagramas de Entidad Relación Diagramas de Entidad Relación Diagramas de entidad relación Tabla de contenido 1.- Concepto de entidad... 91 1.1.- Entidad del negocio... 91 1.2.- Atributos y datos... 91 2.- Asociación de entidades...

Más detalles

Análisis de los datos

Análisis de los datos Universidad Complutense de Madrid CURSOS DE FORMACIÓN EN INFORMÁTICA Análisis de los datos Hojas de cálculo Tema 6 Análisis de los datos Una de las capacidades más interesantes de Excel es la actualización

Más detalles

TÉCNICAS DE ESTUDIO EN EL TERCER CICLO DE EDUCACIÓN PRIMARIA

TÉCNICAS DE ESTUDIO EN EL TERCER CICLO DE EDUCACIÓN PRIMARIA TÉCNICAS DE ESTUDIO EN EL TERCER CICLO DE EDUCACIÓN PRIMARIA Judith Domínguez Martín Diplomada en Educ. Infantil y Audición y Lenguaje. Maestra de Educ. Primaria. A lo largo de la etapa de educación primaria

Más detalles

Características e importancia del código genético

Características e importancia del código genético Características e importancia del código genético Estudio del ADN como portador de la información genética. Concepto de gen. Mecanismos responsables de su transmisión y variación. Los procesos de transcripción-traducción

Más detalles

Fuente: http://www.kzgunea.net

Fuente: http://www.kzgunea.net APRENDE A NAVEGAR SERVICIOS DE INTERNET Internet es como el mercado del pueblo en día de feria. En el mercado los puestos se organizan por secciones: por un lado la fruta, por otro las hortalizas, por

Más detalles

PRUEBAS DE ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR Convocatoria mayo de 2005 BIOLOGIA

PRUEBAS DE ACCESO A CICLOS FORMATIVOS DE GRADO SUPERIOR Convocatoria mayo de 2005 BIOLOGIA Convocatoria mayo de 2005 BIOLOGIA a) El ADN es la molécula portadora del mensaje genético: define cómo está compuesto el ADN y qué diferencias existen entre el ADN y el ARN b) Explica qué es un gen y

Más detalles

1) a) En la figura señale, englobando con un trazo continuo, lo siguiente:

1) a) En la figura señale, englobando con un trazo continuo, lo siguiente: CÁTEDRA: BIOQUÍMICA Carreras: Farmacia Profesorado en Química Licenciatura en Química Licenciatura en Alimentos ÁCIDOS NUCLEICOS 1) a) En la figura señale, englobando con un trazo continuo, lo siguiente:

Más detalles

Información de Servicios de Inversión. Perfiles

Información de Servicios de Inversión. Perfiles Información de Servicios de Inversión Perfiles Introducción En la Información de Servicios de Inversión, DEGIRO ofrece información detallada de los acuerdos contractuales que DEGIRO ha suscrito con usted

Más detalles

Módulo I Unidad Didáctica 2

Módulo I Unidad Didáctica 2 Módulo I Unidad Didáctica 2 Introducción Tal como un periódico, por ejemplo, no es sólo una colección de artículos, un sitio Web no puede ser simplemente una colección de páginas. Qué se busca al diseñar

Más detalles

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.º 1 Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos Abril 2015, Argentina 29 Relojes biológicos en plantas Ajustar el

Más detalles

Introducción a la Firma Electrónica en MIDAS

Introducción a la Firma Electrónica en MIDAS Introducción a la Firma Electrónica en MIDAS Firma Digital Introducción. El Módulo para la Integración de Documentos y Acceso a los Sistemas(MIDAS) emplea la firma digital como método de aseguramiento

Más detalles

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse. TABLA DE DECISION La tabla de decisión es una herramienta que sintetiza procesos en los cuales se dan un conjunto de condiciones y un conjunto de acciones a tomar según el valor que toman las condiciones.

Más detalles

MÓDULO MERCADOS Y PRODUCTOS FINANCIEROS AVANZADOS

MÓDULO MERCADOS Y PRODUCTOS FINANCIEROS AVANZADOS MÓDULO MERCADOS Y PRODUCTOS FINANCIEROS AVANZADOS Mercados financieros Profesor: Victoria Rodríguez MBA-Edición 2007-2008 ESPECIALIDADES DIRECCIÓN CORPORATIVA Y DIRECCIÓN FINANCIERA : Quedan reservados

Más detalles

Sistemas de Gestión de Calidad. Control documental

Sistemas de Gestión de Calidad. Control documental 4 Sistemas de Gestión de Calidad. Control documental ÍNDICE: 4.1 Requisitos Generales 4.2 Requisitos de la documentación 4.2.1 Generalidades 4.2.2 Manual de la Calidad 4.2.3 Control de los documentos 4.2.4

Más detalles

Orbitales híbridos. Cajón de Ciencias

Orbitales híbridos. Cajón de Ciencias Orbitales híbridos Cajón de Ciencias Los orbitales híbridos son aquellos que se forman por la fusión de otros orbitales. Estudiarlos es un paso básico para entender la geometría y la estructura de las

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

Cortar y pegar ADN: arreglar las mutaciones mediante la "edición genómica" ADN, ARN y proteínas

Cortar y pegar ADN: arreglar las mutaciones mediante la edición genómica ADN, ARN y proteínas Novedades en la investigación de la EH. En lenguaje sencillo. Escrito por científicos. Para toda la comunidad EH. Cortar y pegar ADN: arreglar las mutaciones mediante la "edición genómica" Los científicos

Más detalles

La Filogenia en nuestro ADN. Las huellas filogenéticas en nuestro ADN

La Filogenia en nuestro ADN. Las huellas filogenéticas en nuestro ADN 78 Hurvitz M. Filogenia en nuestro ADN La Filogenia en nuestro ADN Las huellas filogenéticas en nuestro ADN Hipótesis o Perspectiva Teórica Marcos Hurvitz Área de Biología Molecular Instituto de Coloproctología

Más detalles

Evolución de la vida en la tierra:la Célula

Evolución de la vida en la tierra:la Célula Evolución de la vida en la tierra:la Célula Nuestro planeta tierra no siempre ha sido igual, sin embargo todos los astros que forman el universo están compuestos por los mismos elementos y están controlados

Más detalles

La explicación la haré con un ejemplo de cobro por $100.00 más el I.V.A. $16.00

La explicación la haré con un ejemplo de cobro por $100.00 más el I.V.A. $16.00 La mayor parte de las dependencias no habían manejado el IVA en los recibos oficiales, que era el documento de facturación de nuestra Universidad, actualmente ya es formalmente un CFD pero para el fin

Más detalles

NIVEL QUÍMICO DE ORGANIZACIÓN DEL CUERPO HUMANO

NIVEL QUÍMICO DE ORGANIZACIÓN DEL CUERPO HUMANO NIVEL QUÍMICO DE ORGANIZACIÓN DEL CUERPO HUMANO 10. Defina macromolécula utilizando los términos polímero y monómero. Cite ejemplos. 11. Qué elementos químicos poseen los glúcidos y por qué reciben el

Más detalles

Procesos Críticos en el Desarrollo de Software

Procesos Críticos en el Desarrollo de Software Metodología Procesos Críticos en el Desarrollo de Software Pablo Straub AgileShift Imagine una organización de desarrollo de software que consistentemente cumple los compromisos con sus clientes. Imagine

Más detalles

QUIERO IRME DE ERASMUS

QUIERO IRME DE ERASMUS QUIERO IRME DE ERASMUS PREGUNTAS FRECUENTES NOTA IMPORTANTE: Toda la información aquí proporcionada está obtenida de la última convocatoria que salió de Erasmus, que fue durante el curso académico 2013-2014.

Más detalles

ISO9001:2015. Todos los certificados emitidos en este periodo tienen una fecha de caducidad de 15 de septiembre de 2018.

ISO9001:2015. Todos los certificados emitidos en este periodo tienen una fecha de caducidad de 15 de septiembre de 2018. ISO9001:2015 PLAN DE TRANSICIÓN Tras la publicación de la nueva versión de la norma ISO9001 el pasado mes de septiembre se inicia un periodo de convivencia entre las dos versiones de la norma. Este periodo

Más detalles