Modelado de regulación de genes en procariotas El ADN almacena toda la información correspondiente a un organismo vivo. Cómo decodifica una célula esa información, escrita en un alfabeto de sólo 4 letras (A, G, C, T)? La información genética controla la síntesis de proteínas. El ADN actúa como director, delegando en un equipo de trabajadores las tareas necesarias. Cuando se necesita una determinada proteína, la secuencia apropiada de la larga cadena de ADN es copiada en una cadena de ARN. Estas copias actúan como moldes para sintetizar una proteína.
El flujo de la información genética se produce en las células del ADN al ARN y del ARN a las proteínas. El mecanismo de expresión de un gen tiene dos fases: Transcripción: la información sigue estando en el mismo lenguaje. Traducción: la información se traduce al lenguaje de las proteínas.
Cada gen puede ser traducido y transcrito con una eficiencia diferente. Una célula puede regular la expresión de cada uno de sus genes según las necesidades del momento.
ARN El ARN es una cadena sencilla formada por ribonucleótidos. Contiene las bases adenina (A), guanina (G), citosina (C) y uracilo (U). Una de las dos hebras de la cadena de ADN actúa como molde para la síntesis del ARN. En las células se producen distintos tipos de ARN. La gran mayoría de los genes determinan la secuencia de aminoácidos de las proteínas. El ARN formado a partir de ellos es el ARN mensajero (marn) El producto final de otros genes es el propio ARN: ARN ribosomal (rarn) y ARN de transferencia (tarn). Desempeñan un papel en la traducción del marn a proteínas.
Transcripción (I) La transcripción es realizada por las enzimas ARN polimerasas en 3 fases. Inicio: la ARN polimerasa se une a la cadena de ADN en un promotor, gracias al factor σ. Elongación: avanza por la cadena de ADN desenrollándola y añadiendo nucleótidos uno a uno. Detrás del lugar donde se añaden, enrolla de nuevo las dos hebras de ADN, desplazando la cadena de ARN recién formada. Terminación: cuando encuentra un terminador, libera la cadena de marn formado y se disocia de la cadena de ADN.
Transcripción (II)
Traducción (I) El lenguaje de las proteínas está formado por 20 aminoácidos. La secuencia de marn es decodificada en grupos de 3 nucleótidos. Cada grupo de 3 nucleótidos se denomina codón y especifica un aminoácido. El código genético, común a todos los seres vivos, indica la correspondencia entre codones y aminoácidos. Las moléculas de tarn aparean los aminoácidos con los codones del marn. Una región de una molécula de tarn se une a un aminoácido gracias a una enzima específica y otra región, el anticodón, se une al codón correspondiente en la cadena de marn. El mensaje del marn es decodificado en los ribosomas. Un ribosoma es una compleja maquinaria molecular formado por más de 50 proteínas y rarn, que se desplaza sobre el marn capturando moléculas de tarn y uniendo los aminoácidos que transportan, para formar la cadena proteíca.
Traducción (II)
Inicio de la transcripción en procariotas El punto principal de regulación que usan las células para determinar qué proteínas se sintetizan y en qué cantidades es el inicio de la transcripción. En el ADN existen regiones que indican a la ARN polimerasa dónde empezar y dónde terminar: promotores y terminadores. Una zona cualquiera de ADN sólo puede ser transcrita si está precedida por una secuencia promotora.
Una especificación de la transcripción y de la traducción Unión y separación de la ARN polimerasa y el promotor r rb : [RNAP + prom ] l [ prom.rnap ]l c r rd : [ prom.rnap ] rd l [RNAP + prom ]l c rb Transcripción c Inicio: r ti : [ RNAP.site ini ] ti l [ siteini.site ini.rnap ] l Elongación: c r el : [ site ini.w.rnap.site mid ] el l [ sitemid.site ini.w.site mid.rnap ] l Terminación: r ter : [ site ini.w.rnap.site ter ] l Traducción Inicio: r tli : [Rib + site ini ] l c tli c ter [RNAP + siteter ; site ini.w.site ter ] l [ siteini.rib ] l Elongación: r tle : [ Rib.site mid ] l [ sitemid.rib ] l c Terminación: r tlt : [ Rib.site ter ] tlt l [Rib + siteter ; Prot] l c tle
Control del inicio de la transcripción (I) Los represores inactivan genes y los represores los activan. Cuando un gen está desactivado, el marn y la proteína correspondiente se sintetizan a una frecuencia muy baja. Cuando está activado, lo hacen a una frecuencia muy alta. En las procariotas, los genes que codifican proteínas con una función similar se agrupan en una región funcional llamada operón. Un operón se transcribe en una sola cadena de marn a partir de un único promotor. La regulación se efectúa con una secuencia reguladora llamada operador, incluida en el promotor. Los ejemplos más sencillos de regulación genética se encuentran en bacterias y virus.
Control del inicio de la transcripción (II) El inicio de la transcripción puede estar controlado por una proteína represora. Por ejemplo, la síntesis del aminoácido triptófano en la bacteria Escherichia Coli. La proteína represora necesita el triptófano para poder unirse al operador. Cuando el nivel de triptófano es bajo, el represor no actúa y el operón trp se transcribe. Cuando el nivel de triptófano es alto, la proteína represora ocupa el operador, impidiendo la unión de la ARN polimerasa.
Control del inicio de la transcripción (III) El promotor del operón trp es un promotor fuerte. En ausencia de represor, la tasa de unión con la ARN polimerasa es muy alta. Hay promotores débiles que no son capaces de iniciar la transcripción por sí solos de forma efectiva. Necesitan la acción de una proteína activadora. La capacidad de una proteína activadora de unirse al ADN está frecuentemente afectada por su interacción con otra molécula. Por ejemplo, la proteína activadora bacteriana CAP necesita el AMP cíclico para unirse al ADN.
Control de la transcripción del lac operon en E. Coli (I) La bacteria Escherichia Coli es capaz de metabolizar lactosa si no hay glucosa disponible. Para ello, necesita las enzimas β galactosidasa, LacY y LacA. Los genes que codifican dichas enzimas, lacz, lacy y laca, se agrupan en una región del genoma de la E. Coli llamada operón lactosa. El promotor de este operón es un promotor débil. El inicio de la transcripción está regulado tanto por un activador como por un represor.
Control de la transcripción del lac operon en E. Coli (II) Represión La proteína represora del operón lactosa se llama LacI. Parte de la molécula LacI se une al operador en el promotor evitando la unión de la ARN polimerasa. La alolactosa (producto de la reacción de la β galactosidasa con la lactosa) actúa como represor del represor. Puede unirse a una región de la LacI provocando un cambio en su estructura que impide su unión con el operador.
Control de la transcripción del lac operon en E. Coli (III) Activación La ausencia del represor LacI es necesaria pero no suficiente para la transcripción efectiva del operón lactosa. El complejo CRP-cAMP 2 actúa como activador. Se une al promotor y asiste a la ARN polimerasa en la transcripción. La presencia de glucosa en el medio inhibe la síntesis de este complejo: represión catabólica. En el transporte de glucosa dentro de la célula interviene la molécula EIIA P, necesaria además para la síntesis de camp. La glucosa es fosforilada con el grupo fosfato de EIIA P. EIIA inhibe además a la enzima permeasa LacY, que transporta lactosa al interior. Cuando no hay glucosa en el medio, EIIA P está libre y se sintetiza camp. Si la concentración de camp es abundante, la proteína receptora del camp (CRP o CAP, Catabolite Activator Protein) puede formar el complejo CRP-cAMP 2.
Control de la transcripción del lac operon en E. Coli (IV) - glucosa, - lactosa + glucosa, - lactosa
Control de la transcripción del lac operon en E. Coli (V) + glucosa, + lactosa - glucosa, + lactosa
Modelo de la expresión del operón lactosa basado en sistemas P (I) Especificación Π lac = (O lac, {e, s, c}, [ [ [ ] c ] s ] e, {R e, R s, R c }) El alfabeto O lac representa todas las entidades moleculares que intervienen en la regulación del operón lactosa: proteínas y regiones del ADN y del ARN. O lac = O prot O dna O rna O prot = { EIIA, EIIA P, EIICB, EIICB-EIIA P, EIICB P, Gluc, Gluc P, EIICB P-Gluc, Lact, LacY, Lact-LacY, AC, AC-EIIA, AC-EIIA P, ATP, AC-EIIA P-ATP, LacY-EIIA, β-galac, Lact, β-galac-lact, Allolact, LacI, LacI-Alloct, CRP, CRP-cAMP, CRP- camp 2, RNAP} O dna = { cap, cap CRP camp 2, op, op LacI, lacz s, lacz m, lacz e, lacy s, lacy m, lacy e, laca s, laca m, laca e } O rna = { Rib, op, lacz s, lacz m, lacz e, lacy s, lacy m, lacy e, lacy s, laca s, laca m, laca e}
Modelo de la expresión del operón lactosa basado en sistemas P (II) Las 3 regiones relevantes están representadas por las etiquetas L = {e, s, c} y por la estructura de membranas µ = [ [ [ ] c ] s ] e. e: medio en el que se encuentra la bacteria E. Coli. s: superficie celular de la bacteria. c: interior de la bacteria. 55 reglas de reescritura de multiconjuntos y de cadenas describen los procesos moleculares que tienen lugar en el sistema. r 1 EIICB [ EIIA P ] c EIICB-EIIA P [ ] c c 1 r 2 EIICB-EIIA P [ ] c EIICB [ EIIA P ] c c 2 r 3 EIICB-EIIA P [ ] c EIICB P [ EIIA ] c c 3 r 4 Gluc [ EIICB P ] s [ EIICB P-Gluc ] s c 4 r 5 [ EIICB P-Gluc ] s Gluc [ EIICB P ] s c 5 r 6 EIICB P-Gluc [ ] c EIICB [ Gluc P ] c c 6 r 7 [ LacY ] c LacY [ ] c c 7 r 8 Lact [ LacY ] s [ Lact-LacY ] s c 8 r 9 Lact-LacY [ ] c LacY [ Lact ] c c 9 r 10 LacY [ EIIA ] c LacY-EIIA [ ] c c 10 r 11 LacY-EIIA [ ] c LacY [ EIIA ] c c 11 r 12 [ β-galac + Lact ] c [ β-galac-lact ] c c 12 r 13 [ β-galac-lact ] c [ β-galac + Allolact ] c c 13 r 14 [ β-galac ] c [ ] c c 14
Modelo de la expresión del operón lactosa basado en sistemas P (III) r 15 [ LacI + Allolact ] c [ LacI-Allolact ] c c 15 r 16 [ Allolact ] c [ ] c c 16 r 17 AC [ EIIA P ] c AC-EIIA P [ ] c c 17 r 18 AC-EIIA P [ ] c AC [ EIIA P ] c c 18 r 19 AC-EIIA P [ ATP ] c AC P-EIIA P-ATP [ ] c c 19 r 20 AC-EIIA P-ATP [ ] c AC P-EIIA P [ camp ] c c 20 r 21 AC [ EIIA ] c AC-EIIA [ ] c c 21 r 22 AC-EIIA [ ] c AC [ EIIA ] c c 22 r 23 [ CRP + camp ] c [ CRP-cAMP ] c c 23 r 24 [ CRP-cAMP + CRP-cAMP ] c [ CRP-cAMP 2 ] c c 24 r 25 [ LacI + op ] c [ op LacI ] c c 25 r 26 [ op LacI ] c [ LacI + op ] c c 26 r 27 [CRP-cAMP 2 + cap ] c [ cap CRP camp 2 ] c c 27 r 28 [ cap CRP camp 2 ] c [ CRP-cAMP 2 + cap ] c c 28 r 29 [RNAP + cap ] c [ cap.rnap ] c c 29 r 30 [RNAP + cap CRP camp 2 ] c [ cap CRP camp 2.RNAP ] c c 30 r 31 [ RNAP.op ] c [ op.op.rnap ] c c 31 r 32 [ op.rnap.lacz s ] c [ lacz s.op.lacz s.rnap ] c c 32 r 33 [ op.w.rnap.lacz m ] c [ lacz m.op.w.lacz m.rnap ] c c 33 r 34 [ op.w.rnap.lacz e ] c [ lacz e.op.w.lacz e.rnap ] c c 34
Modelo de la expresión del operón lactosa basado en sistemas P (IV) r 35 [ op.rnap.lacy s ] c [ lacy s.op.lacy s.rnap ] c c 35 r 36 [ op.w.rnap.lacy m ] c [ lacy m.op.w.lacy m.rnap ] c c 36 r 37 [ op.w.rnap.lacy e ] c [ lacy e.op.w.lacy e.rnap ] c c 37 r 38 [ op.rnap.laca s ] c [ laca s.op.laca s.rnap ] c c 38 r 39 [ op.w.rnap.laca m ] c [ laca m.op.w.laca m.rnap ] c c 39 r 40 [ op.w.rnap.laca e ] c [ RNAP + laca e ; op.w.laca e ] c c 40 r 41 [ Rib + lacz s ] c [ Rib.lacZ s ] c c 41 r 42 [ Rib + lacy s ] c [ Rib.lacY s ] c c 42 r 43 [ Rib + laca s ] c [ Rib.lacA s ] c c 43 r 44 [ Rib.lacZ s ] c [ lacz s.rib ] c c 44 r 45 [ Rib.lacZ m ] c [ lacz m.rib ] c c 45 r 46 [ Rib.lacZ e ] c [ β-galac + Rib + lacz e ] c c 46 r 47 [ Rib.lacY s ] c [ lacy s.rib ] c c 47 r 48 [ Rib.lacY m ] c [ lacy m.rib ] c c 48 r 49 [ Rib.lacY e ] c [ LacY + Rib + lacy e ] c c 49 r 50 [ Rib.lacA s ] c [ laca s.rib ] c c 50 r 51 [ Rib.lacA m ] c [ laca m.rib ] c c 51 r 52 [ Rib.lacA e ] c [ LacA + Rib + laca e ] c c 52 r 53 [ lacz s ] c [ ] c c 53 r 54 [ lacy s ] c [ ] c c 54 r 55 [ laca s ] c [ ] c c 55
Modelo de la expresión del operón lactosa basado en sistemas P (V) Conjuntos de parámetros Constantes cinéticas C = {c 1,..., c 55 } c 1=0.235molec 1 s 1 c 19=2.35e-3molec 1 s 1 c 37=2s 1 c 2=2e-4s 1 c 20=0.02s 1 c 38=2s 1 c 3=0.0706s 1 c 21=2.35e-3molec 1 s 1 c 39=2s 1 c 4=6.96e-3molec 1 s 1 c 22=0.02s 1 c 40=2s 1 c 5=1.04e-2s 1 c 23=5e-3molec 1 s 1 c 41=0.16molec 1 s 1 c 6=0.128s 1 c 24=5e-3molec 1 s 1 c 42=0.16molec 1 s 1 c 7=0.02s 1 c 25=0.2molec 1 s 1 c 43=0.16molec 1 s 1 c 8=5.12e-3molec 1 s 1 c 26=5s 1 c 44=0.3s 1 c 9=5.12e-3s 1 c 27=0.01molec 1 s 1 c 45=0.3s 1 c 10=1e-4molec 1 s 1 c 28=5s 1 c 46=0.3s 1 c 11=1e-3s 1 c 29=5e-4molec 1 s 1 c 47=0.3s 1 c 12=3.92e-4molec 1 s 1 c 30=0.02molec 1 s 1 c 48=0.3s 1 c 13=3.92e-4s 1 c 31=2s 1 c 49=0.3s 1 c 14=1.93e-4s 1 c 32=2s 1 c 50=0.3s 1 c 15=0.01molec 1 s 1 c 33=2s 1 c 51=0.3s 1 c 16=5.58e-5s 1 c 34=2s 1 c 52=0.3s 1 c 17=2.35e-5molec 1 s 1 c 35=2s 1 c 53=0.2s 1 c 18=0.01s 1 c 36=2s 1 c 54=0.2s 1 c 55=0.3s 1
Modelo de la expresión del operón lactosa basado en sistemas P (VI) Multiconjuntos iniciales M 1 e = (- lactosa, - glucosa) M 2 e = {Gluc 300000 } (- lactosa, abundante glucosa) M 3 e = {Lact 300000 } (abundante lactosa, - glucosa) M 4 e = {Lact 300000, Gluc 300000 } (lactosa y glucosa abundantes) Ms = {EIICB 2500, EIICB P 15000, AC 10000, LacY 3000 } Mc = {RNAP 300, Rib 3000, EIIA 2000, EIICA P 13000, ATP 1000000, β-galac 3000, LacI 1500, CRP 10000, s 3} La cadena s 3 representa al operón: cap.op. lacz s.lacz m..lacz m.lacz e. lacy s.lacy m..lacy m.lacy e. laca s.laca m..laca m.laca e {z } {z } {z } 30 12 6
Resultados (I) Se analiza el comportamiento de 4 modelos de sistema P, (Π lac, P i (Π lac )) = (Π lac, ((M i e, M s, M c ), C)), 1 i 4, utilizando el algoritmo multicompartimental de Gillespie. Cada uno de los 4 modelos corresponde a uno de los posibles estados iniciales del medio. Evolución del número de moléculas de camp en ausencia de lactosa y glucosa
Resultados (II) Evolución de las moléculas EIIA P y CRP-cAMP 2 en presencia de glucosa y ausencia de lactosa
Resultados (III) ARN polimerasas transcribiendo en presencia de glucosa y ausencia de lactosa
Resultados (IV) ARN polimerasas transcribiendo y represores activos en presencia de lactosa y ausencia de glucosa
Resultados (V) Evolución de las proteínas β-galactosidasa y LacY en presencia de lactosa y ausencia de glucosa
Resultados (VI) Evolución del medio partiendo de abundante glucosa y lactosa
Resultados (VII) Evolución de las proteínas β-galactosidasa y LacY en presencia de lactosa y glucosa