LOCALIZACIÓN DE SECUENCIAS REGULADORAS DE LA

Documentos relacionados
LA NUEVA BIOTECNOLOGÍA

Control de Expresión Génica Procariota. Profesor: Javier Cabello Schomburg, MS

Fecha de elaboración: 14 de mayo de 2010 Fecha de última actualización: 27 de Mayo de 2010

GENÉTICA MOLECULAR. Unidad 1: Introducción a la genética molecular

TEMA 3. ESTRUCTURA Y EVOLUCIÓN DEL GENOMA EUCARIOTA

Identificación de loci de caracteres. cuantitativos implicados en la morfogénesis. foliar en Arabidopsis thaliana

Regulación génica. Necesaria tanto en procariotas como eucariotas. Todas las células del cuerpo tienen el mismo material genético

PREGUNTAS DE EXÁMENES DE SELECTIVIDAD DE BIOLOGÍA. Tema 7: Microbiología y biotecnología

La síntesis de proteínas

DOGMA CENTRAL DE LA BIOLOGIA

tuberosus (Fairmaire & Germain)

Eras de investigación EPIGENOMICA DESIFRANDO EL OTRO CODIGO GENETICO 01/06/2010

UNIVERSIDAD NACIONAL DEL CALLAO

Alineamiento de pares de secuencias

TEMA 3: CINÉTICA HOMOGÉNEA. REACCIONES SIMPLES CQA-3/1

EVALUACIÓN DE VARIABLES FISICOQUÍMICAS DEL AGUA EN UN SISTEMA DE GEOMEMBRANAS PARA LA PRODUCCIÓN DE TILAPIA ROJA (Oreochromis sp.)

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Práctica X: Genómica comparativa

Búsqueda de secuencias en Bases de Datos.

74 Prime Time. conjetura Suposición acerca de un patrón o relación, basada en observaciones.

CAPITULO III. El propósito de la investigación fue recopilar información actualizada de las Micro

Alineamiento local: búsqueda de homologías

METODOLOGIA PARA LA CONSTRUCCION Y APLICACION DE MODELOS DE SIMULACION DINAMICA A PROCESOS DE IMPORTANCIA AGRÍCOLA

Tema 1.- Correlación Lineal

Tema 8. Mapas físicos Genómica estructural

EL A.D.N. Existen 2 tipos de Acidos Nucleicos : ADN (Acido Desoxirribonucleico) y ARN (Acido Ribonucleico) Diferencias entre ADN y ARN

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

BLOQUE I. Reproducción Celular

Motivos y Dominios. Jesús Fernández C. 19 de Junio del Cinvestav-Zacatenco

Campo Magnético en un alambre recto.

Redacción de Reivindicaciones de Patentes de Productos Agroquímicos

AGRADECIMIENTOS... VII RESUMEN... XIII RESUM... XV SUMMARY... XVII ABREVIATURAS... XIX ÍNDICE DE CONTENIDO... XXIII ÍNDICE DE FIGURAS...

FÍSICA Y QUÍMICA 3º ESO. OBJETIVOS, CONTENIDOS Y CRITERIOS DE EVALUACIÓN 1ª Evaluación: Unidad 1. La medida y el método científico.

Clones Transgénicos Ejemplo

Biotecnología y su aplicación a las ciencias agropecuarias. Oris Sanjur Instituto Smithsonian de Investigaciones Tropicales

Biología Molecular y Filogenia en Micología

Dos matrices son iguales cuando tienen la misma dimensión y los elementos que ocupan el mismo lugar en ambas son iguales

TRABAJO PRÁCTICO Nº 3 GENÉTICA

Guía de actividades. Trabajo colaborativo 2

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Acidos Nucleicos. Cap.3 Dra. Millie L. González

COMPOSICIÓN QUÍMICA DE LA CROMATINA

3.1. Administración de la medición y de la información estratégica:

Capítulo 12 REGULACIÓN DE LA EXPRESIÓN GÉNICA. Factores de Transcripción. Metilación. Procesamiento del ARN. Post-traduccional

ARTÍCULO ORIGINAL. ARS Pharmaceutica. Collazo MV 1, Muñiz MM 2, Alonso1 C 1, Frutos G 2

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

TRANSCRIPCIÓN Y REPLICACIÓN DEL RNA DEL VIRUS DE LA GRIPE

ENFERMEDADES HEREDITARIAS EN ANIMALES que son las enfermedades hereditarias?

Pharos ISSN: Universidad de Las Américas Chile

ACTIVIDADES 2º BACHILLERATO C. Y T. GENÉTICA MOLECULAR

CAPITULO 6 SIMULACIONES Y RESULTADOS

Agua óptima para procesos industriales, sin apenas mantenimiento y muy bajo coste energético

Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA

LA REGENERACION NATURAL EN EL BOSQUE VON HUMBOLDT

Organización del genoma eucariotico. 1. Complejidad del genoma eucariota

1. Conocer, analizar y discutir los mecanismos moleculares del almacenamiento, mantenimiento, expresión y transmisión de la información genética.

Orígenes de replicación en los cromosomas eucariotas

Oferta tecnológica: Método para detectar inserciones de espaciadores en estructuras CRISPR

Biología a Molecular. De la bioquímica a la genómica

Grandes proyectos genómicos

PALINDROMOS: SECUENCIAS ESPECIALES DEL ADN

CAPÍTULO I METODOLOGÍA DEL PROYECTO DE INVESTIGACIÓN. Estudiar y profundizar sobre la medición y valoración del capital Intelectual como medio

ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA 2010 PRÁCTICO: ANOTACIÓN GENÓMICA UTILIZANDO ARTEMIS

VALORES GENÉTICOS Y GENÓMICOS EN MEJORAMIENTO LECHERO

16. Estructuras de Lewis (III)

MODELO DE CRECIMIENTO EXPONENCIAL, DEMANDA Y OFERTA, FUNCIÓN TRIGONOMÉTRICA Y DERIVADAS EVALUACIÓN PRÁCTICA 2016-II PEDRO PABLO HERNÁNDEZ ROMERO


DETERMINACIÓN Y EVALUACIÓN DE LAS PATOLOGÍAS DEL CONCRETO EN LAS VEREDAS DE UN ASENTAMIENTO HUMANO

La eficiencia de los programas

Flujo de información en la célula

Regulación de la expresión genética en eucariontes

VARIACIONES EN EL CONFORT HUMANO DEBIDA A LA VARIABILIDAD Y/O LOS CAMBIOS CLIMATICOS. Rosendo Alvarez Morales y Laura Aenlle Ferro.

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

GUIA PARA LA PRESENTACION DE INFORMES

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

PROGRAMA DE ESTUDIO. 2. CICLO O AREA: División de Ciencias e Ingeniería/Ingeniería Ambiental.

CAPITULO 6. Análisis Dimensional y Semejanza Dinámica

La Biología Molecular Aplicada a la detección de patógenos en alimentos

transcripción en procariotas

Expresión de la información genética en eucariotas. metodologías de estudio 1. Qué se transcribe?

TEMA 1: SISTEMAS MODELADOS POR ECUACIONES DIFERENCIALES EN INGENIERÍA QUÍMICA. CLASIFICACIÓN. GENERALIDADES.

EXAMEN DE ADMISION AL POSGRADO Maestría en Ciencias Ecología y Biotecnología Instituto de Biotecnología y Ecología Aplicada Universidad Veracruzana

Organización y estructura de genomas

GUIA DE APRENDIZAJE. Pensamiento: Comunicativo Expresivo EL HOMBRE, CONSTRUCTOR DE SU PROPIA EVOLUCION

Expliquemos con exactitud qué queremos decir con valores máximos y mínimos.

GENÉTICA MOLECULAR. El ADN, LA MOLÉCULA DE LA HERENCIA

GUÍA DEL PROYECTO DE GRADO

REGULACIÓN GENÉTICA EN CÉLULAS EUCARIOTAS

CAPITULO II ANÁLISIS DEL CRECIMIENTO POBLACIONAL Y CALCULO DE CAUDALES DE DISEÑO

Medicina y Biología Molecular y Celular

PROGRAMA. 2. MATERIA/ OBLIGACION ACADEMICA: Práctica para la Formación

1 sesión: Presentación de la asignatura y criterios de evaluación. 1 sesión: Prueba inicial. UNIDAD DIDÁCTICA I LAS MOLÉCULAS DE LA VIDA

MANUAL EASYCHAIR. A) Ingresar su nombre de usuario y password, si ya tiene una cuenta registrada Ó

Western Blot. Western Blot

Tercera práctica de REGRESIÓN.

PLANES DE ESTUDIO PARA PRIMER CURSO

Caracteristicas del ADN. Se rompen con las siguientes condiciones -Temperaturas >90 - ph >10.5

ESDUDIO DE CASO. Eficiencia Energética Buaiz Alimentos 1 CARACTERÍSTICAS DE LA EMPRESA

Transcripción:

LOCALIZACIÓN DE SECUENCIAS REGULADORAS DE LA TRANSCRIPCIÓN POR MÉTODOS COMPUTACIONALES TRANSCRIPTION REGULATION SEQUENCE DETECTION BY COMPUTATIONAL METHODS Carlos Andres Perez Galindo Grupo de Investigación en Biotecnología y Medio Ambiente(GIBMA) Centro de Investigaciones en Ciencias Básicas, Ambientales y Desarrollo Tecnológico(CICBA), Universidad Santiago de Cali. pegaso107@gmail.com RESUMEN El aumento en la tasa de secuencias biológicas reportadas en las bases de datos, a partir de los procesos de secuenciación y por tanto del crecimiento de las listas de genes de organismos cuyo genoma ha sido secuenciado, contrasta con el poco conocimiento sobre la manera en que esos genes son regulados. En la presente investigación, se elaboro un programa en lenguaje PERL, para la localización de secuencias de ADN que se unen a factores de transcripción que regulan la expresión génica en procariotas. Los conjuntos de genes fueron obtenidos a partir de su expresión (micro arreglos) bajo las mismas condiciones ambientales. El organismo modelo con el que se trabajo fue lactococcus lactis, del cual se dispone su genoma secuenciado en formato del banco de genes. El programa encontró mayor número de posibles secuencias reguladoras en la región flanqueadora 5 de los genes. El número de posibles secuencias reguladoras también estuvo determinado por la cantidad de genes que conformaron cada conjunto. El programa también localizo secuencias flanqueadoras de genes que podrían estar involucradas en su regulación, pero a nivel traduccional. La comparación de los resultados con patrones obtenidos experimentalmente, se hizo mediante matrices de pesos de posición de nucleótidos, obteniéndose aproximadamente un 50 % de secuencias reguladoras que coincidían con las reportadas en las bases de datos, lo que indica un buen nivel de predicción del programa si se tiene en cuenta que la mayoría de secuencias reguladoras para procariotas, aun no han sido caracterizadas por métodos experimentales. Palabras clave: Bioinformática, PERL, transcripción, traducción, matrices de pesos, factores de transcripción. 96 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009

Localización de secuencias reguladoras ABSTRACT The increase in the number of biological sequences reported to the data bases, and the growth in the accompaning gene lists from the organisms whose genome has been sequenced, contrasts with the little existing knowledge of how these genes are regulated. In this study, a PERL computer program was created to detect the DNA sequences that join the transcription factors which regulate the genetic expression in prokaryote organisms. The gene sets were obtained from their expressions (microarrays) under the same environmental conditions. The model organism used was lactococcus lactis, whose sequenced genome is available in gene bank format. The program found a greater number of possible regulating sequences in the 5 gene flanking region. The number of possible regulatory sequences was also determined by the number of genes which make up each set. The program also detected gene flanking sequences which might be involved in its regulation, but at the translational level. The comparisson of the results with experimentally obtained standards was done with position weight nucleotid arrays getting approximately 50% regulating sequence coincidence with reported data which indicates a good prediction level from the program if one takes into account that the mayority of prokaryote regulating sequences still have not been characterized by experimental methods. Keywords: Bioinformatics, PERL, transcription, translation, weight array, transcription factors I. INTRODUCCION. 350 proteínas reguladoras estimadas, tienen caracterizados sus sitios de Hoy en día, se observa un aumento en unión al ADN. Para las bacterias cuyo la tasa de secuencias biológicas genoma ha sido secuenciado reportadas en las bases de datos, a recientemente, así exclusivamente, los partir de los procesos de secuenciación sitios de unión a factores de y por tanto del crecimiento de las listas transcripción que se alineen por de genes de organismos cuyo genoma homología con las secuencias ha sido secuenciado. Sin embargo, este identificadas en E.coli y Bacillus hecho contrasta con el poco subtilis, pueden ser usadas para inferir conocimiento sobre la manera en que propiedades regulatorias del esos genes son regulados. Por organismo. Por tanto, es importante el ejemplo, en Escherichia coli, la d e s a r r o l l o d e h e r r a m i e n t a s b a c t e r i a m á s e s t u d i a d a, computacionales para identificar aproximadamente 1 / 5 de las 300 a secuencias de unión de factores de Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009 97

transcripción aún no caracterizados. La gran velocidad a la que se están 98 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009

la obtención de los mejores utilizarlos como control negativo. alineamientos locales el programa se apoya en el software lalign.exe, el II.I. PROGRAMA cual es ejecutado comparando cada DESARROLLADO. una de las secuencias entre si de cada carpeta. Los resultados son guardados El programa puede obtenerse en la en el archivo ResultadosLalign3.txt dirección electrónica: y ResultadosLalign5.txt. Una vez se http://www.usc.edu.co/investiga/cic tienen estos archivos, el programa ba/alineamiento.txt selecciona aquellos alineamientos con una longitud y porcentaje de similitud II.II. CONJUNTO DE GENES DE igual o mayor al proporcionado por el Lactococcus lactis UTILIZADOS usuario. Los resultados de este primer EN LA COMPROBACIÓN DEL filtro son guardados en los archivos PROGRAMA. ResultadosCompar acion3.txt y ResultadosComparacion5.txt, para Los conjuntos de genes proceden de un cada orientación de las secuencias experimento de arreglos de ADN, en flanqueadoras. En la presente que el control es la cepa utilizada en la investigación se trabajó con un valor secuenciación de su genoma y la diana de identidad igual o mayor al 75 % y es una cepa natural, utilizada en una longitud mínima del alineamiento alimentación, específicamente en la de 7, debido, a que en los genomas de producción de yogur. procariotas, los sitios de unión a El conjunto número 8, esta factores de transcripción tienen una conformado por genes tomados al longitud variable de aproximadamente azar, con el fin de tener un control 30 nucleótidos, sin embargo, hay dos negativo. regiones altamente conservadas de estos sitios, de aproximadamente 7 I I. I I I. M É T O D O P A R A nucleótidos, que predominantemente DETERMINAR EL VALOR DE hacen contacto con los factores de CADA NUCLEÓTIDO EN LAS transcripción y que por cuestiones de evolución neutral pueden variar en uno o dos nucleótidos. MATRICES DE PESOS. Este método es derivado de la teoría de 5 la información, el cual consiste en Los primeros ocho conjuntos de genes, calcular el vector RSequence(l), corresponden a aquellos que tuvieron un nivel similar de expresión en experimentos de micro arreglos. El conjunto 8 esta conformado por genes seleccionados al azar, con el fin de Localización de secuencias reguladoras mediante la formula: 6 F(b, l) es la frecuencia de cada base b Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009 99

en la posición l de los sitios alineados. (100 nucleótidos aguas arriba); El La matriz de pesos m(b, l) se calcula conjunto de genes de texto rojo, mediante la formula: c o r r e s p o n d e a l o s p a t r o n e s encontrados en las secuencias flanqueadoras de la región 3 del gen Donde f(b,l) es igual a: (100 nucleótidos aguas abajo); * conjunto de genes control. Para calcular la puntuación de cada Excepto para el conjunto de genes 7 y secuencia, se suma cada uno de los 8, los resultados indican que hay pesos de los nucleótidos por diferencias entre los patrones de las posición. secuencias flanqueadoras 5 y 3, no sólo a nivel de similitud con los III. RESULTADOS. reportados en las bases de datos, sino también en el número obtenido, siendo Para la obtención de las posibles mayor el de las secuencias secuencias reguladoras, se partió de flanqueadoras 5 (figura 2). El alineamientos locales entre regiones número de genes del conjunto 7 es flanqueadoras 5 de los genes que muy reducido (3 genes) y el conjunto 8 conforman un mismo conjunto de estuvo conformado por 34 genes, datos. todos seleccionados al azar, por tanto, los patrones obtenidos de las A partir de las alineaciones, se secuencias flanqueadoras 5 y 3 de realizaron comparaciones entre todas este conjunto son controles, siendo su las secuencias con el fin de obtener número muy similar. patrones comunes. Para intentar diferenciar los resultados de las Hasta el momento se carece de una secuencias flanqueadoras 5' y 3', se ha base de datos de factores de calculadoculado el número de patrones transcripción para Lactococcus lactis obtenidos por conjunto de genes y su y las reportadas no tienen la totalidad longitud promedio (tabla 1). de secuencias involucradas en p r o c e s o s r e g u l a t o r i o s d e l a Tabla 1. Número y tamaño de transcripción, por tanto es muy difícil patrones encontrados ntra d s por p r conjunto n que el número de patrones obtenidos de genes. El conjunto de genes de coincida en su totalidad con los de las texto azul, corresponde a los patrones bases de datos. Sin embargo, para los encontradosos en las secuencias diferentes conjuntos de genes, excepto flanqueadoras de la región 5 del gen el 7, obtenidos de las secuencias 5 Schneider, T. D., Stormo, G. D. & Gold, L. (1986). Information content of binding sites on nucleotide sequences. J. Mol. Biol. 188, 415-431. 6 Matrices de pesos: http://prodoric.tu-bs.de/vfp/vfp_help.php#pwm 100 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009

Localización de secuencias reguladoras flanqueadoras 5, se obtuvieron Para la mayoría de conjuntos, secuencias similares (tabla 2). aproximadamente el 50% del número de patrones fue similar al reportado en Tabla 2. Número de patrones encontrados las bases de datos (figura 3). Los en las secuencias flanqueadoras de la patrones del conjunto 8 podrían ser región 5 que son similares a los considerados como falsos positivos, reportados en las bases de datos debido a que este conjunto se elaboro (verdaderos positivos).* conjunto de con genes seleccionados al azar y no, genes control por expresarse bajo las mismas # de Patrones 20 18 16 14 12 10 8 6 4 2 0 0 1 2 3 4 5 6 7 8 Conjunto de Genes # de patrones encontrados en las secuencias flanqueadoras de la región 5 del gen # de patrones encontrados en las secuencias flanqueadoras de la región 3 del gen Figura 2. Histograma para la comparación del número de patrones obtenidos de las secuencias flanqueadoras 5 y 3. Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009 101

condiciones ambientales. Sin flanqueadoras de genes. embargo, hay que tener en cuenta el Al realizarse una comparación entre número de secuencias flanqueadoras las secuencias de los patrones en las que se encuentran y las obtenidos a partir de las regiones puntuaciones que obtuvieron respecto flanqueadoras 5 con las 3, de todos a las secuencias de las bases de datos, los conjuntos de genes, se encontró lo que podría indicar que algunas de que muy pocas coincidían (tabla 3), al estas secuencias pondrían ser igual que comparar estos resultados verdaderos positivos obtenidas por con los patrones reportados en las comparación aleatoria de secuencias bases de datos, indicando que el posible número de falsos positivos es de regiones reguladoras de la reducido, debido a que las regiones transcripción en procariotas, utilizan reguladoras de la transcripción se las regiones flanqueadoras 5 para su localizan aguas arriba de los genes en e v a l u a c i ó n. E n l a p r e s e n t e procariotas, muy diferentes a lo que investigación, se han utilizado las ocurre en eucariotas, cuyas regiones regiones flanqueadoras 3, como de regulación génica pueden controles. encontrarse en sitios aguas debajo de 7 los genes o regiones intrónicas. Es por Tabla 3. Patrones que coinciden tanto en esto, que los programas de predicción las regiones flanqueadoras 5 y 3 de un mismo conjunto de genes (posibles 102 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009

Localización de secuencias reguladoras Figura 3. Histograma para la comparación del número de patrones obtenidos de las secuencias flanqueadoras 5 y las reportadas en las bases de datos de sitios de unión a factores de transcripción. falsos positivos). * Secuencias coeficiente de correlación es igual a reportadas en la base de datos como sitio 0.8 (figura 4). de unión a factores de transcripción. Para el número de patrones obtenidos Los conjuntos con los que se trabajo, de las secuencias flanqueadoras 3, la estaban conformados por un número pendiente es 0.129 y el coeficiente de distinto de genes. La distribución de correlación es de 0.60 (figura 5). los datos muestra una tendencia lineal, Las figuras 4 y 5, muestran que la indicando que a mayor número de pendiente de la gráfica es mayor para genes mayor número de patrones el número de patrones de secuencias obtenidos por el programa. flanqueadoras de la región 5 de cada conjunto de genes Vs. Número de La correlación de los datos permite genes, respecto a la curva deducida de obtener la relación entre el número de los controles, indicando que la patrones y el número de genes. Para el tendencia del programa es obtener número de patrones obtenidos de las mayor número de patrones de las secuencias flanqueadoras 5, la secuencias que flanquean aguas arriba correlación es muy buena. El 7 Cliften P, Hillier L, Fulton L, Graves T, Miner T, Gish W, WaterstonR, Johnston M: Surveying Saccharomyces genomes to identify functional elements by comparative DNA sequence analysis. Genome Res 2001, 11:1175-1186. Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009 103

a los genes con un perfil de expresión e x p e r i m e n t a l m e n t e e n o t r o s similar. Para comprobar la precisión organismos. del programa desarrollado, se buscaron las anotaciones funcionales Tabla 4. Algunas de las posibles regiones de los genes con patrones similares, su de regulación generadas por el programa, posición en el cromosoma y la con su respectiva puntuación, obtenida de comparación, mediante matrices de la matriz de pesos por posición de nucleótidos. pesos, de los patrones con los hallados 25 y = 0.428x + 3.011 20 # de Patrones 15 10 5 # Patrones de la secuencias flanqueadoras de la región 5 0 0 10 20 30 40 50 # de Genes IV. CONCLUSIONES. El programa desarrollado localiza r e g i o n e s r e g u l a d o r a s d e l a # de Patrones 9 8 7 6 5 4 3 2 1 0 0 20 40 60 # de Genes y = 0.129x + 2.548 # Patrones de los controles Figura 5. Línea de tendencia de la relación entre el número de patrones de los controles Vs. Número de genes y su función lineal y(x). 104 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009

Localización de secuencias reguladoras t r a n s c r i p c i ó n. L o s p a t r o n e s genes 5, se encontraron varios encontrados, fueron los más patrones para una misma secuencia y conservados para regular expresión de con longitudes promedio de 7 genes bajo las mismas condiciones nucleótidos, lo que indica varias ambientales en un mismo individuo. regiones altamente conservadas en los Al aumentar el número de genes que se sitios de unión a los factores de expresan bajo las mimas condiciones transcripción y la participación de más ambientales, el programa aumenta el de una proteína en el proceso número de predicciones lo que indica regulatorio. un mayor número de proteínas involucradas en la regulación génica. Al restringir la búsqueda de secuencias comunes de las regiones Para las secuencias flanqueadoras de flanqueadoras 5 de cada gen, a Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009 105

secuencias iguales o mayores de 7 reguladoras a otro nivel del flujo de la nucleótidos, permitió, no sólo información genética, como por localizar secuencias cortas muy ejemplo la traducción, debido a su alta conservadas que predominantemente conservación y relación con los genes se unen a las proteínas, sino también, argf y yaje, implicados en la secuencias largas de hasta 41 producción del ARN ribosomal 16S, nucleótidos, que las contienen y 5S, 23S y el ARN de transferencia para altamente conservadas de Bacillus alanina y asparagina. subtilis y Escherichia coli, indicando su gran importancia biológica para los El programa predice un número de microorganismos en los procesos de patrones 5, 3.3 veces mayor al regulación génica. Una comparación número de patrones de secuencias filogenética de estas secuencias podría flanqueadoras de la región 3, lo cual indicar si la evolución de estos genes apoya los datos experimentales que ha sido vertical u horizontal. muestran que los sitios de unión a los factores de transcripción se localizan Las secuencias largas obtenidas por el principalmente en la región 5, programa, pueden considerarse no además, solamente el 3.2 % de las s ó l o c o m o r e g u l a d o r a s secuencias control 3 coincidieron con transcripcionales, sino también, como las secuencias 5, indicando un bajo 106 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009

Localización de secuencias reguladoras número de secuencias obtenidas y sus correspondientes factores de debido a factores aleatorios. El trabajo transcripción obtenidos por la desarrollado tiene una gran validez, si metodología descrita, proporcionan se considera que aproximadamente el secuencias funcionales de ADN que 50 % de los patrones obtenidos en las pueden ser comparadas por homología regiones flanqueadoras 5, están con organismos próximos y distantes reportados en las bases de datos de evolutivamente, permitiendo la sitios de unión a factores de construcción de hipótesis sobre la transcripción, derivados de métodos manera en que se relacionan los experimentales. Las secuencias conjuntos de genes que se activan bajo comparadas han tenido pesos las mismas condiciones ambientales, idénticos o similares. El segundo caso lo cual contribuiría a los diseños indica mutaciones de sitio específico experimentales para localización de debido a la evolución del organismo, secuencias reguladoras de la que podrían ser utilizadas para deducir transcripción y caracterización aquellos nucleótidos en las secuencias genética de rutas bioquímicas. conservadas, que no son esenciales para la unión deladn con la proteína. V. BIBLIOGRAFIA. Los resultados obtenidos, son un 1 Bussemaker, H. J., Li, H. & Siggia, importante punto de partida, para E. D. (2000) Proc. Natl. Acad. Sci. desarrollar estudios biotecnológicos USA97,10096 10100. experimentales que permitan controlar 2 Cliften P, Hillier L, Fulton L, Graves la regulación génica mediante T, Miner T, Gish W, Waterston R & mutaciones dirigidas, debido a que el Johnston M. (2001) Genome Res. programa aporta la secuencia patrón y 11, 1175-1186. por tanto su localización en el genoma. 3 Eisen, M. B., Spellman, P. T., Brown, La alteración de una de estas P. O. & Botstein, D. (1998) Proc. secuencias, cambiaria la respuesta del N a t l. A c a d. S c i. U S A 9 5, organismo a variaciones ambientales, 14863 14868. sin necesidad de caracterizar genética 4 McCue, L., Thompson, W., y bioquímicamente un conjunto de Carmack, C., Ryan, M. P., Liu, J. S., g e n e s, l o c u a l, a h o r r a Derbyshire,V. & Lawrence, C. E. considerablemente los recursos y el (2001) Nucleic Acids Res. 29, tiempo de obtención de fenotipos que 774 782. se deseen para aplicaciones que 5 Pérez Rueda, E. & Collado Videz, puedan tener una representatividad J. (2000) Nucleic Acids Res. 28, 56 tecnológica. 59. 6 Robison, K., McGuire, A. Por otra parte, las secuencias patrones M.&Church, G. M. (1998) J. Mol. Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009 107

Biol. 284, 241 254. 7 Schneider, T. D., Stormo, G. D. & Gold, L. (1986). J. Mol. Biol. 188, 415-431. [8] Stormo, G. & Hartzell, G. W., 3rd (1989) Proc. Natl. Acad. Sci. USA 86,1183 1187. 9 Van Helden, J.,Andre, B. & Collado- Vides, J. (1998) J. Mol. Biol. 281, 827 842. 10 Van Nimwegen, E., Zavolan, M., Rajewsky, N. & Siggia, E. D. (2002) Proc. Natl.Acad. Sci. USA 99, 7323 7328. 108 Rev. Asoc. Col. Cienc. Biol. (Col.), 21: 96-108; 2009