Motivos y Dominios. Jesús Fernández C. 19 de Junio del Cinvestav-Zacatenco

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Motivos y Dominios. Jesús Fernández C. 19 de Junio del 2013. Cinvestav-Zacatenco"

Transcripción

1 Jesús Fernández C. Cinvestav-Zacatenco 19 de Junio del 2013 Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

2 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

3 Introducción 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

4 Introducción Motivos y Dominios Introducción Un aspecto importante de la caracterización de secuencias biológicas son los motivos y los dominios, ya que sirven para caracterizar funciones de proteínas desconocidas. Secuencias conservadas son secuencias biológicas similares o idénticas que pueden encontrarse en ácidos nucléicos, proteínas. Un motivo es un elemento conservado en la secuencia de aminoácidos o nucleótidos, que habitualmente se asocia con una función concreta. Los motivos se generan a partir de alineamientos múltiples de secuencias con elementos funcionales o estructurales conocidos, por lo que son útiles para predecir la existencia de esos mismos elementos en otras proteínas de función y estructura desconocida. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

5 Introducción Motivos y Dominios Introducción Un dominio es un término más genérico que designa una región de una proteína con interés biológico funcional o estructural. También se llama dominio a una región de la estructura tridimensional de una proteína con una función concreta, que incluye regiones no necesariamente contiguas en la secuencia de aminoácidos. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

6 Identicación de motivos y dominios en alineamiento múltiple de secuencias 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

7 Identicación de motivos y dominios en alineamiento múltiple de secuencias Identicación de motivos y dominios en alineamiento múltiple de secuencias Los motivos y dominios son construidos a partir de un AMdS (Alineamiento múltiple de Secuencias) en las cuales, las secuencias está relacionadas entre sí. Esto sirve para hallar las regiones conservadas. Una vez halladas las regiones que se consideran motivos y dominios se prosigue a almacenar la información de consenso en una base de datos para que así sirvan como base en la identicación de las funciones de una proteína desconocida que presente los mismos patrones. Esto puede ser almacenado de dos formas:expresiones regulares o Mediante un modelo estadístico. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

8 Usando expresiones regulares en las bases de datos 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

9 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos Una expresión regular es una manera concisa de representar una familia de secuencias por un string. Cuando los dominios y los motivos son escritos en expresiones regulares se deben seguir las siguientes reglas. Un aminoácido es conservado se debe escribir su código de letra. Cuando una posición tiene varias alternativas de aminoácidos se encierra entre corchetes todas las posibilidades. Si no está especicado se escribe por una X. Cada posición está ligada por un guión. Finalmente si se repite un patrón se escribe entre paréntesis cuántas veces se repite. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

10 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos Ejemplo E X (2) [FHM] X (4) {P} L. Existen dos mecanismos para coincidir dos expresiones regulares: Exact Matching y Fuzzy Matching. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

11 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos En el Exact Matching como su nombre lo indica no permite alguna variación en la secuencia del query, ésta manera de buscar tiene una alta probabilidad de perder motivos relevantes que pueden tener pequeñas variaciones. En el Fuzzy matches, también llamado approximate matches, las coincidencias son más exibles entre residuos de propiedades bioquímicas semejantes, éste método es capaz de incluir una mayor variedad de formas de un motivo con una función conservada, sin embargo ésto incrementa el ruido y los falsos positivos. Ejemplos: PROSITE y Emotif. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

12 Usando modelos estadísticos en las bases de datos 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

13 Usando modelos estadísticos en las bases de datos Usando modelos estadísticos en las bases de datos La mayor limitación de las expresiones regulares es que estos métodos no toman en cuenta la información de la probabilidad. Una expresión regular tiene menos poder predictivo porque muchas secuencias con el mismo tipo de motivo no son representadas. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

14 Usando modelos estadísticos en las bases de datos Usando modelos estadísticos en las bases de datos Al contrario de las expresiones regulares, se utilizan PSSMs (Position specic scoring matrices), perles y HMMs (Hidden Makarov models) y preservan la información de la secuencia de un AMdS y lo expresan con modelos probabilísticos. Además, éstos modelos estadísticos tienen un mayor poder de predicción que los modelos basados en expresiones regulares, incluso aunque han sido obtenidos de un número reducido de secuencias. Ésta capacidad puede incrementar la sensibilidad del descubrimiento de motivos y detectar secuencias divergentes pero que estén relacionadas. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

15 Descubrimiento de motivos en secuencias no alineadas 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

16 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Para un conjunto de secuencias que estén estrechamente relacionadas, se pueden encontrar motivos mediante el uso de AMdS, pero no sucede ésto cuando son distantes pero están relacionadas. Para detectar estos motivos se necesitan algoritmos más especializados como: Expectation maximation y Gibbs Motif sampling. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

17 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Puede ser usado para encontrar motivos ocultos. El método primero hace un alineamiento aleatorio de secuencias para generar un PSSM de prueba. Luego la prueba es usada para comparar cada secuencia individualmente. Se irán modicando las puntuaciones de la PSSM en cada iteración para maximizar el alineamiento de la matriz a cada secuencia. Durante cada iteración la secuencia de patrones de los motivos conservados se irá reuniendo en el PSSM. El problema radica en la convergencia prematura al alcanzar un óptimo local. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

18 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Éste método es muy similar al EM. Primero se hace un alineamiento sobre todas las secuencias excepto una. Luego un se genera un PSSM de prueba, luego la matriz se alinea con la secuencia que se dejó fuera. La matriz de puntuaciones se ajusta para obtener el mejor alineamiento. Éste se procesó se repite hasta que ya no quede nada que mejorar. Éste método es menos susceptible a los mínimos locales. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

19 Motivos reguladores en secuencias de ADN 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

20 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Las moscas de fruta son susceptibles a infecciones de bacterias y otros patógenos.pero no tienen el sistema inmune tan sosticado como nosotros. Ellos tienen un conjunto de genes inmunes que generalmente se encuentran dormidos en el genoma de la mosca los cuáles de alguna manera se despiertan y producen proteínas que destruyen el patógeno y generalmente curan la infección. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

21 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Si realizamos un experimento en el cual se contagian las moscas y medimos cuales genes se despiertan como una respuesta inmune. De este conjunto de genes nos gustaría determinar que activa ese proceso. Éste proceso nos va a mostrar que los residuos TCGGGGATTTCC son los culpables de ésta activación. Éstas cadenas cortas llamadas NF-kB binding sites, son importantes ejemplos de los motivos reguladores. Proteínas tales como los factores de transcripción están ligados a estos motivos, Haciendo que el ARN polimerasa transcriba los genes previamente dichos. Uno de los problemas es descubrir tales motivos sin un conocimiento de como podrían verse. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

22 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Tomando en cuenta el experimento anterior va a devolver un conjunto de regiones de los genes en el genoma, cada región contiene al menos un NF-kB binding sites. Supongamos que no sabemos cual es el patrón de NF-kB y tampoco sabes en que parte se encuentra localizado en la muestra. Por lo cual necesitamos un algoritmo que dado un conjunto de secuencias de un genoma, pueda encontrar subcadenas cortas que parezcan ocurrir seguido. A pesar de que el DNA es complicado de descifrar, éste método es usado popularmente para encontrar motivos bajo la idea de que palabras mas frecuentes o mas rara corresponden a los motivos reguladores en el ADN. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

23 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Figura: Texto encriptado Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

24 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Figura: Texto parcialmente desencriptado Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

25 Proles 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

26 Proles Motivos y Dominios Proles Supongamos que se presentan 7 nucleótidos de tamaño 32 generados aleatoriamente. También se da otro conjunto pero con el patrón secreto p = ATGCAATCT y de tamaño l = 8 implantado en una posición aleatoria. Supongamos que tampoco conocemos el patrón P o donde la secuencia es implantada. La tarea es hallar P analizando la secuencia de ADN. Una de las maneras de hacer esto es buscar todas las cadenas de longitud l que aparezcan en el conjunto, seria muy raro hallar ese tipo de cadenas dado el azar(7 veces o mas) por lo cual podemos concluir que es el patrón p que estamos buscando. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

27 Proles Motivos y Dominios Proles Figura: Ejemplos de secuencias Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

28 Proles Motivos y Dominios Proles Para hacer mas difícil el problema podemos hacer que ADN mute en cierto nucleótidos, como por ejemplo tomando los NF-kB binding sites TCGGGGATTTCC, y se da un conjunto donde cada cadena cambia muy poco. Esto se complica ya que la búsqueda de la cadena de tamaño 8 no revela ninguna patrón y la cadena ATGCAACT no aparece ni una sola vez. Por lo cual es necesario que queremos por motivo. Ya que permitir que un solo string represente un motivo generalmente falla al representar las variaciones de los patrones en la vida real sin embargo una representación de un motivo puede ser hecho por una matriz de perles. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

29 Proles Motivos y Dominios Proles Figura: Nucleótidos mutados y la obtención del Patrón Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

30 Proles Motivos y Dominios Proles Figura: Secuencia con mutaciones Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

31 Proles Motivos y Dominios Proles Lo que se realiza es lo siguiente, consideremos que un conjunto de t secuencias de ADN, cada una tiene n nucleótidos. Selecciona una posición de esas t secuencias,y así formar un array s = (s 1, s 2,..., s t, con 1 <= s i <= n l + 1. Éstas cadenas de tamaño l pueden ser agrupadas en una matriz, la cual será la matriz de perles y después de un consenso se halla que el string de consenso es ATGCAACT que es el patrón P. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

32 Proles Motivos y Dominios Proles Figura: Selección del consenso Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

33 El problema de hallar motivos. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

34 El problema de hallar motivos. El problema de hallar motivos. Si P(s) denota la matriz de perles correspondiente a las posiciones de inicio s, entonces podemos usar Mp s (j) para denotar como el mayor número en la columna j de P(s). Mientras que la puntuación de consenso está dada por la suma de todos los Mp s (j), éste score puede se usado como una medida de que tan fuerte es un perl correspondiendo las posiciones de inicio de s. Un consenso de la puntuación lt corresponde al mejor alineamiento posible, en el cual cada la de una columna tiene la misma letra. Sin embargo un consenso de lt/4 corresponde al peor alineamiento posible. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

35 El problema de hallar motivos. El problema de hallar motivos. En la forma más sencilla el problema de hallar el motivo se formula como la selección de las posiciones iniciales de s. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

36 Motif Finding Problem. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

37 Motif Finding Problem. Motif Finding Problem. Dado un conjunto de secuencias encontrar el conjunto de l-mers. uno por cada secuencia, que maxímice las puntuaciones. Input: Una matriz t n de ADN. Output: Un arreglo de t que contienen posiciones iniciales s = (s1, s2,..., st) que maxímize Score(s, DNA). Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

38 Motif Finding Problem. Motif Finding Problem. Otra forma de ver el problema es en formular el problema como si fuera un problema de hallar un String mediano. Dado dos l-mers v y w, podemos computar la distancia de Hamming entre ellos, como el número de posiciones que dieren en los dos string. Forzando la notación podemos calcular la distancia de hamming total entre v y s, dh(v, s), para hallar la distancia mínima de hamming entre un string v y cualquier set es un problema sencillo. Primero uno tiene que encontrar la mejor coincidencia para v en la primer secuencia de ADN, luego la segunda y así sucesivamente. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

39 Median String Problem. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

40 Median String Problem. Median String Problem. Dado un conjunto desecuencias de ADN, encontrar el string mediano. Input: Una matriz At n de ADN, y l la longitud del patrón. Output: Un string v de l nucleótidos que minimize la distancia total entre v,adn, sobre todos los strings de esa longitud. Una vez calculado el string medio del ADN puede ser usado para generar un prole que resuelva el problema de busqueda de motivos. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

41 Search Trees 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

42 Search Trees Motivos y Dominios Search Trees Como hemos visto hasta ahora para resolver los problemas de hallar el motivo y encontrar la cadena mediana, es necesario manejar una gran cantidad de información ((n l + 1) t y k l ) En general puede ser visto como un todos los k L L-mers, la siguiente subrutina NextLeaf muestra como saltar de un L-mer a otro através de una progresión. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

43 Search Trees Motivos y Dominios Search Trees Figura: Espacio de busqueda para hallar los mejores s Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

44 Search Trees Motivos y Dominios Search Trees Figura: Espacio de busqueda para hallar la cadena mediana Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

45 Search Trees Motivos y Dominios Search Trees NEXTLEAF(a, L, k) 1 for i L to 1 2 if ai < k 3 ai ai return a 5 ai 1 6 return a Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

46 Search Trees Motivos y Dominios Search Trees Utilizando este algoritmo podemos producir todas las hojas de un L-mer con el algoritmo a continuación. ALL LEAVES(L, k) 1 a (1,..., 1) 2 while forever 3 output a 4 a NEXTLEAF(a, L, k) 5 if a = (1, 1,..., 1) 6 return Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

47 Search Trees Motivos y Dominios Search Trees Estas hojas pueden ser utilizadas para construir un árbol como el siguiente. Figura: Arbol con k = 2 y l = 4 Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

48 Search Trees Motivos y Dominios Search Trees PREORDER(v) 1 output v 2 if v has children 3 PREORDER ( left child of v ) 4 PREORDER ( rigth child of v ) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

49 Search Trees Motivos y Dominios Search Trees Una manera iterativa de hacer esto es la siguiente. NEXTVERTEX(a, i, L, k) 1 if i < L 2 a i return (a, i + 1) 4 else 5 for j L to 1 6 if a j < k 7 a j a j return (a, j) 9 return (a, 0) Cuando i > L, nos movemos hacia abajo en el árbol. Si i = L y j < k nos movemos a los lados del árbol, pero k = j nos movemos hacia atrás, el proceso acaba cuando todo el árbol es explorado. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

50 Motif Problem 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

51 Motif Problem Motivos y Dominios Motif Problem El algoritmo de fuerza bruta quedaría como el siguiente. BRUTEFORCEMOTIFSEARCH(ADN, t, n, l) 1 bestscore 0 2 for each (s1,..., st) from (1,..., 1) to (n l + 1,..., n l + 1) 3 if Score(s, ADN) > bestscore 4 bestscore Score(s, ADN) 5 bestmotif (s1, s2,..., st) 6 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

52 Motif Problem Motivos y Dominios Motif Problem Para encontrar un mejor método podemos utilizar el método de selección para encontrar todos los posiblesl-mer. BRUTEFORCEMOTIFSEARCHAGAIN(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore Score(s, ADN) 3 while forever 4 s NEXTLEAF(s, t, n l + 1) 5 if Score(s, ADN) > bestscore 6 bestscore Score(s, ADN) 7 bestmotif (s1, s2,..., st) 8 if s = (1, 1,..., 1) 9 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

53 Motif Problem Motivos y Dominios Motif Problem O en su defecto podemos utilizar el algoritmo de NextVertex para generar un árbol. SIMPLEMOTIFSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 0 3 i 0 4 while i > 0 5 if i < t 6 (s, i) NEXTVERTEX(s, i, t, n l + 1) 7 else 8 if Score(s, ADN) > bestscore 9 bestscore Score(s, ADN) 10 bestmotif (s1, s2,..., st) 11 (s, i) NEXTVERTEX(s, i, t, n l + 1) 12 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

54 Motif Problem Motivos y Dominios Motif Problem Podemos observar de los resultados para hallar la mejor puntuacion. Por ejemplo si al primeras i posiciones de inicio t son un perl débil, puede que no sea necesario seguir analizando esa rama, ya que lo más probable es que los perles que se puedan generar no sean mejores que los perles que generen las otras ramas. BRANCHANDBOUNDMOTIFSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 0 3 i 0 4 while i > 0 5 if i < t 6 optimisticscore Score(s, i, ADN) + (t i)l 7 if optimisticscore < bestscore 8 (s, i) BYPASS(s, i, t, n l + 1) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

55 Motif Problem Motivos y Dominios Motif Problem 1 else 2 (s, i) NEXTVERTEX(s, i, t, n l + 1) 3 else 4 if Score(s, ADN) > bestscore 5 bestscore Score(s, ADN) 6 bestmotif (s1, s2,..., st) 7 (s, i) NEXTVERTEX(s, i, t, n l + 1) 8 return bestmotif Con esto el algoritmo es mejorado para algunas instancias, pero no todas, el peor caso sigue siendo exponencial. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

56 Median String Problem 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

57 Median String Problem Motivos y Dominios Median String Problem Se pueden aplicar los mismo metodos que se aplicaron para mejorar el problema de motivos, pero ahora con respecto a la mediana, el algoritmo optimizado sería el siguiente. BRANCHANDBOUNDMEDIANSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 3 i 0 4 while i > 0 5 if i < l 6 prex nucleotide string corresponding to (s1, s2,..., si) 7 optimisticdistance TOTALDISTANCE(prex, ADN) 8 if optimisticdistance > bestdistance 9 (s, i) BYPASS(s, i, t, 4) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

58 Median String Problem Motivos y Dominios Median String Problem 1 else 2 (s, i) NEXTVERTEX(s, i, t, 4) 3 else 4 word nucleotide string corresponding to (s1, s2,...sl) 5 if TOTALDISTANCE(word, ADN) < bestdistance 6 bestdistance TOTALDISTANCE (word, ADN) 7 bestword word 8 (s, i) NEXTVERTEX(s, i, t, n l + 1) 9 return bestword Como en el caso anterior, el algoritmo no provee una mejora en el peor de los casos, pero hace un incremento en general a la aceleración. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos.

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. Introducción a la Bioinformática Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. El alineamiento múltiple es una de las técnicas bioinformáticas más usadas, ya que por medio de

Más detalles

Bioinformática Clásica

Bioinformática Clásica Tema 4: Alineamiento Múltiple y Filogenias (1) Motivos y Perfiles Dr. Oswaldo Trelles Universidad de Málaga Los motivos o perfiles son pequeños fragmentos, trozos o zonas conservadas presentes en un grupo

Más detalles

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1

Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1 Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1 Gloria Inés Alvarez V. Departamento de Ciencias e Ingeniería de la Computación Pontificia Universidad Javeriana

Más detalles

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS BÚSQUEDA DE PATRONES HABITUALES COMPRESIÓN DE MOLÉCULAS DE ADN ESTUDIOS

Más detalles

Algoritmos Genéticos. Introduccion a la Robótica Inteligente

Algoritmos Genéticos. Introduccion a la Robótica Inteligente Algoritmos Genéticos Introduccion a la Robótica Inteligente 7 Marzo 2014 (IRIN) AGs 7/03/2014 1 / 43 Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos Matemáticos 4 Conclusiones (IRIN)

Más detalles

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en

Más detalles

Análisis de secuencias. Patrones, perfiles y dominios.

Análisis de secuencias. Patrones, perfiles y dominios. Análisis de secuencias. Patrones, perfiles y dominios. Curso de verano de Bioinformática y Biología Computacional de la UCM, Madrid 2004 Federico Abascal Museo Nacional de Ciencias Naturales Recordatorio

Más detalles

Bases de datos biológicas

Bases de datos biológicas Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 28 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 28 de mayo del 2013 1 / 50 1 Introducción Desventajas de las bases de datos biológicas Recuperación

Más detalles

ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS

ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS Universidad Nacional de San Antonio Abad del Cusco Departamento Académico de Informática ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS Iván Medrano Valencia ANALISIS DE ALGORITMOS Un algoritmo es un

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Operadores de Mutación El operador

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

Fuente: http://www.kzgunea.net

Fuente: http://www.kzgunea.net APRENDE A NAVEGAR INTERNET EXPLORER El navegador Internet Explorer ya lo tenemos integrado en el Sistema Operativo, en sus diferentes versiones desde Windows 95, por lo cual no tendremos que instalarlo.

Más detalles

Práctica 1: BLAST y Recuperación de Secuencias

Práctica 1: BLAST y Recuperación de Secuencias Introducción a la Bioinformática Práctica 1: BLAST y Recuperación de Secuencias Recuperación de Secuencias La recuperación de secuencias, es decir la búsqueda y obtención de secuencias de interés en bases

Más detalles

Procesamiento y Optimización de Consultas

Procesamiento y Optimización de Consultas FACULTAD DE CIENCIAS EXACTAS Y NATURALES DEPARTAMENTO DE COMPUTACIÓN Base de Datos Autores Diego Castro Sergio D Arrigo Leticia Seijas Con la colaboración de Cecilia Briozzo y Alejandro Eidelsztein Indice

Más detalles

El proyecto realizado consiste en un resolutor de sudokus mediante CSP.

El proyecto realizado consiste en un resolutor de sudokus mediante CSP. Introducción El proyecto realizado consiste en un resolutor de sudokus mediante CSP. El problema del sudoku fue inventado por Howard Garns en 1979 y se volvió muy popular en Japón en 1986. En España ha

Más detalles

BLAST EJERCICIOS PNLHGLFGRKTG

BLAST EJERCICIOS PNLHGLFGRKTG BLAST EJERCICIOS Ejercicio 1 Haz una búsqueda blastp en el NCBI usando la siguiente secuencia de búsqueda: PNLHGLFGRKTG Por defecto, los parámetros se van a reajustar para búsquedas de secuencias cortas.

Más detalles

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS Una situación que se nos plantea algunas veces es la de resolver un problema hacia atrás, esto es, encontrar

Más detalles

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2 Procesamiento Digital de Imágenes Pablo Roncagliolo B. Nº 22 prb@2007 2 1 El núcleo de cada célula humana contiene una base de datos química. Esta base de datos contiene todas las instrucciones que la

Más detalles

Programación I: Funciones y módulos

Programación I: Funciones y módulos Programación I: Funciones y módulos Esteban De La Fuente Rubio 2 de abril de 23 Índice. Funciones.. Definición y llamado de funciones............................................. 2.2. Parámetros por omisión..................................................

Más detalles

Entrevista de Eduard Punset con Thomas Gingeras, genetista del laboratorio Cold Spring Harbor. Madrid, abril de 2008.

Entrevista de Eduard Punset con Thomas Gingeras, genetista del laboratorio Cold Spring Harbor. Madrid, abril de 2008. Entrevista de Eduard Punset con Thomas Gingeras, genetista del laboratorio Cold Spring Harbor. Madrid, abril de 2008. Vídeo del programa: http://www.smartplanet.es/redesblog/?p=384 Tenemos una tendencia

Más detalles

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Un algoritmo genético híbrido para resolver el EternityII Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Temas Temas Introducción Eternity II Historia Descripción Demo Metaheurísticas Algoritmos

Más detalles

LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA

LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA AULA DE MAYORES Y DE LA EXPERIENCIA F.Córdoba, R.Torronteras, A.Canalejo Departamento de Biología Ambiental y Salud Pública LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA Tema 1.3. Los sistemas

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

DIAGRAMAS DE FLUJO: DFD

DIAGRAMAS DE FLUJO: DFD DIAGRAMAS DE FLUJO: DFD DFD es un programa de libre disposición para ayuda al diseño e implementación de algoritmos expresados en diagramas de flujo (DF). Además incorpora opciones para el depurado de

Más detalles

Martes 28. Alineamientos múltiples. Cedric Notredame (CRG) Lunes 17 Dominios de proteínas y homología remota. Viernes 7 Miércoles 12.

Martes 28. Alineamientos múltiples. Cedric Notredame (CRG) Lunes 17 Dominios de proteínas y homología remota. Viernes 7 Miércoles 12. Hoy Lunes 27 Martes 28 Jueves 30 Bases de datos Federico Abascal Alineamiento y búsqueda de homólogos Federico Abascal Alineamientos múltiples Cedric Notredame (CRG) Búsquedas con perfiles Tirso Pons,

Más detalles

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33 Introducción Búsqueda Local A veces el camino para llegar a la solución no nos importa, buscamos en el espacio de soluciones Queremos la mejor de entre las soluciones posibles alcanzable en un tiempo razonable

Más detalles

Análisis probabilístico y algoritmos aleatorizados

Análisis probabilístico y algoritmos aleatorizados Análisis probabilístico y algoritmos aleatorizados Johan Van Horebeek, horebeek@cimat.mx Análisis probabilístico: considerar el input de un algoritmo como de cierta distribución probabilística. Algoritmo

Más detalles

Introducción a la Programación en MATLAB

Introducción a la Programación en MATLAB Introducción a la Programación en MATLAB La programación en MATLAB se realiza básicamente sobre archivos M, o M-Files. Se los denomina de esta forma debido a su extensión.m. Estos archivos son simple archivos

Más detalles

ARREGLOS DEFINICION GENERAL DE ARREGLO

ARREGLOS DEFINICION GENERAL DE ARREGLO ARREGLOS DEFINICION GENERAL DE ARREGLO Conjunto de cantidades o valores homogéneos, que por su naturaleza se comportan de idéntica forma y deben de ser tratados en forma similar. Se les debe de dar un

Más detalles

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Jorge Salas Chacón A03804 Rubén Jiménez Goñi A93212 Juan Camilo Carrillo Casas A91369 Marco Vinicio Artavia Quesada

Más detalles

UNIDAD 1: Introducción a la biología

UNIDAD 1: Introducción a la biología UNIVERSIDAD DEL TOLIMA FACULTAD DE CIENCIAS BÁSICAS PROGRAMA DE MATEMÁTICAS CON ÉNFASIS EN ESTADÍSTICA MICROCURRICULO ASIGNATURA: OPTATIVA EN BIOLIGÍA CONTENIDOS UNIDAD 1: Introducción a la biología Explicar

Más detalles

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de planificación y control.

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de planificación y control. ESTUDIOS DE CAPACIDAD POTENCIAL DE CALIDAD 1.- INTRODUCCIÓN Este documento proporciona las pautas para la realización e interpretación de una de las herramientas fundamentales para el control y la planificación

Más detalles

TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS HTML:

TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS HTML: TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS HTML Página 1 de 6 TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS

Más detalles

Cómo nombrar variables ( 2&

Cómo nombrar variables ( 2& &'()*+,, *)-.&'*/0+!" #$ # http://www.escet.urjc.es/~aiiq/ Introducción a Visual Studio.NET Aprendiendo el IDE de Visual Basic.NET Elementos del lenguaje. Variables y estructuras de datos Introducción

Más detalles

METAHEURISTICAS Ideas, Mitos, Soluciones

METAHEURISTICAS Ideas, Mitos, Soluciones METAHEURISTICAS Ideas, Mitos, Soluciones OPTIMIZACION COMBINATORIA Qué es un problema de optimización combinatoria? Cómo se modela matemáticamente un problema de optimización combinatoria? Minimizar (o

Más detalles

Algoritmos Genéticos.

Algoritmos Genéticos. Algoritmos Genéticos. Miguel Cárdenas Montes, Antonio Gómez Iglesias Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 15-19 de Octubre de 2011

Más detalles

Fundamentos del diseño 3ª edición (2002)

Fundamentos del diseño 3ª edición (2002) Unidades temáticas de Ingeniería del Software Fundamentos del diseño 3ª edición (2002) Facultad de Informática necesidad del diseño Las actividades de diseño afectan al éxito de la realización del software

Más detalles

PROGRAMACIÓN EN PYTHON 2. Clara Higuera Laboratorio Integrado de Biofísica y Bioinformática Nov-2015

PROGRAMACIÓN EN PYTHON 2. Clara Higuera Laboratorio Integrado de Biofísica y Bioinformática Nov-2015 PROGRAMACIÓN EN PYTHON 2 Clara Higuera Laboratorio Integrado de Biofísica y Bioinformática Nov-2015 Funciones funcion print Esta es mi función x y funcion z w funcion w Funciones Las funciones sirven para

Más detalles

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006 ARBOLES ESTRUCTURAS DE DATOS 2006 DEFINICION Un árbol (tree) es un conjunto finito de nodos. Es una estructura jerárquica aplicable sobre una colección de elementos u objetos llamados nodos; uno de los

Más detalles

Introducción a la programación en R

Introducción a la programación en R Programación en R 1 Introducción a la programación en R Qué es un programa de ordenador? Un programa de ordenador consiste en una secuencia de instrucciones que un ordenador pueda entender. El procesador

Más detalles

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma:

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma: 1. Descripción Generales del Paquete Estadístico SPSS. SPSS es un paquete estadístico orientado -en principio- al ámbito de aplicación de las Ciencias Sociales y que lleva en el mercado alrededor de 25

Más detalles

Introducción a la Computación Evolutiva

Introducción a la Computación Evolutiva Introducción a la Computación Evolutiva Sección de Computación CINVESTAV-IPN Av. IPN No. 2508 Col. San Pedro Zacatenco México, D.F. 07300 email: ccoello@cs.cinvestav.mx http: //delta.cs.cinvestav.mx/~ccoello

Más detalles

MICROSOFT EXCEL 2007 NIVEL AVANZADO. Contenido

MICROSOFT EXCEL 2007 NIVEL AVANZADO. Contenido MICROSOFT EXCEL 2007 NIVEL AVANZADO GUÍA TEÓRICO-PRÁCTICA N 1 FORMULAS y FUNCIONES AVANZADAS Contenido INTRODUCCIÓN...2 CONCEPTOS BÁSICOS...2 Fórmulas Algebraicas...2 Precedencia de los operadores en las

Más detalles

Tema Evaluación / Pruebas del Software

Tema Evaluación / Pruebas del Software 1 DISEÑO DE SISTEMAS DE INFORMACIÓN Tema Evaluación / Pruebas del Software 2 Tema 3. Evaluación / Pruebas del Software 3 Índice Introducción Objetivos y principios de las pruebas Diseño de casos de prueba

Más detalles

CONTENIDOS. 2. Entidades primitivas para el desarrollo de algoritmos.

CONTENIDOS. 2. Entidades primitivas para el desarrollo de algoritmos. Introducción a la ciencia de la computación y a la programación 1. La computadora CONTENIDOS 2. Entidades primitivas para el desarrollo de algoritmos. 3. Metodología a seguir para la resolución de problemas

Más detalles

Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia

Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Andrés M. Pinzón cphd - Universidad de los Andes 7'000.000 de habitantes Capital Mundial

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico.

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico. 1 Primeros pasos en R. Al iniciarse R (ver Figura 16), R espera la entrada de órdenes y presenta un símbolo para indicarlo. El símbolo asignado, como puede observarse al final, es > Figura 16. Pantalla

Más detalles

Árboles. Cursos Propedéuticos 2015. Dr. René Cumplido M. en C. Luis Rodríguez Flores

Árboles. Cursos Propedéuticos 2015. Dr. René Cumplido M. en C. Luis Rodríguez Flores Árboles Cursos Propedéuticos 2015 Dr. René Cumplido M. en C. Luis Rodríguez Flores Contenido de la sección Introducción Árbol genérico Definición y representación Árboles binarios Definición, implementación,

Más detalles

Computación Evolutiva: Técnicas de Selección

Computación Evolutiva: Técnicas de Selección Computación Evolutiva: Técnicas de Selección Dr. Gregorio Toscano Pulido Laboratorio de Tecnologías de Información Centro de Investigación y de Estudios Avanzados del IPN Cinvestav-Tamaulipas Dr. Gregorio

Más detalles

Analisis de algoritmos

Analisis de algoritmos Analisis de algoritmos Eficiencia Es la capacidad de disponer de un recurso. En el caso de los algoritmos, la eficiencia se logra haciendo el mejor uso posible de los recursos del sistema. Recursos Qué

Más detalles

Índice de contenidos INTRODUCCIÓN... 1 OBJETIVOS... 5 HIPÓTESIS... 5 MARCO TEÓRICO... 6. Genes superpuestos... 6

Índice de contenidos INTRODUCCIÓN... 1 OBJETIVOS... 5 HIPÓTESIS... 5 MARCO TEÓRICO... 6. Genes superpuestos... 6 Índice de contenidos INTRODUCCIÓN... 1 OBJETIVOS... 5 HIPÓTESIS... 5 MARCO TEÓRICO... 6 Genes superpuestos... 6 Marcos de lectura abiertos (Open Reading Frame, ORFs) alternativos... 7 MATERIALES Y MÉTODOS...

Más detalles

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la ejecución de programas secuenciales de forma paralela con el requisito de no modificar los programas secuenciales. La idea fundamental

Más detalles

Desarrollar y aplicar estrategias para resolver problemas Determinar si un gráfico es lineal dibujando puntos en una situación dada

Desarrollar y aplicar estrategias para resolver problemas Determinar si un gráfico es lineal dibujando puntos en una situación dada MANEJO DE DATOS Analizar gráficos o diagramas de situaciones dadas para identificar información específica Recoger datos, dibujar los datos usando escalas apropiadas y demostrar una comprensión de las

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

QUÉ ES BIOLOGÍA MOLECULAR Y BIOTECNOLOGÍA. Julio A. Carrasco Vallejo Julio 2014

QUÉ ES BIOLOGÍA MOLECULAR Y BIOTECNOLOGÍA. Julio A. Carrasco Vallejo Julio 2014 QUÉ ES BIOLOGÍA MOLECULAR Y BIOTECNOLOGÍA Julio A. Carrasco Vallejo Julio 2014 Definiciones Biología Molecular: Estudio de los flujos de información genética en una célula Biotecnología: Uso de sistemas

Más detalles

Soluciones de la serie de ejercicios 3 (Curso 7.012)

Soluciones de la serie de ejercicios 3 (Curso 7.012) Soluciones de la serie de ejercicios 3 (Curso 7.012) Stardate 7.012.10.4.00 Diario personal del Médico militar del USS Hackerprise Al regresar de una misión en Europa, su compañero de tripulación, Noslen,

Más detalles

BLOWFISH,AES, AES192, AES256, TWOFISH)

BLOWFISH,AES, AES192, AES256, TWOFISH) Unidad 2 CRIPTOGRAFIA 2.1 Sistemas Criptograficos clasicos 2.1.1 Sustitución Monoalfabetica (Cifrario de Cesar) 2.1.2 Sustitución Polialfabetica (Cifrario Vigenere) 2.1.3 Tranposición 2.2 Criptografia

Más detalles

Clase 11. Análisis dinámico, 2ª parte.

Clase 11. Análisis dinámico, 2ª parte. Clase 11. Análisis dinámico, 2ª parte. Continuamos con el mismo tema de la clase anterior, pero esta vez nos ocuparemos principalmente de la fase de prueba. Nos detendremos brevemente en algunas de las

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Fundamentos de la Programación

Fundamentos de la Programación Fundamentos de la Programación El Software Las operaciones que debe realizar el hardware son especificadas con una lista de instrucciones, llamadas programas o software. Dos grandes grupos de software

Más detalles

Bancos de datos en Biología Molecular, un desarrollo vertiginoso.

Bancos de datos en Biología Molecular, un desarrollo vertiginoso. Bancos de datos en Biología Molecular, un desarrollo vertiginoso. Resumen: la introducción del computador como pieza clave en el trabajo en biologia molecular trajo consigo tambien un gran cambio en la

Más detalles

4. Se considera la función f(x) =. Se pide:

4. Se considera la función f(x) =. Se pide: Propuesta A 1. Queremos realizar una inversión en dos tipos de acciones con las siguientes condiciones: Lo invertido en las acciones de tipo A no puede superar los 10000 euros. Lo invertido en las acciones

Más detalles

Técnicas de Biología Molecular

Técnicas de Biología Molecular Técnicas de Biología Molecular DNA I. Enzimas de restricción Análisis Las enzimas de restricción fueron aisladas de bacterias; su función natural es proteger contra DNA extraño II. Separación electroforética

Más detalles

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN.

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN. 1 GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN. CASO PARTICULAR DE BACTERIAS. Programas CHROMAS, DNA Star, EZ-TAXON,

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Biología Profundización

Biología Profundización UNIDAD 1: GENÉTICA SUB-UNIDAD 2: TRANSCRIPCIÓN Y TRADUCCIÓN Biología Profundización En esta sesión tú podrás: - Conocer el proceso transcripcional y post-transcripcional. - Reconocer los sucesivos procesos

Más detalles

Funciones matriciales

Funciones matriciales 4. FUNCIONES ESPECIALES Funciones matriciales Una matriz es un conjunto de datos organizados en filas y columnas, que en Excel forman un rango de celdas. En una hoja de cálculo es posible tener matrices

Más detalles

Análisis multivariable

Análisis multivariable Análisis multivariable Las diferentes técnicas de análisis multivariante cabe agruparlas en tres categorías: «Análisis de dependencia» tratan de explicar la variable considerada independiente a través

Más detalles

TEMA 3.3 Obtención de árboles filogenéticos mediante el método de máxima parsimonia

TEMA 3.3 Obtención de árboles filogenéticos mediante el método de máxima parsimonia TEMA 3.3 Obtención de árboles filogenéticos mediante el método de máxima parsimonia Contacto: Maite Aguado (maite.aguado@uam.es) PROGRAMAS NECESARIOS Para realizar análisis de Máxima Parsimonia con nuestras

Más detalles

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Juegos Transparencias IA (F29) M.Marcos, 2002 (Figuras c S.Russell & P.Norvig, 1998) 1 Esquema Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Transparencias IA

Más detalles

CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL

CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL Contextualización En la primera parte del curso hemos estudiado el análisis clásico de series temporales en el que se asume que una serie temporal resulta de la

Más detalles

Bloques Repetitivos: Iteración

Bloques Repetitivos: Iteración Fuente: www.appinventor.org Traducción hecha con Google Traductor y mejorada por mi: piatticarlos@gmail.com Bloques Repetitivos: Iteración Una cosa para la que los ordenadores son buenos es la repetición

Más detalles

Apéndices técnicos. Método de representación: forma en que serán representados internamente los documentos.

Apéndices técnicos. Método de representación: forma en que serán representados internamente los documentos. APÉNDICE A: INDEXACIÓN DE INFORMACIÓN. LUCENE 1. INTRODUCCIÓN: INDEXACIÓN DE INFORMACIÓN El desarrollo y crecimiento masivo de las redes de computadoras y medios de almacenamiento a lo largo de los últimos

Más detalles

AMINOÁCIDOS SE PUEDEN UNIR POR ENLACES PEPTÍDICOS

AMINOÁCIDOS SE PUEDEN UNIR POR ENLACES PEPTÍDICOS Tema 4. Proteínas: funciones biológicas y estructura primaria. Enlace peptídico. Péptidos y proteínas. Diversidad de funciones biológicas. Niveles de organización estructural de las proteínas. Separación

Más detalles

Primer Parcial de Programación 3 (1/10/2009)

Primer Parcial de Programación 3 (1/10/2009) Primer Parcial de Programación (/0/009) Instituto de Computación, Facultad de Ingeniería Este parcial dura horas y contiene carillas. El total de puntos es 0. En los enunciados llamamos C* a la extensión

Más detalles

ESTRUCTURA DE DATOS: ARREGLOS

ESTRUCTURA DE DATOS: ARREGLOS ESTRUCTURA DE DATOS: ARREGLOS 1. Introduccion 2. Arreglos - Concepto - Caracteristicas 3. Arreglos Unidimensionales 4. Arreglos Bidimensionales 5. Ventajas del uso de arreglos 6. Ejemplo 1. Introducción

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Matemáticas. 1 o ESO. David J. Tarifa García. info@esobachilleratouniversidad.com.es

Matemáticas. 1 o ESO. David J. Tarifa García. info@esobachilleratouniversidad.com.es Matemáticas 1 o ESO David J. Tarifa García info@esobachilleratouniversidad.com.es 1 Matemáticas - 1 o ESO 2 Índice 1 Tema 1. Los números naturales 6 1.1 Suma de números naturales................................

Más detalles

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.º 1 Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos Abril 2015, Argentina 29 Relojes biológicos en plantas Ajustar el

Más detalles

RESUMEN INFORMATIVO PROGRAMACIÓN DIDÁCTICA CURSO 2015 /2016

RESUMEN INFORMATIVO PROGRAMACIÓN DIDÁCTICA CURSO 2015 /2016 RESUMEN INFORMATIVO PROGRAMACIÓN DIDÁCTICA CURSO 2015 /2016 DEPARTAMENTO: MATEMÁTICAS MATERIA: MATEMÁTICAS ACADÉMICAS CURSO: 3º ESO OBJETIVOS DEL ÁREA DE MATEMÁTICAS A LAS ENSEÑANZAS ACADÉMICAS 3º ESO

Más detalles

TEMA 1. Introducción

TEMA 1. Introducción TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático

Más detalles

LINUX - El intérprete de órdenes II

LINUX - El intérprete de órdenes II LINUX - El intérprete de órdenes II Objetivos: Se pretende introducir al alumno en el uso del intérprete de órdenes bash de LINUX. Ejecución de órdenes en el intérprete de órdenes Orden simple Como ya

Más detalles

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009 Árboles Ejemplos de estructuras arborescentes: con forma de árbol Regla de Alcance: los objetos visibles en un procedimiento son aquellos declarados en él mismo o en cualquier ancestro de él (cualquier

Más detalles

Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan

Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan Caso de éxito Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan El Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan es el máximo referente de salud pública, gratuita y de alta complejidad

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Introducción FACULTAD DE INGENIERÍA. Ordenación

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Introducción FACULTAD DE INGENIERÍA. Ordenación Introducción Uno de los procedimientos más comunes y útiles en el procesamiento de datos, es la clasificación u ordenación de los mismos. Se considera ordenar al proceso de reorganizar un conjunto dado

Más detalles

Sorting++ Herman Schinca. Clase 21. 10 de Junio de 2011

Sorting++ Herman Schinca. Clase 21. 10 de Junio de 2011 Sorting++ Herman Schinca Clase 21 10 de Junio de 2011 Recordando Ya vimos 3 algoritmos de ordenamiento basados en la comparación entre elementos: Selection, Insertion y Bubble. Los 3 en peor caso (cuando

Más detalles

ÁRBOLES GENERALES Y Y ESTRUCTURAS DE ÍNDICES DEFINICIONES Y REPRESENTACIONES DEFINICIONES Y REPRESENTACIONES. NOMENCLATURA SOBRE ÁRBOLES. DECLARACIÓN Y REPRESENTACIÓN.. CONSTRUCCIÓN.. ÁRBOLES 2-3-4. ÁRBOLES

Más detalles

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales Matemáticas 2º BTO Aplicadas a las Ciencias Sociales CONVOCATORIA EXTRAORDINARIA DE JUNIO 2014 MÍNIMOS: No son contenidos mínimos los señalados como de ampliación. I. PROBABILIDAD Y ESTADÍSTICA UNIDAD

Más detalles

Apuntes de ACCESS. Apuntes de Access. Campos de Búsqueda:

Apuntes de ACCESS. Apuntes de Access. Campos de Búsqueda: Apuntes de ACCESS Campos de Búsqueda: Los campos de búsqueda permiten seleccionar el valor de un campo de una lista desplegable en lugar de tener que escribirlos. El usuario sólo tiene que elegir un valor

Más detalles

Guías Excel 2007 Matrices Guía 77

Guías Excel 2007 Matrices Guía 77 MATRICES Las hojas de cálculo poseen prestaciones interesantes la gestión de matrices de tipo matemático. Unas consisten en facilitar los cálculos matriciales y otras están orientadas a cálculos estadísticos.

Más detalles

TEMA 5 TEMA 6. 7. La célula tiene que saber la ruta a emplear en cada momento, cómo regula estos procesos de manera primaria?.

TEMA 5 TEMA 6. 7. La célula tiene que saber la ruta a emplear en cada momento, cómo regula estos procesos de manera primaria?. TEMA 1 1. El agua es uno de los principales elementos de los seres vivos, por qué es tan importante?. 2. Las proteínas son polímeros de aminoácidos, cuáles son las características básicas de los aminoácidos

Más detalles

PRACTICA VI: BUSQUEDA DE SIMILITUDES EN BASES DE DATOS

PRACTICA VI: BUSQUEDA DE SIMILITUDES EN BASES DE DATOS Objetivo: PRACTICA VI: BUSQUEDA DE SIMILITUDES EN BASES DE DATOS Ø Conocer el fundamento de los programas BLAST y FASTA y utilizarlos eficientemente para la búsqueda de similitudes de secuencias de DNA

Más detalles

GENES Y MANIPULACIÓN GENÉTICA

GENES Y MANIPULACIÓN GENÉTICA GENES Y MANIPULACIÓN GENÉTICA El ADN, material de los genes La información que controla la aparición de los caracteres hereditarios se localiza en el interior del núcleo celular y se transmite de célula

Más detalles

La Filogenia en nuestro ADN. Las huellas filogenéticas en nuestro ADN

La Filogenia en nuestro ADN. Las huellas filogenéticas en nuestro ADN 78 Hurvitz M. Filogenia en nuestro ADN La Filogenia en nuestro ADN Las huellas filogenéticas en nuestro ADN Hipótesis o Perspectiva Teórica Marcos Hurvitz Área de Biología Molecular Instituto de Coloproctología

Más detalles

Ficheros. fd = open(nombre, modo)

Ficheros. fd = open(nombre, modo) 1 Ficheros fd = open(nombre, modo) - ruta es una cadena de texto con el nombre del fichero - modo = r para sólo lectura - modo = w para sólo escritura (sobrescribe) - modo = a para añadir texto (append)

Más detalles

ADN ARN Proteínas. La información genética es portada por el ADN y se hereda con él.

ADN ARN Proteínas. La información genética es portada por el ADN y se hereda con él. Todos los organismos contienen información que les permite coordinar sus procesos. Esta información, a fin de poder ser transferida a la descendencia, esta asentada en una molécula capaz de replicarse,

Más detalles