Motivos y Dominios. Jesús Fernández C. 19 de Junio del Cinvestav-Zacatenco

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Motivos y Dominios. Jesús Fernández C. 19 de Junio del 2013. Cinvestav-Zacatenco"

Transcripción

1 Jesús Fernández C. Cinvestav-Zacatenco 19 de Junio del 2013 Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

2 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

3 Introducción 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

4 Introducción Motivos y Dominios Introducción Un aspecto importante de la caracterización de secuencias biológicas son los motivos y los dominios, ya que sirven para caracterizar funciones de proteínas desconocidas. Secuencias conservadas son secuencias biológicas similares o idénticas que pueden encontrarse en ácidos nucléicos, proteínas. Un motivo es un elemento conservado en la secuencia de aminoácidos o nucleótidos, que habitualmente se asocia con una función concreta. Los motivos se generan a partir de alineamientos múltiples de secuencias con elementos funcionales o estructurales conocidos, por lo que son útiles para predecir la existencia de esos mismos elementos en otras proteínas de función y estructura desconocida. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

5 Introducción Motivos y Dominios Introducción Un dominio es un término más genérico que designa una región de una proteína con interés biológico funcional o estructural. También se llama dominio a una región de la estructura tridimensional de una proteína con una función concreta, que incluye regiones no necesariamente contiguas en la secuencia de aminoácidos. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

6 Identicación de motivos y dominios en alineamiento múltiple de secuencias 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

7 Identicación de motivos y dominios en alineamiento múltiple de secuencias Identicación de motivos y dominios en alineamiento múltiple de secuencias Los motivos y dominios son construidos a partir de un AMdS (Alineamiento múltiple de Secuencias) en las cuales, las secuencias está relacionadas entre sí. Esto sirve para hallar las regiones conservadas. Una vez halladas las regiones que se consideran motivos y dominios se prosigue a almacenar la información de consenso en una base de datos para que así sirvan como base en la identicación de las funciones de una proteína desconocida que presente los mismos patrones. Esto puede ser almacenado de dos formas:expresiones regulares o Mediante un modelo estadístico. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

8 Usando expresiones regulares en las bases de datos 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

9 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos Una expresión regular es una manera concisa de representar una familia de secuencias por un string. Cuando los dominios y los motivos son escritos en expresiones regulares se deben seguir las siguientes reglas. Un aminoácido es conservado se debe escribir su código de letra. Cuando una posición tiene varias alternativas de aminoácidos se encierra entre corchetes todas las posibilidades. Si no está especicado se escribe por una X. Cada posición está ligada por un guión. Finalmente si se repite un patrón se escribe entre paréntesis cuántas veces se repite. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

10 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos Ejemplo E X (2) [FHM] X (4) {P} L. Existen dos mecanismos para coincidir dos expresiones regulares: Exact Matching y Fuzzy Matching. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

11 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos En el Exact Matching como su nombre lo indica no permite alguna variación en la secuencia del query, ésta manera de buscar tiene una alta probabilidad de perder motivos relevantes que pueden tener pequeñas variaciones. En el Fuzzy matches, también llamado approximate matches, las coincidencias son más exibles entre residuos de propiedades bioquímicas semejantes, éste método es capaz de incluir una mayor variedad de formas de un motivo con una función conservada, sin embargo ésto incrementa el ruido y los falsos positivos. Ejemplos: PROSITE y Emotif. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

12 Usando modelos estadísticos en las bases de datos 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

13 Usando modelos estadísticos en las bases de datos Usando modelos estadísticos en las bases de datos La mayor limitación de las expresiones regulares es que estos métodos no toman en cuenta la información de la probabilidad. Una expresión regular tiene menos poder predictivo porque muchas secuencias con el mismo tipo de motivo no son representadas. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

14 Usando modelos estadísticos en las bases de datos Usando modelos estadísticos en las bases de datos Al contrario de las expresiones regulares, se utilizan PSSMs (Position specic scoring matrices), perles y HMMs (Hidden Makarov models) y preservan la información de la secuencia de un AMdS y lo expresan con modelos probabilísticos. Además, éstos modelos estadísticos tienen un mayor poder de predicción que los modelos basados en expresiones regulares, incluso aunque han sido obtenidos de un número reducido de secuencias. Ésta capacidad puede incrementar la sensibilidad del descubrimiento de motivos y detectar secuencias divergentes pero que estén relacionadas. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

15 Descubrimiento de motivos en secuencias no alineadas 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

16 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Para un conjunto de secuencias que estén estrechamente relacionadas, se pueden encontrar motivos mediante el uso de AMdS, pero no sucede ésto cuando son distantes pero están relacionadas. Para detectar estos motivos se necesitan algoritmos más especializados como: Expectation maximation y Gibbs Motif sampling. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

17 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Puede ser usado para encontrar motivos ocultos. El método primero hace un alineamiento aleatorio de secuencias para generar un PSSM de prueba. Luego la prueba es usada para comparar cada secuencia individualmente. Se irán modicando las puntuaciones de la PSSM en cada iteración para maximizar el alineamiento de la matriz a cada secuencia. Durante cada iteración la secuencia de patrones de los motivos conservados se irá reuniendo en el PSSM. El problema radica en la convergencia prematura al alcanzar un óptimo local. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

18 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Éste método es muy similar al EM. Primero se hace un alineamiento sobre todas las secuencias excepto una. Luego un se genera un PSSM de prueba, luego la matriz se alinea con la secuencia que se dejó fuera. La matriz de puntuaciones se ajusta para obtener el mejor alineamiento. Éste se procesó se repite hasta que ya no quede nada que mejorar. Éste método es menos susceptible a los mínimos locales. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

19 Motivos reguladores en secuencias de ADN 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

20 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Las moscas de fruta son susceptibles a infecciones de bacterias y otros patógenos.pero no tienen el sistema inmune tan sosticado como nosotros. Ellos tienen un conjunto de genes inmunes que generalmente se encuentran dormidos en el genoma de la mosca los cuáles de alguna manera se despiertan y producen proteínas que destruyen el patógeno y generalmente curan la infección. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

21 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Si realizamos un experimento en el cual se contagian las moscas y medimos cuales genes se despiertan como una respuesta inmune. De este conjunto de genes nos gustaría determinar que activa ese proceso. Éste proceso nos va a mostrar que los residuos TCGGGGATTTCC son los culpables de ésta activación. Éstas cadenas cortas llamadas NF-kB binding sites, son importantes ejemplos de los motivos reguladores. Proteínas tales como los factores de transcripción están ligados a estos motivos, Haciendo que el ARN polimerasa transcriba los genes previamente dichos. Uno de los problemas es descubrir tales motivos sin un conocimiento de como podrían verse. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

22 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Tomando en cuenta el experimento anterior va a devolver un conjunto de regiones de los genes en el genoma, cada región contiene al menos un NF-kB binding sites. Supongamos que no sabemos cual es el patrón de NF-kB y tampoco sabes en que parte se encuentra localizado en la muestra. Por lo cual necesitamos un algoritmo que dado un conjunto de secuencias de un genoma, pueda encontrar subcadenas cortas que parezcan ocurrir seguido. A pesar de que el DNA es complicado de descifrar, éste método es usado popularmente para encontrar motivos bajo la idea de que palabras mas frecuentes o mas rara corresponden a los motivos reguladores en el ADN. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

23 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Figura: Texto encriptado Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

24 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Figura: Texto parcialmente desencriptado Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

25 Proles 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

26 Proles Motivos y Dominios Proles Supongamos que se presentan 7 nucleótidos de tamaño 32 generados aleatoriamente. También se da otro conjunto pero con el patrón secreto p = ATGCAATCT y de tamaño l = 8 implantado en una posición aleatoria. Supongamos que tampoco conocemos el patrón P o donde la secuencia es implantada. La tarea es hallar P analizando la secuencia de ADN. Una de las maneras de hacer esto es buscar todas las cadenas de longitud l que aparezcan en el conjunto, seria muy raro hallar ese tipo de cadenas dado el azar(7 veces o mas) por lo cual podemos concluir que es el patrón p que estamos buscando. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

27 Proles Motivos y Dominios Proles Figura: Ejemplos de secuencias Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

28 Proles Motivos y Dominios Proles Para hacer mas difícil el problema podemos hacer que ADN mute en cierto nucleótidos, como por ejemplo tomando los NF-kB binding sites TCGGGGATTTCC, y se da un conjunto donde cada cadena cambia muy poco. Esto se complica ya que la búsqueda de la cadena de tamaño 8 no revela ninguna patrón y la cadena ATGCAACT no aparece ni una sola vez. Por lo cual es necesario que queremos por motivo. Ya que permitir que un solo string represente un motivo generalmente falla al representar las variaciones de los patrones en la vida real sin embargo una representación de un motivo puede ser hecho por una matriz de perles. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

29 Proles Motivos y Dominios Proles Figura: Nucleótidos mutados y la obtención del Patrón Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

30 Proles Motivos y Dominios Proles Figura: Secuencia con mutaciones Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

31 Proles Motivos y Dominios Proles Lo que se realiza es lo siguiente, consideremos que un conjunto de t secuencias de ADN, cada una tiene n nucleótidos. Selecciona una posición de esas t secuencias,y así formar un array s = (s 1, s 2,..., s t, con 1 <= s i <= n l + 1. Éstas cadenas de tamaño l pueden ser agrupadas en una matriz, la cual será la matriz de perles y después de un consenso se halla que el string de consenso es ATGCAACT que es el patrón P. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

32 Proles Motivos y Dominios Proles Figura: Selección del consenso Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

33 El problema de hallar motivos. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

34 El problema de hallar motivos. El problema de hallar motivos. Si P(s) denota la matriz de perles correspondiente a las posiciones de inicio s, entonces podemos usar Mp s (j) para denotar como el mayor número en la columna j de P(s). Mientras que la puntuación de consenso está dada por la suma de todos los Mp s (j), éste score puede se usado como una medida de que tan fuerte es un perl correspondiendo las posiciones de inicio de s. Un consenso de la puntuación lt corresponde al mejor alineamiento posible, en el cual cada la de una columna tiene la misma letra. Sin embargo un consenso de lt/4 corresponde al peor alineamiento posible. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

35 El problema de hallar motivos. El problema de hallar motivos. En la forma más sencilla el problema de hallar el motivo se formula como la selección de las posiciones iniciales de s. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

36 Motif Finding Problem. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

37 Motif Finding Problem. Motif Finding Problem. Dado un conjunto de secuencias encontrar el conjunto de l-mers. uno por cada secuencia, que maxímice las puntuaciones. Input: Una matriz t n de ADN. Output: Un arreglo de t que contienen posiciones iniciales s = (s1, s2,..., st) que maxímize Score(s, DNA). Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

38 Motif Finding Problem. Motif Finding Problem. Otra forma de ver el problema es en formular el problema como si fuera un problema de hallar un String mediano. Dado dos l-mers v y w, podemos computar la distancia de Hamming entre ellos, como el número de posiciones que dieren en los dos string. Forzando la notación podemos calcular la distancia de hamming total entre v y s, dh(v, s), para hallar la distancia mínima de hamming entre un string v y cualquier set es un problema sencillo. Primero uno tiene que encontrar la mejor coincidencia para v en la primer secuencia de ADN, luego la segunda y así sucesivamente. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

39 Median String Problem. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

40 Median String Problem. Median String Problem. Dado un conjunto desecuencias de ADN, encontrar el string mediano. Input: Una matriz At n de ADN, y l la longitud del patrón. Output: Un string v de l nucleótidos que minimize la distancia total entre v,adn, sobre todos los strings de esa longitud. Una vez calculado el string medio del ADN puede ser usado para generar un prole que resuelva el problema de busqueda de motivos. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

41 Search Trees 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

42 Search Trees Motivos y Dominios Search Trees Como hemos visto hasta ahora para resolver los problemas de hallar el motivo y encontrar la cadena mediana, es necesario manejar una gran cantidad de información ((n l + 1) t y k l ) En general puede ser visto como un todos los k L L-mers, la siguiente subrutina NextLeaf muestra como saltar de un L-mer a otro através de una progresión. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

43 Search Trees Motivos y Dominios Search Trees Figura: Espacio de busqueda para hallar los mejores s Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

44 Search Trees Motivos y Dominios Search Trees Figura: Espacio de busqueda para hallar la cadena mediana Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

45 Search Trees Motivos y Dominios Search Trees NEXTLEAF(a, L, k) 1 for i L to 1 2 if ai < k 3 ai ai return a 5 ai 1 6 return a Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

46 Search Trees Motivos y Dominios Search Trees Utilizando este algoritmo podemos producir todas las hojas de un L-mer con el algoritmo a continuación. ALL LEAVES(L, k) 1 a (1,..., 1) 2 while forever 3 output a 4 a NEXTLEAF(a, L, k) 5 if a = (1, 1,..., 1) 6 return Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

47 Search Trees Motivos y Dominios Search Trees Estas hojas pueden ser utilizadas para construir un árbol como el siguiente. Figura: Arbol con k = 2 y l = 4 Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

48 Search Trees Motivos y Dominios Search Trees PREORDER(v) 1 output v 2 if v has children 3 PREORDER ( left child of v ) 4 PREORDER ( rigth child of v ) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

49 Search Trees Motivos y Dominios Search Trees Una manera iterativa de hacer esto es la siguiente. NEXTVERTEX(a, i, L, k) 1 if i < L 2 a i return (a, i + 1) 4 else 5 for j L to 1 6 if a j < k 7 a j a j return (a, j) 9 return (a, 0) Cuando i > L, nos movemos hacia abajo en el árbol. Si i = L y j < k nos movemos a los lados del árbol, pero k = j nos movemos hacia atrás, el proceso acaba cuando todo el árbol es explorado. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

50 Motif Problem 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

51 Motif Problem Motivos y Dominios Motif Problem El algoritmo de fuerza bruta quedaría como el siguiente. BRUTEFORCEMOTIFSEARCH(ADN, t, n, l) 1 bestscore 0 2 for each (s1,..., st) from (1,..., 1) to (n l + 1,..., n l + 1) 3 if Score(s, ADN) > bestscore 4 bestscore Score(s, ADN) 5 bestmotif (s1, s2,..., st) 6 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

52 Motif Problem Motivos y Dominios Motif Problem Para encontrar un mejor método podemos utilizar el método de selección para encontrar todos los posiblesl-mer. BRUTEFORCEMOTIFSEARCHAGAIN(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore Score(s, ADN) 3 while forever 4 s NEXTLEAF(s, t, n l + 1) 5 if Score(s, ADN) > bestscore 6 bestscore Score(s, ADN) 7 bestmotif (s1, s2,..., st) 8 if s = (1, 1,..., 1) 9 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

53 Motif Problem Motivos y Dominios Motif Problem O en su defecto podemos utilizar el algoritmo de NextVertex para generar un árbol. SIMPLEMOTIFSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 0 3 i 0 4 while i > 0 5 if i < t 6 (s, i) NEXTVERTEX(s, i, t, n l + 1) 7 else 8 if Score(s, ADN) > bestscore 9 bestscore Score(s, ADN) 10 bestmotif (s1, s2,..., st) 11 (s, i) NEXTVERTEX(s, i, t, n l + 1) 12 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

54 Motif Problem Motivos y Dominios Motif Problem Podemos observar de los resultados para hallar la mejor puntuacion. Por ejemplo si al primeras i posiciones de inicio t son un perl débil, puede que no sea necesario seguir analizando esa rama, ya que lo más probable es que los perles que se puedan generar no sean mejores que los perles que generen las otras ramas. BRANCHANDBOUNDMOTIFSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 0 3 i 0 4 while i > 0 5 if i < t 6 optimisticscore Score(s, i, ADN) + (t i)l 7 if optimisticscore < bestscore 8 (s, i) BYPASS(s, i, t, n l + 1) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

55 Motif Problem Motivos y Dominios Motif Problem 1 else 2 (s, i) NEXTVERTEX(s, i, t, n l + 1) 3 else 4 if Score(s, ADN) > bestscore 5 bestscore Score(s, ADN) 6 bestmotif (s1, s2,..., st) 7 (s, i) NEXTVERTEX(s, i, t, n l + 1) 8 return bestmotif Con esto el algoritmo es mejorado para algunas instancias, pero no todas, el peor caso sigue siendo exponencial. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

56 Median String Problem 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

57 Median String Problem Motivos y Dominios Median String Problem Se pueden aplicar los mismo metodos que se aplicaron para mejorar el problema de motivos, pero ahora con respecto a la mediana, el algoritmo optimizado sería el siguiente. BRANCHANDBOUNDMEDIANSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 3 i 0 4 while i > 0 5 if i < l 6 prex nucleotide string corresponding to (s1, s2,..., si) 7 optimisticdistance TOTALDISTANCE(prex, ADN) 8 if optimisticdistance > bestdistance 9 (s, i) BYPASS(s, i, t, 4) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

58 Median String Problem Motivos y Dominios Median String Problem 1 else 2 (s, i) NEXTVERTEX(s, i, t, 4) 3 else 4 word nucleotide string corresponding to (s1, s2,...sl) 5 if TOTALDISTANCE(word, ADN) < bestdistance 6 bestdistance TOTALDISTANCE (word, ADN) 7 bestword word 8 (s, i) NEXTVERTEX(s, i, t, n l + 1) 9 return bestword Como en el caso anterior, el algoritmo no provee una mejora en el peor de los casos, pero hace un incremento en general a la aceleración. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en

Más detalles

Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1

Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1 Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1 Gloria Inés Alvarez V. Departamento de Ciencias e Ingeniería de la Computación Pontificia Universidad Javeriana

Más detalles

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos.

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. Introducción a la Bioinformática Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. El alineamiento múltiple es una de las técnicas bioinformáticas más usadas, ya que por medio de

Más detalles

Bioinformática Clásica

Bioinformática Clásica Tema 4: Alineamiento Múltiple y Filogenias (1) Motivos y Perfiles Dr. Oswaldo Trelles Universidad de Málaga Los motivos o perfiles son pequeños fragmentos, trozos o zonas conservadas presentes en un grupo

Más detalles

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en

Más detalles

Algoritmos Genéticos. Introduccion a la Robótica Inteligente

Algoritmos Genéticos. Introduccion a la Robótica Inteligente Algoritmos Genéticos Introduccion a la Robótica Inteligente 7 Marzo 2014 (IRIN) AGs 7/03/2014 1 / 43 Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos Matemáticos 4 Conclusiones (IRIN)

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS BÚSQUEDA DE PATRONES HABITUALES COMPRESIÓN DE MOLÉCULAS DE ADN ESTUDIOS

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

Análisis de secuencias. Patrones, perfiles y dominios.

Análisis de secuencias. Patrones, perfiles y dominios. Análisis de secuencias. Patrones, perfiles y dominios. Curso de verano de Bioinformática y Biología Computacional de la UCM, Madrid 2004 Federico Abascal Museo Nacional de Ciencias Naturales Recordatorio

Más detalles

Programación I: Funciones y módulos

Programación I: Funciones y módulos Programación I: Funciones y módulos Esteban De La Fuente Rubio 2 de abril de 23 Índice. Funciones.. Definición y llamado de funciones............................................. 2.2. Parámetros por omisión..................................................

Más detalles

Bases de datos biológicas

Bases de datos biológicas Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 28 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 28 de mayo del 2013 1 / 50 1 Introducción Desventajas de las bases de datos biológicas Recuperación

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Operadores de Mutación El operador

Más detalles

MICROSOFT EXCEL 2007 NIVEL AVANZADO. Contenido

MICROSOFT EXCEL 2007 NIVEL AVANZADO. Contenido MICROSOFT EXCEL 2007 NIVEL AVANZADO GUÍA TEÓRICO-PRÁCTICA N 1 FORMULAS y FUNCIONES AVANZADAS Contenido INTRODUCCIÓN...2 CONCEPTOS BÁSICOS...2 Fórmulas Algebraicas...2 Precedencia de los operadores en las

Más detalles

Práctica 1: BLAST y Recuperación de Secuencias

Práctica 1: BLAST y Recuperación de Secuencias Introducción a la Bioinformática Práctica 1: BLAST y Recuperación de Secuencias Recuperación de Secuencias La recuperación de secuencias, es decir la búsqueda y obtención de secuencias de interés en bases

Más detalles

Martes 28. Alineamientos múltiples. Cedric Notredame (CRG) Lunes 17 Dominios de proteínas y homología remota. Viernes 7 Miércoles 12.

Martes 28. Alineamientos múltiples. Cedric Notredame (CRG) Lunes 17 Dominios de proteínas y homología remota. Viernes 7 Miércoles 12. Hoy Lunes 27 Martes 28 Jueves 30 Bases de datos Federico Abascal Alineamiento y búsqueda de homólogos Federico Abascal Alineamientos múltiples Cedric Notredame (CRG) Búsquedas con perfiles Tirso Pons,

Más detalles

Árboles. Cursos Propedéuticos 2015. Dr. René Cumplido M. en C. Luis Rodríguez Flores

Árboles. Cursos Propedéuticos 2015. Dr. René Cumplido M. en C. Luis Rodríguez Flores Árboles Cursos Propedéuticos 2015 Dr. René Cumplido M. en C. Luis Rodríguez Flores Contenido de la sección Introducción Árbol genérico Definición y representación Árboles binarios Definición, implementación,

Más detalles

DIAGRAMAS DE FLUJO: DFD

DIAGRAMAS DE FLUJO: DFD DIAGRAMAS DE FLUJO: DFD DFD es un programa de libre disposición para ayuda al diseño e implementación de algoritmos expresados en diagramas de flujo (DF). Además incorpora opciones para el depurado de

Más detalles

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33 Introducción Búsqueda Local A veces el camino para llegar a la solución no nos importa, buscamos en el espacio de soluciones Queremos la mejor de entre las soluciones posibles alcanzable en un tiempo razonable

Más detalles

Análisis probabilístico y algoritmos aleatorizados

Análisis probabilístico y algoritmos aleatorizados Análisis probabilístico y algoritmos aleatorizados Johan Van Horebeek, horebeek@cimat.mx Análisis probabilístico: considerar el input de un algoritmo como de cierta distribución probabilística. Algoritmo

Más detalles

BLAST EJERCICIOS PNLHGLFGRKTG

BLAST EJERCICIOS PNLHGLFGRKTG BLAST EJERCICIOS Ejercicio 1 Haz una búsqueda blastp en el NCBI usando la siguiente secuencia de búsqueda: PNLHGLFGRKTG Por defecto, los parámetros se van a reajustar para búsquedas de secuencias cortas.

Más detalles

Programación: QBASIC

Programación: QBASIC 1. QBASIC Programación: QBASIC Guía del alumno Qbasic es una versión moderna del lenguaje BASIC. Se trata de un lenguaje de alto nivel. En un lenguaje de alto nivel las instrucciones tienen un formato

Más detalles

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS Una situación que se nos plantea algunas veces es la de resolver un problema hacia atrás, esto es, encontrar

Más detalles

Tema 10. Estimación Puntual.

Tema 10. Estimación Puntual. Tema 10. Estimación Puntual. Presentación y Objetivos. 1. Comprender el concepto de estimador y su distribución. 2. Conocer y saber aplicar el método de los momentos y el de máxima verosimilitud para obtener

Más detalles

Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan

Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan Caso de éxito Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan El Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan es el máximo referente de salud pública, gratuita y de alta complejidad

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

Introducción a la Computación Evolutiva

Introducción a la Computación Evolutiva Introducción a la Computación Evolutiva Sección de Computación CINVESTAV-IPN Av. IPN No. 2508 Col. San Pedro Zacatenco México, D.F. 07300 email: ccoello@cs.cinvestav.mx http: //delta.cs.cinvestav.mx/~ccoello

Más detalles

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS 1) Reseña histórica Abrahan De Moivre (1733) fue el primero en obtener la ecuación matemática de la curva normal. Kart Friedrich Gauss y Márquez De Laplece (principios

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS

ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS Universidad Nacional de San Antonio Abad del Cusco Departamento Académico de Informática ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS Iván Medrano Valencia ANALISIS DE ALGORITMOS Un algoritmo es un

Más detalles

Bloques Repetitivos: Iteración

Bloques Repetitivos: Iteración Fuente: www.appinventor.org Traducción hecha con Google Traductor y mejorada por mi: piatticarlos@gmail.com Bloques Repetitivos: Iteración Una cosa para la que los ordenadores son buenos es la repetición

Más detalles

Introducción a la Programación en MATLAB

Introducción a la Programación en MATLAB Introducción a la Programación en MATLAB La programación en MATLAB se realiza básicamente sobre archivos M, o M-Files. Se los denomina de esta forma debido a su extensión.m. Estos archivos son simple archivos

Más detalles

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Un algoritmo genético híbrido para resolver el EternityII Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Temas Temas Introducción Eternity II Historia Descripción Demo Metaheurísticas Algoritmos

Más detalles

Evaluación de modelos para la predicción de la Bolsa

Evaluación de modelos para la predicción de la Bolsa Evaluación de modelos para la predicción de la Bolsa Humberto Hernandez Ansorena Departamento de Ingeniería Telemática Universidad Carlos III de Madrid Madrid, España 10003975@alumnos.uc3m.es Rico Hario

Más detalles

TEMA 1. Introducción

TEMA 1. Introducción TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009 Árboles Ejemplos de estructuras arborescentes: con forma de árbol Regla de Alcance: los objetos visibles en un procedimiento son aquellos declarados en él mismo o en cualquier ancestro de él (cualquier

Más detalles

El proyecto realizado consiste en un resolutor de sudokus mediante CSP.

El proyecto realizado consiste en un resolutor de sudokus mediante CSP. Introducción El proyecto realizado consiste en un resolutor de sudokus mediante CSP. El problema del sudoku fue inventado por Howard Garns en 1979 y se volvió muy popular en Japón en 1986. En España ha

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

ARREGLOS DEFINICION GENERAL DE ARREGLO

ARREGLOS DEFINICION GENERAL DE ARREGLO ARREGLOS DEFINICION GENERAL DE ARREGLO Conjunto de cantidades o valores homogéneos, que por su naturaleza se comportan de idéntica forma y deben de ser tratados en forma similar. Se les debe de dar un

Más detalles

Algoritmos Genéticos.

Algoritmos Genéticos. Algoritmos Genéticos. Miguel Cárdenas Montes, Antonio Gómez Iglesias Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 15-19 de Octubre de 2011

Más detalles

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN.

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN. 1 GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN. CASO PARTICULAR DE BACTERIAS. Programas CHROMAS, DNA Star, EZ-TAXON,

Más detalles

CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL

CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL Contextualización En la primera parte del curso hemos estudiado el análisis clásico de series temporales en el que se asume que una serie temporal resulta de la

Más detalles

Soluciones de la serie de ejercicios 3 (Curso 7.012)

Soluciones de la serie de ejercicios 3 (Curso 7.012) Soluciones de la serie de ejercicios 3 (Curso 7.012) Stardate 7.012.10.4.00 Diario personal del Médico militar del USS Hackerprise Al regresar de una misión en Europa, su compañero de tripulación, Noslen,

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Predicción de los ciclos de El Niño

Predicción de los ciclos de El Niño Predicción de los ciclos de El Niño Israel Cendrero Sánchez I.T.T.Telemática Universidad Carlos III de Madrid Leganes,Madrid,España 100055713@alumnos.uc3m.es Beatriz López Moreno I.T.T.Telemática Universidad

Más detalles

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2 Procesamiento Digital de Imágenes Pablo Roncagliolo B. Nº 22 prb@2007 2 1 El núcleo de cada célula humana contiene una base de datos química. Esta base de datos contiene todas las instrucciones que la

Más detalles

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico.

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico. 1 Primeros pasos en R. Al iniciarse R (ver Figura 16), R espera la entrada de órdenes y presenta un símbolo para indicarlo. El símbolo asignado, como puede observarse al final, es > Figura 16. Pantalla

Más detalles

Analisis de algoritmos

Analisis de algoritmos Analisis de algoritmos Eficiencia Es la capacidad de disponer de un recurso. En el caso de los algoritmos, la eficiencia se logra haciendo el mejor uso posible de los recursos del sistema. Recursos Qué

Más detalles

Procesamiento y Optimización de Consultas

Procesamiento y Optimización de Consultas FACULTAD DE CIENCIAS EXACTAS Y NATURALES DEPARTAMENTO DE COMPUTACIÓN Base de Datos Autores Diego Castro Sergio D Arrigo Leticia Seijas Con la colaboración de Cecilia Briozzo y Alejandro Eidelsztein Indice

Más detalles

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la ejecución de programas secuenciales de forma paralela con el requisito de no modificar los programas secuenciales. La idea fundamental

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA Pensemos en los tres siguientes ejemplos: Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinión sobre cambios generales que pretendemos hacer en diversas

Más detalles

Módulo II - Excel. Identificando tipos de datos... 2. Introduciendo datos en las celdas... 3. Llenando automáticamente las celdas...

Módulo II - Excel. Identificando tipos de datos... 2. Introduciendo datos en las celdas... 3. Llenando automáticamente las celdas... Módulo II - Excel Índice Identificando tipos de datos... 2 Introduciendo datos en las celdas... 3 Llenando automáticamente las celdas... 4 Seleccionando un rango de celdas... 5 Seleccionando una fila o

Más detalles

4. Se considera la función f(x) =. Se pide:

4. Se considera la función f(x) =. Se pide: Propuesta A 1. Queremos realizar una inversión en dos tipos de acciones con las siguientes condiciones: Lo invertido en las acciones de tipo A no puede superar los 10000 euros. Lo invertido en las acciones

Más detalles

En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.

En cualquier caso, tampoco es demasiado importante el significado de la B, si es que lo tiene, lo interesante realmente es el algoritmo. Arboles-B Características Los árboles-b son árboles de búsqueda. La "B" probablemente se debe a que el algoritmo fue desarrollado por "Rudolf Bayer" y "Eduard M. McCreight", que trabajan para la empresa

Más detalles

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.º 1 Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos Abril 2015, Argentina 29 Relojes biológicos en plantas Ajustar el

Más detalles

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma:

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma: 1. Descripción Generales del Paquete Estadístico SPSS. SPSS es un paquete estadístico orientado -en principio- al ámbito de aplicación de las Ciencias Sociales y que lleva en el mercado alrededor de 25

Más detalles

Tema 7: Estadística y probabilidad

Tema 7: Estadística y probabilidad Tema 7: Estadística y probabilidad En este tema revisaremos: 1. Representación de datos e interpretación de gráficas. 2. Estadística descriptiva. 3. Probabilidad elemental. Representaciones de datos Cuatro

Más detalles

Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8

Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8 Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8 gramos del primer elemento y 1 gramo del segundo; un kilo

Más detalles

Traductores Push Down para Gramáticas LL

Traductores Push Down para Gramáticas LL Push Down para Gramáticas LL Extensión de Autómatas Universidad de Cantabria Outline El Problema 1 El Problema 2 3 4 El Problema Podemos resolver el problema de la palabra para lenguajes generados por

Más detalles

Comencemos a programar con. Entrega 09

Comencemos a programar con. Entrega 09 Comencemos a programar con VBA - Access Entrega 09 Estructuras de Control Eduardo Olaz 09-2 Estructuras de Control. Las estructuras de control son segmentos de código que nos permiten tomar decisiones

Más detalles

Índice de contenidos INTRODUCCIÓN... 1 OBJETIVOS... 5 HIPÓTESIS... 5 MARCO TEÓRICO... 6. Genes superpuestos... 6

Índice de contenidos INTRODUCCIÓN... 1 OBJETIVOS... 5 HIPÓTESIS... 5 MARCO TEÓRICO... 6. Genes superpuestos... 6 Índice de contenidos INTRODUCCIÓN... 1 OBJETIVOS... 5 HIPÓTESIS... 5 MARCO TEÓRICO... 6 Genes superpuestos... 6 Marcos de lectura abiertos (Open Reading Frame, ORFs) alternativos... 7 MATERIALES Y MÉTODOS...

Más detalles

Una heurística para la asignación de máquinas a trabajos fijos

Una heurística para la asignación de máquinas a trabajos fijos VIII Congreso de Ingeniería de Organización Leganés, 9 y 10 de septiembre de 2004 Una heurística para la asignación de máquinas a trabajos fijos José Manuel García Sánchez, Marcos Calle Suárez, Gabriel

Más detalles

Receta general para resolver problemas de sincronización con semáforos

Receta general para resolver problemas de sincronización con semáforos Receta general para resolver problemas de sincronización con semáforos La primera vez que te enfrentas a la tarea de implementar una solución a un problema de sincronización entre procesos, es normal que

Más detalles

5. Experimentos y Resultados

5. Experimentos y Resultados Experimentos y Resultados 52 5. Experimentos y Resultados Después de haber entrenado los modelos acústicos y los modelos del lenguaje para el reconocimiento de voz de niños, estas fuentes de conocimiento

Más detalles

LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA

LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA AULA DE MAYORES Y DE LA EXPERIENCIA F.Córdoba, R.Torronteras, A.Canalejo Departamento de Biología Ambiental y Salud Pública LOS RETOS DE LA BIOMEDICINA: ENTRE LA CIENCIA Y LA ÉTICA Tema 1.3. Los sistemas

Más detalles

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Juegos Transparencias IA (F29) M.Marcos, 2002 (Figuras c S.Russell & P.Norvig, 1998) 1 Esquema Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Transparencias IA

Más detalles

Entrevista de Eduard Punset con Thomas Gingeras, genetista del laboratorio Cold Spring Harbor. Madrid, abril de 2008.

Entrevista de Eduard Punset con Thomas Gingeras, genetista del laboratorio Cold Spring Harbor. Madrid, abril de 2008. Entrevista de Eduard Punset con Thomas Gingeras, genetista del laboratorio Cold Spring Harbor. Madrid, abril de 2008. Vídeo del programa: http://www.smartplanet.es/redesblog/?p=384 Tenemos una tendencia

Más detalles

Integrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es)

Integrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es) UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Exactas y Naturales Departamento de Computación Trabajo Práctico de Metaheurística Segundo cuatrimestre 2010 Implementación de un Algoritmo basado en la

Más detalles

Guías Excel 2007 Matrices Guía 77

Guías Excel 2007 Matrices Guía 77 MATRICES Las hojas de cálculo poseen prestaciones interesantes la gestión de matrices de tipo matemático. Unas consisten en facilitar los cálculos matriciales y otras están orientadas a cálculos estadísticos.

Más detalles

UNIDAD DIDÁCTICA: ELECTRÓNICA DIGITAL

UNIDAD DIDÁCTICA: ELECTRÓNICA DIGITAL IES PABLO RUIZ PICASSO EL EJIDO (ALMERÍA) CURSO 2013-2014 UNIDAD DIDÁCTICA: ELECTRÓNICA DIGITAL ÍNDICE 1.- INTRODUCCIÓN A LA ELECTRÓNICA DIGITAL 2.- SISTEMA BINARIO 2.1.- TRANSFORMACIÓN DE BINARIO A DECIMAL

Más detalles

MASTER EN INGENIERÍA DEL HORMIGÓN

MASTER EN INGENIERÍA DEL HORMIGÓN MASTER EN INGENIERÍA DEL HORMIGÓN MODELOS PREDICTIVOS Y DE OPTIMIZACIÓN DE ESTRUCTURAS DE HORMIGÓN Profesores: Víctor Yepes Piqueras, Julián Alcalá González PROGRAMACIÓN DE UN GENERADOR DE LISTAS DE NÚMEROS

Más detalles

Introducción a la Estadística con Excel

Introducción a la Estadística con Excel Introducción a la Estadística con Excel En el siguiente guión vamos a introducir el software Excel 2007 y la manera de trabajar con Estadística Descriptiva. Cargar o importar datos En Excel 2007 podemos

Más detalles

Cultura Cientí fica 1 Bachillerato

Cultura Cientí fica 1 Bachillerato Cultura Cientí fica 1 Bachillerato 3. La revolución genética: biotecnología Actividades de consolidación 1. Cualquier molécula de ADN formada por la unión de segmentos de ADN de origen diferente es: a)

Más detalles

Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia

Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Introducción a la Bioinformática Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Andrés M. Pinzón cphd - Universidad de los Andes 7'000.000 de habitantes Capital Mundial

Más detalles

Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas).

Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas). TEMA 5.- GRAFOS 5.1.- DEFINICIONES BÁSICAS Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas). Gráficamente representaremos

Más detalles

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006 ARBOLES ESTRUCTURAS DE DATOS 2006 DEFINICION Un árbol (tree) es un conjunto finito de nodos. Es una estructura jerárquica aplicable sobre una colección de elementos u objetos llamados nodos; uno de los

Más detalles

Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática

Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática Fundamentos de la informática 2. Algoritmos, diagramas de flujo y pseudocódigo Contenido Algoritmos Diagramas de flujo

Más detalles

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Jorge Salas Chacón A03804 Rubén Jiménez Goñi A93212 Juan Camilo Carrillo Casas A91369 Marco Vinicio Artavia Quesada

Más detalles

Funciones matriciales

Funciones matriciales 4. FUNCIONES ESPECIALES Funciones matriciales Una matriz es un conjunto de datos organizados en filas y columnas, que en Excel forman un rango de celdas. En una hoja de cálculo es posible tener matrices

Más detalles

Cómo nombrar variables ( 2&

Cómo nombrar variables ( 2& &'()*+,, *)-.&'*/0+!" #$ # http://www.escet.urjc.es/~aiiq/ Introducción a Visual Studio.NET Aprendiendo el IDE de Visual Basic.NET Elementos del lenguaje. Variables y estructuras de datos Introducción

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

Desarrollar y aplicar estrategias para resolver problemas Determinar si un gráfico es lineal dibujando puntos en una situación dada

Desarrollar y aplicar estrategias para resolver problemas Determinar si un gráfico es lineal dibujando puntos en una situación dada MANEJO DE DATOS Analizar gráficos o diagramas de situaciones dadas para identificar información específica Recoger datos, dibujar los datos usando escalas apropiadas y demostrar una comprensión de las

Más detalles

TEMA 3.3 Obtención de árboles filogenéticos mediante el método de máxima parsimonia

TEMA 3.3 Obtención de árboles filogenéticos mediante el método de máxima parsimonia TEMA 3.3 Obtención de árboles filogenéticos mediante el método de máxima parsimonia Contacto: Maite Aguado (maite.aguado@uam.es) PROGRAMAS NECESARIOS Para realizar análisis de Máxima Parsimonia con nuestras

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

PRACTICA VI: BUSQUEDA DE SIMILITUDES EN BASES DE DATOS

PRACTICA VI: BUSQUEDA DE SIMILITUDES EN BASES DE DATOS Objetivo: PRACTICA VI: BUSQUEDA DE SIMILITUDES EN BASES DE DATOS Ø Conocer el fundamento de los programas BLAST y FASTA y utilizarlos eficientemente para la búsqueda de similitudes de secuencias de DNA

Más detalles

hay alguien ahi? por Marcelino Alvarez maralvilla@gmail.com

hay alguien ahi? por Marcelino Alvarez maralvilla@gmail.com hay alguien ahi? por Marcelino Alvarez maralvilla@gmail.com Un repaso a las estadísticas de lectura tanto de la página web como de la revista digital, para ver si alguien se acuerda de nosotros. Ya podemos

Más detalles

MatemásTIC. Estudio y práctica del álgebra matricial con una aplicación TIC didáctica y sencilla. 65 Noviembre 2010, pp. 57-67

MatemásTIC. Estudio y práctica del álgebra matricial con una aplicación TIC didáctica y sencilla. 65 Noviembre 2010, pp. 57-67 65, pp. 57-67 Estudio y práctica del álgebra matricial con una aplicación TIC didáctica y sencilla MatemásTIC A lo largo de los distintos números de Suma nos planteamos en esta sección descubrir distintas

Más detalles

Bancos de datos en Biología Molecular, un desarrollo vertiginoso.

Bancos de datos en Biología Molecular, un desarrollo vertiginoso. Bancos de datos en Biología Molecular, un desarrollo vertiginoso. Resumen: la introducción del computador como pieza clave en el trabajo en biologia molecular trajo consigo tambien un gran cambio en la

Más detalles

UNIDAD 3: ARITMÉTICA DEL COMPUTADOR

UNIDAD 3: ARITMÉTICA DEL COMPUTADOR UNIDAD 3: ARITMÉTICA DEL COMPUTADOR Señor estudiante, es un gusto iniciar nuevamente con usted el desarrollo de esta tercera unidad. En esta ocasión, haremos una explicación más detallada de la representación

Más detalles

7.012 Serie de ejercicios 5

7.012 Serie de ejercicios 5 Nombre Grupo 7.012 Serie de ejercicios 5 Pregunta 1 Al estudiar los problemas de esterilidad, usted intenta aislar un hipotético gen de conejo que explique la prolífica reproducción de estos animales.

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Introducción FACULTAD DE INGENIERÍA. Ordenación

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Introducción FACULTAD DE INGENIERÍA. Ordenación Introducción Uno de los procedimientos más comunes y útiles en el procesamiento de datos, es la clasificación u ordenación de los mismos. Se considera ordenar al proceso de reorganizar un conjunto dado

Más detalles

Fundamentos de la Programación

Fundamentos de la Programación Fundamentos de la Programación El Software Las operaciones que debe realizar el hardware son especificadas con una lista de instrucciones, llamadas programas o software. Dos grandes grupos de software

Más detalles

Trabajo Práctico 6 Métricas para la toma decisiones

Trabajo Práctico 6 Métricas para la toma decisiones 1. Defina los siguientes conceptos: Trabajo Práctico 6 Métricas para la toma decisiones a) Media aritmética (o promedio), mediana, y moda. b) Entidad y atributo. Considere algunas mediciones cotidianas

Más detalles

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán Capítulo 4 MEDIDA DE MAGNITUDES Autor: Santiago Ramírez de la Piscina Millán 4 MEDIDA DE MAGNITUDES 4.1 Introducción El hecho de hacer experimentos implica la determinación cuantitativa de las magnitudes

Más detalles

Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I

Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I 1. Supongamos que Ω = A B y P (A B) = 0.2. Hallar: (a) El máximo valor posible para P (B), de tal manera

Más detalles

Programación Orientada a Objetos Profr. Pedro Pablo Mayorga

Programación Orientada a Objetos Profr. Pedro Pablo Mayorga Actividad 2 Unidad 1 Ciclo de vida del software y Diseño Orientado a Objetos Ciclo de Vida del Software Un modelo de ciclo de vida define el estado de las fases a través de las cuales se mueve un proyecto

Más detalles

IMPORTANCIA DE LA MATEMÁTICA DISCRETA EN EL DESARROLLO DE LA BIOLOGÍA Y LA BIOINFORMÁTICA

IMPORTANCIA DE LA MATEMÁTICA DISCRETA EN EL DESARROLLO DE LA BIOLOGÍA Y LA BIOINFORMÁTICA IMPORTANCIA DE LA MATEMÁTICA DISCRETA EN EL DESARROLLO DE LA BIOLOGÍA Y LA BIOINFORMÁTICA Gregorio Martín Quetglás Bernardo Cuenca Grau Instituto de Robótica Instituto de Robótica Departamento de Informática

Más detalles

TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS HTML:

TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS HTML: TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS HTML Página 1 de 6 TUTORIAL SOBRE EXPRESIONES REGULARES EN JAVASCRIPT PARA VALIDACIÓN DE CAMPOS EN FORMULARIOS

Más detalles