Motivos y Dominios. Jesús Fernández C. 19 de Junio del Cinvestav-Zacatenco

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Motivos y Dominios. Jesús Fernández C. 19 de Junio del 2013. Cinvestav-Zacatenco"

Transcripción

1 Jesús Fernández C. Cinvestav-Zacatenco 19 de Junio del 2013 Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

2 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

3 Introducción 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

4 Introducción Motivos y Dominios Introducción Un aspecto importante de la caracterización de secuencias biológicas son los motivos y los dominios, ya que sirven para caracterizar funciones de proteínas desconocidas. Secuencias conservadas son secuencias biológicas similares o idénticas que pueden encontrarse en ácidos nucléicos, proteínas. Un motivo es un elemento conservado en la secuencia de aminoácidos o nucleótidos, que habitualmente se asocia con una función concreta. Los motivos se generan a partir de alineamientos múltiples de secuencias con elementos funcionales o estructurales conocidos, por lo que son útiles para predecir la existencia de esos mismos elementos en otras proteínas de función y estructura desconocida. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

5 Introducción Motivos y Dominios Introducción Un dominio es un término más genérico que designa una región de una proteína con interés biológico funcional o estructural. También se llama dominio a una región de la estructura tridimensional de una proteína con una función concreta, que incluye regiones no necesariamente contiguas en la secuencia de aminoácidos. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

6 Identicación de motivos y dominios en alineamiento múltiple de secuencias 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

7 Identicación de motivos y dominios en alineamiento múltiple de secuencias Identicación de motivos y dominios en alineamiento múltiple de secuencias Los motivos y dominios son construidos a partir de un AMdS (Alineamiento múltiple de Secuencias) en las cuales, las secuencias está relacionadas entre sí. Esto sirve para hallar las regiones conservadas. Una vez halladas las regiones que se consideran motivos y dominios se prosigue a almacenar la información de consenso en una base de datos para que así sirvan como base en la identicación de las funciones de una proteína desconocida que presente los mismos patrones. Esto puede ser almacenado de dos formas:expresiones regulares o Mediante un modelo estadístico. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

8 Usando expresiones regulares en las bases de datos 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

9 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos Una expresión regular es una manera concisa de representar una familia de secuencias por un string. Cuando los dominios y los motivos son escritos en expresiones regulares se deben seguir las siguientes reglas. Un aminoácido es conservado se debe escribir su código de letra. Cuando una posición tiene varias alternativas de aminoácidos se encierra entre corchetes todas las posibilidades. Si no está especicado se escribe por una X. Cada posición está ligada por un guión. Finalmente si se repite un patrón se escribe entre paréntesis cuántas veces se repite. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

10 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos Ejemplo E X (2) [FHM] X (4) {P} L. Existen dos mecanismos para coincidir dos expresiones regulares: Exact Matching y Fuzzy Matching. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

11 Usando expresiones regulares en las bases de datos Usando expresiones regulares en las bases de datos En el Exact Matching como su nombre lo indica no permite alguna variación en la secuencia del query, ésta manera de buscar tiene una alta probabilidad de perder motivos relevantes que pueden tener pequeñas variaciones. En el Fuzzy matches, también llamado approximate matches, las coincidencias son más exibles entre residuos de propiedades bioquímicas semejantes, éste método es capaz de incluir una mayor variedad de formas de un motivo con una función conservada, sin embargo ésto incrementa el ruido y los falsos positivos. Ejemplos: PROSITE y Emotif. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

12 Usando modelos estadísticos en las bases de datos 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

13 Usando modelos estadísticos en las bases de datos Usando modelos estadísticos en las bases de datos La mayor limitación de las expresiones regulares es que estos métodos no toman en cuenta la información de la probabilidad. Una expresión regular tiene menos poder predictivo porque muchas secuencias con el mismo tipo de motivo no son representadas. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

14 Usando modelos estadísticos en las bases de datos Usando modelos estadísticos en las bases de datos Al contrario de las expresiones regulares, se utilizan PSSMs (Position specic scoring matrices), perles y HMMs (Hidden Makarov models) y preservan la información de la secuencia de un AMdS y lo expresan con modelos probabilísticos. Además, éstos modelos estadísticos tienen un mayor poder de predicción que los modelos basados en expresiones regulares, incluso aunque han sido obtenidos de un número reducido de secuencias. Ésta capacidad puede incrementar la sensibilidad del descubrimiento de motivos y detectar secuencias divergentes pero que estén relacionadas. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

15 Descubrimiento de motivos en secuencias no alineadas 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

16 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Para un conjunto de secuencias que estén estrechamente relacionadas, se pueden encontrar motivos mediante el uso de AMdS, pero no sucede ésto cuando son distantes pero están relacionadas. Para detectar estos motivos se necesitan algoritmos más especializados como: Expectation maximation y Gibbs Motif sampling. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

17 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Puede ser usado para encontrar motivos ocultos. El método primero hace un alineamiento aleatorio de secuencias para generar un PSSM de prueba. Luego la prueba es usada para comparar cada secuencia individualmente. Se irán modicando las puntuaciones de la PSSM en cada iteración para maximizar el alineamiento de la matriz a cada secuencia. Durante cada iteración la secuencia de patrones de los motivos conservados se irá reuniendo en el PSSM. El problema radica en la convergencia prematura al alcanzar un óptimo local. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

18 Descubrimiento de motivos en secuencias no alineadas Descubrimiento de motivos en secuencias no alineadas Éste método es muy similar al EM. Primero se hace un alineamiento sobre todas las secuencias excepto una. Luego un se genera un PSSM de prueba, luego la matriz se alinea con la secuencia que se dejó fuera. La matriz de puntuaciones se ajusta para obtener el mejor alineamiento. Éste se procesó se repite hasta que ya no quede nada que mejorar. Éste método es menos susceptible a los mínimos locales. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

19 Motivos reguladores en secuencias de ADN 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

20 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Las moscas de fruta son susceptibles a infecciones de bacterias y otros patógenos.pero no tienen el sistema inmune tan sosticado como nosotros. Ellos tienen un conjunto de genes inmunes que generalmente se encuentran dormidos en el genoma de la mosca los cuáles de alguna manera se despiertan y producen proteínas que destruyen el patógeno y generalmente curan la infección. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

21 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Si realizamos un experimento en el cual se contagian las moscas y medimos cuales genes se despiertan como una respuesta inmune. De este conjunto de genes nos gustaría determinar que activa ese proceso. Éste proceso nos va a mostrar que los residuos TCGGGGATTTCC son los culpables de ésta activación. Éstas cadenas cortas llamadas NF-kB binding sites, son importantes ejemplos de los motivos reguladores. Proteínas tales como los factores de transcripción están ligados a estos motivos, Haciendo que el ARN polimerasa transcriba los genes previamente dichos. Uno de los problemas es descubrir tales motivos sin un conocimiento de como podrían verse. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

22 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Tomando en cuenta el experimento anterior va a devolver un conjunto de regiones de los genes en el genoma, cada región contiene al menos un NF-kB binding sites. Supongamos que no sabemos cual es el patrón de NF-kB y tampoco sabes en que parte se encuentra localizado en la muestra. Por lo cual necesitamos un algoritmo que dado un conjunto de secuencias de un genoma, pueda encontrar subcadenas cortas que parezcan ocurrir seguido. A pesar de que el DNA es complicado de descifrar, éste método es usado popularmente para encontrar motivos bajo la idea de que palabras mas frecuentes o mas rara corresponden a los motivos reguladores en el ADN. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

23 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Figura: Texto encriptado Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

24 Motivos reguladores en secuencias de ADN Motivos reguladores en secuencias de ADN Figura: Texto parcialmente desencriptado Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

25 Proles 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

26 Proles Motivos y Dominios Proles Supongamos que se presentan 7 nucleótidos de tamaño 32 generados aleatoriamente. También se da otro conjunto pero con el patrón secreto p = ATGCAATCT y de tamaño l = 8 implantado en una posición aleatoria. Supongamos que tampoco conocemos el patrón P o donde la secuencia es implantada. La tarea es hallar P analizando la secuencia de ADN. Una de las maneras de hacer esto es buscar todas las cadenas de longitud l que aparezcan en el conjunto, seria muy raro hallar ese tipo de cadenas dado el azar(7 veces o mas) por lo cual podemos concluir que es el patrón p que estamos buscando. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

27 Proles Motivos y Dominios Proles Figura: Ejemplos de secuencias Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

28 Proles Motivos y Dominios Proles Para hacer mas difícil el problema podemos hacer que ADN mute en cierto nucleótidos, como por ejemplo tomando los NF-kB binding sites TCGGGGATTTCC, y se da un conjunto donde cada cadena cambia muy poco. Esto se complica ya que la búsqueda de la cadena de tamaño 8 no revela ninguna patrón y la cadena ATGCAACT no aparece ni una sola vez. Por lo cual es necesario que queremos por motivo. Ya que permitir que un solo string represente un motivo generalmente falla al representar las variaciones de los patrones en la vida real sin embargo una representación de un motivo puede ser hecho por una matriz de perles. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

29 Proles Motivos y Dominios Proles Figura: Nucleótidos mutados y la obtención del Patrón Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

30 Proles Motivos y Dominios Proles Figura: Secuencia con mutaciones Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

31 Proles Motivos y Dominios Proles Lo que se realiza es lo siguiente, consideremos que un conjunto de t secuencias de ADN, cada una tiene n nucleótidos. Selecciona una posición de esas t secuencias,y así formar un array s = (s 1, s 2,..., s t, con 1 <= s i <= n l + 1. Éstas cadenas de tamaño l pueden ser agrupadas en una matriz, la cual será la matriz de perles y después de un consenso se halla que el string de consenso es ATGCAACT que es el patrón P. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

32 Proles Motivos y Dominios Proles Figura: Selección del consenso Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

33 El problema de hallar motivos. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

34 El problema de hallar motivos. El problema de hallar motivos. Si P(s) denota la matriz de perles correspondiente a las posiciones de inicio s, entonces podemos usar Mp s (j) para denotar como el mayor número en la columna j de P(s). Mientras que la puntuación de consenso está dada por la suma de todos los Mp s (j), éste score puede se usado como una medida de que tan fuerte es un perl correspondiendo las posiciones de inicio de s. Un consenso de la puntuación lt corresponde al mejor alineamiento posible, en el cual cada la de una columna tiene la misma letra. Sin embargo un consenso de lt/4 corresponde al peor alineamiento posible. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

35 El problema de hallar motivos. El problema de hallar motivos. En la forma más sencilla el problema de hallar el motivo se formula como la selección de las posiciones iniciales de s. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

36 Motif Finding Problem. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

37 Motif Finding Problem. Motif Finding Problem. Dado un conjunto de secuencias encontrar el conjunto de l-mers. uno por cada secuencia, que maxímice las puntuaciones. Input: Una matriz t n de ADN. Output: Un arreglo de t que contienen posiciones iniciales s = (s1, s2,..., st) que maxímize Score(s, DNA). Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

38 Motif Finding Problem. Motif Finding Problem. Otra forma de ver el problema es en formular el problema como si fuera un problema de hallar un String mediano. Dado dos l-mers v y w, podemos computar la distancia de Hamming entre ellos, como el número de posiciones que dieren en los dos string. Forzando la notación podemos calcular la distancia de hamming total entre v y s, dh(v, s), para hallar la distancia mínima de hamming entre un string v y cualquier set es un problema sencillo. Primero uno tiene que encontrar la mejor coincidencia para v en la primer secuencia de ADN, luego la segunda y así sucesivamente. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

39 Median String Problem. 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

40 Median String Problem. Median String Problem. Dado un conjunto desecuencias de ADN, encontrar el string mediano. Input: Una matriz At n de ADN, y l la longitud del patrón. Output: Un string v de l nucleótidos que minimize la distancia total entre v,adn, sobre todos los strings de esa longitud. Una vez calculado el string medio del ADN puede ser usado para generar un prole que resuelva el problema de busqueda de motivos. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

41 Search Trees 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

42 Search Trees Motivos y Dominios Search Trees Como hemos visto hasta ahora para resolver los problemas de hallar el motivo y encontrar la cadena mediana, es necesario manejar una gran cantidad de información ((n l + 1) t y k l ) En general puede ser visto como un todos los k L L-mers, la siguiente subrutina NextLeaf muestra como saltar de un L-mer a otro através de una progresión. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

43 Search Trees Motivos y Dominios Search Trees Figura: Espacio de busqueda para hallar los mejores s Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

44 Search Trees Motivos y Dominios Search Trees Figura: Espacio de busqueda para hallar la cadena mediana Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

45 Search Trees Motivos y Dominios Search Trees NEXTLEAF(a, L, k) 1 for i L to 1 2 if ai < k 3 ai ai return a 5 ai 1 6 return a Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

46 Search Trees Motivos y Dominios Search Trees Utilizando este algoritmo podemos producir todas las hojas de un L-mer con el algoritmo a continuación. ALL LEAVES(L, k) 1 a (1,..., 1) 2 while forever 3 output a 4 a NEXTLEAF(a, L, k) 5 if a = (1, 1,..., 1) 6 return Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

47 Search Trees Motivos y Dominios Search Trees Estas hojas pueden ser utilizadas para construir un árbol como el siguiente. Figura: Arbol con k = 2 y l = 4 Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

48 Search Trees Motivos y Dominios Search Trees PREORDER(v) 1 output v 2 if v has children 3 PREORDER ( left child of v ) 4 PREORDER ( rigth child of v ) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

49 Search Trees Motivos y Dominios Search Trees Una manera iterativa de hacer esto es la siguiente. NEXTVERTEX(a, i, L, k) 1 if i < L 2 a i return (a, i + 1) 4 else 5 for j L to 1 6 if a j < k 7 a j a j return (a, j) 9 return (a, 0) Cuando i > L, nos movemos hacia abajo en el árbol. Si i = L y j < k nos movemos a los lados del árbol, pero k = j nos movemos hacia atrás, el proceso acaba cuando todo el árbol es explorado. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

50 Motif Problem 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

51 Motif Problem Motivos y Dominios Motif Problem El algoritmo de fuerza bruta quedaría como el siguiente. BRUTEFORCEMOTIFSEARCH(ADN, t, n, l) 1 bestscore 0 2 for each (s1,..., st) from (1,..., 1) to (n l + 1,..., n l + 1) 3 if Score(s, ADN) > bestscore 4 bestscore Score(s, ADN) 5 bestmotif (s1, s2,..., st) 6 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

52 Motif Problem Motivos y Dominios Motif Problem Para encontrar un mejor método podemos utilizar el método de selección para encontrar todos los posiblesl-mer. BRUTEFORCEMOTIFSEARCHAGAIN(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore Score(s, ADN) 3 while forever 4 s NEXTLEAF(s, t, n l + 1) 5 if Score(s, ADN) > bestscore 6 bestscore Score(s, ADN) 7 bestmotif (s1, s2,..., st) 8 if s = (1, 1,..., 1) 9 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

53 Motif Problem Motivos y Dominios Motif Problem O en su defecto podemos utilizar el algoritmo de NextVertex para generar un árbol. SIMPLEMOTIFSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 0 3 i 0 4 while i > 0 5 if i < t 6 (s, i) NEXTVERTEX(s, i, t, n l + 1) 7 else 8 if Score(s, ADN) > bestscore 9 bestscore Score(s, ADN) 10 bestmotif (s1, s2,..., st) 11 (s, i) NEXTVERTEX(s, i, t, n l + 1) 12 return bestmotif Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

54 Motif Problem Motivos y Dominios Motif Problem Podemos observar de los resultados para hallar la mejor puntuacion. Por ejemplo si al primeras i posiciones de inicio t son un perl débil, puede que no sea necesario seguir analizando esa rama, ya que lo más probable es que los perles que se puedan generar no sean mejores que los perles que generen las otras ramas. BRANCHANDBOUNDMOTIFSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 0 3 i 0 4 while i > 0 5 if i < t 6 optimisticscore Score(s, i, ADN) + (t i)l 7 if optimisticscore < bestscore 8 (s, i) BYPASS(s, i, t, n l + 1) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

55 Motif Problem Motivos y Dominios Motif Problem 1 else 2 (s, i) NEXTVERTEX(s, i, t, n l + 1) 3 else 4 if Score(s, ADN) > bestscore 5 bestscore Score(s, ADN) 6 bestmotif (s1, s2,..., st) 7 (s, i) NEXTVERTEX(s, i, t, n l + 1) 8 return bestmotif Con esto el algoritmo es mejorado para algunas instancias, pero no todas, el peor caso sigue siendo exponencial. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

56 Median String Problem 1 Motivos y Dominios Introducción Identicación de motivos y dominios en alineamiento múltiple de secuencias Usando expresiones regulares en las bases de datos Usando modelos estadísticos en las bases de datos Descubrimiento de motivos en secuencias no alineadas Motivos reguladores en secuencias de ADN Proles El problema de hallar motivos. Motif Finding Problem. Median String Problem. Search Trees Motif Problem Median String Problem Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

57 Median String Problem Motivos y Dominios Median String Problem Se pueden aplicar los mismo metodos que se aplicaron para mejorar el problema de motivos, pero ahora con respecto a la mediana, el algoritmo optimizado sería el siguiente. BRANCHANDBOUNDMEDIANSEARCH(ADN, t, n, l) 1 s (1, 1,..., 1) 2 bestscore 3 i 0 4 while i > 0 5 if i < l 6 prex nucleotide string corresponding to (s1, s2,..., si) 7 optimisticdistance TOTALDISTANCE(prex, ADN) 8 if optimisticdistance > bestdistance 9 (s, i) BYPASS(s, i, t, 4) Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

58 Median String Problem Motivos y Dominios Median String Problem 1 else 2 (s, i) NEXTVERTEX(s, i, t, 4) 3 else 4 word nucleotide string corresponding to (s1, s2,...sl) 5 if TOTALDISTANCE(word, ADN) < bestdistance 6 bestdistance TOTALDISTANCE (word, ADN) 7 bestword word 8 (s, i) NEXTVERTEX(s, i, t, n l + 1) 9 return bestword Como en el caso anterior, el algoritmo no provee una mejora en el peor de los casos, pero hace un incremento en general a la aceleración. Jesús Fernández C. (Cinvestav) Motivos y Dominios 19 de Junio del / 58

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en

Más detalles

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos.

Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. Introducción a la Bioinformática Práctica 2: Alineamiento múltiple e Identificación y búsqueda de Motivos. El alineamiento múltiple es una de las técnicas bioinformáticas más usadas, ya que por medio de

Más detalles

Programación I: Funciones y módulos

Programación I: Funciones y módulos Programación I: Funciones y módulos Esteban De La Fuente Rubio 2 de abril de 23 Índice. Funciones.. Definición y llamado de funciones............................................. 2.2. Parámetros por omisión..................................................

Más detalles

Bioinformática Clásica

Bioinformática Clásica Tema 4: Alineamiento Múltiple y Filogenias (1) Motivos y Perfiles Dr. Oswaldo Trelles Universidad de Málaga Los motivos o perfiles son pequeños fragmentos, trozos o zonas conservadas presentes en un grupo

Más detalles

Tutorial - Parte 2: Scoring

Tutorial - Parte 2: Scoring Introducción Tutorial - Parte 2: Scoring En este segundo tutorial aprenderá lo que significa un modelo de Scoring, verá cómo crear uno utilizando Powerhouse Analytics y finalmente a interpretar sus resultados.

Más detalles

Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1

Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1 Seminario Bioinformática: The ten most wanted solutions in protein bioinformatics. Problem 1 Gloria Inés Alvarez V. Departamento de Ciencias e Ingeniería de la Computación Pontificia Universidad Javeriana

Más detalles

Análisis de secuencias. Patrones, perfiles y dominios.

Análisis de secuencias. Patrones, perfiles y dominios. Análisis de secuencias. Patrones, perfiles y dominios. Curso de verano de Bioinformática y Biología Computacional de la UCM, Madrid 2004 Federico Abascal Museo Nacional de Ciencias Naturales Recordatorio

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS BÚSQUEDA DE PATRONES HABITUALES COMPRESIÓN DE MOLÉCULAS DE ADN ESTUDIOS

Más detalles

Algoritmos Genéticos. Introduccion a la Robótica Inteligente

Algoritmos Genéticos. Introduccion a la Robótica Inteligente Algoritmos Genéticos Introduccion a la Robótica Inteligente 7 Marzo 2014 (IRIN) AGs 7/03/2014 1 / 43 Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos Matemáticos 4 Conclusiones (IRIN)

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Operadores de Mutación El operador

Más detalles

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS

DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS DISTRIBUCIÓN NORMAL CON EXCEL Y WINSTATS 1) Reseña histórica Abrahan De Moivre (1733) fue el primero en obtener la ecuación matemática de la curva normal. Kart Friedrich Gauss y Márquez De Laplece (principios

Más detalles

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA

BASES DE DATOS DE INTERÉS EN BIOQUÍMICA BASES DE DATOS DE INTERÉS EN BIOQUÍMICA Las técnicas de alto rendimiento desarrolladas en las últimas décadas han permitido la adquisición masiva de información de biología molecular que se depositan en

Más detalles

ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS

ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS Universidad Nacional de San Antonio Abad del Cusco Departamento Académico de Informática ALGORITMICA III Capitulo I ANALISIS DE ALGORITMOS Iván Medrano Valencia ANALISIS DE ALGORITMOS Un algoritmo es un

Más detalles

Análisis probabilístico y algoritmos aleatorizados

Análisis probabilístico y algoritmos aleatorizados Análisis probabilístico y algoritmos aleatorizados Johan Van Horebeek, horebeek@cimat.mx Análisis probabilístico: considerar el input de un algoritmo como de cierta distribución probabilística. Algoritmo

Más detalles

Tema 7: Estadística y probabilidad

Tema 7: Estadística y probabilidad Tema 7: Estadística y probabilidad En este tema revisaremos: 1. Representación de datos e interpretación de gráficas. 2. Estadística descriptiva. 3. Probabilidad elemental. Representaciones de datos Cuatro

Más detalles

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.

Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N. 28 ACTUALIDAD EN I+D RIA / Vol. 41 / N.º 1 Entender el funcionamiento de los relojes permitiría lidiar con ciertas patologías en humanos Abril 2015, Argentina 29 Relojes biológicos en plantas Ajustar el

Más detalles

Analisis de algoritmos

Analisis de algoritmos Analisis de algoritmos Eficiencia Es la capacidad de disponer de un recurso. En el caso de los algoritmos, la eficiencia se logra haciendo el mejor uso posible de los recursos del sistema. Recursos Qué

Más detalles

ARREGLOS DEFINICION GENERAL DE ARREGLO

ARREGLOS DEFINICION GENERAL DE ARREGLO ARREGLOS DEFINICION GENERAL DE ARREGLO Conjunto de cantidades o valores homogéneos, que por su naturaleza se comportan de idéntica forma y deben de ser tratados en forma similar. Se les debe de dar un

Más detalles

Programación: QBASIC

Programación: QBASIC 1. QBASIC Programación: QBASIC Guía del alumno Qbasic es una versión moderna del lenguaje BASIC. Se trata de un lenguaje de alto nivel. En un lenguaje de alto nivel las instrucciones tienen un formato

Más detalles

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS Una situación que se nos plantea algunas veces es la de resolver un problema hacia atrás, esto es, encontrar

Más detalles

MICROSOFT EXCEL 2007 NIVEL AVANZADO. Contenido

MICROSOFT EXCEL 2007 NIVEL AVANZADO. Contenido MICROSOFT EXCEL 2007 NIVEL AVANZADO GUÍA TEÓRICO-PRÁCTICA N 1 FORMULAS y FUNCIONES AVANZADAS Contenido INTRODUCCIÓN...2 CONCEPTOS BÁSICOS...2 Fórmulas Algebraicas...2 Precedencia de los operadores en las

Más detalles

Introducción a la Programación en MATLAB

Introducción a la Programación en MATLAB Introducción a la Programación en MATLAB La programación en MATLAB se realiza básicamente sobre archivos M, o M-Files. Se los denomina de esta forma debido a su extensión.m. Estos archivos son simple archivos

Más detalles

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN.

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN. 1 GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN. CASO PARTICULAR DE BACTERIAS. Programas CHROMAS, DNA Star, EZ-TAXON,

Más detalles

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL OBJETIVO Mejorar el nivel de comprensión y el manejo de las destrezas del estudiante para utilizar formulas en Microsoft Excel 2010. 1) DEFINICIÓN Una fórmula de Excel es un código especial que introducimos

Más detalles

Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I

Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I Universidad Simón Bolívar CO3121. Probabilidades para Ingenieros. Enero-Marzo 2010 Problemario I 1. Supongamos que Ω = A B y P (A B) = 0.2. Hallar: (a) El máximo valor posible para P (B), de tal manera

Más detalles

Programación Genética

Programación Genética Programación Genética Programación Genética consiste en la evolución automática de programas usando ideas basadas en la selección natural (Darwin). No sólo se ha utilizado para generar programas, sino

Más detalles

Introducción a la Computación Evolutiva

Introducción a la Computación Evolutiva Introducción a la Computación Evolutiva Sección de Computación CINVESTAV-IPN Av. IPN No. 2508 Col. San Pedro Zacatenco México, D.F. 07300 email: ccoello@cs.cinvestav.mx http: //delta.cs.cinvestav.mx/~ccoello

Más detalles

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33

Búsqueda Local. cbea (LSI-FIB-UPC) Inteligencia Artificial Curso 2011/2012 1 / 33 Introducción Búsqueda Local A veces el camino para llegar a la solución no nos importa, buscamos en el espacio de soluciones Queremos la mejor de entre las soluciones posibles alcanzable en un tiempo razonable

Más detalles

Bloques Repetitivos: Iteración

Bloques Repetitivos: Iteración Fuente: www.appinventor.org Traducción hecha con Google Traductor y mejorada por mi: piatticarlos@gmail.com Bloques Repetitivos: Iteración Una cosa para la que los ordenadores son buenos es la repetición

Más detalles

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 22. Algoritmos Genéticos. prb@2007 2 Procesamiento Digital de Imágenes Pablo Roncagliolo B. Nº 22 prb@2007 2 1 El núcleo de cada célula humana contiene una base de datos química. Esta base de datos contiene todas las instrucciones que la

Más detalles

A. Subcampos basados en el contenido.

A. Subcampos basados en el contenido. ARTIFICIAL INTELLIGENCE. AN ILLUSTRATIVE OVERVIEW Aaron Sloman School of Computer Science The University of Birmingham http://www.cs.bham.ac.uk/~axs/courses.ai.html Las áreas de aplicación de la Inteligencia

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

hay alguien ahi? por Marcelino Alvarez maralvilla@gmail.com

hay alguien ahi? por Marcelino Alvarez maralvilla@gmail.com hay alguien ahi? por Marcelino Alvarez maralvilla@gmail.com Un repaso a las estadísticas de lectura tanto de la página web como de la revista digital, para ver si alguien se acuerda de nosotros. Ya podemos

Más detalles

Árboles. Cursos Propedéuticos 2015. Dr. René Cumplido M. en C. Luis Rodríguez Flores

Árboles. Cursos Propedéuticos 2015. Dr. René Cumplido M. en C. Luis Rodríguez Flores Árboles Cursos Propedéuticos 2015 Dr. René Cumplido M. en C. Luis Rodríguez Flores Contenido de la sección Introducción Árbol genérico Definición y representación Árboles binarios Definición, implementación,

Más detalles

Funciones matriciales

Funciones matriciales 4. FUNCIONES ESPECIALES Funciones matriciales Una matriz es un conjunto de datos organizados en filas y columnas, que en Excel forman un rango de celdas. En una hoja de cálculo es posible tener matrices

Más detalles

En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.

En cualquier caso, tampoco es demasiado importante el significado de la B, si es que lo tiene, lo interesante realmente es el algoritmo. Arboles-B Características Los árboles-b son árboles de búsqueda. La "B" probablemente se debe a que el algoritmo fue desarrollado por "Rudolf Bayer" y "Eduard M. McCreight", que trabajan para la empresa

Más detalles

4. Se considera la función f(x) =. Se pide:

4. Se considera la función f(x) =. Se pide: Propuesta A 1. Queremos realizar una inversión en dos tipos de acciones con las siguientes condiciones: Lo invertido en las acciones de tipo A no puede superar los 10000 euros. Lo invertido en las acciones

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico.

Proyecto de Innovación Docente: Guía multimedia para la elaboración de un modelo econométrico. 1 Primeros pasos en R. Al iniciarse R (ver Figura 16), R espera la entrada de órdenes y presenta un símbolo para indicarlo. El símbolo asignado, como puede observarse al final, es > Figura 16. Pantalla

Más detalles

TEMA 1. Introducción

TEMA 1. Introducción TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático

Más detalles

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la ejecución de programas secuenciales de forma paralela con el requisito de no modificar los programas secuenciales. La idea fundamental

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Un juego de cartas: Las siete y media

Un juego de cartas: Las siete y media Un juego de cartas: Las siete y media Paula Lagares Federico Perea Justo Puerto * MaMaEuSch ** Management Mathematics for European Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 * Universidad de Sevilla

Más detalles

Charla No 3: Fórmulas de mayor uso.

Charla No 3: Fórmulas de mayor uso. 1 Charla No 3: Fórmulas de mayor uso. Objetivos generales: Explicar el uso de las funciones de mayor uso en MS-Excel Objetivos específicos: Autosuma. Asistente de fórmulas. Max y Min. Buscarv Contar Si

Más detalles

Introducción a la Estadística con Excel

Introducción a la Estadística con Excel Introducción a la Estadística con Excel En el siguiente guión vamos a introducir el software Excel 2007 y la manera de trabajar con Estadística Descriptiva. Cargar o importar datos En Excel 2007 podemos

Más detalles

Guía rápida de Excel Tablas y gráficos dinámicos A. Roldán 2010

Guía rápida de Excel Tablas y gráficos dinámicos A. Roldán 2010 Tablas y gráficos dinámicos Tablas dinámicas Cambios en una tabla dinámica Filtrados Opciones de tabla Configuración de campo Otras operaciones Subtotales Gráficos dinámicos Tablas dinámicas Las tablas

Más detalles

UNIDAD 3: ARITMÉTICA DEL COMPUTADOR

UNIDAD 3: ARITMÉTICA DEL COMPUTADOR UNIDAD 3: ARITMÉTICA DEL COMPUTADOR Señor estudiante, es un gusto iniciar nuevamente con usted el desarrollo de esta tercera unidad. En esta ocasión, haremos una explicación más detallada de la representación

Más detalles

Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8

Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8 Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8 gramos del primer elemento y 1 gramo del segundo; un kilo

Más detalles

Comparar las siguientes ecuaciones, y hallar sus soluciones:

Comparar las siguientes ecuaciones, y hallar sus soluciones: TEMA. Iteraciones. % Hemos aprendido que para resolver una ecuación en x, se despeja la x y se evalúa la expresión que resulta. El siguiente ejemplo nos hará revisar ese esquema. Ejemplo. Comparar las

Más detalles

Análisis Estadístico de Datos Climáticos

Análisis Estadístico de Datos Climáticos Análisis Estadístico de Datos Climáticos Análisis de agrupamiento (o clusters) (Wilks, Cap. 14) Facultad de Ciencias Facultad de Ingeniería 2013 Objetivo Idear una clasificación o esquema de agrupación

Más detalles

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009 Árboles Ejemplos de estructuras arborescentes: con forma de árbol Regla de Alcance: los objetos visibles en un procedimiento son aquellos declarados en él mismo o en cualquier ancestro de él (cualquier

Más detalles

Martes 28. Alineamientos múltiples. Cedric Notredame (CRG) Lunes 17 Dominios de proteínas y homología remota. Viernes 7 Miércoles 12.

Martes 28. Alineamientos múltiples. Cedric Notredame (CRG) Lunes 17 Dominios de proteínas y homología remota. Viernes 7 Miércoles 12. Hoy Lunes 27 Martes 28 Jueves 30 Bases de datos Federico Abascal Alineamiento y búsqueda de homólogos Federico Abascal Alineamientos múltiples Cedric Notredame (CRG) Búsquedas con perfiles Tirso Pons,

Más detalles

Fundamentos de Investigación de Operaciones Asignación y Vendedor Viajero

Fundamentos de Investigación de Operaciones Asignación y Vendedor Viajero Fundamentos de Investigación de Operaciones y Vendedor Viajero 23 de mayo de 2004 Si bien la resolución del problema de transporte mediante tableau parece ser muy expedita, existen ciertos tipos de problemas

Más detalles

Tema 10. Estimación Puntual.

Tema 10. Estimación Puntual. Tema 10. Estimación Puntual. Presentación y Objetivos. 1. Comprender el concepto de estimador y su distribución. 2. Conocer y saber aplicar el método de los momentos y el de máxima verosimilitud para obtener

Más detalles

Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas).

Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas). TEMA 5.- GRAFOS 5.1.- DEFINICIONES BÁSICAS Un grafo G es un par (V,E) donde V es un conjunto (llamado conjunto de vértices) y E un subconjunto de VxV (conjunto de aristas). Gráficamente representaremos

Más detalles

Razonamiento inductivo

Razonamiento inductivo LECCIÓN CONDENSADA 2.1 Razonamiento inductivo En esta lección Aprenderás cómo se usa el razonamiento inductivo en la ciencia y en las matemáticas Usarás el razonamiento inductivo para hacer conjeturas

Más detalles

Algoritmos Genéticos.

Algoritmos Genéticos. Algoritmos Genéticos. Miguel Cárdenas Montes, Antonio Gómez Iglesias Centro de Investigaciones Energéticas Medioambientales y Tecnológicas, Madrid, Spain miguel.cardenas@ciemat.es 15-19 de Octubre de 2011

Más detalles

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán

Capítulo 4 MEDIDA DE MAGNITUDES. Autor: Santiago Ramírez de la Piscina Millán Capítulo 4 MEDIDA DE MAGNITUDES Autor: Santiago Ramírez de la Piscina Millán 4 MEDIDA DE MAGNITUDES 4.1 Introducción El hecho de hacer experimentos implica la determinación cuantitativa de las magnitudes

Más detalles

Introducción a Matlab

Introducción a Matlab Introducción a Matlab Visión en Robótica 1er cuatrimestre de 2013 En este apunte veremos las operaciones más comunes del entorno de programación Matlab. Se aprerán a manejar los aspectos básicos como saltos

Más detalles

Receta general para resolver problemas de sincronización con semáforos

Receta general para resolver problemas de sincronización con semáforos Receta general para resolver problemas de sincronización con semáforos La primera vez que te enfrentas a la tarea de implementar una solución a un problema de sincronización entre procesos, es normal que

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

Capítulo 4 Procesos con estructuras de repetición

Capítulo 4 Procesos con estructuras de repetición Estructura de contador Capítulo 4 Procesos con estructuras de repetición Esta es una operación que incrementa en una unidad el valor almacenado en la variable c, cada vez que el flujo del diagrama pasa

Más detalles

- Herramientas Biotecnológicas Como Contribución al Desarrollo de la Biología Evolutiva -

- Herramientas Biotecnológicas Como Contribución al Desarrollo de la Biología Evolutiva - - Herramientas Biotecnológicas Como Contribución al Desarrollo de la Biología Evolutiva - Bioinformática y evolución molecular Julio Rozas Liras 1,2 1 Departament de Genètica. Universitat de Barcelona.

Más detalles

Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática

Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática Escuela Politécnica Superior de Ingeniería Departamento de Ingeniería Informática Fundamentos de la informática 2. Algoritmos, diagramas de flujo y pseudocódigo Contenido Algoritmos Diagramas de flujo

Más detalles

Módulo II - Excel. Identificando tipos de datos... 2. Introduciendo datos en las celdas... 3. Llenando automáticamente las celdas...

Módulo II - Excel. Identificando tipos de datos... 2. Introduciendo datos en las celdas... 3. Llenando automáticamente las celdas... Módulo II - Excel Índice Identificando tipos de datos... 2 Introduciendo datos en las celdas... 3 Llenando automáticamente las celdas... 4 Seleccionando un rango de celdas... 5 Seleccionando una fila o

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Introducción FACULTAD DE INGENIERÍA. Ordenación

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Introducción FACULTAD DE INGENIERÍA. Ordenación Introducción Uno de los procedimientos más comunes y útiles en el procesamiento de datos, es la clasificación u ordenación de los mismos. Se considera ordenar al proceso de reorganizar un conjunto dado

Más detalles

ESTIMACIÓN. puntual y por intervalo

ESTIMACIÓN. puntual y por intervalo ESTIMACIÓN puntual y por intervalo ( ) Podemos conocer el comportamiento del ser humano? Podemos usar la información contenida en la muestra para tratar de adivinar algún aspecto de la población bajo estudio

Más detalles

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA INFERENCIA ESTADÍSTICA Pensemos en los tres siguientes ejemplos: Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinión sobre cambios generales que pretendemos hacer en diversas

Más detalles

1 Introducción al SPSS

1 Introducción al SPSS Breve guión para las prácticas con SPSS 1 Introducción al SPSS El programa SPSS está organizado en dos bloques: el editor de datos y el visor de resultados. En la barra de menú (arriba de la pantalla)

Más detalles

Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan

Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan Caso de éxito Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan El Hospital de Pediatría SAMIC Prof. Dr. Juan Pedro Garrahan es el máximo referente de salud pública, gratuita y de alta complejidad

Más detalles

Centro de Capacitación en Informática

Centro de Capacitación en Informática Fórmulas y Funciones Las fórmulas constituyen el núcleo de cualquier hoja de cálculo, y por tanto de Excel. Mediante fórmulas, se llevan a cabo todos los cálculos que se necesitan en una hoja de cálculo.

Más detalles

PARA QUÉ NÚMEROS REALES... 2 SUCESIONES... 3 NÚMEROS COMPLEJOS... 5 CÓNICAS... 6 FUNCIÓN INVERSA... 7 FUNCIONES CUADRÁTICAS... 8

PARA QUÉ NÚMEROS REALES... 2 SUCESIONES... 3 NÚMEROS COMPLEJOS... 5 CÓNICAS... 6 FUNCIÓN INVERSA... 7 FUNCIONES CUADRÁTICAS... 8 PARA QUÉ SIRVE? Índice NÚMEROS REALES.... 2 SUCESIONES.... 3 SUCESIONES ARITMÉTICAS Y GEOMÉTRICAS.... 4 NÚMEROS COMPLEJOS.... 5 CÓNICAS.... 6 FUNCIÓN INVERSA.... 7 FUNCIONES CUADRÁTICAS.... 8 TEOREMA DE

Más detalles

Análisis de los datos

Análisis de los datos Universidad Complutense de Madrid CURSOS DE FORMACIÓN EN INFORMÁTICA Análisis de los datos Hojas de cálculo Tema 6 Análisis de los datos Una de las capacidades más interesantes de Excel es la actualización

Más detalles

2 Métodos combinatorios

2 Métodos combinatorios 2 Métodos combinatorios Las pruebas pueden aplicarse de muchas maneras, es decir, existen diferentes formas de preparar casos de prueba. En este capítulo se presentan dos formas de prueba muy fáciles de

Más detalles

Tema 2. Software. Informática (1º Ingeniería Civil) jcarmur@unex.es

Tema 2. Software. Informática (1º Ingeniería Civil) jcarmur@unex.es Tema 2. Software Informática (1º Ingeniería Civil) Curso 2011/2012 Javier Carmona Murillo jcarmur@unex.es Índice Introducción. Programas e instrucciones. Tipos y estructuras de datos. Algoritmos. Proceso

Más detalles

Traductores Push Down para Gramáticas LL

Traductores Push Down para Gramáticas LL Push Down para Gramáticas LL Extensión de Autómatas Universidad de Cantabria Outline El Problema 1 El Problema 2 3 4 El Problema Podemos resolver el problema de la palabra para lenguajes generados por

Más detalles

Práctica 1: BLAST y Recuperación de Secuencias

Práctica 1: BLAST y Recuperación de Secuencias Introducción a la Bioinformática Práctica 1: BLAST y Recuperación de Secuencias Recuperación de Secuencias La recuperación de secuencias, es decir la búsqueda y obtención de secuencias de interés en bases

Más detalles

DIAGRAMAS DE FLUJO: DFD

DIAGRAMAS DE FLUJO: DFD DIAGRAMAS DE FLUJO: DFD DFD es un programa de libre disposición para ayuda al diseño e implementación de algoritmos expresados en diagramas de flujo (DF). Además incorpora opciones para el depurado de

Más detalles

LECCION 2 FORMULAS Y FUNCIONES

LECCION 2 FORMULAS Y FUNCIONES LECCION 2 FORMULAS Y FUNCIONES FÓRMULAS Esta es una de las características más importantes de una planilla de cálculos. Permite establecer relaciones entre constantes, funciones y referencias a celdas

Más detalles

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

x 10000 y 8000 x + y 15000 a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas. Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Septiembre 2012 - Propuesta A 1. Queremos realizar una inversión en dos tipos

Más detalles

Ejemplos de conversión de reales a enteros

Ejemplos de conversión de reales a enteros Ejemplos de conversión de reales a enteros Con el siguiente programa se pueden apreciar las diferencias entre las cuatro funciones para convertir de reales a enteros: program convertir_real_a_entero print

Más detalles

MatemásTIC. Estudio y práctica del álgebra matricial con una aplicación TIC didáctica y sencilla. 65 Noviembre 2010, pp. 57-67

MatemásTIC. Estudio y práctica del álgebra matricial con una aplicación TIC didáctica y sencilla. 65 Noviembre 2010, pp. 57-67 65, pp. 57-67 Estudio y práctica del álgebra matricial con una aplicación TIC didáctica y sencilla MatemásTIC A lo largo de los distintos números de Suma nos planteamos en esta sección descubrir distintas

Más detalles

Cálculo de probabilidades con Scilab

Cálculo de probabilidades con Scilab Cálculo de probabilidades con Scilab En este tutorial se va a asumir que ya sabemos crear funciones y trabajar con bucles en scilab. Sin embargo, también se puede usar como práctica para aprer estos conceptos

Más detalles

Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI

Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI Aplicación de la inteligencia artificial a la resolución del problema de asignación de estudiantes del departamento de PDI Ricardo Köller Jemio Departamento de Ciencias Exactas e Ingeniería, Universidad

Más detalles

1.3 Números racionales

1.3 Números racionales 1.3 1.3.1 El concepto de número racional Figura 1.2: Un reparto no equitativo: 12 5 =?. Figura 1.3: Un quinto de la unidad. Con los números naturales y enteros es imposible resolver cuestiones tan simples

Más detalles

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006 ARBOLES ESTRUCTURAS DE DATOS 2006 DEFINICION Un árbol (tree) es un conjunto finito de nodos. Es una estructura jerárquica aplicable sobre una colección de elementos u objetos llamados nodos; uno de los

Más detalles

Métodos Iterativos para Resolver Sistemas Lineales

Métodos Iterativos para Resolver Sistemas Lineales Métodos Iterativos para Resolver Sistemas Lineales Departamento de Matemáticas, CCIR/ITESM 17 de julio de 2009 Índice 3.1. Introducción............................................... 1 3.2. Objetivos................................................

Más detalles

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3.

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3. GANTT, PERT y CPM Características Conseguir una buena programación es un reto, no obstante es razonable y alcanzable. Ella debe tener el compromiso del equipo al completo, para lo cual se recomienda que

Más detalles

MASTER EN INGENIERÍA DEL HORMIGÓN

MASTER EN INGENIERÍA DEL HORMIGÓN MASTER EN INGENIERÍA DEL HORMIGÓN MODELOS PREDICTIVOS Y DE OPTIMIZACIÓN DE ESTRUCTURAS DE HORMIGÓN Profesores: Víctor Yepes Piqueras, Julián Alcalá González PROGRAMACIÓN DE UN GENERADOR DE LISTAS DE NÚMEROS

Más detalles

Soluciones de la serie de ejercicios 3 (Curso 7.012)

Soluciones de la serie de ejercicios 3 (Curso 7.012) Soluciones de la serie de ejercicios 3 (Curso 7.012) Stardate 7.012.10.4.00 Diario personal del Médico militar del USS Hackerprise Al regresar de una misión en Europa, su compañero de tripulación, Noslen,

Más detalles

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Un algoritmo genético híbrido para resolver el EternityII Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Temas Temas Introducción Eternity II Historia Descripción Demo Metaheurísticas Algoritmos

Más detalles

Diagramas de frecuencias relativas

Diagramas de frecuencias relativas LEIÓN ONENSAA 10.1 iagramas de frecuencias relativas En esta lección crearás diagramas de círculo calcularás frecuencias relativas crearás diagramas de barras de frecuencias relativas y diagramas de círculo

Más detalles

Integrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es)

Integrantes: Leonardo Tilli (leotilli@gmail.com) Fernando Hernández (matematicas527@yahoo.es) UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Exactas y Naturales Departamento de Computación Trabajo Práctico de Metaheurística Segundo cuatrimestre 2010 Implementación de un Algoritmo basado en la

Más detalles

Tutorial de Introducción a la Informática Tema 0 Windows. Windows. 1. Objetivos

Tutorial de Introducción a la Informática Tema 0 Windows. Windows. 1. Objetivos 1. Objetivos Este tema de introducción es el primero que debe seguir un alumno para asegurar que conoce los principios básicos de informática, como el manejo elemental del ratón y el teclado para gestionar

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

Tema 3: Problemas de Satisfacción de Restricciones

Tema 3: Problemas de Satisfacción de Restricciones Tema 3: Problemas de Satisfacción de Restricciones Universidad de Granada Tema 3: Satisfacción de Restricciones Contenido Problemas de satisfacción de restricciones Métodos de búsqueda Búsqueda local para

Más detalles

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma:

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma: 1. Descripción Generales del Paquete Estadístico SPSS. SPSS es un paquete estadístico orientado -en principio- al ámbito de aplicación de las Ciencias Sociales y que lleva en el mercado alrededor de 25

Más detalles

Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.

Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula. Sistema Incremental Generador de Oraciones y de Descodificación Lingüística. José Luciano Maldonado. luzmalvy@telcel.net.ve maldonaj@faces.ula.ve Resumen: se describe la implementación experimental de

Más detalles

5. Experimentos y Resultados

5. Experimentos y Resultados Experimentos y Resultados 52 5. Experimentos y Resultados Después de haber entrenado los modelos acústicos y los modelos del lenguaje para el reconocimiento de voz de niños, estas fuentes de conocimiento

Más detalles