Alineamiento de pares de secuencias

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Alineamiento de pares de secuencias"

Transcripción

1 Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 30 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

2 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

3 Introducción 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

4 Introducción Alineamiento de pares de secuencias Introducción La comparación de secuencias es una de las actividades fundamentales en el análisis bioinformático Es un primer paso hacia el análisis estructural y funcional de nuevas secuencias descubiertas A medida que nuevas secuencias están siendo generadas a tasas exponenciales, la importancia de la comparación de secuencias ha aumentando considerablemente Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

5 Introducción Alineamiento de pares de secuencias Introducción Esto se debe a que gracias a la comparación de secuencias es posible realizar inferencias sobre la evolución de una nueva proteína en base a proteínas existentes en las bases de datos (BD) El proceso fundamental detrás de este tipo de comparación es el alineamiento de secuencias En términos simples el alineamiento de secuencias es el proceso en el cual diferentes secuencias son comparadas mediante la búsqueda de patrones de caracteres comunes y el establecimiento de correspondencias residuo-residuo entre secuencias relacionadas Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

6 Introducción Alineamiento de pares de secuencias Introducción El alineamiento de pares de secuencias es el proceso de alineamiento de dos secuencias y es la base de diversas herramientas de análisis de secuencias: Alineamiento múltiple de secuencias Desarrollo de modelos ocultos de Márkov (búsqueda de familias de proteínas) Predicción de la estructura 3D de proteínas Análisis filogenético Búsqueda de similitud en BD Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

7 Introducción Alineamiento de pares de secuencias Introducción Alineamiento de secuencias producido con ClustalW entre dos secuencias de proteínas zinc finger disponibles en GenBank Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

8 Evolución de secuencias 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

9 Evolución de secuencias Evolución de secuencias El ADN y las proteínas son producto de la evolución Recordemos que los componentes básicos de estas macromoléculas (bases y aminoácidos) forman secuencias lineales que determinan la estructura primaria de las moléculas Una característica importante de estas moléculas es que codifican la historia de millones de años de evolución Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

10 Evolución de secuencias Evolución de secuencias Durante este largo período de evolución las secuencias moleculares han sufrido cambios aleatorios (mutaciones) que las hacen diferir Sin embargo, algunos rastros de la evolución pueden quedar en ciertas porciones de las secuencias, lo que permite identificar los ancestros comunes La presencia de estos rastros se debe a que los residuos que realizan papeles importantes (funcionales o estructurales) tienden a ser preservados por la selección natural Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

11 Evolución de secuencias Evolución de secuencias Por otra parte los residuos que son menos cruciales tienden a mutar más frecuentemente Ejemplo: los sitios activos de los residuos de una familia de enzimas tienden a ser conservados porque son responsables de las funciones catalíticas Gracias a la comparación de secuencias mediante alineamiento es posible identificar la conservación y variación de patrones Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

12 Evolución de secuencias Evolución de secuencias El grado de conservación en el alineamiento revela las relaciones evolutivas de secuencias diferentes Mientras que la variación entre secuencias refleja los cambios que han ocurrido durante la evolución (substituciones, inserciones y eliminaciones) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

13 Evolución de secuencias Evolución de secuencias La identificación adecuada de las relaciones evolutivas entre secuencias permite caracterizar la función de secuencias desconocidas de la siguiente forma: Cuando un alineamiento de secuencias revela una similitud significativa entre un grupo de secuencias entonces se puede considerar que pertenecen a la misma familia (mismo origen evolucionario) Si un miembro de esa familia tiene una estructura o funciones conocidas, entonces esa información puede extrapolarse a aquellos que aún no se han caracterizado experimentalmente Es así como el alineamiento de secuencias es usado como base para la predicción de la estructura y función de secuencias no caracterizadas Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

14 Evolución de secuencias Evolución de secuencias Extrapolación de información acerca de una secuencia utilizando las características conocidas de otra secuencia Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

15 Evolución de secuencias Evolución de secuencias Relaciones en la evolución de secuencias Misma secuencia Mismo origen Misma función Mismo plegado 3D Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

16 Homología y similitud de secuencias 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

17 Homología y similitud de secuencias Homología y similitud de secuencias Un concepto importante en el análisis de secuencias es la homología de secuencias Cuando dos secuencias descienden de un origen evolucionario común, se dice que tienen una relación homóloga o que comparten una homología Por su parte la similitud de secuencias mide el porcentaje de residuos alineados que son similares en cuanto a propiedades fisicoquímicas tales como el tamaño, carga, e hidrofobicidad Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

18 Homología y similitud de secuencias Homología y similitud de secuencias Aun cuando los dos términos suelen confundirse, es importante distinguir sus diferencias La homología de secuencias es una conclusión (inferencia) acerca de una relación ancestral común hecha a base de comprobar que existe un grado de similitud suficientemente alto entre las secuencias comparadas La homología es una afirmación cualitativa (homólogas o no homólogas) Por otra parte, la similitud es un resultado directo de la observación de un alineamiento de secuencias y se cuantifica usando porcentajes (40 % similitud) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

19 Homología y similitud de secuencias Homología y similitud de secuencias En la práctica el decidir a que nivel de similitud puede uno inferir relaciones de homología no es siempre fácil La respuesta depende del tipo de secuencias examinadas y de sus longitudes Las secuencias de nucleótidos consisten solo de 4 caracteres, y por lo tanto, las secuencias no relacionadas tiene al menos 25 % de oportunidad de ser idénticas Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

20 Homología y similitud de secuencias Homología y similitud de secuencias Para las secuencias de proteínas, hay 20 posibles residuos de aminoácidos, y por lo tanto dos secuencias no relacionadas pueden coincidir hasta en 5 % de los residuos por azar Además si se permiten huecos, el porcentaje puede incrementarse entre 10 y 20 % La longitud de las secuencias también es un factor muy importante Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

21 Homología y similitud de secuencias Homología y similitud de secuencias Entre más corta es una secuencia más alta es la posibilidad de que algún alineamiento se deba al azar Entre más larga es una secuencia es menos probable que una coincidencia en el mismo nivel de similitud sea atribuible al azar Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

22 Homología y similitud de secuencias Homología y similitud de secuencias Tres zonas de los alineamientos de secuencias: homólogas, probablemente homólogas, no es posible determinar homología Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

23 Similitud e identidad de secuencias 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

24 Similitud e identidad de secuencias Similitud e identidad de secuencias Otros dos conceptos relacionados con la comparación de secuencias son la similitud y la identidad de secuencias Cuando se trata de secuencias de nucleótidos estos dos términos son sinónimos Sin embargo, para secuencias de proteínas los dos conceptos son muy diferentes Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

25 Similitud e identidad de secuencias Similitud e identidad de secuencias En el alineamiento de secuencias de proteínas, la identidad de secuencias se refiere al porcentaje de coincidencias de los mismos residuos de aminoácidos entre las dos secuencias alineadas Por su parte la similitud de secuencias se refiere al porcentaje de residuos alineados que tienen características fisicoquímicas similares y que pueden ser substituídos entre sí Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

26 Similitud e identidad de secuencias Similitud e identidad de secuencias Para calcular el porcentaje de similitud de dos secuencias se emplea la siguiente fórmula que hace uso de la totalidad de las longitudes de ambas secuencias: S = [(L s 2)/(L a + L b )] 100 (1) donde S es el porcentaje de similitud de las secuencias, L s es el número de residuos alineados con características similares, y L a, L b son las longitudes totales de cada secuencia Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

27 Similitud e identidad de secuencias Similitud e identidad de secuencias La identidad (I) de las secuencias puede ser calculada de manera similar: I = [(L i 2)/(L a + L b )] 100 (2) donde L i es el número de residuos alineados idénticos Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

28 Métodos de alineamiento de secuencias 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

29 Métodos de alineamiento de secuencias Métodos de alineamiento de secuencias El alineamiento de pares de secuencias consiste en encontrar la mejor forma de emparejar (aparear) dos secuencias, de forma tal que haya una máxima correspondencia entre los residuos Para realizar esto, una de las secuencias necesita ser corrida con relación a la otra para encontrar la posición donde se da el máximo de coincidencias Hay dos estrategias diferentes de alineamiento que son utilizadas: Alineamiento global Alineamiento local Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

30 Métodos de alineamiento de secuencias Métodos de alineamiento de secuencias En el alineamiento global, se asume que las dos secuencias que se van a alinear son generalmente similares sobre sus longitudes totales El alineamiento se lleva a cabo a todo lo largo de ambas secuencias para encontrar el mejor posible Este método es más aplicable para alinear dos secuencias relacionadas estrechamente de aproximadamente la misma longitud En el caso contrario no entregará buenos resultados, pues tiene problemas para reconocer regiones locales altamente similares entre dos secuencias Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

31 Métodos de alineamiento de secuencias Métodos de alineamiento de secuencias Por el contrario, el alineamiento local no asume que las dos secuencias en cuestión tienen similitud sobre la longitud total Sólo encuentra regiones locales con el más alto nivel de similitud entre las dos secuencias y alinea estas regiones sin preocuparse por el resto de las secuencias Este enfoque es el más apropiado para alinear secuencias biológicas divergentes que contienen módulos que son similares (dominios o motivos) y de esta forma encontrar patrones conservados en secuencias de ADN o proteínas Incluso las dos secuencias pueden ser de diferentes longitudes Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

32 Métodos de alineamiento de secuencias Métodos de alineamiento de secuencias Alineamiento global de secuencias Alineamiento local de secuencias Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

33 Métodos de alineamiento de secuencias Métodos de alineamiento de secuencias Los algoritmos de alineamiento, tanto globales como locales son fundamentalmente similares y sólo difieren en la estrategia de optimización utilizada al alinear los residuos similares Ambos tipos de algoritmos pueden estar basados en uno de tres métodos: Matriz de puntos Método de palabra corta Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

34 Método de matriz de puntos 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

35 Método de matriz de puntos Método de matriz de puntos El método de la matriz de puntos es una forma gráfica de comparar dos secuencias utilizando una matriz bidimensional Las secuencias comparadas se escriben en los ejes vertical y horizontal de la matriz La comparación es realizada verificando la similitud entre cada residuo de una secuencia contra los de la otra Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

36 Método de matriz de puntos Método de matriz de puntos Si una coincidencia de residuos es encontrada, un punto se coloca en la gráfica De otra forma, las posiciones de la matriz se dejan en blanco Cuando las dos secuencias tienen regiones substancialmente similares, muchos puntos se alinean para formar líneas diagonales continuas, las cuales revelan el alineamiento de las secuencias Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

37 Método de matriz de puntos Método de matriz de puntos Si hay interrupciones en las líneas diagonales, éstas indican inserciones o eliminaciones Las líneas diagonales paralelas representan regiones repetitivas de las secuencias Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

38 Método de matriz de puntos Método de matriz de puntos Ejemplo del método de la matriz de puntos Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

39 Método de matriz de puntos Método de matriz de puntos Cuando este método es usado para comparar secuencias largas genera un alto grado de ruido En la mayoría de los casos hay demasiados puntos en la gráfica, lo que dificulta la identificación del verdadero alineamiento Para reducir el ruido, en vez de usar un solo residuo para verificar la similitud, se emplea (filtrado) una ventana de longitud fija que cubre un conjunto de pares de residuos Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

40 Método de matriz de puntos Método de matriz de puntos Con esta técnica de filtrado los puntos solo se dibujan cuando un conjunto de residuos de tamaño igual al de la ventana de una secuencia coincide completamente con el de la otra secuencia Esta técnica ha demostrado ser efectiva reduciendo el nivel de ruido Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

41 Método de matriz de puntos Método de matriz de puntos El método de la matriz de puntos despliega todas las posibles coincidencias de las secuencias Sin embargo, comúnmente el usuario debe construir el alineamiento completo al ir uniendo las diagonales Otra limitación de este método visual de análisis es que carece de rigor estadístico para medir la calidad del alineamiento Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

42 Método de matriz de puntos Método de matriz de puntos Además, el método está restringido solo a alienamiento de pares de secuencias Los siguiente son ejemplos de páginas Web que proveen comparación de pares de secuencias usando matrices de puntos: Dotmatcher interfaces/dotmatcher.html Dottup dottup.html Dothelix http: // MatrixPlot Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

43 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

44 La programación dinámica es un método que determina el alineamiento óptimo de dos secuencias al verificar las coincidencias para todos los posibles pares de caracteres entre las dos secuencias También crea una matriz bidimensional Sin embargo, encuentra un alineamiento en una forma más cuantitativa al convertir la matriz de puntos en una matriz de puntajes para contar las coincidencias y divergencias entre las secuencias Buscando el conjunto de puntajes más altos en esta matriz, es posible obtener de manera confiable el mejor alineamiento Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

45 El método de programación dinámica se compone de 3 pasos fundamentales: 1 Inicialización 2 Construcción de la matriz de puntajes 3 Rastreo del alineamiento Veamos un ejemplo de alineamiento de secuencias global utilizando el algoritmo de programación dinámica de Needleman/Wunsch Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

46 Ejemplo: Para este ejemplo las dos secuencias a alinear son: G A A T T C A G T T A (secuencia 1) G G A T C G A (secuencia 2) Por lo tanto las longitudes de las secuencias son X = 11 y Y = 7 respectivamente Utilizaremos el siguiente esquema de puntaje simple: S i,j = 1, si el residuo en la posición i de la secuencia uno es el mismo que el de la posición j de la secuencia dos; sino S i,j = 0 (no hay coincidencia) w = 0 (penalidad por hueco) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

47 Inicialización El primer paso consiste en crear una matriz con X + 1 columnas y Y + 1 filas donde X y Y son los tamaños de las secuencias En este ejemplo asumimos que no hay penalidad por huecos (w = 0) por lo que llenamos la primera fila y columna con 0 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

48 Construcción de la matriz de puntajes Se inicia en la esquina superior izquierda y se encuentra el máximo puntaje M i,j para cada posición i, j Para conocer M i,j se necesita saber el puntaje de las posiciones M i 1,j, M i,j 1 y M i 1,j 1 y usar la siguiente fórmula: M i,j = Max[M i 1,j 1 + S i,j, M i,j 1 + w, M i 1,j + w] (3) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

49 Usando esta información el puntaje para la posición 1,1 en la matriz puede ser calculado En ambas secuencias el primer residuo es G entonces, S 1,1 = 1, y como w = 0, entonces M 1,1 = Max[M 0,0 + 1, M 1,0 + 0, M 0,1 + 0] = Max[1, 0, 0] = 1 (4) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

50 Como w = 0, el resto de la fila 1 y columna 1 puede llenarse con 1 s Tomemos de ejemplo la fila 1 columna 2 M 1,2 = Max[M 0,1 + 0, M 1,1 + 0, M 0,2 + 0] = Max[0, 1, 0] = 1 (5) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

51 Ahora llenemos la columna 2. En la fila 2 que tendra el valor: M 2,2 = Max[M 1,1 + 0, M 2,1 + 0, M 1,2 + 0] = Max[0, 1, 0] = 1 (6) Y la columna 2, fila 3: M 3,2 = Max[M 2,1 + 1, M 3,1 + 0, M 2,2 + 0] = Max[2, 1, 1] = 2 (7) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

52 Usando el mismo procedimiento se llena la columna 3 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

53 Después de calcular todos los valores, la matriz de puntajes queda así: Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

54 Rastreo del alineamiento De la matriz anterior observamos que el puntaje máximo del alineamiento es 6 El paso de rastreo del alineamiento determina el alineamiento que lleva a este resultado Éste comienza en la posición M X,Y de la matriz y verifica sus predecesores directos: Vecino a la izquierda (hueco en secuencia 2) Vecino en la diagonal (coincidencia/no coincidencia) Vecino hacia arriba (hueco en secuencia 1) Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

55 Se elige uno de los vecinos (marcados en rojo) Debido a que la celda actual vale 6, el único vecino que es posible elegir es el de la diagonal Lo que da el alineamiento A A Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

56 Ahora determinamos cual es el predecesor directo de la celda actual, en este caso la celda roja con el 5 Esto agrega un hueco a la secuencia 2, por lo que el alineamiento actual es: T A _ A Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

57 Una vez más, el predecesor directo produce un hueco en la secuencia 2: T T A A Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

58 Continuado estos pasos llegamos al siguiente alineamiento: G A A T T C A G T T A G G A _ T C _ G A Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

59 Una solución alternativa es el siguiente alineamiento: G _ A A T T C A G T T A G G _ A _ T C _ G A Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

60 Tarea 1 Alineamiento de pares de secuencias Introducción Evolución de secuencias Homología y similitud de secuencias Similitud e identidad de secuencias Métodos de alineamiento de secuencias Método de matriz de puntos Tarea Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

61 Tarea Alineamiento de pares de secuencias Tarea Implemente en el lenguaje de su preferencia el algoritmo de programación dinámica para alineamiento de pares de secuencias visto en clase. El algoritmo recibe como entrada dos secuencias (posiblemente de longitudes diferentes) tomadas de una BD biológica disponible en Internet, una matriz de puntajes y regresa el mejor alineamiento así como su puntaje. Debera entregar el código fuente documentado y un reporte (en Latex) indicando los detalles de su implementación y las instrucciones para utilizarlo Fecha de entrega: 6 de junio antes de las 16h00 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del / 61

Búsqueda de similitud en BD

Búsqueda de similitud en BD Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 4 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 4 de junio del 2013 1 / 37 1 Introducción Requerimientos para búsqueda en BD FASTA Comparación

Más detalles

Alineamiento múltiple de secuencias

Alineamiento múltiple de secuencias Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 11 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento múltiple de secuencias 11 de junio del 2013 1 / 39 1 Alineamiento múltiple de

Más detalles

Perfiles y modelos ocultos de Markov

Perfiles y modelos ocultos de Markov Perfiles y modelos ocultos de Markov Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 13 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Perfiles y modelos ocultos de Markov 13 de junio del 2013

Más detalles

Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia

Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Alineamiento: Análisis computacional de secuencias Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Por qué y para qué... Tengo una secuencia de DNA/Proteína......

Más detalles

Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA

Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA Martin A. Lozano, Jaime Velasco-Medina Grupo de Bio-nanoelectrónica EIEE, Universidad del Valle, A.A. 25360, Cali, Colombia E-mail:

Más detalles

Análisis de proteínas

Análisis de proteínas Análisis de proteínas Qué determina su estructura? Composición de las proteínas Las proteínas son polímeros de aminoácidos que se unen mediante una unión peptídica Todos los aminoácidos tienen un grupo

Más detalles

Investigación en evolución

Investigación en evolución Investigación en evolución Análisis de secuencias de: nucleótidos en DNA (genómica) aminoácidos en Proteínas (proteómica) Comparación de secuencias de: nucleótidos aminoácidos Bioinformática Análisis de

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento múltiple de secuencias Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial

Más detalles

Alineamientos de Secuencias. CeCalCULA - C.P.T.M. Mérida. Venezuela.

Alineamientos de Secuencias. CeCalCULA - C.P.T.M. Mérida. Venezuela. Alineamientos de Secuencias Análisis comparativo El alineamiento de secuencias es similar a otros tipos de análisis comparativo. En ambos es necesario cuantificar las similitudes y diferencias (scoring)

Más detalles

DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS

DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS COMPARACION DE DOS ATPASAS DE PECES El DOT PLOT permite una visualización rápida de la similitud entre dos secuencias Inconvenientes: No identifica

Más detalles

Introducción a la Bioinformática

Introducción a la Bioinformática Introducción a la Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 16 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Introducción a la 16 de mayo del 2013 1 / 37 1 Introducción Qué es bioinformática?

Más detalles

Bioinformática Clásica

Bioinformática Clásica Tema 4: Alineamiento Múltiple y Filogenias (1) Sección 1: Alineamiento Múltiple Dr. Oswaldo Trelles Universidad de Málaga El alineamiento múltiple de secuencias (AM) es con frecuencia el punto de partida,

Más detalles

Métodos de alineamiento. Bioinformática, Elvira Mayordomo

Métodos de alineamiento. Bioinformática, Elvira Mayordomo Métodos de alineamiento Bioinformática, 16-2-17 Elvira Mayordomo Motivación: 2 razones para comparar secuencias biológicas 1. Los errores y omisiones en los datos biológicos producidos en la extracción

Más detalles

Métodos de alineamiento. Bioinformática, Elvira Mayordomo

Métodos de alineamiento. Bioinformática, Elvira Mayordomo Métodos de alineamiento Bioinformática, 24-2-16 Elvira Mayordomo Motivación: 2 razones para comparar secuencias biológicas 1. Los errores y omisiones en los datos biológicos producidos en la extracción

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento múltiple de secuencias Mario de J. Pérez Jiménez Luis Valencia Cabrera Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación

Más detalles

Conceptos básicos de filogenética molecular

Conceptos básicos de filogenética molecular Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 18 de julio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Conceptos básicos de filogenética molecular 18 de julio del 2013 1 / 43 1 Conceptos básicos

Más detalles

COMPARACIÓN DE MODELOS DE SINCRONIZACIÓN EN PROGRAMACIÓN PARALELA SOBRE CLUSTER DE MULTICORES

COMPARACIÓN DE MODELOS DE SINCRONIZACIÓN EN PROGRAMACIÓN PARALELA SOBRE CLUSTER DE MULTICORES COMPARACIÓN DE MODELOS DE SINCRONIZACIÓN EN PROGRAMACIÓN PARALELA SOBRE CLUSTER DE MULTICORES Autor: A.P.U. Enzo Rucci Director: Ing. Armando E. De Giusti Co-Director: Lic. Franco Chichizola Tesina de

Más detalles

Alineamientos Bioinformática. Daniel M. Alberto M. Fernando M.

Alineamientos Bioinformática. Daniel M. Alberto M. Fernando M. Alineamientos Bioinformática Daniel M. Alberto M. Fernando M. Repasando Qué son los alineamientos? Repasando Qué son los alineamientos? Comparación de dos o más secuencias de DNA. Repasando Qué son los

Más detalles

Elvira Mayordomo y Jorge Álvarez. Marzo - Abril de 2016

Elvira Mayordomo y Jorge Álvarez. Marzo - Abril de 2016 TRABAJO DE PRÁCTICAS Elvira Mayordomo y Jorge Álvarez Marzo - Abril de 2016 1 Introducción El trabajo de prácticas de la asignatura consistirá en que cada alumno realice por separado el trabajo que se

Más detalles

Programa Bioinformática. Máster en Biofísica

Programa Bioinformática. Máster en Biofísica Programa Bioinformática. Máster en Biofísica 2013 2014 Resumen del programa: El curso de bioinformática está finalizado a introducir las técnicas y las herramientas de la bioinformática que pueden ser

Más detalles

Biotecnología. Alineación de secuencias. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Biotecnología. Alineación de secuencias. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Biotecnología Alineación de secuencias Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Motivación Una vez localizado un gen Buscamos parecidos con genes de los que se

Más detalles

Programación Dinámica

Programación Dinámica Programación Dinámica Es aplicada típicamente a problemas de optimización, donde puede haber muchas soluciones, cada una tiene un valor asociado y prentendemos obtener la solución con valor óptimo. Al

Más detalles

Comparación de secuencias

Comparación de secuencias Comparación de secuencias Por qué nos interesa comparar secuencias de ADN o proteínas de distintos orígenes? Cómo se pueden alinear secuencias? Alineamiento de secuencias Dos tipos de alineamientos Alineamiento

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento de secuencias de genes/proteínas

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento de secuencias de genes/proteínas TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento de secuencias de genes/proteínas Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Evolución Molecular y Filogenia

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Evolución Molecular y Filogenia TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Evolución Molecular y Filogenia Ignacio Pérez Hurtado de Mendoza Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial

Más detalles

ASIGNATURA: BIOINFORMÁTICA

ASIGNATURA: BIOINFORMÁTICA Página 1 de 5 CARACTERÍSTICAS GENERALES* Tipo: Formación básica, Obligatoria, Optativa Trabajo de fin de grado, Prácticas externas Duración: Cuatrimestral Semestre/s: 5 Número de créditos ECTS: 6 Idioma/s:

Más detalles

BÚSQUEDA DE SECUENCIAS PARECIDAS (Similarity search)

BÚSQUEDA DE SECUENCIAS PARECIDAS (Similarity search) BÚSQUEDA DE SECUENCIAS PARECIDAS (Similarity search) Cuando los proyectos de secuenciación genómica descubren una nueva secuencia biológica es muy poco lo que se sabe de ella. Por ese motivo, una de las

Más detalles

Evolución cambio perfil genético nuevas especies

Evolución cambio perfil genético nuevas especies Evolución Biológica En el contexto de las Ciencias de la vida, la evolución es un cambio en el perfil genético de una población de individuos, que puede llevar a la aparición de nuevas especies, a la adaptación

Más detalles

Bioinformática Clásica Tema 3: Análisis de Secuencias (2) Algoritmia

Bioinformática Clásica Tema 3: Análisis de Secuencias (2) Algoritmia Tema 3: Análisis de Secuencias (2) Algoritmia Dr. Oswaldo Trelles ots@ac ac.uma.es En la presentación definimos algunos conceptos básicos sobre el análisis de secuencias: que las secuencias se almacenan

Más detalles

Patentabilidad en el campo técnico de la biotecnología

Patentabilidad en el campo técnico de la biotecnología Patentabilidad en el campo técnico de la biotecnología Mesa redonda: Industria española de biotecnología y Agentes de patentes - OEPM EPO. (Madrid, 13 Noviembre 2013) ADN y genes Perfiles de expresión,

Más detalles

Por regla general, las búsquedas con BLAST obedecen a uno de estos dos objetivos:

Por regla general, las búsquedas con BLAST obedecen a uno de estos dos objetivos: BLAST en el servidor del NCBI BLAST es la herramienta bioinformática más utilizada en todo el mundo. Compara una secuencia problema (query sequence) de nucleótidos o de proteínas con todas las secuencias

Más detalles

DTW. Alineamiento Temporal Dinámico (DTW)

DTW. Alineamiento Temporal Dinámico (DTW) DTW. Alineamiento Temporal Dinámico (DTW) El Alineamiento Temporal Dinámico (Dynamic Time Warping, DTW), es una técnica surgida de la problemática inherente a diferentes realizaciones de una misma locución,

Más detalles

Filogenias. Inferencia filogenética

Filogenias. Inferencia filogenética Filogenias Para Darwin la evolución es descendencia con modificación a partir de un único origen de la vida. Siguiendo esta idea, todos los taxa actuales tendrán algún tipo de parentesco más o menos cercano.

Más detalles

PROGRAMACION DE REDES. MODELOS DE TRANSPORTE

PROGRAMACION DE REDES. MODELOS DE TRANSPORTE PROGRAMACION DE REDES. MODELOS DE TRANSPORTE El modelo de transporte o modelo de distribución es un ejemplo de un problema de optimización de redes. Se aplican para resolver ciertos tipos de problemas

Más detalles

Bioinformática Clásica

Bioinformática Clásica Bioinformática Clásica Dr. Oswaldo Trelles Universidad de Málaga Esta presentación contiene información sobre la organización del curso de Bioinformática Clásica. En ella se describe para cada tema su

Más detalles

Adyacencias generalizadas en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura

Adyacencias generalizadas en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura Edgar HERNÁNDEZ VENTURA CINVESTAV-Zacatenco 24 de Junio de 2010 Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24

Más detalles

Seguramente has escuchado la frase: Una imagen vale más que mil palabras

Seguramente has escuchado la frase: Una imagen vale más que mil palabras Gráficas por Oliverio Ramírez Seguramente has escuchado la frase: Una imagen vale más que mil palabras Estás de acuerdo con ella? La pregunta viene al tema porque aunque las distribuciones de frecuencia

Más detalles

Tile64 Many-Core. vs. Intel Xeon Multi-Core

Tile64 Many-Core. vs. Intel Xeon Multi-Core Tile64 Many-Core vs. Intel Xeon Multi-Core Comparación del Rendimiento en Bioinformática Myriam Kurtz Francisco J. Esteban Pilar Hernández Juan Antonio Caballero Antonio Guevara Gabriel Dorado Sergio Gálvez

Más detalles

Aplicaciones guiadas: Blast. Genome Browsers.

Aplicaciones guiadas: Blast. Genome Browsers. Curso de Formación UEB Herramientas Bioinformáticas para la Investigación Biomédica 1 r bloque (20/06/2012) Introducción a la Bioinformática y a las Bases de Datos 3 a sesión Aplicaciones guiadas: Blast.

Más detalles

EVALUACION DEL EFECTO DE LA EVOLUCIÓN HETEROGENEA SITIO- ESPECIFICA SOBRE LA RECONSTRUCCIÓN FILOGENETICA MEDIANTE PARSIMONIA

EVALUACION DEL EFECTO DE LA EVOLUCIÓN HETEROGENEA SITIO- ESPECIFICA SOBRE LA RECONSTRUCCIÓN FILOGENETICA MEDIANTE PARSIMONIA EVALUACION DEL EFECTO DE LA EVOLUCIÓN HETEROGENEA SITIO- ESPECIFICA SOBRE LA RECONSTRUCCIÓN FILOGENETICA MEDIANTE PARSIMONIA INTRODUCCION La biología comparada estudia la diversidad de especies analizando

Más detalles

ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN

ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN Jeffrey Vega Aguilar Facultad de Ciencias, Escuela de Biología, Sistemática, Universidad Industrial de Santander.

Más detalles

Gráfico de Desgaste de Herramientas

Gráfico de Desgaste de Herramientas Gráfico de Desgaste de Herramientas Resumen El procedimiento Gráfico de Desgaste de Herramientas crea cuadros de control para una sola variable numérica donde se espera que cambien las cantidades en un

Más detalles

El virus de la gripe. Análisis bioinformático

El virus de la gripe. Análisis bioinformático El virus de la gripe Análisis bioinformático Es una enfermedad respiratoria, de origen vírico y altamente contagiosa. Obliga a hospitalizar a 200.000 personas al año en USA. Está relacionada con 30.000

Más detalles

Genómica comparada. Brown 2002, págs

Genómica comparada. Brown 2002, págs Genómica comparada 1. Teoría neutralista de la evolución molecular 2. Sustituciones nucleotídicas sinónimas y no-sinónimas. Interpretación de la razón Ka/Ks. 3. Duplicaciones y el destino de los genes

Más detalles

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.

Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. REGRESIÓN LINEAL. Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. Dada una población, hasta ahora hemos estudiado cómo a partir de una muestra extraída de ella podemos

Más detalles

INTRODUCCION A LA SIMULACION DE MODELOS. Simulación es la descripción de un sistema a través de modelos que se pueden aplicar a varias disciplinas.

INTRODUCCION A LA SIMULACION DE MODELOS. Simulación es la descripción de un sistema a través de modelos que se pueden aplicar a varias disciplinas. Tema N 1 Definiciones INTRODUCCION A LA SIMULACION DE MODELOS Simulación es la descripción de un sistema a través de modelos que se pueden aplicar a varias disciplinas. La simulación esencialmente es una

Más detalles

Tema 2: Determinantes

Tema 2: Determinantes Tema 2: Determinantes 1. Introducción En este tema vamos a asignar a cada matriz cuadrada de orden, un número real que llamaremos su determinante y escribiremos. Vamos a ver cómo se calcula. Consideremos

Más detalles

Coloraciones en tableros

Coloraciones en tableros Coloraciones en tableros Matías Saucedo * Selectivo Cono Sur 2015 1. El tablero de ajedrez El siguiente es un problema muy conocido que aparece en varios textos de divulgación matemática. Problema 1. Consideremos

Más detalles

6 Analizador de escena

6 Analizador de escena Reconocimiento de señales de tráfico para un sistema de ayuda a la conducción 6 Analizador de escena 6.1 Objetivo y funcionamiento Hasta ahora se ha explicado el proceso de extracción de información de

Más detalles

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Objetivos 2 Identificar los tipos de gráficas. Definir los conceptos tablas y cuadros Reconocer las partes de una gráfica. Construir

Más detalles

Predicción de la estructura terciara de las proteínas

Predicción de la estructura terciara de las proteínas Predicción de la estructura terciara de las proteínas Cuando la estructura terciaria de una proteína no se ha determinado experimentalmente, se puede intentar construir un modelo tridimensional a partir

Más detalles

Motivos, patrones y perfiles

Motivos, patrones y perfiles Motivos, patrones y perfiles Representación de Alineamientos Múltiples, Homologías remotas y Bases de datos secundarias Esquema Representación de alineamientos múltiples Bases de datos secundarias o de

Más detalles

Método Simplex. Ing. Ricardo Fernando Otero, MSc

Método Simplex. Ing. Ricardo Fernando Otero, MSc Método Simplex Ing. Ricardo Fernando Otero, MSc Forma estándar de un modelo de programación lineal Dirección de mejora: Maximizar Todas las restricciones deben ser El lado izquierdo debe contener solo

Más detalles

Tema 7: Problemas clásicos de Programación Lineal

Tema 7: Problemas clásicos de Programación Lineal Tema 7: Problemas clásicos de Programación Lineal 1.- Características generales de un problema de transporte y asignación Surgen con frecuencia en diferentes contextos de la vida real. Requieren un número

Más detalles

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS 1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias

Más detalles

Conceptos Fundamentales del Análisis de Algoritmos

Conceptos Fundamentales del Análisis de Algoritmos Conceptos Fundamentales del Análisis de Algoritmos Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 15 de enero de 2018 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Conceptos Fundamentales del Análisis 15 de

Más detalles

Tema 2: Determinantes

Tema 2: Determinantes Tema 2: Determinantes 1. Introducción En este tema vamos a asignar a cada matriz cuadrada de orden n, A M n un número real que llamaremos su determinante y escribiremos A. Vamos a ver cómo se calcula.

Más detalles

Tema 05: Tablas hash. M. en C. Edgardo Adrián Franco Martínez edgardoadrianfrancom

Tema 05: Tablas hash. M. en C. Edgardo Adrián Franco Martínez edgardoadrianfrancom Tema 05: Tablas hash M. en C. Edgardo Adrián Franco Martínez http://www.eafranco.com edfrancom@ipn.mx @edfrancom edgardoadrianfrancom Estructuras de datos (Prof. Edgardo A. Franco) 1 Contenido Función

Más detalles

Al hacer clic en el vínculo al simulador, en tu navegador se abre la hoja del programa, con una interface como la de la figura siguiente:

Al hacer clic en el vínculo al simulador, en tu navegador se abre la hoja del programa, con una interface como la de la figura siguiente: Taller de Modelado de Cinética Enzimática Emplearas el programa de simulación de cinética enzimática que se encuentra en el sitio: (htpp://www.kscience.co.uk/-animations/model.swf) para realiza los ejercicios

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

Modelos de Markov ocultos Profile HMM. Alex Sánchez. Departament d Estadística U.B. 1. Estadística i Bioinformàtica. MMO en Biologia Computacional

Modelos de Markov ocultos Profile HMM. Alex Sánchez. Departament d Estadística U.B. 1. Estadística i Bioinformàtica. MMO en Biologia Computacional Modelos de Markov ocultos Profile HMM Departament d Estadística U.B. Estadística i Bioinformàtica Esquema del tema Alineamientos múltiples de secuencias (AMS) Representaciones de AMS: Patrones y Perfiles

Más detalles

Biopolímero s (4831)

Biopolímero s (4831) Biopolímero s (4831) 1.2. Niveles de estructura en las macromoléculas biológicas. (La visualización interactiva adecuada de las moléculas de la página requiere la instalación en el navegador del plug-in

Más detalles

A partir de los modelos obtenidos, podemos hacer un análisis de las propiedades de los

A partir de los modelos obtenidos, podemos hacer un análisis de las propiedades de los 6. DISUSIÓ A partir de los modelos obtenidos, podemos hacer un análisis de las propiedades de los 74 análogos a la isoniazida que fueron utilizados para este estudio, y del mismo estudio en sí. Es indudable

Más detalles

Alineamiento local: búsqueda de homologías

Alineamiento local: búsqueda de homologías Alineamiento local: búsqueda de homologías Supongamos que el material de partida para realizar una búsqueda de homologías no es un gen o una proteína completos y bien caracterizados de los que podamos

Más detalles

Análisis y anotación de una secuencia mediante las herramientas y bases de datos de UCSC Genome Bioinformatics & Galaxy

Análisis y anotación de una secuencia mediante las herramientas y bases de datos de UCSC Genome Bioinformatics & Galaxy Análisis y anotación de una secuencia mediante las herramientas y bases de datos de UCSC Genome Bioinformatics & Galaxy Master de Genética y Evolución 2011/2012 Analisis de Secuencias Michael Hackenberg

Más detalles

Laboratorio de Previsión del Tiempo I cuatrimestre 2011 Dra. Silvina Solman

Laboratorio de Previsión del Tiempo I cuatrimestre 2011 Dra. Silvina Solman La predicción por ensambles: Parte 2 Agradecimientos: este material se basa en el módulo de Explicación del pronóstico por ensambles tomado del Programa COMET (www.comet.ucar.edu) Laboratorio de Previsión

Más detalles

A continuación se describirán el problema, el análisis del algoritmo, sus propiedades y los

A continuación se describirán el problema, el análisis del algoritmo, sus propiedades y los 3.- Descripción y análisis del algoritmo A continuación se describirán el problema, el análisis del algoritmo, sus propiedades y los resultados al aplicarlo a las matrices de entrada de los casos de uso.

Más detalles

Seleccionar Copiar. Modificar objeto. Mover

Seleccionar Copiar. Modificar objeto. Mover Clic sobre el mismo; verás que el recuadro mostrará un recuadro de puntos, indicando que el objeto está seleccionado. Para quitar la selección, haz clic en cualquier parte fuera del recuadro. Seleccionar

Más detalles

Análisis matemático de algoritmos recursivos

Análisis matemático de algoritmos recursivos Análisis matemático de algoritmos recursivos Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 24 de enero de 2018 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Análisis matemático de algoritmos 24 de enero de

Más detalles

Árboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010

Árboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010 Unidad 6: Árboles Filogenéticos BT7412, CC5702 Bioinformática Diego Arroyuelo 2 de noviembre de 2010 Temario (Introduction to Computational Molecular Biology Setubal y Meidanis Capítulo 6) 1. Introducción

Más detalles

Anexo 1.1 Operación Matriciales y Matrices en Sistemas de Potencia

Anexo 1.1 Operación Matriciales y Matrices en Sistemas de Potencia ELC-30524 Sistemas de Potencia II Anexo 1.1 Operación Matriciales y Matrices en Sistemas de Potencia Prof. Francisco M. Gonzalez-Longatt fglongatt@ieee.org http://www.giaelec.org/fglongatt/sp2.htm 1. Ejemplo

Más detalles

Ataque de texto claro escogido contra la clave de protocolo del cifrado de Doble Criptograma Simétrico

Ataque de texto claro escogido contra la clave de protocolo del cifrado de Doble Criptograma Simétrico Ataque de texto claro escogido contra la clave de protocolo del cifrado de Doble Criptograma Simétrico Manuel J. Lucena López 27 de enero de 2013 Resumen Se presenta un ataque de texto claro escogido para

Más detalles

Tema 8.- Evolución y Origen de la Vida

Tema 8.- Evolución y Origen de la Vida Tema 8.- Evolución y Origen de la Vida 1 ORIGEN DE LA DIVERSIDAD BIOLÓGICA Teorías Fijistas: Los seres vivos no cambian. Las especies se han mantenido siempre tal y como las conocemos ahora. Perduró hasta

Más detalles

XVIII Olimpíada Matemática Rioplatense San Isidro, 7 de Diciembre de Nivel A Primer Día

XVIII Olimpíada Matemática Rioplatense San Isidro, 7 de Diciembre de Nivel A Primer Día Nivel A Primer Día 1. En una caja hay 2009 bolitas numeradas del 1 al 2009, y fuera de la caja hay bolitas sin numerar. Andrés repite el siguiente procedimiento hasta que quedee sólo una bolita en la caja.

Más detalles

Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp

Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp Gráficos X-Bar y S Resumen El procedimiento Gráficos X-Bar y S crea gráficos de control para una simple variable numérica cuando los datos han sido recabados en subgrupos. Crea un Gráfico X-bar para monitorear

Más detalles

Método Extendido de Hückel

Método Extendido de Hückel TEORIA Este método fue ampliamente popularizado por Hoffmann a finales de los años 50, y posteriormente las aproximaciones realizadas se deben a Wolfsberg y Helmholz a principios de los 60. Este método

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

CAPÍTULO 2: Diseño del algoritmo

CAPÍTULO 2: Diseño del algoritmo CAPÍTULO 2: Diseño del algoritmo 2.1 Introducción La fase del diseño del algoritmo es la fase previa a la de la implementación del mismo, y no cabe ninguna duda de que el éxito o el fracaso de dicho algoritmo

Más detalles

El origen de los organismos multicelulares. Lineamientos fundamentales de la evolución de los fungi, los metazoarios, y las plantas vasculares

El origen de los organismos multicelulares. Lineamientos fundamentales de la evolución de los fungi, los metazoarios, y las plantas vasculares Unidad 2 Parte IV El origen de los organismos multicelulares. Lineamientos fundamentales de la evolución de los fungi, los metazoarios, y las plantas vasculares La biología Evolutiva estudia los procesos

Más detalles

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN 165 ENCUESTA DE COMPORTAMIENTOS Y TIPOLOGÍAS DE VISITANTES EN EUSKADI 166 ANEXO I. CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Más detalles

Problema 9: Diseño de Proteínas

Problema 9: Diseño de Proteínas Problema 9: Diseño de Proteínas Tomado de: The Ten Most Wanted Solutions In Protein Bioinformatics por Anna Tramontano Seminario de Bioinformática Jorge Hernán Victoria Moreno Octubre 23 de 2009 Agenda

Más detalles

OFERTAS DE TRABAJOS FIN DE GRADO

OFERTAS DE TRABAJOS FIN DE GRADO Sistemas de detección y seguimiento preciso de la cara y partes del cuerpo Descripción: Se desarrollarán algoritmos para la detección de la cara y de distintas partes del cuerpo, que funcionen en tiempo

Más detalles

Fundamentos de Programación Entera. A. Revisión. Carlos Testuri Germán Ferrari

Fundamentos de Programación Entera. A. Revisión. Carlos Testuri Germán Ferrari Fundamentos de Programación Entera A. Revisión Carlos Testuri Germán Ferrari Departamento de Investigación Operativa Instituto de Computación Facultad de Ingeniería Universidad de la República 2012-2018

Más detalles

Tema 5. Matrices y Determinantes

Tema 5. Matrices y Determinantes Tema 5. Matrices y Determinantes 1. Definiciones 2. Operaciones Propiedades 3. Determinantes Orden 2 Orden 3: Regla de Sarrus Orden mayor de 3 Propiedades 4. Matriz inversa Ecuaciones matriciales 5. Rango

Más detalles

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 10

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 10 Computación Aplicada Universidad de Las Américas Aula virtual de Computación Aplicada Módulo de Excel 2013 LIBRO 10 Contenido GRÁFICOS... 3 GRÁFICOS DESCRIPCION... 4 TIPOS DE GRÁFICOS... 6 GRÁFICOS DE

Más detalles

84 Tema 3. Dualidad. todas las restricciones son del tipo, todas las variables son no negativas.

84 Tema 3. Dualidad. todas las restricciones son del tipo, todas las variables son no negativas. Tema 3 Dualidad En el desarrollo de la programación lineal la teoria de la dualidad es importante, tanto desde el punto de vista teórico como desde el punto de vista práctico. Para cada modelo lineal se

Más detalles

MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN

MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN - Inferir una filogenia es un proceso de estimación. Se hace la mejor estimación de una historia evolutiva con base en la información

Más detalles

MOS EXCEL APLICAR FORMATO A CELDAS Y RANGOS. Aplicar formato a la estructura de las celdas.

MOS EXCEL APLICAR FORMATO A CELDAS Y RANGOS. Aplicar formato a la estructura de las celdas. 2.2. APLICAR FORMATO A CELDAS Y RANGOS. Aplicar formato a la estructura de las celdas. El formato de las celdas puede aplicarse a una celda, una fila, una columna o a toda la hoja de cálculo. Sin embargo,

Más detalles

Construcción de Gráficas en forma manual y con programados

Construcción de Gráficas en forma manual y con programados Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción

Más detalles

1ER TRABAJO DE ALGEBRA LINEAL Y GEOMETRÍA PEDRO JAVIER CARMONA LUNA PRESENTADO A: HUGO R. PÉREZ CARRASCAL LIC. EN MATEMÁTICAS UNIVERSIDAD DE CÓRDOBA

1ER TRABAJO DE ALGEBRA LINEAL Y GEOMETRÍA PEDRO JAVIER CARMONA LUNA PRESENTADO A: HUGO R. PÉREZ CARRASCAL LIC. EN MATEMÁTICAS UNIVERSIDAD DE CÓRDOBA 1ER TRABAJO DE ALGEBRA LINEAL Y GEOMETRÍA PEDRO JAVIER CARMONA LUNA PRESENTADO A: HUGO R. PÉREZ CARRASCAL LIC. EN MATEMÁTICAS UNIVERSIDAD DE CÓRDOBA FACULTAD DE INGENIERÍAS PROGRAMA DE INGENIERÍA AMBIENTAL

Más detalles

Tema 2: PROCESAMIENTO EN EL DOMINIO ESPACIAL (Parte 2)

Tema 2: PROCESAMIENTO EN EL DOMINIO ESPACIAL (Parte 2) Tema 2: PROCESAMIENTO EN EL DOMINIO ESPACIAL (Parte 2) 1 I N G E N I E R Í A I N F O R M Á T I C A D P T O. M A T E M Á T I C A A P L I C A D A I 2 ÍNDICE: Filtrado espacial Filtros de suavizado Filtros

Más detalles

Fundamentos de Visión por Computador

Fundamentos de Visión por Computador Fundamentos de Visión por Computador Sistemas Informáticos Avanzados Índice Filtrado en el espacio Filtros lineales Tipos de ruido Filtro media Filtro mediana Filtros gausianos Filtrado en la frecuencia

Más detalles

Regresión polinomial y factores

Regresión polinomial y factores Capítulo Regresión polinomial y factores.. Regresión polinomial Si una función media tiene un predictor X pueden usarse sus potencias enteras para aproximar E (Y X). El caso más simple es la regresión

Más detalles

Crecimiento: Buscando la Eficiencia en la Estructura Organizacional. Marcelo Córdova Director de Capital Humano, Mercer - Chile

Crecimiento: Buscando la Eficiencia en la Estructura Organizacional. Marcelo Córdova Director de Capital Humano, Mercer - Chile Crecimiento: Buscando la Eficiencia en la Estructura Organizacional Marcelo Córdova Director de Capital Humano, - Chile Tenemos 30 gerentes, 40 jefes de proyectos y 60 supervisores nada mal para una compañía

Más detalles

Programación Dinámica

Programación Dinámica Programación Dinámica La técnica de programación dinámica se aplica en general a problemas de optimización. l igual que "dividir y conquistar", el problema es dividido en subproblemas de tamaños menores

Más detalles

Gráfico de Medias Móviles (MA)

Gráfico de Medias Móviles (MA) Gráfico de Medias Móviles (MA) Resumen El procedimiento Gráfico de Medias Móviles crea cuadros de control para una sola variable numérica donde los datos se han recolectado ya sea individualmente o en

Más detalles

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias

Part I. Descripción estadística de dos variables. Estadística I. Mario Francisco. Variable. bidimensional. Distribuciones de frecuencias Part I Descripción de dos variables Introducción Si para un mismo individuo observamos simultáneamente k obtendremos como resultado una variable k-dimensional. Nos ocuparemos del estudio de las variables

Más detalles

Sistemas Inteligentes. Tema B2T7: Algoritmo de Viterbi. Estimación de modelos de Markov.

Sistemas Inteligentes. Tema B2T7: Algoritmo de Viterbi. Estimación de modelos de Markov. Sistemas Inteligentes Escuela Técnica Superior de Informática Universitat Politècnica de València Tema BT7: Algoritmo de Viterbi. Estimación de modelos de Markov. DSIC UPV: Octubre, 8 SIN-TemaBT7 índice

Más detalles