TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Evolución Molecular y Filogenia

Tamaño: px
Comenzar la demostración a partir de la página:

Download "TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Evolución Molecular y Filogenia"

Transcripción

1 TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Evolución Molecular y Filogenia Ignacio Pérez Hurtado de Mendoza Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Máster Universitario en Lógica, Computación e Inteligencia Artificial Curso

2 Introducción La comparación entre secuencias de genomas de distintos organismos de la misma especie y de especies diferentes nos muestra que los genomas no son estáticos sino dinámicos. Cambios o mutaciones aparecen en el genoma de un único individuo. Estas pueden ser neutrales, defectuosas o ventajosas. Si una mutación aparece en la línea germinal de un organismo puede ser transmitida a sus descendientes. De esta forma una mutación puede extenderse en una población y fijarse dando lugar a polimorfismos, existencia de diferentes variantes de una misma secuencia de DNA llamados alelos. Los polimorfismos más frecuentes son los SNPs (single nucleotide polymorphisms) seguidos de los STR (short tandem repeats) y por último indels. Finalmente, pueden darse transposiciones, inversiones y duplicaciones.

3 Filogenia Molecular La filogenia consiste en la inferencia de las relaciones evolutivas entre las especies existentes. Tradicionalmente se basaba en el estudio de carácteres morfológicos y fisiológicos hasta principios de 1980s con la obtención de las secuencias de los primeras proteínas y genes. Actualmente se basa en la comparación entre secuencias biológicas dando lugar a la filogenia molecular. Los principales objetivos de la filogenia molecular son: Determinar una relación jerárquica entre las especies existentes según su relación evolutiva. Estimar el tiempo de divergencia entre las especies, i.e. tiempo de existencia de su ancestro en común más cercano.

4 Análisis Filogenético El estudio filogenético se divide en cinco pasos: Paso 1: Selección de las secuencias biológicas a analizar. Paso 2: Alineamiento múltiple de las secuencias biológicas. Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias. Paso 4: Construcción de árboles filogenéticos. Paso 5: Evaluación de los árboles construídos.

5 Análisis Filogenético El estudio filogenético se divide en cinco pasos: Paso 1: Selección de las secuencias biológicas a analizar. Paso 2: Alineamiento múltiple de las secuencias biológicas. Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias. Paso 4: Construcción de árboles filogenéticos. Paso 5: Evaluación de los árboles construídos.

6 Paso 1: Selección de las secuencias biológicas a analizar Los estudios filogenéticos se basan en la comparación de secuencias biológicas (DNA o AA) homólogas. El estudio de las diferencias entre ellas nos permiten estimar la relación evolutiva entre las correspondientes especies y su tiempo de divergencia (existencia de un ancestro en común). Para obtener secuencias homólogas podemos recurrir: Bases de datos tales como Refseq, Uniprot o HomoloGene Resultados de alineamientos utilizando BLAST.

7 Análisis Filogenético El estudio filogenético se divide en cinco pasos: Paso 1: Selección de las secuencias biológicas a analizar. Paso 2: Alineamiento múltiple de las secuencias biológicas. Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias. Paso 4: Construcción de árboles filogenéticos. Paso 5: Evaluación de los árboles construídos.

8 Paso 2: Alineamiento Múltiple de Secuencias El alineamiento múltiple de las secuencias biológicas analizadas es el paso crucial en el estudio filogenético ya que consiste en la comparación entre las distintas secuencias. Es necesario comprobar los siguientes puntos: Eliminar secuencias no homólogas, aquellas que no muestran alineamiento. Se deber realizar un alineamiento de pares de secuencias y ver su significancia. Si el alineamiento no es bueno y estamos seguros de la homología entre las secuencias modificar los parámetros de penalización por la inserción y extensión de huecos. Normalmente no se conoce la secuencia completa de las correpondientes secuencias y aparecen muchos huecos. Es necesario eliminar las columnas que corresponde a hueco (manualmente o indicárselo al correspondiente programa). Dualidad entre alineamiento múltiple y árbol filogenético.

9 Análisis Filogenético El estudio filogenético se divide en cinco pasos: Paso 1: Selección de las secuencias biológicas a analizar. Paso 2: Alineamiento múltiple de las secuencias biológicas. Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias. Paso 4: Construcción de árboles filogenéticos. Paso 5: Evaluación de los árboles construídos.

10 Paso 3: Modelos estadísticos de Evolución Molecular o Modelos de Substitución de DNA y AA. Una vez realizado el alineamiento múltiple podemos pasar a la estimación de la distancia genética entre las distintas secuencias. La distancia genética entre dos secuencias homólogas se define como el número de sustituciones acumuladas entre ellas desde que divergieron de un ancestro común. La estimación de la distancia genética no es trivial ya que no todas las sustituciones son observables especialmente en secuencias con muchas sustituciones.

11 Paso 3: Modelos de Sustitución de Aminoácidos El análisis filogenético se basa en la correcta elección del model de sustitución correspondiente: P-distance o distancia de Hamming o grado de divergencia: Consiste en contar la frecuencia relativa de cambios entre dos secuencias de un alineamiento múltiple. Si tenemos un alineamiento de longitud N con n diferencias la p-distance se define como: p = n / N

12 Paso 3: Modelos de Substitución de Aminoácidos El análisis filogenético se basa en la correcta elección del model ode substitución correspondiente: P-distance o distancia de Hamming o grado de divergencia: Consiste en contar la frecuencia relativa de cambios entre dos secuencias de un alineamiento múltiple. Si tenemos un alineamiento de longitud N con n diferencias la p-distance se define como: d = n / N

13 Paso 3: Modelos de Sustitución de Aminoácidos Secuencias homólogas muy divergentes acumulan un gran número de sustituciones lo cual hace que no todas sean observables. Por lo tanto, es necesario corregir aquellas substituciones observables. La corrección de Poisson es una de las más ampliamente utilizadas: d = - ln(1 p) donde p es frecuencia relativa observable

14 Paso 3: Modelos de Sustitución de Aminoácidos

15

16 Paso 3: Modelos de Sustitución de Nucleótidos El cálculo de la distancia genética entre secuencias de nucleótidos es más difícil debido entre otras razones a la redundancia del código genético. Existen diferentes modelos de sustitución de nucleótidos que persiguen conseguir una mejor estimación de la distancia genética, es decir, una mejor estimación de número real de sustituciones entre dos secuencias homólogas dadas las sustituciones obervables. Estos modelos en general asumen que el proceso de evolución de las secuencias de nucleótidos pueden representarse usando cadenas de Markov. Es decir, asumen que el estado actual de una secuencia tan sólo depende del estado precedente.

17 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Jukes-Cantor El modelo de Jukes-Cantor es el modelo más simple que propone una corrección del número de sustituciones observables. Asume que la probabilidad de mutar un nucleótido por otro es independiente de la posición de dicho nucleótido y del nucleótido en sí: La probabilidad de cambiar A por C, G o T es idéntica, a/3. De igual forma para C, G y T.

18 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Jukes-Cantor A α/3 G α/3 α/3 α/3 α/3 T α/3 C

19 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Jukes-Cantor El modelo de Jukes-Cantor es el modelo más simple que propone una corrección del número de sustituciones observables. Asume que la probabilidad de mutar un nucleótido por otro es independiente de la posición de dicho nucleótido y del nucleótido en sí: La probabilidad de cambiar A por C, G o T es idéntica, a/3. De igual forma para C, G y T.

20 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Jukes-Cantor El modelo de Jukes-Cantor es el modelo más simple que propone una corrección del número de sustituciones observables. Asume que la probabilidad de mutar un nucleótido por otro es independiente de la posición de dicho nucleótido y del nucleótido en sí: La probabilidad de cambiar A por C, G o T es idéntica, a/3. De igual forma para C, G y T.

21 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Kimura-2 parámetros Kimura propuso un refinamiento del modelo de Jukes-Cantor que tiene en cuenta la mayor probabilidad de observar transiciones que observar transversiones. Por lo tanto depende de dos parámetros: La probabilidad de observar una transición, a. La probabilidad de observar una transversión, b.

22 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Kimura-2 parámetros A α G β β β β T α C

23 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Kimura-2 parámetros Kimura propuso un refinamiento del modelo de Jukes-Cantor que tiene en cuenta la mayor probabilidad de observar transiciones que observar transversiones. Por lo tanto depende de dos parámetros: La probabilidad de observar una transición, a. La probabilidad de observar una transversión, b.

24 Paso 3: Modelos de Sustitución de Nucleótidos El Modelo de Kimura-2 parámetros Kimura propuso un refinamiento del modelo de Jukes-Cantor que tiene en cuenta la mayor probabilidad de observar transiciones que observar transversiones. Por lo tanto depende de dos parámetros: La probabilidad de observar una transición, a. La probabilidad de observar una transversión, b. Donde P y Q es la frecuencia relativa de transciones y transversiones respectivamente. Existen otros mucho modelos de sustitucion como por ejemplo GTR (General time reversable) que considera una probabilidad para cada tipo de transición y transversión.

25 Paso 3: Modelos de Sustitución de Nucleótidos La distribución Gamma Todos los modelos de sustitución vistos hasta ahora asumen que las sustituciones son independientes de la posición. Las probabilidades de sustitución son uniformes a lo largo de toda la secuencia. Esto no se cumple siempre. Con frecuencia se usa una corrección basada en la distribución gamma para representar la zona de la secuencia donde se da una mayor probabilidad de sustitución.

26 Paso 3: Modelos de Sustitución de Nucleótidos Selección de Modelos de Substitución Dado un alineamiento múltiple de secuencias existe una gran variedad de posibles modelos a elegir para representar la evolución de las distintas secuencias. La selección de modelos es una rama de la estadística dedicada a clasificar la bondad de los distintos modelos posibles buscando un compromiso entre la complejidad del modelo (número de parámetros) y el ajuste a los datos disponibles. MEGA permite realizar este análisis basado en los Criterios de Información Bayesianos y de Akaike (BIC y AIC).

27 Análisis Filogenético El estudio filogenético se divide en cinco pasos: Paso 1: Selección de las secuencias biológicas a analizar. Paso 2: Alineamiento múltiple de las secuencias biológicas. Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias. Paso 4: Construcción de árboles filogenéticos. Paso 5: Evaluación de los árboles construidos.

28 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

29 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Nodos

30 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. La longitud de las ramas representa la distancia genética. Cladograma, todas las ramas son de la misma longitud. Filograma, las ramas de distinta longitud representan la distancia filogenética. Ramas o Aristas

31 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Nodos externos Hojas Taxones OTUs (Operational Taxonomic Unit)

32 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Nodos internos Ancestros comunes

33 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Clado: conjunto de todos los taxones y ancestros comunes que descienden de un nodo en concreto

34 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Clado: conjunto de todos los taxones y ancestros comunes que descienden de un nodo en concreto

35 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Clado: conjunto de todos los taxones y ancestros comunes que descienden de un nodo en concreto

36 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Clado: conjunto de todos los taxones y ancestros comunes que descienden de un nodo en concreto

37 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Clado: conjunto de todos los taxones y ancestros comunes que descienden de un nodo en concreto

38 Definiciones y propiedades básicas Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos. Clado: conjunto de todos los taxones y ancestros comunes que descienden de un nodo en concreto

39 Definiciones y propiedades básicas Existen dos tipos de árboles según la existencia de un nodo destacado llamado raíz: Los árboles enraizados poseen un nodo llamado raíz que corresponde con el ancestro común a todos los taxones. En un árbol enraizado podemos establecer una relación temporal. Los árboles no enraizados carecen de raíz y por lo tanto de relación temporal. Existen principalmente dos métodos para determinar la raíz de un árbol no enraizado: Se añade un outgroup, un taxón que conocemos es el más alejado del resto, y determinamos la raíz en el punto medio de la arista que lo une a clado formado por el resto de taxones. Se determina la rama de mayor longitud y se establece la raiz en su punto medio pasado presente

40 Definiciones y propiedades básicas Existen dos tipos de árboles según la existencia de un nodo destacada llamado raíz: Los árboles enraizados poseen un nodo llamado raíz que corresponde con el ancestro en común entre todos los taxones. En un árbol enraizado podemos establecer una relación temporal. Los árboles no enraizados carecen de raíz y por lo tanto de relación temporal. Existen principalmente dos métodos para determinar la raíz de un árbol no enraizado: Se añade un outgroup, un taxón que conocemos es el más alejado del resto, y determinamos la raíz en el punto medio de la arista que lo une a clado formado por el resto de taxones. Se determina la rama de mayor longitud y se establece la raiz en su punto medio raíz 5 6 Outgroup pasado presente

41 Métodos de Construcción de Árboles Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos: Métodos basados en distancia Métodos de máxima parsimonia Métodos de máxima verosimilitud Métodos de inferencia bayesiana

42 Métodos de Construcción de Árboles Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos: Métodos basados en distancia Métodos de máxima parsimonia Métodos de máxima verosimilitud Métodos de inferencia bayesiana

43 Métodos basados en distancia Los métodos basados en distancia tienen como primer paso el cálculo de las distancias genéticas entre todos los pares de secuencias según el correspondiente modelo de sustitución seleccionado. Estos modelos resumen toda la información de un alineamiento múltiple en la correspondiente matriz de distancias ignorando el resto de la información (otros métodos también tienen en cuenta esta información). Los principales métodos de construcción de árboles filogenéticos basados en distancia son: UPGMA (Unweighted Pair Group Method with Arithmetic mean) Neighbour Joining El algoritmo de Neighbour Joining se usa ampliamente debido a su velocidad y a que bajo ciertas condiciones devuelve árboles con buenas propiedades.

44 UPGMA Etapa 1. Calcular la matriz de distancias según el modelo de sustitución seleccionado

45 UPGMA Etapa 2. Determinar las dos secuencias con la menor distancia genética entre ellas y unirlas para formar un primer clúster. Añadir un primer nodo interno para representar el ancestro en común entre dichas secuencias. Se asume que las dos ramas que unen este ancestro en común con los dos taxones son de la misma longitud (la mitad de la distancia entre dichas secuencias). Recalcular la matriz de distancias

46 UPGMA Etapa 2. Determinar las dos secuencias con la menor distancia genética entre ellas y unirlas para formar un primer clúster. Añadir un primer nodo interno para representar el ancestro en común entre dichas secuencias. Se asume que las dos ramas que unen este ancestro en común con los dos taxones son de la misma longitud (la mitad de la distancia entre dichas secuencias). Recalcular la matriz de distancias

47 UPGMA Etapa 2. Determinar las dos secuencias con la menor distancia genética entre ellas y unirlas para formar un primer clúster. Añadir un primer nodo interno para representar el ancestro en común entre dichas secuencias. Se asume que las dos ramas que unen este ancestro en común con los dos taxones son de la misma longitud (la mitad de la distancia entre dichas secuencias). Recalcular la matriz de distancias. (1,2) (1,2)

48 UPGMA Etapa 3. Determinar las siguientes dos secuencias con la menor distancia genética entre ellas. Estas pueden ser dos secuencias originales o contener al ancestro en común añadido. Unir las correspondientes secuencias en un clúster. Añadir un nodo interno para representar el ancestro en común. Recalcular la matriz de distancias

49 UPGMA Etapa 3. Determinar las siguientes dos secuencias con la menor distancia genética entre ellas. Estas pueden ser dos secuencias originales o contener al ancestro en común añadido. Unir las correspondientes secuencias en un clúster. Añadir un nodo interno para representar el ancestro en común. Recalcular la matriz de distancias

50 UPGMA Etapa 3. Determinar las siguientes dos secuencias con la menor distancia genética entre ellas. Estas pueden ser dos secuencias originales o contener al ancestro en común añadido. Unir las correspondientes secuencias en un clúster. Añadir un nodo interno para representar el ancestro en común. Recalcular la matriz de distancias. (1,2) 3 (4,5) (1,2) (4,5)

51 UPGMA Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol

52 UPGMA Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol

53 UPGMA Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol. (1,2) (4,5,3) 0.85 (1,2) (4,5,3)

54 UPGMA Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol

55 Neighbour Joining Neighbour Joining es el método de construcción de árboles filogenéicos basado en distancias más popular. Es rápido lo cual permite formar árboles con decenas de taxones. Además bajo ciertas condiciones produce árboles con buenas propiedades. Al contrario de UPGMA Neighbour joining produce ramas de distinta longitud. Neighbour Joining produce árboles no enraizados. Por lo tanto, para añadir una raíz debemos añadir un outgroup o determinar la rama de mayor longitud.

56 Neighbour Joining El primer paso de este algoritmo posiciona a todos los taxones en una estructura en forma de estrella. Seguidamente determina los dos taxones vecinos más cercanos y añade un nuevo nodo representando su ancestro en común más cercano.

57 Neighbour Joining Este algoritmo de basa en encontrar taxones vecinos y unirlos progresivamente añadiendo su ancestro en común. Decimos que dos nodos son vecinos en un árbol filogenético si están conectados entre sí por un único nodo interno. Test de vecindad o la condición 4-puntos: Dados i y j dos vecinos genéricos podemos afirmar que los nodos 1 y 2 son vecinos si la anterior condición es verdadera. La suma de la distancia entre vecinos es menor a la suma de las distancias entre no vecinos.

58 Neighbour Joining Para determinar la longitud de las ramas añadidas al nuevo nodo se utiliza la llamada fórmula de los tres puntos:

59 Métodos de Construcción de Árboles Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos: Métodos basados en distancia Métodos de máxima parsimonia Métodos de máxima verosimilitud Métodos de inferencia bayesiana

60 Máxima Parsimonia En lugar de resumir toda la información de un alineamiento multiple en las distancias genéticas entre secuencias en este tipo de métodos se tienen encuenta las columnas de nucleótidos o aminoácidos alineadas. La principal hipótesis de este metodo de construcción de árboles consiste en asumir que es preferible considerar el menor número de cambios o mutaciones posibles para explicar la evolución de las secuencias analizadas a considerar escenarios más complejos. De esta forma se busca el arbol filogenético tal que la suma de las longitudes de sus ramas sea la menor posible.

61 Máxima Parsimonia Cuál es la explicación más simple o árbol filogenético más simple que puede explicar la evolución de las secuencias AAG, AAA, GGA, AGA? AAA AAA 1 2 AAA 1 AAA AAA 1 1 AAA 2 AAA 1 AAA 1 1 AGA AAG GGA AAA AGA AAG AGA AAA GGA AAG AAA GGA AGA Coste = 4 Coste = 4 Coste = 3

62 Máxima Parsimonia La contrucción de árboles filogenéticos utilizando máxima parsimonia se divide en tres pasos: Paso 1: Identificación de posiciones informativas en un alineamiento múltiple, es decir, se excluyen aquellas posiciones que no cambian en ninguna secuencia y aquellas que no se repiten más de una vez. Paso 2: Construcción de todos los árboles filogenéticos posibles si trabajamos con menos de 12 taxones o utilización de un algoritmo aproximado que construya sólo los árboles más relevantes. Paso 3: Coste de cada árbol según la longitudes de sus ramas y selección del arból con la menor puntuación..

63 Métodos de Construcción de Árboles Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos: Métodos basados en distancia Métodos de máxima parsimonia Métodos de máxima verosimilitud Métodos de inferencia bayesiana

64 Máxima Verosimilitud El método de construcción de árboles por máxima verosimilitud es uno de los más costosos computacionalmente pero uno de los más fiables. Este método asocia a cada árbol posible una probabilidad calculada según un modelo de substitución (Jukes-Cantor, Kimura 2-parámetros, etc) El árbol con mayor probabilidad o verosimilitud es seleccionado.

65 Qué método de construcción de árboles elegir? Seleccionar secuencias biológicas Obtener un alineamiento múltiple Determinar la similitud entre las secuencias Fuerte similitud Máxima Parsimonia Poca similitud Neighbour-Joining Derminar modelo de substitución Muy Poca similitud Máxima verosimilitud Derminar modelo de substitución Evaluación del árbol construído

66 Análisis Filogenético El estudio filogenético se divide en cinco pasos: Paso 1: Selección de las secuencias biológicas a analizar. Paso 2: Alineamiento múltiple de las secuencias biológicas. Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias. Paso 4: Construcción de árboles filogenéticos. Paso 5: Evaluación de los árboles construidos.

67 Paso 5: Evaluación de Árboles Filogenéticos Bootstrapping Una vez construído un árbol filogenético debemos evaluar su robustez. Con cuánta frecuencia se obtiene un orden de ramificación dado considerando secuencias similares a las utilizadas? El método de evaluación de árboles más extendido consiste en Bootstrapping.

68 Paso 5: Evaluación de Árboles Filogenéticos Bootstrapping En este método las secuencias similares a las utilizadas se construyen como permutaciones con repetición de las columnas del correspondiente alineamiento múltiple. Con este nuevo alineamiento se construye un nuevo árbol. Este proceso se repite un número de veces prefijado. A cada ramificación se le asigna el porcentaje de veces que aparece en los árboles construidos. Se asume que una ramificación es significativa si aparece más del 50%-70% de las veces. El resto de las ramificaciones pueden condensarse dando lugar a politomía. Usualmente se construye además el árbol consenso que recoge el orden de ramificación más frecuente.

69

70

71 This work is licensed under the Creative Commons Attribution- NonCommercial NoDerivs 3.0 Unported License. To view a copy of this license, visit

El virus de la gripe. Análisis bioinformático

El virus de la gripe. Análisis bioinformático El virus de la gripe Análisis bioinformático Es una enfermedad respiratoria, de origen vírico y altamente contagiosa. Obliga a hospitalizar a 200.000 personas al año en USA. Está relacionada con 30.000

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento múltiple de secuencias Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial

Más detalles

ÁRBOLES FILOGENÉTICOS

ÁRBOLES FILOGENÉTICOS ÁRBOLES FILOGENÉTICOS Por qué usar filogenias? El conocimiento del pasado es importante para poder resolver muchas cuestiones relacionadas con procesos biológicos. Las filogenias nos permiten obtener relaciones

Más detalles

Evolución de secuencias de DNA

Evolución de secuencias de DNA Evolución de secuencias de DNA 4 transiciones (α) 8 transversiones (β) Proporción esperada Transiciones/Transversiones = 1/2 DESDE HASTA ATCTAGATCTAGTGCATAGCATGCA * * * * * * ACCTAAATTTAGTGAATATCATCCA

Más detalles

Filogenética molecular (III)

Filogenética molecular (III) Filogenética molecular (III) Bioinformática, 14-3-18 Basado en Kevin Yip-CSE-CUHK (Universidad china de Hong-Kong) HOY 1. Distancia evolutiva y modelos de mutación 2. Árboles: Las estructuras jerárquicas

Más detalles

Construcción y análisis de árboles filogenéticos. Antonio Gómez Tato

Construcción y análisis de árboles filogenéticos. Antonio Gómez Tato Construcción y análisis de árboles filogenéticos Antonio Gómez Tato Introducción Árboles filogenéticos Surgen a partir de la teoría de la evolución de Darwin. Son representaciones gráficas de las relaciones

Más detalles

Filogenias. Charles Darwin (1859)

Filogenias. Charles Darwin (1859) Filogenias Charles Darwin (1859) Filogenia Consiste en el estudio de las relaciones evolutivas entre diferentes grupos de organismos. Su inferencia implica el desarrollo de hipótesis sobre los patrones

Más detalles

Filogenias. Inferencia filogenética

Filogenias. Inferencia filogenética Filogenias Para Darwin la evolución es descendencia con modificación a partir de un único origen de la vida. Siguiendo esta idea, todos los taxa actuales tendrán algún tipo de parentesco más o menos cercano.

Más detalles

Filogenias. Jose Blanca COMAV institute bioinf.comav.upv.es

Filogenias. Jose Blanca COMAV institute bioinf.comav.upv.es Filogenias Jose Blanca COMAV institute bioinf.comav.upv.es Filogenias Estudio de las relaciones evolutivas Asumimos: Ancestro común Bifurcación Es habitual en las poblaciones y especies cercanas que no

Más detalles

Conceptos básicos de filogenética molecular

Conceptos básicos de filogenética molecular Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 18 de julio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Conceptos básicos de filogenética molecular 18 de julio del 2013 1 / 43 1 Conceptos básicos

Más detalles

UNIDAD 7: PROGRAMACIÓN EN R

UNIDAD 7: PROGRAMACIÓN EN R UNIDAD 7: PROGRAMACIÓN EN R Técnicas Inteligentes en Bioinformática Master en Lógica, Computación e Inteligencia Artificial Dpto. Ciencias de la Computación e Inteligencia Artificial Francisco J. Romero

Más detalles

MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN

MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN - Inferir una filogenia es un proceso de estimación. Se hace la mejor estimación de una historia evolutiva con base en la información

Más detalles

Modelos de mutación y filogenética molecular. Bioinformática, Kevin Yip-CSE-CUHK (Universidad china de Hong-Kong)

Modelos de mutación y filogenética molecular. Bioinformática, Kevin Yip-CSE-CUHK (Universidad china de Hong-Kong) Modelos de mutación y filogenética molecular Bioinformática, 6-4-16 Kevin Yip-CSE-CUHK (Universidad china de Hong-Kong) HOY 1. Distancia evolutiva y modelos de mutación 2. Árboles: Las estructuras jerárquicas

Más detalles

Elvira Mayordomo y Jorge Álvarez. Marzo - Abril de 2016

Elvira Mayordomo y Jorge Álvarez. Marzo - Abril de 2016 TRABAJO DE PRÁCTICAS Elvira Mayordomo y Jorge Álvarez Marzo - Abril de 2016 1 Introducción El trabajo de prácticas de la asignatura consistirá en que cada alumno realice por separado el trabajo que se

Más detalles

Análisis multivariado

Análisis multivariado Análisis multivariado -Las técnicas multivariadas permiten establecer relaciones de similitud global (o fenéticas) entre unidades de estudio, sobre la base de la evidencia que brindan sus caracteres -A

Más detalles

El método de máxima verosimilitud (ML) Introducción a la inferencia de filogenias moleculares (II) ML en filogenias (I) ML en filogenias (III)

El método de máxima verosimilitud (ML) Introducción a la inferencia de filogenias moleculares (II) ML en filogenias (I) ML en filogenias (III) Introducción a la inferencia de filogenias moleculares (II) David Posada@Universidad de Vigo El método de máxima verosimilitud (ML)! L = P(D H) = probabilidad de los datos dada una hipótesis.! Si tiramos

Más detalles

Alineamiento múltiple de secuencias

Alineamiento múltiple de secuencias Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 11 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento múltiple de secuencias 11 de junio del 2013 1 / 39 1 Alineamiento múltiple de

Más detalles

Tema 4: Alineamiento Múltiple y Filogenias (3)

Tema 4: Alineamiento Múltiple y Filogenias (3) Bioinformática lásica Bioinformática lásica ema 4: lineamiento Múltiple y Filogenias (3) Sección 3: Filogenias Dr. Oswaldo relles Universidad de Málaga La filogenia estudia las relaciones de parentesco

Más detalles

[ ] [ ] Lección 8. Análisis filogenético Bayesiano. Inferencia Bayesiana Introducción. Inferencia Bayesiana Máxima verosimilitud

[ ] [ ] Lección 8. Análisis filogenético Bayesiano. Inferencia Bayesiana Introducción. Inferencia Bayesiana Máxima verosimilitud Introducción Imagina una caja con 100 dados. Noventa de esos dados son insesgados o justos y 10 son sesgados. Las probabilidades de observar diferentes resultados al tirar los dados son: Lección 8. Análisis

Más detalles

Lección 1. Introducción a las filogenias moleculares. Relaciones entre organismos. Introducción Darwin. Introducción. Introducción Objetivos

Lección 1. Introducción a las filogenias moleculares. Relaciones entre organismos. Introducción Darwin. Introducción. Introducción Objetivos arwin stoy seguro de que llegará el tiempo, aunque yo no viva para verlo, en el que tendremos árboles genealógicos para cada reino de la Naturaleza - arta de arwin a Thomas Huxley, 87 a las filogenias

Más detalles

Caracteres moleculares

Caracteres moleculares PEDECIBA BIOLOGÍA - 2007 Sistemática Biológica: Métodos y Principios Alejandro D Anatro Caracteres moleculares Esquema para esta clase Generalidades Tipos de caracteres moleculares Particularidades del

Más detalles

Caracteres moleculares

Caracteres moleculares PEDECIBA BIOLOGÍA - 2007 Sistemática Biológica: Métodos y Principios Alejandro D Anatro Caracteres moleculares Esquema para esta clase Generalidades Tipos de caracteres moleculares Particularidades del

Más detalles

Programa Bioinformática. Máster en Biofísica

Programa Bioinformática. Máster en Biofísica Programa Bioinformática. Máster en Biofísica 2013 2014 Resumen del programa: El curso de bioinformática está finalizado a introducir las técnicas y las herramientas de la bioinformática que pueden ser

Más detalles

TEMA 2 : ANÁLISIS DE DATOS. TAXONOMÍA Y SISTEMÁTICA.

TEMA 2 : ANÁLISIS DE DATOS. TAXONOMÍA Y SISTEMÁTICA. TEMA 2 : ANÁLISIS DE DATOS. TAXONOMÍA Y SISTEMÁTICA. Taxonomía: ciencia que se encarga de dar nombre y clasificar los seres vivos. Sistemática: ciencia comparada que ordena los seres vivos según sus relaciones

Más detalles

Lección 3. Modelos de evolución molecular. Transiciones. Transversiones. Transiciones. Inferencia filogenética Mutación y substitución

Lección 3. Modelos de evolución molecular. Transiciones. Transversiones. Transiciones. Inferencia filogenética Mutación y substitución Mutación y substitución Mutación (µ: cambio de base en la secuencia de DN de evolución molecular Substitución (µ: mutación que se fija en una población (o especie P(substitución = Nºmutaciones * P(fijación

Más detalles

Filogenias moleculares (los métodos) Arturo Becerra Facultad de Ciencias, UNAM

Filogenias moleculares (los métodos) Arturo Becerra Facultad de Ciencias, UNAM Filogenias moleculares (los métodos) Arturo Becerra Facultad de Ciencias, UNAM abb@ciencias.unam.mx En estas horas: Las bases biológicas de las filogenias moleculares Las diferencias más importantes entre

Más detalles

Práctica 1: Alineamientos

Práctica 1: Alineamientos Práctica 1: Alineamientos Partimos de un archivo de datos que contiene 5 secuencias de mrna asociado a la CFTR http://madma.usc.es/cursoverano/materiales Abrimos el ClustalX en la carpeta C:\ClustalX de

Más detalles

Código de barras del ADN. Dra. Analía A. Lanteri División Entomología- Museo de La Plata

Código de barras del ADN. Dra. Analía A. Lanteri División Entomología- Museo de La Plata Código de barras del ADN Dra. Analía A. Lanteri División Entomología- Museo de La Plata CÓDIGO DE BARRAS DEL ADN Los genes están formados por EXONES (traducen a proteínas) y los INTRONES (no codificantes)

Más detalles

Lección 4. Métodos filogenéticos

Lección 4. Métodos filogenéticos Básico La inferencia filogenética es un campo per se del estudio de la evolución, en continuo movimiento y expansión. filogenéticos La inferencia filogenética es un procedimiento de estimación estadística.

Más detalles

Evolución de los seres vivos

Evolución de los seres vivos Unidad 1 Evolución de los seres vivos Tema 1: Taxonomía La biodiversidad es clasificada por la taxonomía se subdivide en para ello utiliza sistema jerárquico sistema binominal filogenia cladística Objetivos

Más detalles

Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia

Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Alineamiento: Análisis computacional de secuencias Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Por qué y para qué... Tengo una secuencia de DNA/Proteína......

Más detalles

UNIDAD 4: MATRICES, MARCOS DE DATOS Y LECTURA DE DATOS EN R

UNIDAD 4: MATRICES, MARCOS DE DATOS Y LECTURA DE DATOS EN R UNIDAD 4: MATRICES, MARCOS DE DATOS Y LECTURA DE DATOS EN R Técnicas Inteligentes en Bioinformática Máster en Lógica, Computación e Inteligencia Artificial Dpto. Ciencias de la Computación e Inteligencia

Más detalles

Herramientas moleculares

Herramientas moleculares MÁSTER UNIVERSITARIO EN BIODIVERSIDAD EN ÁREAS TROPICALES Y SU CONSERVACIÓN UNIVERSIDAD INTERNACIONAL MENÉNDEZ PELAYO Este documento puede utilizarse como documentación de referencia de esta asignatura

Más detalles

Rama. Las relaciones filogenéticas se pueden representar como una árbol filogenético. Partes de un árbol filogenético. Terminal (especies) A B C D E F

Rama. Las relaciones filogenéticas se pueden representar como una árbol filogenético. Partes de un árbol filogenético. Terminal (especies) A B C D E F Análisis Filogenético Una de las diferencias entre las teorías evolutivas de Lamarck y Darwin esta relacionada al origen de las especies. Mientras que Lamarck planteaba que el origen de las mismas era

Más detalles

Alineamiento de pares de secuencias

Alineamiento de pares de secuencias Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 30 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del 2013 1 / 61 1 Alineamiento de pares de secuencias

Más detalles

introducción a la cladística JUAN DIEGO DAZA

introducción a la cladística JUAN DIEGO DAZA introducción a la cladística JUAN DIEGO DAZA que es cladística? Cladística vine del griego antiguo κλάδος, klados = rama i.e. es la clasificación jeráquica de las especies basada en una filogenia o ancestría

Más detalles

1/19/11! Modelos de Sustitución y Selección de Modelos! Taller Latinoamericano de Evolución Molecular! 2011! 1. Distancias!

1/19/11! Modelos de Sustitución y Selección de Modelos! Taller Latinoamericano de Evolución Molecular! 2011! 1. Distancias! aller Latinoamericano de Evolución Molecular! 201 riterios de Optimización II! Máxima Verosimilitud! Modelos de Sustitución! 4. Matriz de Probabilidad de ransición - Matriz P(t)! 5. asas de Sustitución

Más detalles

Objetivos. Introducción a la inferencia de filogenias moleculares (I) Árboles filogenéticos. Bifurcaciones y multifurcaciones

Objetivos. Introducción a la inferencia de filogenias moleculares (I) Árboles filogenéticos. Bifurcaciones y multifurcaciones Objetivos Introducción a la inferencia de filogenias moleculares (I) avid Posada@Universidad de Vigo!omprender las ventajas y desventajas de los distintos métodos de reconstrucción filogenética.!saber

Más detalles

2008 Pablo Vinuesa, 1

2008 Pablo Vinuesa,  1 Introducción a la Inferencia Filogenética y Evolución Molecular 23-26 Junio 2008, Fac. C. Biológicas - UANL Pablo Vinuesa (vinuesa@ccg.unam.mx) Centro de Ciencias Genómicas-UNAM, México http://www.ccg.unam.mx/~vinuesa/

Más detalles

El ADN de cada individuo afectado o no, se analiza utilizando una variedad

El ADN de cada individuo afectado o no, se analiza utilizando una variedad LOS ESTUDIOS DE LIGAMIENTO PUEDEN MAPEAR GENES DE ENFERMEDADES CON UNA RESOLUCION DE ALREDEDOR DE 1 cm (centimorgan): 1cM =una región de 7.5 x 10 5 bases, pero en ese tamaño puede haber unos 50 genes distintos!

Más detalles

UNIDAD 3: FUNCIONES, VECTORES Y LISTAS EN R

UNIDAD 3: FUNCIONES, VECTORES Y LISTAS EN R UNIDAD 3: FUNCIONES, VECTORES Y LISTAS EN R Técnicas Inteligentes en Bioinformática Máster en Lógica, Computación e Inteligencia Artificial Dpto. Ciencias de la Computación e Inteligencia Artificial Francisco

Más detalles

El origen de los organismos multicelulares. Lineamientos fundamentales de la evolución de los fungi, los metazoarios, y las plantas vasculares

El origen de los organismos multicelulares. Lineamientos fundamentales de la evolución de los fungi, los metazoarios, y las plantas vasculares Unidad 2 Parte IV El origen de los organismos multicelulares. Lineamientos fundamentales de la evolución de los fungi, los metazoarios, y las plantas vasculares La biología Evolutiva estudia los procesos

Más detalles

Darwin: la evolución es descendencia con modificación

Darwin: la evolución es descendencia con modificación Curso de Evolución 2016 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ Tema 2. Las filogenias como contexto de análisis de la evolución. Métodos

Más detalles

Curso de Evolución 2017 Facultad de Ciencias Montevideo, Uruguay

Curso de Evolución 2017 Facultad de Ciencias Montevideo, Uruguay Curso de Evolución 2017 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ Tema 2. Las filogenias como contexto de análisis de la evolución. Métodos

Más detalles

Análisis Filogenético. Reconstrucción de las relaciones genealógicas entre taxa

Análisis Filogenético. Reconstrucción de las relaciones genealógicas entre taxa Análisis Filogenético Reconstrucción de las relaciones genealógicas entre taxa Una de las diferencias entre las teorías evolutivas de Lamarck y Darwin esta relacionada al origen de las especies. Mientras

Más detalles

Búsqueda de similitud en BD

Búsqueda de similitud en BD Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 4 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 4 de junio del 2013 1 / 37 1 Introducción Requerimientos para búsqueda en BD FASTA Comparación

Más detalles

DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS

DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS COMPARACION DE DOS ATPASAS DE PECES El DOT PLOT permite una visualización rápida de la similitud entre dos secuencias Inconvenientes: No identifica

Más detalles

TEMA 2.1. Breve introducción a las técnicas y métodos de reconstrucción filogenética

TEMA 2.1. Breve introducción a las técnicas y métodos de reconstrucción filogenética TM 21 reve introducción a las técnicas y métodos de reconstrucción filogenética ontacto: Virginia Valcárcel (virginiavalcarcel@uames) xisten diversos métodos de análisis para estimar reconstrucciones filogenéticas

Más detalles

Taxonomía y clasificación

Taxonomía y clasificación Taxonomía y clasificación Taxonomía vs. sistemática La Taxonomía es la ciencia que encargada de nombrar y clasificar los organismos. Sistemática es la ciencia que se encarga de determinar las relaciones

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento múltiple de secuencias Mario de J. Pérez Jiménez Luis Valencia Cabrera Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación

Más detalles

Evolución de los seres vivos

Evolución de los seres vivos Unidad 1 Evolución de los seres vivos Tema 1: Taxonomía La biodiversidad es clasificada por la taxonomía se subdivide en para ello utiliza sistema jerárquico sistema binominal filogenia cladística Objetivos

Más detalles

Clase 2. Introducción a la Sistemática Cladística

Clase 2. Introducción a la Sistemática Cladística Curso: Principios y métodos de la Sistemática Cladística. Clase 2. Introducción a la Sistemática Cladística Fernando Pérez-Miles Entomología, Facultad de Ciencias El método más utilizado Hennig 950 Grundrüge

Más detalles

Árboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010

Árboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010 Unidad 6: Árboles Filogenéticos BT7412, CC5702 Bioinformática Diego Arroyuelo 2 de noviembre de 2010 Temario (Introduction to Computational Molecular Biology Setubal y Meidanis Capítulo 6) 1. Introducción

Más detalles

Investigación en evolución

Investigación en evolución Investigación en evolución Análisis de secuencias de: nucleótidos en DNA (genómica) aminoácidos en Proteínas (proteómica) Comparación de secuencias de: nucleótidos aminoácidos Bioinformática Análisis de

Más detalles

Consenso: Hoy 3 temas. 2- evaluando los resultados. evolucion.fcien.edu.uy/sistematica/sistematica.htm

Consenso: Hoy 3 temas. 2- evaluando los resultados. evolucion.fcien.edu.uy/sistematica/sistematica.htm PEDECIBA BIOLOGÍA CURSO: SISTEMÁTICA BIOLÓGICA: MÉTODOS Y PRINCIPIOS Guillermo D Elía Hoy 3 temas 1- qué hacemos cuando al analizar una matriz obtenemos más de un árbol más óptimo? - consensos - pesos

Más detalles

Definición:Bioinformática

Definición:Bioinformática Bioinformática Definición:Bioinformática La bioinformática es el estudio del contenido y flujo de la información en sistemas y procesos biológicos. Requieren el uso o el desarrollo de diferentes técnicas

Más detalles

ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES

ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES ÁRBOL Un árbol es un grafo no dirigido, conexo, sin ciclos (acíclico), y que no contiene aristas

Más detalles

Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA

Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA Martin A. Lozano, Jaime Velasco-Medina Grupo de Bio-nanoelectrónica EIEE, Universidad del Valle, A.A. 25360, Cali, Colombia E-mail:

Más detalles

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento de secuencias de genes/proteínas

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento de secuencias de genes/proteínas TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento de secuencias de genes/proteínas Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia

Más detalles

UNIDAD 2: INTRODUCCIÓN AL LENGUAJE DE PROGRAMACiÓN R

UNIDAD 2: INTRODUCCIÓN AL LENGUAJE DE PROGRAMACiÓN R UNIDAD 2: INTRODUCCIÓN AL LENGUAJE DE PROGRAMACiÓN R Técnicas Inteligentes en Bioinformática Máster en Lógica, Computación e Inteligencia Artificial Dpto. Ciencias de la Computación e Inteligencia Artificial

Más detalles

Pablo Vinuesa 2007, 1

Pablo Vinuesa 2007,  1 Curso fundamenteal de Inferencia Filogenética Molecular Pablo Vinuesa (vinuesa@ccg.unam.mx) Progama de Ingeniería Genómica, CCG, UNAM http://www.ccg.unam.mx/~vinuesa/ Tutor: PDCBM, Ciencias Biológicas,

Más detalles

PRACTICA XI: ALINEAMIENTO POR TRADUCCION INVERSA Y ANALISIS FILOGENETICO POR EL CRITERIO DE DISTANCIAS

PRACTICA XI: ALINEAMIENTO POR TRADUCCION INVERSA Y ANALISIS FILOGENETICO POR EL CRITERIO DE DISTANCIAS PRACTICA XI: ALINEAMIENTO POR TRADUCCION INVERSA Y ANALISIS FILOGENETICO POR EL CRITERIO DE DISTANCIAS Objetivo: - Aplicar las técnicas para realizar el alineamiento de secuencias de DNA codificantes empleadas

Más detalles

UNIDAD 5: GRÁFICOS DE PUNTOS, LÍNEAS E HISTOGRAMS EN R

UNIDAD 5: GRÁFICOS DE PUNTOS, LÍNEAS E HISTOGRAMS EN R UNIDAD 5: GRÁFICOS DE PUNTOS, LÍNEAS E HISTOGRAMS EN R Técnicas Inteligentes en Bioinformática Master en Lógica, Computación e Inteligencia Artificial Dpto. Ciencias de la Computación e Inteligencia Artificial

Más detalles

Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada

Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Clustering Análisis de segmentación Prof. Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International

Más detalles

Árboles. Un grafo no dirigido es un árbol si y sólo si existe una ruta unica simple entre cualquiera dos de sus vértices.

Árboles. Un grafo no dirigido es un árbol si y sólo si existe una ruta unica simple entre cualquiera dos de sus vértices. ÁRBOLES Árboles Un grafo conectado que no contiene circuitos simples. Utilizados desde 1857, por el matemático Ingles Arthur Cayley para contar ciertos tipos de componentes químicos. Un árbol es un grafo

Más detalles

21/08/2014. Algunos puntos de la clase pasada. Filogenias usando distancias Caracteres. Métodos de inferencia filogenética. Árbol

21/08/2014. Algunos puntos de la clase pasada. Filogenias usando distancias Caracteres. Métodos de inferencia filogenética. Árbol Curso de Evolución 2014 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ Algunos puntos de la clase pasada filogenias como contexto de análisis, con

Más detalles

Tema 8: Teorema de Herbrand. Tableros en lógica de primer orden

Tema 8: Teorema de Herbrand. Tableros en lógica de primer orden Tema 8:. en de primer orden Dpto. Ciencias de la Computación Inteligencia Artificial Universidad de Sevilla Lógica Informática (Tecnologías Informáticas) Curso 2016 17 Contenido Sea Γ un conjunto de fórmulas

Más detalles

Alineamientos Bioinformática. Daniel M. Alberto M. Fernando M.

Alineamientos Bioinformática. Daniel M. Alberto M. Fernando M. Alineamientos Bioinformática Daniel M. Alberto M. Fernando M. Repasando Qué son los alineamientos? Repasando Qué son los alineamientos? Comparación de dos o más secuencias de DNA. Repasando Qué son los

Más detalles

Curso de Evolución 2016 Facultad de Ciencias Montevideo, Uruguay

Curso de Evolución 2016 Facultad de Ciencias Montevideo, Uruguay Curso de Evolución 2016 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ Tema 2. Las filogenias como contexto de análisis de la evolución. Métodos

Más detalles

I CURSILLO DE FILOGENIA PARA USUARIOS. SESIÓN 1 Recordatorio de conceptos básicos

I CURSILLO DE FILOGENIA PARA USUARIOS. SESIÓN 1 Recordatorio de conceptos básicos I CURSILLO DE FILOGENIA PARA USUARIOS SESIÓN 1 Recordatorio de conceptos básicos The power of phylogenies, by Lanna Jin WILLI HENNIG: FILOGENÉTICA WILLI HENNIG: FILOGENÉTICA Grundzüge einer Theorie der

Más detalles

MARCADORES GENÉTICOS

MARCADORES GENÉTICOS MARCADORES GENÉTICOS MARCADORES GENÉTICOS La diferencia entre individuos se denotaba señalando diferencias en su aspecto externo (fenotipo) Marcadores Morfológicos Carácter Informativo Variación POLIMORFISMO

Más detalles

Por regla general, las búsquedas con BLAST obedecen a uno de estos dos objetivos:

Por regla general, las búsquedas con BLAST obedecen a uno de estos dos objetivos: BLAST en el servidor del NCBI BLAST es la herramienta bioinformática más utilizada en todo el mundo. Compara una secuencia problema (query sequence) de nucleótidos o de proteínas con todas las secuencias

Más detalles

Redes Complejas. Inteligencia Colectiva y Sistemas de Recomendación Master Propio en Data Science y Big Data (II Edición: )

Redes Complejas. Inteligencia Colectiva y Sistemas de Recomendación Master Propio en Data Science y Big Data (II Edición: ) Redes Complejas Inteligencia Colectiva y Sistemas de Recomendación Master Propio en Data Science y Big Data (II Edición: 2017-2018) Qué es una red? Conjunto de puntos, algunos de ellos conectados mediante

Más detalles

Adyacencias generalizadas en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura

Adyacencias generalizadas en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura Edgar HERNÁNDEZ VENTURA CINVESTAV-Zacatenco 24 de Junio de 2010 Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24

Más detalles

ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN

ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN Jeffrey Vega Aguilar Facultad de Ciencias, Escuela de Biología, Sistemática, Universidad Industrial de Santander.

Más detalles

Técnicas de Minería de Datos

Técnicas de Minería de Datos Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.

Más detalles

Cátedra de Diversidad Biológica III FCEFyN-UNC Tutorial para utilizar el programa de computo TNT

Cátedra de Diversidad Biológica III FCEFyN-UNC Tutorial para utilizar el programa de computo TNT Cátedra de Diversidad Biológica III FCEFyN-UNC Tutorial para utilizar el programa de computo TNT Paso 1- Descargar el programa TNT (Tree analysis using New Technology): es un programa para realizar análisis

Más detalles

1/26/11! Taller Latinoamericano de Evolución Molecular! 2011! Relojes Moleculares:! Fechación de Clados con Datos Moleculares! EL RELOJ MOLECULAR!

1/26/11! Taller Latinoamericano de Evolución Molecular! 2011! Relojes Moleculares:! Fechación de Clados con Datos Moleculares! EL RELOJ MOLECULAR! Taller Latinoamericano de Evolución Molecular! 2011! Relojes Moleculares:! Fechación de Clados con Datos Moleculares! Prof. Susana Magallón! Enero 27, 2011! EL RELOJ MOLECULAR! La distancia genética entre

Más detalles

Tema 5: Algoritmos Genéticos

Tema 5: Algoritmos Genéticos Tema 5: Algoritmos Genéticos José Luis Ruiz Reina Miguel A. Gutiérrez Naranjo Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Inteligencia Artificial Búsqueda

Más detalles

Análisis y Complejidad de Algoritmos. Arboles Binarios. Arturo Díaz Pérez

Análisis y Complejidad de Algoritmos. Arboles Binarios. Arturo Díaz Pérez Análisis y Complejidad de Algoritmos Arboles Binarios Arturo Díaz Pérez Arboles Definiciones Recorridos Arboles Binarios Profundidad y Número de Nodos Arboles-1 Arbol Un árbol es una colección de elementos,

Más detalles

EVALUACION DEL EFECTO DE LA EVOLUCIÓN HETEROGENEA SITIO- ESPECIFICA SOBRE LA RECONSTRUCCIÓN FILOGENETICA MEDIANTE PARSIMONIA

EVALUACION DEL EFECTO DE LA EVOLUCIÓN HETEROGENEA SITIO- ESPECIFICA SOBRE LA RECONSTRUCCIÓN FILOGENETICA MEDIANTE PARSIMONIA EVALUACION DEL EFECTO DE LA EVOLUCIÓN HETEROGENEA SITIO- ESPECIFICA SOBRE LA RECONSTRUCCIÓN FILOGENETICA MEDIANTE PARSIMONIA INTRODUCCION La biología comparada estudia la diversidad de especies analizando

Más detalles

Tema 8: Teorema de Herbrand. Tableros en lógica de primer orden

Tema 8: Teorema de Herbrand. Tableros en lógica de primer orden Tema 8:. en de primer orden Dpto. Ciencias de la Computación Inteligencia Artificial Universidad de Sevilla Lógica Informática (Tecnologías Informáticas) Curso 2014 15 Contenido Sea Γ un conjunto de fórmulas

Más detalles

Análisis genético mediante secuenciación masiva. Biocomputación Grado en Bioquímica

Análisis genético mediante secuenciación masiva. Biocomputación Grado en Bioquímica Análisis genético mediante secuenciación masiva Biocomputación Grado en Bioquímica Motivación Existen diferentes situaciones que requieren la determinación del genotipo de un individuo Asesoramiento genético:

Más detalles

Biología Molecular y Filogenia en Micología

Biología Molecular y Filogenia en Micología Biología Molecular y Filogenia en Micología Biól. Nicolás Pastor Micología 2014 Por qué usar herramientas moleculares? Sistemática - Delimitación de especies Concepto filogenético de especie Diagnosis

Más detalles

Perfiles y modelos ocultos de Markov

Perfiles y modelos ocultos de Markov Perfiles y modelos ocultos de Markov Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 13 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Perfiles y modelos ocultos de Markov 13 de junio del 2013

Más detalles

Teoría de redes y optimización en redes

Teoría de redes y optimización en redes Teoría de redes y optimización en redes Pedro Sánchez Martín Contenidos Definiciones básicas Árbol generador mínimo de expansión Camino mínimo Algoritmo Dkstra Algoritmo Bellman-Ford Fluo máximo Fluo de

Más detalles

Biotecnología. Alineación de secuencias. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Biotecnología. Alineación de secuencias. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Biotecnología Alineación de secuencias Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Motivación Una vez localizado un gen Buscamos parecidos con genes de los que se

Más detalles

Evolución de secuencias de proteínas

Evolución de secuencias de proteínas Evolución de secuencias de proteínas Sustituciones múltiples 12 mutaciones Solo 3 cambios X * * * A B Se desechan los gaps n d n i Número de posiciones con Aa diferentes idénticos n d n i n p n / d n con

Más detalles

Curso de Inteligencia Artificial

Curso de Inteligencia Artificial Curso de Inteligencia Artificial Modelos Ocultos de Markov Gibran Fuentes Pineda IIMAS, UNAM Redes Bayesianas Representación gráfica de relaciones probabilísticas Relaciones causales entre variables aleatorias

Más detalles

Apellidos:... Nombre:...

Apellidos:... Nombre:... Apellidos:....................................... Nombre:........................................ Introducción a la Inteligencia Artificial 1 er Parcial de Teoría 12 Noviembre 2004 Ejercicio 1: Responder

Más detalles

Estadística Inferencial. Resúmen

Estadística Inferencial. Resúmen Ofimega - Estadística inferencial - 1 Estadística Inferencial. Resúmen Métodos y técnicas que permiten inducir el comportamiento de una población. Muestreo o selección de la muestra: 1. Aleatorio simple:

Más detalles

Filogenia y Sistemática

Filogenia y Sistemática Filogenia y Sistemática La Sistemática es la disciplina científica que estudia la diversidad y las relaciones de los seres vivos en un intento de construir un sistema ordenado de clasificación de los organismos,

Más detalles

Son una clase particular de los algoritmos evolutivos.

Son una clase particular de los algoritmos evolutivos. Algoritmos Genéticos (AGs) Los AGs son técnicas de resolución para problemas de Búsqueda Optimización Aprendizaje en máquinas Son una clase particular de los algoritmos evolutivos. Los AGs intentan resolver

Más detalles

Bioinformática Clásica

Bioinformática Clásica Tema 4: Alineamiento Múltiple y Filogenias (1) Sección 1: Alineamiento Múltiple Dr. Oswaldo Trelles Universidad de Málaga El alineamiento múltiple de secuencias (AM) es con frecuencia el punto de partida,

Más detalles

Maestría en Bioinformática Probabilidad y Estadística: Clase 13

Maestría en Bioinformática Probabilidad y Estadística: Clase 13 Maestría en Bioinformática Probabilidad y Estadística: Clase 13 Gustavo Guerberoff gguerber@fing.edu.uy Facultad de Ingeniería Universidad de la República Mayo de 2010 Contenidos 1 Hidden Markov Models

Más detalles

El ADN y sus posibles modificaciones

El ADN y sus posibles modificaciones El ADN y sus posibles modificaciones Nuestro Genoma está compuesto aproximadamente por 3.000.000.000 de letras llamadas bases de ADN o nucleótidos (Adenina, Guanina, Citosina y Timina), hoy se sabe que

Más detalles

Algoritmos Genéticos. Introducción a la Robótica Inteligente. Álvaro Gutiérrez 20 de abril de

Algoritmos Genéticos. Introducción a la Robótica Inteligente. Álvaro Gutiérrez 20 de abril de Algoritmos Genéticos Introducción a la Robótica Inteligente Álvaro Gutiérrez 20 de abril de 2016 aguti@etsit.upm.es www.robolabo.etsit.upm.es Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos

Más detalles