ATCG GCG A-CG ACG ACG ACG. Lección 2. Alineamiento de secuencias. Substitución. Inserción. Alineamiento Mutación. Alineamiento Inserción
|
|
- Benito Marín Mora
- hace 7 años
- Vistas:
Transcripción
1 Mutación de secuencias urso nálisis filogenético Máster de Bioestadística 26 Universidad de Santiago de ompostela Marzo 26 Substitución Inserción Substitución - Inserción diferencia 2 correspondencias diferencias 3 correspondencias gap 2
2 Delección Homología posicional - diferencias 3 correspondencias gap -2 Delección Un alineamiento de secuencias no es más que una hipótesis sobre la homología posicional de los caracteres moleculares. Implica la identificación de indeles (indel = inserción-delección) 26 * 28 * 3 * 32 84r : : r : : r : : r : : r : : 282 ph2f : : 36 cag ttgcctactcctttggg ac correspondencia ( match ) gap - diferencia ( mismatch ) Método de matrices de puntos (I) El método de matrices de puntos (ibbs and McIntyre 97) es una herramienta gráfica para la comparación de dos secuencias. Se coloca un punto dónde las secuencias coinciden y luego se traza la ruta del alineamiento. óptimo El alineamiento óptimo es aquél en el que el número de diferencias y gaps es mínimo. Secuencia : Secuencia 2: Diagonal con punto = match Diagonal sin punto = mismatch Horizontal = gap (arriba) Vertical = gap (izquierda) * * (I) - - diferencias 7 correspondencias gaps (II) 5 diferencias * * * * * 4 correspondencias - - gap (III) - 2 diferencias * * 6 correspondencias gaps Pero la optimalidad siempre depende del coste de los diferentes eventos.
3 linear implica decicidir - indel 3 cambios - indel cambio - indel cambio indel cambio oste indel = oste cambio = oste indel = oste cambio = indeles cambios Penalizaciones en alineamientos Para comparar gaps y correspondencias establecemos: Penalización de gap ( gap penalty ) Penalización de diferencia ( mismatch penalty ) Indíce de disimilitud: D = y i = número de diferencias de tipo i m i = penalización de la diferencia de tipo i z k = número de gaps de longitud k w k = penalización por gaps de longitud k! m i y i +! w k z k oste indel = oste cambio = 2 oste indel = oste cambio = 3 Indíce de similitud: x = número de correspondencias z k = número de gaps de longitud k w k = penalización por gaps de longitud k S = x! " w k z k Penalizaciones de gaps Penalización de la substitución nucleotídica Se suelen asumir dos componentes en las penalizaciones de los gaps (w k ): oste por apertura (a) - oste por extensión (e) Puede haber diferentes costes para las diferentes substituciones en la secuencia de DN, por ejemplo: Hay varios sistemas posibles de penalización: Fijo: sin coste por extensión; w k es constante (k es la longitud) Linear: w k = a + e! (k - ) Logarítmico: el coste de extensión incrementa logarítmicamente con k 2 D =! m i y i +! w k z k
4 Penalización del remplazamiento aminoacídico Matrices PM 2 símbolos en vez de 4 Diferentes aminoácidos difieren en distinto número de substituciones: isteína -> irosina = UU -> UU isteína -> Metionina = UU -> U Poseen propiedades bioquímica y físicas muy diferentes Se utilizan matrices de puntuación como PM (Dayhoff et al. 978) y BLOSUM (Henikoff and Henikoff, 992) Las matrices PM ( percent accepted mutation ) indican la probabilidad de que un aminoácido sea remplazado por otro a lo largo de un intervalo de tiempo. PM es el tiempo transcurrido para que se produzcan diferencias del %. Se estimaron los reemplazamientos aminoacídicos ocurridos a partir de 572 cambios en 7 grupos de proteínas con al menos un 85% de similitud. ada sitio ha cambiado como mucho una vez Es sencillo construir árboles filogenéticos, y así estimar los reemplazamientos Los valores de PM se pueden elevar para obtener matrices más adecuadas para secuencias más divergentes: PM % identidad Probabilidad i <->j = log (tasa de mutación observada i <->j / tasa de mutación esperada a partir de las frecuencias aminoacídicas) (estos valores están multiplicados por ) Un valor de +2 implica que esperamos que el cambio ocurra.2 =.6 veces de forma más frecuente que por azar PM Matrices BLOSUM R N D Q E H I L K M F P S W Y V 2 R -2 6 N 2 D Q E H I L K M F P S W Y V Derivadas de muchos alineamientos locales de dominios proteicos de 3-6 aa ( blocks substitution matrices ) Dentro de los bloques se agrupan secuencias que son más similares que un cierto valor umbral (p.e., 62%), en una secuencia consenso. Se comparan pares de secuencias y se tabulan las co-ocurrencias de los aminoácidos día de hoy se utilizan las matrices BLOSUM ya que : No asumen que todos los sitios mutan con la misma tasa Fueron derivados con muchos más datos que las PM Fueron derivadascon varios tipos de proteínas (PM -> globulares) Pueden ser utilizadas con secuencias más divergentes Blosum62 es una matrix muy utilizada por defecto.
5 ipos de alineamiento lobal vs. local: se alinean las secuencias en todas su extensión, o se realizan alineamientos de fragmentos Por parejas vs. múltiple: se alinean secuencias de dos en dos, o más de dos simultáneamente. lgoritmo de Needleman-Wunsch (97) global de dos secuencias arantiza el alineamiento óptimo(s) dado los parámetros de alineamiento Utiliza programación dinámica: fraccionar el problema en pequeños subproblemas independientes onstruimos una matriz de costes posibles que se trazan hacia atrás para buscar el alineamiento óptimo. Exactos vs Heurísticos: se obtiene siempre el alineamiento óptimo (Needleman- Wunsch (97) [global], Smith-Waterman (98) [local])) o se intenta buscar el mejor (BLS -basado en SW8), FS) OSES (diagonal) correspondencia = (diagonal) diferencia = 2 (vertical u horizontal) indel = lgoritmo de Needleman-Wunsch (97) lgoritmo de Needleman-Wunsch (97) OSES (diagonal) correspondencia = (diagonal) diferencia = 2 (vertical u horizontal) indel = oste del alineamiento =
6 lgoritmo de Smith-Waterman (98) Significación de un alineamiento El algoritmo de Needleman-Wunsch es inapropiado para alinear un fragmento pequeño con una secuencia grande -> penalización por gaps en regiones externas Smith-Waterman realizan varias modificaciones al algoritmo de Needleman- Wunsch para poder alinear localmente: La primera fila y columna de la matriz se componen de ceros. Hay un cuarto tipo de paso: terminación de región Empieza el trazado restrospectivo desde el valor óptimo, esté dónde esté. Es el coste del alineamiento menor que el esperado por azar? leatorizar una de las secuencias y realinear múltiples veces para construir la distribución nula del coste de alineamientos al azar. En el caso de base de datos, éstas mismas proporcionan la población control. Valor-Z = (media - coste) / desviación estándar Z! 5 suelen ser significativos P = probabilidad de que el alineamiento no sea mejor que un alineamiento al azar P " - ajuste perfecto - " P " -5 secuencias casi idénticas -5 " P " - secuencias muy relacionadas -5 " P " - secuencias distantes P > - probablemente no significativo La zona de penumbra de alineamientos de proteinas está en el 8-% de identidad Mioglobina de esperma de ballena y legahemoglobina del lupino: 5% identidad. Estructuras 3D similares. Son homólogos distantes Secuencias N y terminal de la rodanesa: % identidad. Parálogos. Quimotripsina y subtilisina: 2% identidad. No homólogas. BLS Es la herramienta más popular para búsquedas en bases de datos ( Basic Local Sequence lignment ool ) Para este propósito es mucho más rápida que el algoritmo de Smith-Waterman Busca regiones cortas de correspondencia entre nuestra secuencia ( query ) y cada una de las secuencias de la base de datos. Una vez que ha identificado una región con un buen ajuste, trata de extenderla EJEMPLO EJE JEM EMP MPL PLO JEM JM JVM JLM JE etc. Repetir con 4 letras JEMP JMP JVMP JLMP JP etc. Repetir con 5 letras Programas BLS BL2SEQ - Permite crear el alineamiento local heurístico de dos secuencias nucleotídicas o proteicas BL2SEQX - Permite crear el alineamiento local heurístico de una secuencias nucleotídicas con una proteica BLSP - Usa una secuencia proteica para sondear una base de datos de proteínas BLSN - Usa una secuencia proteica para sondear una base de datos de secuencias de DN que han sido traducidas a proteínas. BLSN - Usa una secuencia nucleotídica para sondear una base de datos de secuencias de DN BLSX - Usa una secuencia nucleotídica traducida a proteína para sondear una base de datos de proteínas BLSX - Usa una secuencia nucleotídica traducida a proteína para sondear una base de datos de secuencias de DN que han sido traducidas a proteínas. Score = 55.5 bits (32), Expect = 2e-3 Identities = 33/ (3%), Positives = 58/ (52%), aps = 7/ (6%) Query: 3 YRKQSQILKEHMDKVIPLPELVMFHISLSQ--EVNNHSNKEYIFQISNNW Q L+ D+ + + V + + S +VN + +++Y+FQI++ W Sbjct: 3 FRLVQELRRLFDEL-MSNWVLVENESRFDKIKVNKNSRDYLFQINDKYW 6 Query: 6 EKQEDVNSVILSKFLDDDIDDIEKKILQLPELY--WKH L DDI+ KKI WK H Sbjct: 62 S--KPKDNVNQLLDDISVKKIYKRHKFDWYWKNH 9
7 Significación del sondeo de una base de datos Similar a la significación de los alineamientos La misma base de datos proporciona la población control. Valor-E: es el número esperado se secuencias que resultan en el mismo o mejor valor-z si la base datos se sondea con una secuencia al azar. Depende del tamaño de la base de datos. E ".2 secuencias probablemente homólogas.2 " E " la homología no se puede descartar P > esperado por azar múltiple Necesario para la estimación filogenética En el caso de proteínas pueden permitir inferencias estructurales Zonas conservadas: centro activo Zonas ricas en indeles: lazos superficial minoácidos hidrofóbicos cada 2 posiciones: cadena " superficial minoácidos hidrofóbicos cada 4 posiciones: hélice Muy complicado, la programación dinámica podría ser utilizada en teoría, pero no en la práctica. El alineamiento progresivo utiliza alineamiento en pares de forma iterativa, comenzando por las secuencias más relacionada. Se trata de una solución heurística que no garantiza el coste óptimo. Database ID Name Score Evalue Bsub_gene 6787 NP_ Bsub_gene NP_ tra_gene NP_ El programa lustalw lustalw es el programa más popular para alinear secuencias Los tres pasos básicos de programa LUSL W los comparten todos los métodos de alineamiento progresivo : alcula una matriz de distancias basándo en distancias entre secuencias alineadas a pares Usa esta matriz para construir un árbol guía Usa este árbol para construir un alineamiento de forma progresiva lustalw: familia de las tripsinas. omputa los alineamientos de todas la parejas Sequences (2:3) ligned. Score: 82 Sequences (4:5) ligned. Score: 65 Sequences (2:4) ligned. Score: 67 Sequences (4:6) ligned. Score: 62 Sequences (2:5) ligned. Score: 67 Sequences (4:7) ligned. Score: 68 Sequences (2:6) ligned. Score: 6 Sequences (4:8) ligned. Score: 5 Sequences (2:7) ligned. Score: 67 Sequences (4:9) ligned. Score: 5 Sequences (2:8) ligned. Score: 53 Sequences (4:) ligned. Score: 53
8 lustalw: familia de las tripsinas 2. onvierte los alineamientos de parejas en distancias lustalw: familia de las tripsinas 3. onstruye el árbol guía (NJ) a partir de las distancias Sequences (2:3) ligned. Score: 82 Sequences (4:5) ligned. Score: 65 Sequences (2:4) ligned. Score: 67 Sequences (4:6) ligned. Score: 62 Sequences (2:5) ligned. Score: 67 Sequences (4:7) ligned. Score: 68 Sequences (2:6) ligned. Score: 6 Sequences (4:8) ligned. Score: 5 Sequences (2:7) ligned. Score: 67 Sequences (4:9) ligned. Score: 5 Sequences (2:8) ligned. Score: 53 Sequences (4:) ligned. Score: 53 lustalw: familia de las tripsinas 4. Progresivamente, desde las puntas del árbol hacia atrás, alinea las secuencias derivadas de cada nodo del árbol. ligning... roup : Sequences: 2 Score:489 roup 2: Sequences: 3 Score: roup 3: Sequences: 4 Score:488 roup 4: Sequences: 2 Score:465 roup 5: Sequences: 5 Score:424 roup 6: Sequences: 7 Score:4 roup 7: Sequences: 2 Score:487 roup 8: Sequences: 3 Score:467 roup 9: Sequences: 4 Score:433 roup : Sequences: Score:422 lignment Score 76 lustalw: familia de las tripsinas EEI-II ----PRILMRKQDSDLVPN-FSP Ii_Mutant ----PRLLMRKQDSDLVPN-F-- BDI-II ---RPRILMRKRDSDLVQKN-Y-- MeI-B ---VPRILMKKDRDLKRN-Y-- MI-IV HEERVPRILMKKKDSDLEVLEH-Y-- SI-IIB ---MVPKILMKKHDSDLLDVLEDIYVS MRI-I ---IPRILMEKRDSDLQVKRQ-Y-- rypsin ---RIPRIWMERDSDMKIV--H-- IR_MOMH ---RSPRIWMERDSDMKIV--H-- MI- ---RIPRIWMEKRDSDMQIVD--H-- LI-III ---RIPRILMESSDSDLEILEN-F-- onsensus **:: *.*. * **: * *.**
9 Opciones de lustal W lustal X lustal permite jugar con varios parámetros - Matrix de puntuación (PM, Blosum, ti/tv, ) - pertura de gap - Extensión de gap - aps de proteínas (loops, residuos,etc) - Penalizaciones relacionadas con la estructura secundaria Produce alineamientos razonables en un amplio rango de condiciones Pero no es infalible: conviene revisar lustal X BioEdit
10 Blocks
Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia
Alineamiento: Análisis computacional de secuencias Andrés M. Pinzón Centro de Bioinformática Instituto de Biotecnología Universidad Nacional de Colombia Por qué y para qué... Tengo una secuencia de DNA/Proteína......
Más detallesDOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS
DOT PLOT: VISUALIZACIÓN DE LA SIMILITUD ENTRE DOS SECUENCIAS COMPARACION DE DOS ATPASAS DE PECES El DOT PLOT permite una visualización rápida de la similitud entre dos secuencias Inconvenientes: No identifica
Más detallesAplicaciones guiadas: Blast. Genome Browsers.
Curso de Formación UEB Herramientas Bioinformáticas para la Investigación Biomédica 1 r bloque (20/06/2012) Introducción a la Bioinformática y a las Bases de Datos 3 a sesión Aplicaciones guiadas: Blast.
Más detallesBiotecnología. Alineación de secuencias. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Biotecnología Alineación de secuencias Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Motivación Una vez localizado un gen Buscamos parecidos con genes de los que se
Más detallesTÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias
TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento múltiple de secuencias Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial
Más detallesAlineamiento múltiple de secuencias
Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 11 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento múltiple de secuencias 11 de junio del 2013 1 / 39 1 Alineamiento múltiple de
Más detallesBúsqueda de similitud en BD
Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 4 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 4 de junio del 2013 1 / 37 1 Introducción Requerimientos para búsqueda en BD FASTA Comparación
Más detallesTÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias
TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento múltiple de secuencias Mario de J. Pérez Jiménez Luis Valencia Cabrera Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación
Más detallesComparación de secuencias
Comparación de secuencias Por qué nos interesa comparar secuencias de ADN o proteínas de distintos orígenes? Cómo se pueden alinear secuencias? Alineamiento de secuencias Dos tipos de alineamientos Alineamiento
Más detallesTÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento de secuencias de genes/proteínas
TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Alineamiento de secuencias de genes/proteínas Mario de J. Pérez Jiménez Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia
Más detallesBLAST: Búsqueda de homologías. 13/06/10 J.L. Mosquera, I. Ortega i A. Sánchez 1
BLAST: Búsqueda de homologías 13/06/10 J.L. Mosquera, I. Ortega i A. Sánchez 1 Outline - Motivación - Alineamiento por parejas - Sistemas de puntuación - Matrices de substitución (PAM, BLOSUM) - BLAST
Más detallesAlineamientos de Secuencias. CeCalCULA - C.P.T.M. Mérida. Venezuela.
Alineamientos de Secuencias Análisis comparativo El alineamiento de secuencias es similar a otros tipos de análisis comparativo. En ambos es necesario cuantificar las similitudes y diferencias (scoring)
Más detallesAlineamiento de pares de secuencias. Rodrigo Santamaría
Alineamiento de pares de secuencias Rodrigo Santamaría Alineamiento de pares de secuencias Introducción Definiciones Ejemplo Algoritmos Matrices de puntuación 2 Objetivo Determinar si una secuencia de
Más detallesAlineamiento local: búsqueda de homologías
Alineamiento local: búsqueda de homologías Supongamos que el material de partida para realizar una búsqueda de homologías no es un gen o una proteína completos y bien caracterizados de los que podamos
Más detallesObjetivos. Introducción a la inferencia de filogenias moleculares (I) Árboles filogenéticos. Bifurcaciones y multifurcaciones
Objetivos Introducción a la inferencia de filogenias moleculares (I) avid Posada@Universidad de Vigo!omprender las ventajas y desventajas de los distintos métodos de reconstrucción filogenética.!saber
Más detallesInvestigación en evolución
Investigación en evolución Análisis de secuencias de: nucleótidos en DNA (genómica) aminoácidos en Proteínas (proteómica) Comparación de secuencias de: nucleótidos aminoácidos Bioinformática Análisis de
Más detallesAlineamiento de pares de secuencias
Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 30 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Alineamiento de pares de secuencias 30 de mayo del 2013 1 / 61 1 Alineamiento de pares de secuencias
Más detallesDiseño de un Procesador para el Alineamiento Global de Secuencias de DNA
Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA Martin A. Lozano, Jaime Velasco-Medina Grupo de Bio-nanoelectrónica EIEE, Universidad del Valle, A.A. 25360, Cali, Colombia E-mail:
Más detallesPor regla general, las búsquedas con BLAST obedecen a uno de estos dos objetivos:
BLAST en el servidor del NCBI BLAST es la herramienta bioinformática más utilizada en todo el mundo. Compara una secuencia problema (query sequence) de nucleótidos o de proteínas con todas las secuencias
Más detallesSimilitud de Secuencias: de un Par a Todas contra Todas
Similitud de Secuencias: de un Par a Todas contra Todas Ricardo Baeza-Yates Centro de Investigación de la Web Depto. de Ciencias de la Computación Universidad de Chile ricardo@baeza.cl Resumen Similitud
Más detallesBIOINFORMÁTICA. Vicente Arnau Llombart. Técnicas Avanzadas de Inteligencia Artificial.
BIOINFORMÁTICA Vicente Arnau Llombart Técnicas Avanzadas de Inteligencia Artificial. http://www.uv.es/~varnau/taia_2011-12.htm E-mail: Vicente.Arnau@uv.es BIOINFORMÁTICA Clase 2ª: Análisis de secuencias
Más detalles2008 Pablo Vinuesa, 1
Introducción a la Inferencia Filogenética y Evolución Molecular 23-26 Junio 2008, Fac. C. Biológicas - UANL Pablo Vinuesa (vinuesa@ccg.unam.mx) Centro de Ciencias Genómicas-UNAM, México http://www.ccg.unam.mx/~vinuesa/
Más detallesProgramación Dinámica
Programación Dinámica La técnica de programación dinámica se aplica en general a problemas de optimización. l igual que "dividir y conquistar", el problema es dividido en subproblemas de tamaños menores
Más detallesPerfiles y modelos ocultos de Markov
Perfiles y modelos ocultos de Markov Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 13 de junio del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) Perfiles y modelos ocultos de Markov 13 de junio del 2013
Más detallesLección 4. Métodos filogenéticos
Básico La inferencia filogenética es un campo per se del estudio de la evolución, en continuo movimiento y expansión. filogenéticos La inferencia filogenética es un procedimiento de estimación estadística.
Más detallesAlineamientos Bioinformática. Daniel M. Alberto M. Fernando M.
Alineamientos Bioinformática Daniel M. Alberto M. Fernando M. Repasando Qué son los alineamientos? Repasando Qué son los alineamientos? Comparación de dos o más secuencias de DNA. Repasando Qué son los
Más detallesAlgoritmos de alineamiento optimo para pares de secuencias
Algoritmos de alineamiento optimo para pares de secuencias Alex Sánchez & Esteban Vegas 1 Alineamientos óptimos Una vez fijado un sistema de puntuación Matriz de substitución (Identidad, PAMx, BLOSUMx,
Más detallesANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN
ANÀLISIS FENOMENOLÓGICO DE CARACTERES ESTRUCTURALES DE PROTEÍNAS PARA SU USO EN CLASIFICACIÓN Jeffrey Vega Aguilar Facultad de Ciencias, Escuela de Biología, Sistemática, Universidad Industrial de Santander.
Más detallesLección 3. Modelos de evolución molecular. Transiciones. Transversiones. Transiciones. Inferencia filogenética Mutación y substitución
Mutación y substitución Mutación (µ: cambio de base en la secuencia de DN de evolución molecular Substitución (µ: mutación que se fija en una población (o especie P(substitución = Nºmutaciones * P(fijación
Más detallesMétodos de alineamiento. Bioinformática, Elvira Mayordomo
Métodos de alineamiento Bioinformática, 16-2-17 Elvira Mayordomo Motivación: 2 razones para comparar secuencias biológicas 1. Los errores y omisiones en los datos biológicos producidos en la extracción
Más detallesMétodos de alineamiento. Bioinformática, Elvira Mayordomo
Métodos de alineamiento Bioinformática, 24-2-16 Elvira Mayordomo Motivación: 2 razones para comparar secuencias biológicas 1. Los errores y omisiones en los datos biológicos producidos en la extracción
Más detallesBioinformática Clásica Tema 3: Análisis de Secuencias (2) Algoritmia
Tema 3: Análisis de Secuencias (2) Algoritmia Dr. Oswaldo Trelles ots@ac ac.uma.es En la presentación definimos algunos conceptos básicos sobre el análisis de secuencias: que las secuencias se almacenan
Más detallesBioinformática Clásica
Tema 4: Alineamiento Múltiple y Filogenias (1) Sección 1: Alineamiento Múltiple Dr. Oswaldo Trelles Universidad de Málaga El alineamiento múltiple de secuencias (AM) es con frecuencia el punto de partida,
Más detallesBÚSQUEDA DE SECUENCIAS PARECIDAS (Similarity search)
BÚSQUEDA DE SECUENCIAS PARECIDAS (Similarity search) Cuando los proyectos de secuenciación genómica descubren una nueva secuencia biológica es muy poco lo que se sabe de ella. Por ese motivo, una de las
Más detallesIntroducción a la Bioinformática Alineamiento de secuencias Búsqueda de secuencias en bases de datos
Introducción a la Bioinformática lineamiento de secuencias Búsqueda de secuencias en bases de datos Fernán güero Instituto de Investigaciones Biotecnológicas Universidad Nacional de San Martín 1 Fernán
Más detallesProgramación Dinámica
Programación Dinámica Es aplicada típicamente a problemas de optimización, donde puede haber muchas soluciones, cada una tiene un valor asociado y prentendemos obtener la solución con valor óptimo. Al
Más detallesElvira Mayordomo y Jorge Álvarez. Marzo - Abril de 2016
TRABAJO DE PRÁCTICAS Elvira Mayordomo y Jorge Álvarez Marzo - Abril de 2016 1 Introducción El trabajo de prácticas de la asignatura consistirá en que cada alumno realice por separado el trabajo que se
Más detallesComparación de secuencias de ADN y proteínas Matriz de puntos Alineamientos de secuencias
Comparación de secuencias de ADN y proteínas Matriz de puntos Alineamientos de secuencias Supongamos dos secuencias actuales (A y B), con un ancestro comun (X), es decir, homólogas: X A B........... Mutaciones:
Más detallesTema 4: Alineamiento Múltiple y Filogenias (3)
Bioinformática lásica Bioinformática lásica ema 4: lineamiento Múltiple y Filogenias (3) Sección 3: Filogenias Dr. Oswaldo relles Universidad de Málaga La filogenia estudia las relaciones de parentesco
Más detalles[ ] [ ] Lección 8. Análisis filogenético Bayesiano. Inferencia Bayesiana Introducción. Inferencia Bayesiana Máxima verosimilitud
Introducción Imagina una caja con 100 dados. Noventa de esos dados son insesgados o justos y 10 son sesgados. Las probabilidades de observar diferentes resultados al tirar los dados son: Lección 8. Análisis
Más detallesMétodos de alineamiento (3) Bioinformática, Elvira Mayordomo
Métodos de alineamiento (3) Bioinformática, 7-3-16 Elvira Mayordomo Hoy veremos Multialineamiento (MSA): Un problema NP-completo Algoritmo aproximado para Multialineamiento: el método de la estrella Métodos
Más detallesPablo Vinuesa 2007, 1
Curso fundamenteal de Inferencia Filogenética Molecular Pablo Vinuesa (vinuesa@ccg.unam.mx) Progama de Ingeniería Genómica, CCG, UNAM http://www.ccg.unam.mx/~vinuesa/ Tutor: PDCBM, Ciencias Biológicas,
Más detallesAnálisis de proteínas
Análisis de proteínas Qué determina su estructura? Composición de las proteínas Las proteínas son polímeros de aminoácidos que se unen mediante una unión peptídica Todos los aminoácidos tienen un grupo
Más detallesAnálisis de secuencias biológicas
Capítulo 8 Análisis de secuencias biológicas Álvaro Sebastián 8.1. Introducción Las secuencias son a la biología como las palabras al lenguaje. Normalmente representamos complejos polímeros orgánicos como
Más detallesComparación de secuencias de ADN y proteínas Matriz de puntos Alineamiento global
Comparación de secuencias de ADN y proteínas Matriz de puntos Alineamiento global a) Las dos secuencias son idénticas en la parte alineada. b) Las dos secuencias muestran un desemparejamiento debido a
Más detallesBacktracking: Esquema General
Backtracking Idea: Técnica para recorrer sistemáticamente todas las posibles configuraciones de un espacio asociado a soluciones candidatos de un problema computacional. Se puede pensar este espacio tiene
Más detallesPARTE II: ALGORÍTMICA
Programa de teoría Parte I. Estructuras de Datos.. Abstracciones y especificaciones.. Conjuntos y diccionarios.. Representación de conjuntos mediante árboles. 4. Grafos. Parte II. Algorítmica.. Análisis
Más detallesLAB 1 LAB 1/2. Estadística descriptiva. Pruebas de neutralidad. Mismatch distribution. Tajima Fu MacDonald-Kreitman
LAB 1 Estadística descriptiva Pruebas de neutralidad Tajima Fu MacDonald-Kreitman Mismatch distribution LAB 1/2 1-numero de sitios segregantes en una muestra numero de sitios Tajima, 1989 : Var se puede
Más detallesRegresión ponderada y falta de ajuste
Capítulo 4 Regresión ponderada y falta de ajuste 4.1. Introducción En este capítulo se presentan la regresión ponderada y la prueba de falta de ajuste como un conjunto adicional de herramientas usadas
Más detallesGenómica comparada. Brown 2002, págs
Genómica comparada 1. Teoría neutralista de la evolución molecular 2. Sustituciones nucleotídicas sinónimas y no-sinónimas. Interpretación de la razón Ka/Ks. 3. Duplicaciones y el destino de los genes
Más detallesTÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Evolución Molecular y Filogenia
TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA Evolución Molecular y Filogenia Ignacio Pérez Hurtado de Mendoza Grupo de investigación en Computación Natural Dpto. Ciencias de la Computación e Inteligencia Artificial
Más detallesBúsqueda en línea y Búsqueda multiagente
Búsqueda en línea y Búsqueda multiagente Ingeniería Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani 1 Tema 2: Agentes basados en Búsqueda Resumen: 2. Agentes basados
Más detallesBioestadística y uso de software científico TEMA 4 DATOS CATEGÓRICOS COMPARACIÓN DE PROPORCIONES
Bioestadística y uso de software científico TEMA 4 DATOS CATEGÓRICOS COMPARACIÓN DE PROPORCIONES Índice Tablas de contingencia y grados de libertad Ji-cuadrado Comparación de proporciones Tabla 2x2 Diferencia
Más detallesCódigo de barras del ADN. Dra. Analía A. Lanteri División Entomología- Museo de La Plata
Código de barras del ADN Dra. Analía A. Lanteri División Entomología- Museo de La Plata CÓDIGO DE BARRAS DEL ADN Los genes están formados por EXONES (traducen a proteínas) y los INTRONES (no codificantes)
Más detallesPrograma de teoría. Algoritmos y Estructuras de Datos II. 3. Algoritmos voraces. 1. Análisis de algoritmos 2. Divide y vencerás
Programa de teoría Algoritmos y Estructuras de Datos II 1. Análisis de algoritmos 2. Divide y vencerás 3. Algoritmos voraces 4. Programación dinámica 5. Backtracking 6. Ramificación y poda A.E.D. II 1
Más detallesDAMBE - DR. XUHUA XIA
DAMBE - DR. XUHUA XIA DAMBE es un programa que fue escrito por el Dr. Xuhua Xia de distribución gratuita (http://dambe.bio.uottawa.ca/dambe.asp) y nos sirve para trabajar con diferentes datos acerca de
Más detallesAlineamientos de múltiples secuencias. Rodrigo Santamaría
Alineamientos de múltiples secuencias Rodrigo Santamaría Alineamientos de múltiples secuencias Introducción Motivación Definición Usos Algoritmos Benchmarking Visualización Bases de Datos 2 Introducción
Más detallesModelos de Markov ocultos Profile HMM. Alex Sánchez. Departament d Estadística U.B. 1. Estadística i Bioinformàtica. MMO en Biologia Computacional
Modelos de Markov ocultos Profile HMM Departament d Estadística U.B. Estadística i Bioinformàtica Esquema del tema Alineamientos múltiples de secuencias (AMS) Representaciones de AMS: Patrones y Perfiles
Más detallesde aas grupo hemo asociado Citocromo C (humano) grupo hemo unido covalentemente Albúmina (humana) 550 Apolipoproteína B (humana) 4536
Proteínas. Formadas por una o más cadenas polipeptídicas de más de 100 aminoácidos. La estructura primaria de las proteínas es la secuencia de aminoácidos, que está codificada por los genes correspondientes;
Más detallesTipos de gráficos disponibles
Tipos de gráficos disponibles Microsoft Office Excel admite muchos tipos de gráficos para ayudarle a mostrar datos de forma comprensible para su audiencia. Cuando crea un gráfico o cambia el tipo de uno
Más detallesProgramación Dinámica
Programación Dinámica Adaptado de Algorithm Design Goodrich and Tamassia Programación Dinámica 1 Calculando la serie de Fibonacci 1,1,2,3,5,8,13,21,. fib(n) = 1 si n = 0,1 fib(n 1) + fib(n 2) o.c. Programación
Más detallesMATEMÁTICAS DE 2º BACHILLER APLICADAS A LAS CIENCIAS SOCIALES
MATEMÁTICAS DE 2º BACHILLER APLICADAS A LAS CIENCIAS SOCIALES BLOQUE DE ÁLGEBRA Editorial SM TEMA 1: MATRICES Concepto de matriz Dimensión de una matriz Tipos de Matrices: o Matriz fila o Matriz columna
Más detallesSistemas Inteligentes. Tema B2T7: Algoritmo de Viterbi. Estimación de modelos de Markov.
Sistemas Inteligentes Escuela Técnica Superior de Informática Universitat Politècnica de València Tema BT7: Algoritmo de Viterbi. Estimación de modelos de Markov. DSIC UPV: Octubre, 8 SIN-TemaBT7 índice
Más detallesESTUDIO COMPARATIVO DE ALGORITMOS INDIZADOS PARA BÚSQUEDA APROXIMADA EN TEXTO
ESTUDIO COMPARATIVO DE ALGORITMOS INDIZADOS PARA BÚSQUEDA APROXIMADA EN TEXTO Javier Bustos Jiménez Departamento de Ciencias de la Computación (DCC) Universidad de Chile. jbustos@dcc.uchile.cl ESTUDIO
Más detallesPablo Vinuesa 2007, 1
Biología Genómica y Evolución IV - Inferencia Filogenética y Evolución Molecular Semestre 2007-1 Pablo Vinuesa (vinuesa@ccg.unam.mx) Progama de Ingeniería Genómica, CCG-UNAM, México http://www.ccg.unam.mx/~vinuesa/
Más detallesPablo Vinuesa 2011, 1
Introducción a la Filoinformática Instituto de Ecología, UNAM, 9-11 de Septiembre del 2011 Pablo Vinuesa (vinuesa@ccg.unam.mx) Centro de Ciencias Genómicas UNAM http://www.ccg.unam.mx/~vinuesa/ http://www.ccg.unam.mx/~vinuesa/filoinfo_ie11/
Más detallesDadas dos secuencias, X = (x 1 x 2 x m ) e Y = (y 1 y 2 y n ), encontrar la forma de alinearlas con un coste mínimo.
Análisis y Diseño de Algoritmos Aplicaciones Aplicaciones Bioinformática: Alineación de secuencias de ADN Ingeniería del Software: Detección de clones (fragmentos de código duplicado) Procesamiento del
Más detallesFASTQC. taller de Herramientas para el Análisis de Secuencias y proteínas 2016
FASTQC taller de Herramientas para el Análisis de Secuencias y proteínas 2016 *Basado en manual https://biof-edu.colorado.edu/videos/dowell-short-read-class/day-4/fastqc-manual FastQC genera un reporte
Más detallesLección 1. Introducción a las filogenias moleculares. Relaciones entre organismos. Introducción Darwin. Introducción. Introducción Objetivos
arwin stoy seguro de que llegará el tiempo, aunque yo no viva para verlo, en el que tendremos árboles genealógicos para cada reino de la Naturaleza - arta de arwin a Thomas Huxley, 87 a las filogenias
Más detallesPRACTICA V: ALINEAMIENTO POR METODOS HEURISTICOS Y ANÁLISIS ESTADÍSTICO DE LAS PUNTACIONES DE LOS ALINEAMIENTOS.
PRACTICA V: ALINEAMIENTO POR METODOS HEURISTICOS Y ANÁLISIS ESTADÍSTICO DE LAS PUNTACIONES DE LOS ALINEAMIENTOS. Objetivo general: Ø Conocer y aplicar las técnicas de alineamiento heurístico así como las
Más detallesHerramientas moleculares
MÁSTER UNIVERSITARIO EN BIODIVERSIDAD EN ÁREAS TROPICALES Y SU CONSERVACIÓN UNIVERSIDAD INTERNACIONAL MENÉNDEZ PELAYO Este documento puede utilizarse como documentación de referencia de esta asignatura
Más detallesGráficos de columnas. Excel Guía de ejercicios Informática 1. Universidad Nacional de Ezeiza
Microsoft Office Excel 2007 admite muchos tipos de gráficos para ayudarle a mostrar datos de forma comprensible para su audiencia. Cuando crea un gráfico o cambia el tipo de uno existente, puede seleccionar
Más detallesESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detallesTeoría de las decisiones y de los juegos Asignatura: Profesores: Sjaak Hurkens y Flip Klijn Examen: 6 de febrero de 2008
Teoría de las decisiones y de los juegos Asignatura: 50 Profesores: Sjaak Hurkens y Flip Klijn Examen: 6 de febrero de 008 Observaciones: Versión: Duración: 3 horas Documentos autorizados: ninguno Teléfonos
Más detallesTEMA. Conformación tridimensional de proteínas Niveles estructurales Tipos de enlaces y fuerzas que estabilizan estas estructuras
TEMA Conformación tridimensional de proteínas Niveles estructurales Tipos de enlaces y fuerzas que estabilizan estas estructuras Primaria Terciaria Cuaternaria Secundaria NIVELES ESTRUCTURALES DE LAS PROTEÍNAS
Más detallesEl método de máxima verosimilitud (ML) Introducción a la inferencia de filogenias moleculares (II) ML en filogenias (I) ML en filogenias (III)
Introducción a la inferencia de filogenias moleculares (II) David Posada@Universidad de Vigo El método de máxima verosimilitud (ML)! L = P(D H) = probabilidad de los datos dada una hipótesis.! Si tiramos
Más detallesExplicación de la tarea 8 Felipe Guerra
Pruebas de bondad de ajuste de χ 2 Explicación de la tarea 8 Felipe Guerra Las pruebas de bondad de ajuste corresponden a una comparación entre la distribución de una muestra aleatoria y una distribución
Más detallesMAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN
MAXIMA PARSIMONIA EN LA INFERENCIA FILOGENÉTICA DE SECUENCIAS DE ADN - Inferir una filogenia es un proceso de estimación. Se hace la mejor estimación de una historia evolutiva con base en la información
Más detallesDinámica Molecular de Proteínas Modelado y Simulación Computacional
Dinámica Molecular de Proteínas Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do cuatrimestre 2017 Escuela de Ciencia y Tecnología UNSAM Dinámica Molecular de
Más detallesTécnicas de aprendizaje sobre series temporales
Técnicas de aprendizaje sobre series temporales Contenido 1. Motivación. 2. Ejemplo del Problema. 3. Aproximaciones al problema de clasificación de series temporales. 4. Aprendizaje de reglas. 5. Boosting
Más detallesLección 10. Aplicaciones filogenéticas en epidemiogía
Epidemiología filogenéticas en epidemiogía Curso Análisis filogenético Máster de Bioestadística 26 Universidad de Santiago de Compostela Marzo 26 La epidemiología estudia el origen, distribución, frecuencia,
Más detallesGRADO DE BIOQUÍMICA Y BIOLOGÍA MOLECULAR. ASIGNATURA: BIOINFORMÁTICA (6 Créditos)
GRADO DE BIOQUÍMICA Y BIOLOGÍA MOLECULAR ASIGNATURA: BIOINFORMÁTICA (6 Créditos) OBJETIVOS 1.- Familiarizar al alumno con los recursos disponibles en los principales portales bioinformáticos disponibles
Más detallesUniversidad Autónoma de Nuevo León Facultad de Ciencias Biológicas Licenciado en Biotecnología Genómica
Universidad Autónoma de Nuevo León Facultad de Ciencias Biológicas Licenciado en Biotecnología Genómica 1. Datos de identificación Universidad Autónoma de Nuevo León Nombre de la institución y de la dependencia:
Más detallesProgramación dinámica
Parte de Algoritmos de la asignatura de Programación Master de Bioinformática Programación dinámica Web asignatura: http://dis.um.es/~domingo/algbio.html E-mail profesor: domingo@um.es Transparencias preparadas
Más detallesÍNDICE GENERAL ÍNDICE DE FIGURAS ÍNDICE DE TABLAS INDICE DE GRÁFICOS RESUMEN SUMMARY I. INTRODUCCIÓN 1
ÍNDICE GENERAL Página ÍNDICE GENERAL ÍNDICE DE FIGURAS ÍNDICE DE TABLAS INDICE DE GRÁFICOS RESUMEN SUMMARY i iv vii viii ix x I. INTRODUCCIÓN 1 I.1 Consideraciones Generales 1 I.1.1 Flavonoides 1 I.2 Biosíntesis
Más detallesGRADO DE BIOQUÍMICA Y BIOLOGÍA MOLECULAR. ASIGNATURA: BIOINFORMÁTICA (6 Créditos)
GRADO DE BIOQUÍMICA Y BIOLOGÍA MOLECULAR ASIGNATURA: BIOINFORMÁTICA (6 Créditos) OBJETIVOS 1.- Familiarizar al alumno con los recursos disponibles en los principales portales bioinformáticos disponibles
Más detallesPrograma Bioinformática. Máster en Biofísica
Programa Bioinformática. Máster en Biofísica 2013 2014 Resumen del programa: El curso de bioinformática está finalizado a introducir las técnicas y las herramientas de la bioinformática que pueden ser
Más detallesUniversidad Autónoma de Nuevo León Facultad de Ciencias Biológicas Licenciado en Biología
Universidad Autónoma de Nuevo León Facultad de Ciencias Biológicas Licenciado en Biología 1. Datos de identificación Universidad Autónoma de Nuevo León Nombre de la institución y de la dependencia: Facultad
Más detallesCaracteres moleculares
PEDECIBA BIOLOGÍA - 2007 Sistemática Biológica: Métodos y Principios Alejandro D Anatro Caracteres moleculares Esquema para esta clase Generalidades Tipos de caracteres moleculares Particularidades del
Más detallesCaracteres moleculares
PEDECIBA BIOLOGÍA - 2007 Sistemática Biológica: Métodos y Principios Alejandro D Anatro Caracteres moleculares Esquema para esta clase Generalidades Tipos de caracteres moleculares Particularidades del
Más detallesPruebas estadís,cas para evaluar relaciones
Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la
Más detallesMatemáticas Discretas TC1003
Matemáticas Discretas TC13 Matrices: Conceptos y Operaciones Básicas Departamento de Matemáticas ITESM Matrices: Conceptos y Operaciones Básicas Matemáticas Discretas - p. 1/25 Una matriz A m n es un arreglo
Más detallesCONTENIDOS MÍNIMOS Y ESTÁNDARES DE APRENDIZAJE EVALUABLES IMPRESCINDIBLES PARA SUPERAR LA MATERIA
DEPARTAMENTO DE MATEMÁTICAS Área: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II Curso: 2º Bach CCSS CONTENIDOS MÍNIMOS Y ESTÁNDARES DE APRENDIZAJE EVALUABLES IMPRESCINDIBLES PARA SUPERAR LA MATERIA
Más detallesContenidos de matemáticas del Curso Propedéutico. I. Funciones: lineales, exponenciales, periódicas. II. Diferenciación numérica, Series de Taylor
El siguiente temario resume los conocimientos de Matemáticas y Estadística que se que se espera en los candidatos a ingresar al programa de Maestría en Ciencias Ambientales del Instituto Potosino de Investigación
Más detallesArchivos Indice. Indexación y. Asociación. Conceptos Básicos Indices Ordenados Arboles. Asociación. Docente: Albert A.
Docente: Albert A. Osiris Sofía 1º Cuatrimestre 2002 Conceptos Básicos Indices Ordenados Arboles Asociación Indexación y Asociación Archivos Indice 1 2 3 1 Archivos Indice Ordenados Asociativos Primario
Más detallesEfectos de los alineamientos
Efectos de los alineamientos Una evaluación empírica mediante el método de parsimonia con alineamientos implícitos generados por POY vs los alineamientos ClustalW en topologías de mamíferos. Claudia Infante
Más detalles3. Introducción a la microevolución. Variación genética. Equilibrio Hardy-Weinberg y factores que producen desviaciones del mismo.
Curso de Evolución 2016 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ G. H. Hardy W. Weinberg 3. Introducción a la microevolución. Variación genética.
Más detalles