Elvira Mayordomo y Jorge Álvarez. Marzo - Abril de 2016

Documentos relacionados
TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES TRABAJO DE PRÁCTICAS. Convocatoria de junio de 2013

Conceptos básicos de filogenética molecular

Tema 2 Introducción a la Programación en C.

Algoritmos. Diagramas de Flujo. Informática IV. L. S. C. Heriberto Sánchez Costeira

TEMA 4. PROCESO UNIFICADO

Asignaturas antecedentes y subsecuentes

Manual de Usuario. Aplicación de Autoevaluación de Centros

4ta. Práctica. Búsqueda en árbol con contrincante: MiniMax con poda Alfa-Beta. Inteligencia Artificial Prácticas 2004/2005

CRITERIOS DE SELECCIÓN DE MODELOS

2007/ PROGRAMACIÓN. Tipo: TRO Curso: 1 Semestre: AB CREDITOS Totales TA TS AT AP PA OBJETIVOS. 1.-Introducción.

UNIVERSIDAD AUTÓNOMA DE YUCATÁN FACULTAD DE MATEMÁTICAS

TECNICO SUPERIOR EN INFORMÁTICA EMPRESARIAL MÓDULO INTRUCCIONAL

Manual de Instrucciones Definición de Componentes y Registro de Notas Parciales

CRITERIOS DE EVALUACIÓN DE 3º y 4º DE ESO CRITERIOS GENERALES DE EVALUACIÓN ESO

SISTEMAS OPERATIVOS MONOPUESTO 1. CONTENIDOS MÍNIMOS PARA LA EVALUACIÓN POSITIVA

TEMPORALIZACIÓN Y SECUENCIACIÓN DE CONTENIDOS

Definición:Bioinformática

SERVICIO NACIONAL DE APRENDIZAJE SENA SISTEMA INTEGRADO DE GESTIÓN Procedimiento Ejecución de la Formación Profesional Integral GUÍA DE APRENDIZAJE

Aprendizaje Automatizado

GUIA 2: Repaso sobre uso de C#. Funciones, métodos y arreglos.

CRITERIOS DE EVALUACIÓN DE 1º Y 2º DE ESO CRITERIOS GENERALES DE EVALUACIÓN ESO

Biología Molecular y Filogenia en Micología

MATERIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II INSTRUCCIONES Y CRITERIOS GENERALES DE CALIFICACIÓN

Informe de Reporte Ejemplo. Análisis de. Aptitudes

BLOQUE I: HOJA DE CÁLCULO

EJERCICIO COLABORATIVO SOBRE MUTACIÓN DE ADN MITOCONDRIAL EN PELO

Diseño y Desarrollo Web. Espinola Raul 2008 basado en una Presentación de G. Gaona.

7ª Práctica. Matlab página 1 EJERCICIO 1. ORDENAR UN VECTOR CON EL MÉTODO DE LA BURBUJA...1

PROYECTO 2 Parte 1 BASES DE DATOS. Curso (2 Semestre) Grupos 4F2M y 4F1M-1 (aula 5102) CONSULTAS REMOTAS EN JAVA A UNA BASE DE DATOS

Fila: Es un conjunto de varias celdas dispuestas en sentido horizontal.

Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.

Profesor(a): Ing. Miriam Cerón Brito

Formulación del problema de la ruta más corta en programación lineal

CC3001 Algoritmos y Estructuras de Datos Tarea 1: Algoritmos simples de ordenación

Microsoft Project 2013

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Redacción de Reivindicaciones de Patentes de Productos Agroquímicos

TEMA 1: SISTEMAS MODELADOS POR ECUACIONES DIFERENCIALES EN INGENIERÍA QUÍMICA. CLASIFICACIÓN. GENERALIDADES.

Qué es un programa informático?

PROGRAMACIÓN CURSOS INTERCAMBIA Año académico

ESTRUCTURA DEL EXAMEN DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II PARA ALUMNOS DE BACHILLERATO

PRACTICUM II CUARTO CURSO DE GRADO DE EDUCACIÓN INFANTIL Y DE EDUCACIÓN PRIMARIA CURSO

SESION 12 LA DISTRIBUCIÓN BINOMIAL

MICROSOFT ACCESS 2010 FÁCIL

Nombre de la asignatura: Diseño Estructurado de Algoritmos. Carrera: Ingeniería en Sistemas Computacionales. Clave de la asignatura: SCB-9316

INGENIERÍA EN ENERGÍA RENOVABLE EN COMPETENCIAS PROFESIONALES ASIGNATURA DE CÁLCULO APLICADO

cuevogenet Paralelización en CUDA de la Dinámica Evolutiva de Redes Génicas Dirigido por: Fernando Díaz del Río José Luis Guisado Lizar

ALGORITMO MINIMAX. o Nodo: Representa una situación del juego. o Sucesores de un nodo: Situaciones del juego a las que se

Valor esperado: ejemplo

INDICE Prologo Capitulo 1. Algoritmos y programas Capitulo 2. La resolución de los problemas con computadoras y las herramientas de programación

ORIENTACIONES PARA LAS PRUEBAS DE ACREDITACIÓN B1 y B2 DE INGLÉS y FRANCÉS

Escala San Martín. InstruccIones para la aplicación InformátIca. Evaluación de la Calidad de Vida de Personas con Discapacidades Significativas

Manual del candidato. Aplicación Gestsol para la convocatoria de interinos

PARTE COMÚN MATERIA: FUNDAMENTOS DE MATEMÁTICAS

PLANIFICACIÓN DE LA UNIDAD DIDÁCTICA 4. TÍTULO DE LA UNIDAD La energía mecánica y sus aplicaciones en la vida diaria

ELABORACIÓN DE UN SISTEMA INFORMÁTICO PARA SOPORTE DE LA VIGILANCIA ENTOMOLÓGICA PARA SU APLICACIÓN EN CUATRO DIRECCIONES DE SALUD

Introducción a las RdP. Optimización basada en redes de Petri. Redes de Petri. Son objeto de estudio: RdP. Ejemplos:

EL RUIDO Y SU EVALUACIÓN

Estadística: Conceptos Básicos, Tablas y Gráficas. Dra. Noemí L. Ruiz Limardo Revisado 2011 Derechos de Autor Reservados

Práctica 3. Paso de parámetros entre subrutinas. 3. Consideraciones sobre el paso de parámetros

Universidad Nacional Autónoma de Nicaragua UNAN-Managua. Curso de Investigación de Operaciones

Algoritmos Genéticos. Introducción a la Robótica Inteligente. Álvaro Gutiérrez 20 de abril de

Retículos y Álgebras de Boole

EXAMEN EXTRAORDINARIO Informática y Computación IV

Aulas Virtuales Introducción a la Docencia en Línea. Creando un Syllabus (Programa de Curso) en Línea

Introducción a la Bioinformática

Relación de prácticas de la asignatura METODOLOGÍA DE LA PROGRAMACIÓN Segundo Cuatrimestre Curso º Grado en Informática

APUNTADORES. Un apuntador es un objeto que apunta a otro objeto. Es decir, una variable cuyo valor es la dirección de memoria de otra variable.

Diseño de un Procesador para el Alineamiento Global de Secuencias de DNA

MANUAL DE LABORATORIO DE FÍSICA GENERAL 9ª Edición EXPERIENCIA N 02

Tema II: Metodología para la construcción de programas. Profesora: Nelly García Mora

Breve introducción a la Investigación de Operaciones

Intel lanza su procesador Caballero Medieval habilitado para Inteligencia Artificial

Proyecto 2: recorridos sobre grafos y componentes conexas

SISTEMAS INFORMÁTICOS PROGRAMACION I - Contenidos Analíticos Ing. Alejandro Guzmán M. TEMA 2. Diseño de Algoritmos

Diagramas De Casos De Uso

Reporte de la prueba de habilidad

SEXTO CERTAMEN DEL SUR INCUBADORA DE SONDEOS Y EXPERIMENTOS BASES DEL CERTAMEN

INSTRUCCIONES PARA EL CIERRE DEL PLAN DE FORMACIÓN DEL CENTRO Curso (10/05/2013)

SOLICITUD DE PREINSCRIPCIÓN EN TÍTULOS PROPIOS UNIVERSIDAD REY JUAN CARLOS CURSO ACADÉMICO

TEMA 7: INGENIERIA DEL SOFTWARE.

TEORÍA DE MECANISMOS ANÁLISIS DE MECANISMOS POR ORDENADOR

Contrato de clase para: CALCULO DIFERENCIAL

PLAN DE TRABAJO. Después de concluir las actividades correspondientes a esta etapa del curso, el participante será capaz de:

TEMA 2 FRACCIONES MATEMÁTICAS 2º ESO

NUEVAS TECNOLOGÍAS APLICADAS A LA EDUCACIÓN. MICROSOFT OFFICE: WORD, POWERPOINT Y EXCEL.

UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I CARRETERAS

Práctica 5: Implementación en C++ de sistemas cliente/servidor basados en comunicación

1.4.1 Inicio de la computadora por primera vez Hay problemas Causas, síntomas y soluciones a posibles averías...

MARIA. -Plan de Estudios- Doctorado en Informática

I. PRERREQUISITOS Para más información acerca de los prerrequisitos de este curso, por favor refiérase al Academic Course Catalog.

NORMATIVA ESPECÍFICA DEL TRABAJO FIN DE GRADO GRADO EN INGENIERÍA ELECTRÓNICA

Autómatas Deterministas. Ivan Olmos Pineda

Conocimientos previos

Pontificia Universidad Católica del Ecuador

UNIVERSIDADES PÚBLICAS DE LA COMUNIDAD DE MADRID

TÉCNICO SUPERIOR UNIVERSITARIO EN ENERGIAS RENOVABLES ÁREA CALIDAD Y AHORRO DE ENERGÍA EN COMPETENCIAS PROFESIONALES

El presente documento pretende ser una guía de estilo de la memoria del Trabajo Fin de Grado (en lo sucesivo TFG).

Modelado y simulación de sistemas dinámicos

Requerimientos de Software

Transcripción:

TRABAJO DE PRÁCTICAS Elvira Mayordomo y Jorge Álvarez Marzo - Abril de 2016 1 Introducción El trabajo de prácticas de la asignatura consistirá en que cada alumno realice por separado el trabajo que se describe en las siguientes secciones. Además de los resultados de cada parte, el alumno deberá realizar una memoria breve que contenga las decisiones tomadas, los pasos realizados (con las herramientas y argumentos aplicados) y las conclusiones extraídas al final de cada fase. El tiempo total no debería ser superior las 3 siguientes sesiones de prácticas, a las cuales puede asistir el alumno si lo desea para consultar dudas a los profesores o realizar el trabajo en el laboratorio (la asistencia no es obligatoria). 2 Detalles del trabajo a realizar El alumno deberá realizar el trabajo que se describe a continuación, el cual se ha dividido en 4 fases o secciones. 2.1 Obtención de la información biológica Los alumnos podrán elegir entre los siguientes tipos de secuencias a la hora de realizar el trabajo: ˆ Gen neuraminidase del virus de la gripe (influenza.tar.gz) ˆ Gen tubg1 de distintas especies (tubg1.tar.gz) ˆ Proteína del gen mitocondrial ND5 de distintas especies (nd5.tar.gz) 1

Los ficheros comprimidos correspondientes a cada conjunto de datos contienen un fichero.rep que contiene información relativa a la descarga de las secuencias, y un fichero.gb (formato GENBANK) y otro.fasta con las secuencias específicas y su información biológica. 2.2 Multialineamiento Aunque se traten de fragmentos, las mutaciones y errores de secuenciación ya comentados en anteriores prácticas y en clase hacen que las secuencias no se puedan estudiar en muchos casos tras su descarga, lo que requiere un alineamiento previo. En esta parte el alumno deberá elegir la herramienta y parámetros que considere más adecuados para el tipo de datos seleccionados y el resultado deseado, teniendo en cuenta los siguientes criterios que tomarán parte de la evaluación de esta parte del trabajo: 1. La longitud final del alineamiento con respecto a la secuencia de mayor longitud del conjunto. 2. Adecuación de los argumentos utilizados a los datos de entrada (por ejemplo, utilizar addfragments con Mafft no tendría sentido). 3. Coste temporal (algo razonable, no se pretende que el alumno tenga el ordenador varias horas trabajando para reducir en 1 ó 2 la longitud del alineamiento final). 2.3 Detección de mutaciones y errores de secuenciación El estudio de mutaciones y cómo estas pueden afectar en menor o mayor medida al individuo (normalmente influyendo o causando alguna enfermedad genética) se puede hacer de diversas formas. Una de ellas es mediante el estudio del índice de conservación: si un nucleótido aparece en la misma posición en muchas secuencias (habitualmente observando distintas especies) es muy probable que una mutación en dicha posición afecte de forma mucho más negativa al individuo, que una mutación en una posición donde la variedad de nucleótidos es mayor. Además, este estudio no requiere de información adicional, como podría ser un árbol filogenético, sino que simplemente se basa en el estudio del alineamiento generado en la fase anterior. 2

Para ello el alumno deberá implementar un algoritmo en dos fases 1 : 1. Calcular la frecuencia de cada nucleótido para cada posición del alineamiento, aplicando la siguiente fórmula: f v (i) = n v (i) /n (i), donde v es cada nucleótido, i es cada posición (columna) del alineamiento, n v (i) es el número de secuencias en las que aparece el nucleótido v en la posición i, y n (i) es el número de secuencias en las que en la posición i hay un nucleótido 2. 2. Calcular la medida de conservación para cada posición según el método de entropía: C (i) = 4 v=1 f v (i) ln (f v (i)) Se valorará la eficiencia de la implementación así como el informe final con la información recopilada tras la aplicación del algoritmo. El lenguaje de programación a utilizar así como el entorno es libre, aunque se recomienda que el programa pueda ser probado en cualquier entorno y equipo (o que se incluyan en la memoria instrucciones claras y precisas de cómo ejecutarlo). El programa deberá adjuntarse a la memoria (como un fichero separado), por lo que se aconseja que el código sea legible y comprensible. 2.4 Construcción de una filogenia Una filogenia o árbol filogenético es una representación gráfica sencilla del proceso de evolución que puede seguir un conjunto de especies o secuencias biológicas. Para ello se utiliza una representación basada en una estructura de árbol (normalmente binario) como las que se explica en el grado de informática, donde los nodos representan individuos o secuencias, y las ramas una mutación o conjunto de mutaciones que sufre un nodo para evolucionar al siguiente. Las hojas del árbol suelen representar individuos pertenecientes a la época actual, mientras que los nodos internos representan a los ancestros del conjunto. Los algoritmos desarrollados para contruir filogenias han sido categorizados como NP-duros, por lo que todas las herramientas software existentes se basan en heurísticas, obteniendo un resultado aceptado con un coste de tiempo razonable. Dos de las herramientas más usadas para la construcción 1 Para más información sobre este método, el alumno puede consultar el artículo http://bioinformatics.oxfordjournals.org/content/17/8/700.long 2 Recordad que el gap no es un nucleótido! 3

http://www.nature.com/nature/journal/v496/n7445/images/nature12027-f1.2.jpg de árboles filogenéticos son FastTree (http://www.microbesonline.org/ fasttree/) y RAxML (http://sco.h-its.org/exelixis/web/software/ raxml/index.html). Estas dos herramientas aplican el método de máxima verosimilitud, que se basa en modelos matemáticos (conocidos como modelos evolutivos) para inferir la distribución del conjunto de secuencias a lo largo de un árbol. Será necesario estudiar ambas herramientas y evular su comportamiento y resultado al modificar el modelo evolutivo aplicado. Para poder evaluar cuán óptimo es un árbol, estas herramientas suelen devolver, además del árbol en formato NEWICK, su puntuación con el identificador Log-likelihood score. El alumno deberá adjuntar a la memoria el mejor árbol evolutivo obtenido junto con la herramienta y parámetros usados. 4

3 Entrega de la práctica La práctica debe ser entregada hasta el viernes 6 de mayo mediante envío por correo electrónico de un fichero comprimido (preferiblemente.zip) a elvira@unizar.es Dicho fichero comprimido debe contener al menos: ˆ Una memoria detallada del trabajo realizado (preferiblemente en formato PDF) incluyendo tareas realizadas, pruebas y conclusiones. ˆ El código de los programas realizados. ˆ Un fichero de comandos o instrucciones detalladas para probar el código entregado. 5