NCBI - BLAST. 1. Uso de Entrez

Documentos relacionados
Práctico prueba de ensamblaje con Galaxy

Herramientas de Bioinformática en NGS

Análisis y anotación de una secuencia mediante las herramientas y bases de datos de UCSC Genome Bioinformatics & Galaxy

Introducción al análisis de datos RNA- Seq con Galaxy y la suite Cufflinks

USER MANUAL LOGAN CAM VIEW FOR PC LOGAN CAM VIEW PARA PC English / Español

TP GENOMA HUMANO. Medicina Molecular, Maestría en Biología Molecular Médica, 2011

Curso RNA-seq Ejercicios prácticos Ana Conesa UBA, Noviembre 2013

Análisis genético usando datos de secuenciación masiva. Michael Hackenberg

Búsqueda de secuencias en Bases de Datos.

Uso del visor de genomas GBrowse (Genome Browser) (Ejercicio 2)

Introducción al NCBI

OPTIMIZACIÓN DEL PREPROCESAMIENTO DE LECTURAS DE SECUENCIACIÓN DE NUEVA GENERACIÓN

GUIA RÁPIDA PERFECTSCREEN (LEDSTUDIO)

Cargar entradas planificadas del proveedor en el Monitor de pronóstico de pedidos ES

Cargar entradas planificadas por el proveedor en OFM ES

Hallando genes y explorando la página del gen (Ejercicio 1)

EJERCICIOS DE BIOINFORMÁTICA

PROCESO ETL (EXTRACCIÓN TRANSFORMACIÓN Y CARGA)

Historia de revisiones

Manual para Cambio de Apariencia en Acrobat Reader DC. Change of Appearance in Acrobat Reader DC

Por regla general, las búsquedas con BLAST obedecen a uno de estos dos objetivos:

Confirmar orden de compra utilizando el Método de transferencia de archivos ES

Elaboración de contenidos educativos digitales. Guía sobre Prezi

Tutorial Programa Oziexplorer

MANUAL DE INSTALACIÓN Y USO DE FBackup

copia de Seguridad manual de usuario instalación servidor Linux XXXXXXXX

MANUAL DE USUARIO: SOFTWARE MIGRADOR DE SCRIPTS.SQL ORACLE PARA BASES DE DATOS SQLSERVER EN LA EMPRESA EXPINN TECHNOLOGY

DAMBE - DR. XUHUA XIA

Intercambio de datos. Importar y exportar con TILOS. Daniel Busquet;Christine Hsui AVANCE REAL

WebForms con LeadTools

Instalación de Point Linux versión 3.2

EL GENOMA HUMANO VISTO POR ENSEMBL

Trabajando con documentos

Hasta el momento hemos visto ejemplos de aplicación de Data Provider que requieren acceder a la base de datos para recuperar información.

Añadir para firmar digitalmente documentos EDE. Add digital signatures to EDE documents

Effective EDGE for Professionals Outlook 2010 Steps Guide

Cmap toools MAPAS CONCEPTUALES

Ingreso Creación de usuarios para profesor Agregar productos a su cuenta Contenido Planeación Crear Clases...

OPENOFFICE IMPRESS. Uso básico Basic usage

Bioinformática. Pregunta 1: (Bases de datos bibliográficos) Genes de enfermedades

Formularios dinámicos

Rawel E. Luciano B Sistema Operativo III. 3- Configuración de la NIC. José Doñe

Gestion de Plan de Cuentas

Correos electrónicos: Página web de la asigatura:

RNA-Seq: Introducción al ensamblado de novo de transcriptomas

VISUALIZADOR CARTOGRÁFICO

Biocomputación Licenciatura en Bioquímica

GenBank. Resumen y búsquedas básicas

Oficina de Tecnologías de la Información y Comunicaciones MANUAL DE USUARIO SISTEMA DE GESTIÓN DE CONTENIDO INTRANET REGION CALLAO VS.1.

ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA 2010 PRÁCTICO: ANOTACIÓN GENÓMICA UTILIZANDO ARTEMIS

ALLEN LINUX. Todas las computadoras poseen una memoria llamada cache, significa en inglés to

José Vallejo Biblioteca Hospital Carlos Haya Málaga

Parent/Teacher Conference Scheduling

GUIA RAPIDA PARA LA CARGA DE CONTENIDO CON TYPO3

3. Entra a tu Pagina Sign In. Sign out

TÉCNICAS INTELIGENTES EN BIOINFORMÁTICA. Alineamiento múltiple de secuencias

Los bloques DLL (Figura A.1) externos permiten al usuario escribir su propio código y

Ministerio de Economía y Finanzas. Manual del Usuario MODULO DE DEUDA PÚBLICA SIN GARANTIA - EN WEB Versión SIAF

Determinación experimental de la velocidad de propagación de la onda en instrumentos de cuerda

COMO HACER BUSQUEDAS EN PUBMED?

E l i t e D S H S. A. S

Detectar micrornas en datos de secuencación masiva

Curso de Métodos Estadísticos y Anaĺıticos de Datos Genómicos

BLAST EJERCICIOS PNLHGLFGRKTG

2001 Antonio Barbadilla

Oficina de Tecnologías de la Información y Comunicaciones MANUAL DE USUARIO SISTEMA DE GESTIÓN DE CONTENIDO INTRANET REGION CALLAO VS.1.

Análisis de Desempeño Adempiere 3.4

COMIENZO A ELABORAR MI LÍNEA DEL TIEMPO

Manual LSMW Legacy System Migration Workbench

Instrucciones para instalar el Script de Boleto Electrónico en Worldspan Go! Res v 4.x

EndNote Web Gestor de bibliografía. Ejercicios básicos.

Procesador: 1 GHz o superior Memoria: 256 Mb. Espacio de disco duro: 5 Gb. Espacio mínimo para la instalación del sistema: 300 MB

Página - 8 Planeación Digital Interactiva (PDI)

PGADMIN III: base de datos de SIABUC9 CÓMO INICIAR PGADMIN III?

Roaming Profile en Debian GNU/LINUX

COLEGIO PABLO DE TARSO IED CONSTRUCCION DE PROYECTOS DE VIDA PRODUCTIVOS DREAMWEAVER UNO- PRÁCTICAS DOC RAUL MONROY PAMPLONA

Roaming Profile en Debian GNU/LINUX

CÓMO UTILIZAR EL ANTHROPAC? Primera parte

Al invocar GUIDE en cualquiera de estas formas aparecerá la siguiente ventana.

Cómo rotar, enderezar, recortar, añadir, borrar y reordenar las páginas de un PDF online

backup corporativo cloud R

Manual Power Point Formato de diapositivas

Creando CRUD en PHP: operaciones básicas para la gestión de bases de datos

Tutorial de wind3d. Introducción...1 Ejemplo 1: HARMONIE...2 Ejemplo 2: WRF...10 Ejemplo 3: Estaciones...16

IDENTIFICACIÓN GENERAL. Bioinformática aplicada. Maestría en Ciencias Básicas Biomédicas. IDENTIFICACION ESPECÍFICA (Ver nota 1)

Mi primera aplicación ASP.NET MVC 2 paso a paso parte 2 «afelipelc Blog

Guía de actividades. Trabajo colaborativo 2

QUICK GUIDE RECORD SETUP CONFIGURACIÓN DE GRABACIÓN English / Español

Cómo compartir audios en el Aula virtual

EAD DEL ITSP Pedagogía y recursos tecnológicos para la enseñanza y el aprendizaje. Aprendiendo a usar Blogger

VOZ SINTÉTICA INSTALACIÓN

Guía para modificar un formato

Acceso Web e instalación del cliente Windows

INSTALACIÓN SIP-POPE MODULO REGISTRO PENITENCIARIO

2 Congreso Colombiano de Bioinformática y biología computacional.

USER MANUAL VMS FOR PC VMS PARA PC English / Español

Transcripción:

TP Bioinformática Autores: Máximo Rivarola, Ana Julia Distéfano, Paula Fernández, Norma Paniego, Sergio González Instituto de Biotecnología, Centro de Investigaciones en Ciencias Veterinarias y Agronómicas (CICVyA), INTA-Castelar NCBI - BLAST 1. Uso de Entrez 1. Utilizando Entrez, encuentra cuantos genes humanos tienen un dominio WAP. Tipear human [orgn] AND WAP domain (23 entradas) 2. Acotar la búsqueda para encontrar cuantas proteínas con este tipo de dominio están localizadas en el cromosoma 20. Usar el buscador en la página principal de Entrez y tipear: 20 [chr] AND human [orgn] and WAP domain. Hay 16 entradas clasificadas como genes. 2. NCBI - BLAST Estamos trabajando con el cdna AF217525. Utiliza Entrez para obtener la secuencia FASTA y encontrar la siguiente información: 1. Cuál gen está codificado por este cdna? DSCAM gene, mol de adhesión en Síndrome de Down 2. Cuántos aminoácidos tiene la traducción? 2012 aa AF217525_1 3. Cuáles son los IDs de cada posible transcripto de este gen y confirmar si fueron manual o automáticamente curados (NM o XM)?. Que variante contiene el cdna AF217525? NM_001389 y NM_001271534, NM indica que fue curado manualmente. La variante que contiene al cdna es NM_001389. 4. Qué dominios Pfam contiene la proteína? Para ver el dominio en Entrez clickear en el link del dominio conservado bajo la proteína refseq (pfam07679) 5. Utilizando NCBI, ejecute 2 nucleotide Blast con la secuencia RefSeq NM_001389 contra la base de datos human genomic + transcript: primero utilizar los parametros por default, luego destildar opcion mask for look up table only Existe diferencia entre ambos resultados? Cambia el resultado si se aplica o no el low complexity filter? La aplicacion o no de los distintos parmetros modifica el funcionamiento del blast en la consideracion o no de regiones de baja complejidad para en distintas fases del alineamiento.

Galaxy UCSC Browser Introducción: En este Trabajo Practico veremos como es un análisis típico de un bioinformático. En el caso de obtener una gran cantidad de datos, como sucede con las tecnologías NGS, la terminal de Linux es requerida! Sin embargo, existen otras posibilidades para analizar tus datos de manera similar. Ahora te mostraremos como se hace un trabajo bioinformático con una herramienta mucho mas amigable. La herramienta se desarrollo en la Universidad de Estatal de Pensilvana (Penn State) y el programa se llama Galaxy (Blankenberg et al. 2007, PMID 17568012). Luego te mostraremos como visualizar una inmensa cantidad de datos, públicos o propios, en un visualizador de Genomas. El UCSC Genome browser (Kent et al., The human genome browser at UCSC. Genome Res. 2002 Jun;12(6):996-1006). Información sobre Galaxy: Galaxy Penn State s Galaxy is a useful way of wrapping many command line modules together in a user-friendly GUI. When logged in, you can save your workflow and execute the entire workflow on a new dataset without manually executing each individual step. You can also easily share these workflows with others. Figura 1. Algunos Iconos de Galaxy explicados Nota de los datos usados en este TP: Este set de datos es solo una pequeña parte de los verdaderos resultados, se utiliza esta cantidad de datos por razones practicas de tiempo y uso de computadora.

Comenzamos el Trabajo Practico: 1. Abrir el explorador de internet de tu PC e ir a: https://main.g2.bx.psu.edu/ 2. Registrarse: Clic en User, luego en Register en la barra superior. 3. Subir Archivo que utilizaremos para trabajar: Solapa Get Data: ejecutar Upload File. Ejercicio 1. Crear un archivo con la información de cada SNP obtenido por los reads alineados al genoma humano. El archivo de entrada (.fq) es un FASTQ que contiene la secuencia de ADN mas su calidad en cada posición. (El resultado va ser SNPs ubicados en el gen humano BRCA1 ubicado en el cromosoma 17). Primero, veamos el archivo fastq (fq) y luego alineamos al genoma humano: 1. Solapa NGS: QC and manipulation: 1. Ejecutar FastQC Read QC: run on the BRCA1reads.fq. Que muestran las figuras generadas? 2. Ejecutar FASTQ Groomer: run on the BRCA1reads.fq (Sanger quality output). Cuantas secuencias teniamos antes y después de ejecutar FASTQ Groomer? 2. Solapa NGS: Mapping: Ahora vamos a alinear contra el genoma humano. 1. Ejecutar Map with Bowtie for Illumina. Usamos un programa que mapea (alinea rápido) usando el programa Bowtie con los reads del output: FASTQ groomed data. El genoma que usaremos para mapear sera el hg19 (versión 19 del genoma humano). El resto de parámetros los dejamos como están. 2. Cuantos reads se mapearon? Que porcentaje de los reads se alineo? Para poder saber las estadísticas del resultado de Bowtie, realizaremos lo siguiente: Vamos a solapa NGS: SAM Tools: Utilizamos el programa SAM-to-BAM : El input de este programa es el output de Bowtie. El output de sam-to-bam es luego utilizado por el programa flagstat que nos da las estadísticas del mapeo. 3. Verifiquemos el archivo de mapeo a ver si encontramos SNPs 1. Solapa NGS: SAM Tools: programa Generate Pileup : El input es el archivo de salida

de sam-to-bam, el archivo BAM. Aquí creamos el archivo pileup que contiene el detalle de las variantes. 2. Solapa NGS: SAM Tools: Programa Filter pileup : Para ello antes debemos editar los atributos de archivo que fue generado en el paso anterior: Click en el icono del lapiz. Solapa Datatype Completamo el campo New Type con pileup Save Ahora si ejecutamos Filter pileup (parametros por defecto). Cuantos SNPs tenemos? Veamos esos resultados! Los podemos guardar a la PC de manera local. Ejercicio 2. En este ejercicio Utilizaremos un Genome Browser para buscar la informacion disponible de los lugares del genoma humano en los cuales encontramos SNP's Vamos al UCSC genome browser: http://genome.ucsc.edu/index.html 1. Clic Genome Browser. 2. Select the human genome hg19 assembly. 3. Vamos a la posicion en la cual queremos buscar, en el box ponemos: chr[numero de cromosoma]:[posicion inicio]-[posicion fin] (ver ejemplo en figura 2) 4. Visualizar en Genome browser, Primero hacer clic en hide all 5. Luego mostrar y esconder tracks de interés! Por ejemplo: RefSeq genes 6. Dentro de que gen se ubican nuestros SNP's? 7. Hay SNP's reportados en estas posiciones? Son los mismos que encontramos nosotros con nuestros reads? 8. Para contestar estas preguntas visualizar tracks de SNPs (el ultimo grupo de tracks disponibles: Variation and Repeats). 9. Otra pregunta, El hombre Neandertal tenia este gen? Se tiene información sobre SNPs? Ver track: SNPS Used for Selective Sweep Scan (S) (All Neandertal Assembly and Analysis tracks).

Figura 2. Visualización de la posicion 41245546 (intervalo alrrededor) del cromosoma 17 en el UCSC Genome Browser. Créditos: Algunas partes de este TP son de: Hands on workshop: Next generation sequence data analysis. The Netherlands Bioinformatics Centre. Leiden Genome Technology Center