Objetivos y avances del consorcio latinoamericano para el secuenciamiento del genoma de la papa



Documentos relacionados
Objetivo del Proyecto Genoma Humano

2 Congreso Colombiano de Bioinformática y biología computacional.

FICHA PÚBLICA DEL PROYECTO WINTER FORENSICS

Genoma y Ensamblado Seminario de Modelos y Métodos cuantitativos (Bioinformática)

MBA3 v12.1 RESPALDOS NOCTURNOS TEMA. Guía Informativa FUNCIONALIDAD FECHA J 94 RELEASE

GUÍA RÁPIDA DEL PROCESO DE IDENTIFICACIÓN Y ANÁLISIS FILOGENÉTICO DE RECURSOS GENÉTICOS, BASADO EN LA COMPARACIÓN DE SECUENCIAS DE ADN.

Organización Básica de un Computador y Lenguaje de Máquina

Prueba de Concepto, Informes XBRL vs. SGBDR.

CERDO-IBERICO: FORO DE DISCUSIÓN SOBRE EL CERDO IBÉRICO EN INTERNET

Computación en Procesado de Datos de Secuenciación Masiva Proyecto CloudPYME II Pablo Iglesias Veiga 15/10/2015

INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE N SGEI-GPYP/MDLP


Servicio de Geomática Intendencia de Montevideo

Manual de Referencia

INFORME SOBRE VERIFICACION CUMPLIMIENTO DE NORMAS USO DE SOFTWARE

Symantec Desktop and Laptop Option

ASOCIACIÓN PERUANA DE FACULTADES DE MEDICINA

Enfermedad Mendeliana. Búsqueda en bases de datos con proteínas homólogas. Clonaje in silico del gen. Gen candidato

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

FE DE ERRATAS LINEA 1. Donde dice:

INFLUENCIA EN LA PRODUCTIVIDAD QUE TIENEN LOS SISTEMAS DE CONTROL

INFORME DE EXPECTATIVAS DE LOS ESTUDIANTES DE NUEVO INGRESO EN LOS ESTUDIOS OFICIALES DE POSGRADO

MANUAL DE AYUDA INSTALACIÓN VERSIÓN DEMO

EVALUACIÓN DE LA CALIDAD EDUCATIVA

JAVAFilters: Cálculo y Diseño de Filtros Analógicos y Digitales Primavera 2004

ACLARACIONES. Consulta 1 Referencia: A Instrucciones para los Licitadores, Numeral 6. MONEDA: Las ofertas se deberán presentar en Euros.

PROPUESTA DE CREACION DE LA BIBLIOTECA REGIONAL DE PSICOLOGIA

PROMOARTESANÍA Expositor: Alberto Wurst Mayo 2010

CAPITULO 5 DESARROLLO

Administración de Recursos UTN FRLP. Tema: Administración de Proyectos Administración de Proyectos 2009

SISTEMA DE GESTIÓN DOCUMENTAL PARA PEOVEEDORES DE MATERIA PRIMA EN IANCEM

La universidad no debe limitarse a la transmisión del saber; debe generar opinión, demostrar su compromiso con el progreso social y ser un ejemplo

-Plan de Estudios- Doctorado en Relaciones Internacionales

MGS Moda, Confección

SIGAN 1.0 SISTEMA DE INFORMACIÓN DE GESTIÓN ADMINISTRATIVA DE NÓMINA

Instructivo de Operación. Profesor SIMULADOR SIMDEF

GERENCIA DE INTEGRACIÓN

Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570

Word Interfaz Word 2007.

Estrategias para la secuenciación de Genomas y NGS

TUTORIAL DE INSTALACIÓN Y CONFIGURACIÓN SERVIDOR LOCAL (MYSQL) Facturar en Línea

patrimonio inventario

CONFERENCISTA Braulio Villatoro Especialista en Sistemas de Información para Agricultura de Precisión

INFORME TECNICO PREVIO DE EVALUACIÓN DE SOFTWARE N /UIE-PATPAL - FBB

EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM)

SITUACIÓN PROBLEMÁTICA ACTUAL DE LA EMPRESA

CERTIFICACION Y ACREDITACION DE LABORATORIOS DE ENSAYO

1. Visualización de datos con Octave

REQUERIMIENTOS AMBIENTE DESARROLLO SWBOFFICE. COMPONENTES ESPECIALES

Las herramientas utilizadas para el desarrollo del aplicativo son:

ADENDO 03. Mediante el presente adendo se realizan las siguientes modificaciones al Pliego de Condiciones de la Licitación:

Aspel-PROD 3.0 Aspel-PROD 3.0 SAE 6.0 SAE 6.0

Estándares Índice Estándares de Hardware Estándares para la adquisición de Equipos

Ingeniería en tecnologías de la información y comunicación Administración de proyectos de TI I

PETICIÓN DE TEMA DE PROYECTO FIN DE CARRERA INGENIERÍA TÉCNICA INFORMÁTICA SISTEMAS

Redes de Computadores I

Informe Evaluación Núcleos Problemicos 2012 CURN

Tutorial sobre sistemas de archivos con LVM en Linux

Pattern Generation System Moda, Confección

Para trabajar con esta aplicación sólo es necesario tener acceso a Internet y utilizar uno de estos navegadores:

U.N.Sa. - Facultad de Cs.Económicas, Jurídicas y Sociales. Seminario de Informática Presentación

Manual de Procedimientos

PRESENTACION.

POLITICA DE GESTION DE RIESGOS, ROLES Y RESPONSABLES. Departamento de Estudios y Gestión Estratégica

Manual de Referencia. Manual de instalación rápida SQL

Enfermería en quirófano

Delphin Express Profesional Manual de instrucciones. Como importar Presupuestos Hechos en S10

DIAGNOSTICO SERVIDOR Y PLATAFORMA MOODLE

MANUAL DE USUARIO APLICACIÓN DE RASTREO QTRACK

Referencia: Propuesta servicios dedicados cloud de hosting

Instantáneas o Shadow Copy

Q-flow 2.2. Código de Manual: Qf22007ESP Versión del Manual: 3.1 Última revisión: 19/8/2005 Se aplica a: Q-flow 2.2. Sizing

RESOLUCIÓN DE ERRORES EN MOODLE CAMPUS VIRTUAL-BIRTUALA UPV-EHU

Guía de instalación de CivilFEM for ANSYS 16.1

Manual de 1 nstalación CONAGUA

para servidores: Referencia de rendimiento

Técnicas de Programación

Juan Pablo Jaramillo Valencia Planilla de trabajo: Investigación de componentes de PC

MOTORES VERSUS DIRECTORIOS: EL DILEMA DE LA BÚSQUEDA

-ISO 9001: Norma más popular a nivel mundial. -Normas revisadas cada 5 años. -Antecedentes: ISO 9001/2:1994 ISO 9001:2000 ISO 9001:2008

Manual de Instalación

Guía de estudio para examen de recuperación tecnología I

La gran mayoría de las personas pasan su vida y mueren sin haber desarrollado más del 10% de sus capacidades humanas y creativas.

PRÁCTICA 2: Planificación financiera

The human genome. El proyecto genoma humano

Requisitos del Sistema Instalación SQL Server

CAPITULO IV. 4. INTERPRETACIÓN DE RESULTADOS. Procesos de Consulta, Revisión de Formularios Actuales e Informes.

ÁREA DE NUEVAS TECNOLOGÍAS Informática

T. M. Calle Tarajal, 7. Tel: (+34) ventas@nicalia.com web :

AFIP Dirección de Infraestructura Tecnológica Dpto. Desarrollo de Infraestructura

PRÁCTICA 3: ACRONIS TRUE IMAGE

TALLER DE CONOCIMIENTOS APRENDICES JORGE LEONARDO MAZA CARLOS DAVID ZAMBRANO JOSE G. RODRIGUEZ PROFESOR RONALD MARTELO

PLATAFORMA REMAVEF INTRODUCCIÓN JUSTIFICACIÓN 2 PLATAFORMA REMAVEF

ORIENTACIONES SIMCE TIC

CAPÍTULO I EL PROBLEMA PLANTEAMIENTO DEL PROBLEMA

Copyright 2010 Eurohelp

MANUAL DE INSTALACIÓN DEL SISTEMA PERUANO DE INFORMACIÓN JURÍDICA

Dirección de Informática y Telecomunicaciones

PROBLEMAS DE FUNDAMENTOS DE TECNOLOGÍA DE COMPUTADORES T5. MEMORIAS

Transcripción:

Objetivos y avances del consorcio latinoamericano para el secuenciamiento del genoma de la papa Gisella Orjeda Unidad de Genomica Universidad Peruana Cayetano Heredia Diciembre 2008

The Potato Genome Sequencing Consortium, PGSC Organizaciones académicas que se han comprometido en secuenciar el genoma completo de la papa para contribuir a resolver las necesidades alimentarias del mundo. El PGSC esta coordinado por el Laboratory of Plant Breeding, Dept. of Plant Sciences, Wageningen University and Research Centre (2006) Director: Prof. Richard Visser. Contacto: Dr. Christian Bachem www.potatogenome.net

Genoteca BAC: 78336 clones DNA genomico del parental diploid RH 89-039-16 Tamaño promedio de los BAcs120 kbp; vector pindigobac5 Approx. 10 equivalentes genoma (850 Mbp genome) λ concatamers 200 150 100 50 kb

Ensamblaje de contigs de Fingerprint con FPC Software por C. Soderlund AGI; USA. Usa movilidad de bandas Alinea BACs usando la proporcion de bandas en comun

El mapa físico y mapa genético 2 Contigs de clones BAC (BAC fingerprints alineados) 1 Mapa genetico de un genotipo diploide RH89-039-16

El mapa fisico y mapa genetico 2 Contigs de clones BAC (BAC fingerprints alineados) Marcadores AFLP anclan los contigs al mapa genetico 3 1 Mapa genetico de un genotipo diploide RH89-039-16

Extension del tiling path en ambas direcciones Seed BAC (AFLP anchor) Extension BAC right Extension BAC left Merged fingerprint ctg

Cual es nuestro trabajo? Identificación y anclaje de BAcs/contigs en el mapa genético :Integración del Mapa físico y el mapa genético Extensión del tiling path Secuenciación Ensamblaje Submisión de secuencias a genebank Anotación

Pipeline bioinformatico PROCESADORES QUAD CORE INTEL XEON 2.0 GHZ CACHE 12MB BUS 1333 MHZ 2 DISCOS DUROS 500 GBS 48 GBS DE MEMORIA RAM DDR2 5300 CINTAS BACKUP DE 400/800GB

Integración del Mapa físico y el mapa genético Seleccion de BACs de enucleacion AFLP map (Bac pools) FPC Validacion Talla del BAC (fingerprint con enzimas de restriccion) BACEnd sequencing: blast en BacEnd Tool (web page) AFLP markers QC Check (Blast con todos los Bacs Secuenciados) Assembly Phred Phrap Consed Bambus Repeatmasker (Repeats de Solanaceas TIGR)

Avances

Mapa fisico y Secuenciamiento Tenemos 50 BACs posicionados de los 660 en total (165 cada pais) De los 165 Bacs que toca secuenciar a Peru 8 Bacs han sido secuenciados a una profundidad de 8X 10 mas están siendo secuenciados 3 por Peru 7 por Chile, Argentina y Brasil

análisis de las secuencias Hemos comenzado con el software especializado Phred, Phrap, Consed, Staden, Miropeats, RepeatMasker, Web server para Blast etc The phred software reads DNA sequencing trace files, calls bases, and assigns a quality value to each called base. Phrap is a program for assembling shotgun DNA sequence data. cross_match is a general purpose utility for comparing any two DNA sequence sets. For example, it can be used to compare a set of reads to a set of vector sequences and produce vector-masked versions of the reads. Phred/Phrap/Consed is a trace file analysis and sequence assembly pipeline for large sequencing projects.

Test 1 with ST1R ASSEMBLY TIGR 1728 chromatograms AC212316: 42,944 nt

ST1R: -minmatch 12 -penalty -2 -minscore 20 Contig 1 (2) 1413 bp Contig 2 (2) 1809 bp Contig 3 (6) 277 bp Contig 4 (1402) 42775 bp

CONTIG 4 vs AC212316 (local blast) QUERY: CONTIG 4 (42775 bp) DAT ABASE: AC212316(NCBI) 1 AC212316 42944 163 2226 40712 2204 3575 39363 8565 11759 31179 9945 14534 28404 16866 21552 21386 18543 23422 19516 26510 28031 42775 40734 3598 34373 7351 32992 26072 24395 23745 16428 25004 14908 39340 35587 19193 17934 33511 38444 9428 4495

X Significa vector enmascarado, pero por qué en medio del ensamblaje? Es debido a los parámetros default.

Test 2 with ST15 ASSEMBLY TIGR 1536 chromatograms NCBI REFERENCE AC213586 140,754 NT

ST15 -minmatch 12 -penalty -2 -minscore 20 Contig 1 (2) 374bp Contig 2 (3) 980bp Contig 3 (3) 1019bp Contig 4 (12) 3204bp Contig 5 (93) 8035bp Contig 6 (110) 11082bp Contig 7 (1139) 119719bp NCBI reference AC213586

CONTIG 6 vs AC213586 QUERY: CONTIG 6 (Local blast) DAT ABASE: AC213586 4000bp 21000bp AC213586 1 140754bp 13659 14629 20403 20911 4176 3206 656 176 4457 5611 14658 17799 8115 6959 8284 13599 177 36 9551 4236 7510 7747 10461 10698 MAL ENSAMBLAJE. APUNTA DIRECCIÓN OPUESTA

Test 3 with ST1R ASSEMBLY TIGR 1728 chromatograms AC212316: 42,944 nt

ST1R: trim_alt -minmatch 16 -penalty -2 - score 60 Contig 1 (2) 1451 bp Contig 2 (2) 1809 bp Contig 3 (6) 277 bp Contig 4 (515) 17530 bp Contig 5 (887) 26111 bp TESTING TRIMING: OPTION ON

CONTIG 4 vs AC212316 QUERY: CONTIG 4 (Local blast) DAT ABASE: AC212316 AC212316 1 42944bp 7375 7623 8198 8495 7213 7461 8036 8333 163 1 2204 2042 2226 2064 3598 3436 3575 3413 7351 7189 7726 7564 8159 7997 8565 8403 9945 9783 9971 7564 10379 10217 ALINEAMIENTO CONTINUO PERFECTO, NO MISSASSEMBLY

Resultados blast Contig4 vs AC212316

CONTIG 5 vs AC212316 QUERY: CONTIG 5 (Local blast) DAT ABASE: AC212316 AC212316 1 42944bp 23745 25004 26510 28031 19194 17935 16429 14908 16877 26064 18543 24396 18581 24358 21552 21387 21469 21470 23422 19517 25019 17920 25870 17069 28734 14207 29362 13577 30970 11969 31571 11368 ALINEAMIENTO CONTINUO PERFECTO, NO MISSASSEMBLY

Resultados blast Contig5 vs AC212316

Test 4 with ST1R ASSEMBLY TIGR 1728 chromatograms AC212316: 42,944 nt

ST1R: trim_alt -minmatch 16 -penalty -2 - score 30 Contig 1 (2) 1451 bp Contig 2 (2) 1809 bp Contig 3 (6) 277 bp Contig 4 (1402) 42776 bp TESTING TRIMING: OPTION OFF

CONTIG 4 vs AC212316 (local blast) QUERY: CONTIG 4 (42775 bp) DAT ABASE: AC212316(NCBI) AC212316 1 42944 163 2226 40712 2204 3575 39363 8565 11759 31179 9945 14534 28404 16866 21552 21386 18543 23422 19516 26510 28031 42775 40734 3598 34373 7351 32992 26072 24395 23745 16428 25004 14908 39340 35587 19193 17934 33511 38444 9428 4495

Resultados blast Contig4 vs Ac212316

Ensamble clon RH132M21 Con los parámetros ya establecidos para el script PhredPhrap, podemos comenzar el análisis con nuestros datos.

Contig 802

Procedimiento para el correcto ensamblaje de los clones Obtenemos como resultado 4 Contigs de gran tamaño (Contigs 6,7,8 y 9). Exportamos las secuencias de cada contig en un archivo fasta y lo subimos al servidor blast Blast contra los Bac ends del mismo contig sin enmascarar. cut-off a 95%

Exportando Contigs a secuencias fasta

CUT-OFF 95% DATABASE OF UNMASKED BAC_ENDS SPECIFIC CTG FPC

CONTIG 6

CONTIG 7

CONTIG 8

CONTIG 9

USAMOS MAPA FPC PARA UBICAR LOS BAC-ENDs, EL ORDEN DE LOS CONTIGS Y SU POSICION DENTRO DE RH132M21 CONTIG 6 CONTIG 7 CONTIG 8 CONTIG 9 48k 1 BE-R CONTIG 8 CONTIG 6 CONTIG 9 CONTIG 7 BE-F

USO

BAMBUS Es un módulo de bioperl, que sirve para ordenar los contigs de un ensamblaje en Scaffolds. Usa la información de archivo *.fasta.screen.ace (este archivo contiene valores de calidad, matches, cantidad de contigs) que es output de Phrap

Resultados Al seguir todo este procedimiento obtenemos una secuencia debidamente ordenada en fase 2, lista para ser utilizada para la selección de posibles candidatos para la extensión de Bacs o contigs de fpc (si el Bac esta en el borde del contig)

Soy Frank Yo, Michael Y yo, soy Roberto