Tema 8 Mapas físicos Genómica estructural
Genoma Genómica Genómica estructural Genómica funcional Mapas genéticos Mapas físicos EXPRESIÓN Transcriptoma Proteoma Interactoma FUNCIÓN Genética inversa
Secuenciacion (metodo de los dideoxinucleotidos)
Secuenciadores automaticos S. de capilar S. de gel
información obtenida por los secuenciadores. La tecnología que existe hoy en día permite secuenciar hasta El principal problema con el que se encuentra la secuenciación de los genomas es la ordenación de la información obtenida por los La tecnología que existe hoy en día permite secuenciar hasta 700 pb en una sola reacción de secuenciación. Con el desarrollo de secuenciaciones múltiples se han el desarrollo de secuenciaciones múltiples se han abaratado los precios y se aumenta la velocidad de procesamiento de las muestras
El tamaño de los genomas 1 volumen = 2320 pg 4 Mb (1 vol) 12 Mb 125 Mb (3 vol) (31 vol) 3000 Mb (750 vol)
Estrategias para la secuenciación de genomas Secuenciación al azar
Estrategias para la secuenciación de genomas Secuenciación ordenada 1 2 3 1 10 6 3 1 3 2 4 5.. 10 1 1 2 2
Secuenciación al azar Genoteca de plásmidos Secuenciación al azar Ensamblaje
Mapa físico Secuenciación ordenada Genoteca de BAC/YAC Mapa
Genoteca de BAC/YAC Mapa 1500 kb Secuenciación ordenada BAC/YAC Genoteca de cósmidos Mapa 40 Kb Cósmido Genoteca de plásmidos Secuenciación al azar Ensamblaje del cósmido
Paseo cromosómico (Chromosome walking) Hibridación Hibridar con el clon A1 Genoteca de BAC/YAC E D C B 1 2 3 4 5 6 7 8 A A1 A2 Hibridación PCR C6 Hibridar con el clon C6 E D C B A 1 2 3 4 5 6 7 8 A1 A2 E8 C6
Paseo cromosómico (Chromosome walking) Genoteca de BAC/YAC PCR A1 C D E B A 1 2 3 4 5 6 7 8 PCR A B C D 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 A1 A4
Secuenciador 1 capilar 300 n/hora 7200 n!/día 50400 n/semana Secuenciador 100 capilares 30.000 n/hora 720.000 n!/día 5.040.000 n/semana
Evolución proyectos secuenciación genomas Genoma secuenciado Año Tamaño Genoma Comentario Bacteriófago _X174 1977 5,38 kb 1 er genoma secuenciado Plásmido pbr322 1979 4,3 kb 1 er plásmido secuenciado Bacteriófago _ 1982 48,5 kb Cromosoma III levadura 1992 315 kb 1 er cromosoma Haemophilus influenzae 1995 1,8 Mb 1 er genoma organismo celular Saccharomyces cerevisiae 1996 12 Mb 1 er organismo eucariota Caenorhabditis elegans 1998 97 Mb 1 er organismo multicelular Drosophila melanogaster 2000 165 Mb Arabidopsis thaliana 2000 125 Mb 1ª planta secuenciada Homo sapiens 2001 3000 Mb 1 er genoma mamífero Arroz (Oryza sativa) 2002 430 Mb 1ª planta cultivo Pez cebra (Fugu rubripes) 2002 400 Mb Genoma vertebrado menor tamaño A. gambiae 2002 280 Mb Ratón (Mus musculus) 2003 2700 Mb Organismo modelo cercano hombre
Evolución proyectos secuenciación genomas Servidor GOLD (Genomes OnLine Database) wit.integratedgenomics.com/gold/
La Bioinformática El principal problema con el que se encuentra la secuenciación de los genomas es la ordenación de la información obtenida por losinformación obtenida por los secuenciadores. La tecnología que existe hoy en día permite secuenciar hasta 700 pb en una sóla reacción de secuenciación. Con el desarrollo de secuenciaciones múltiples se han abaratado los precios y se aumenta la velocidad de procesamiento de las muestras
Genoma Genes y secuencias relacionadas DNA extragénico DNAcodificante DNAno codificante Intrones Pseudogenes Fragmentos de genes DNA repetitivo DNA bajo nº copias Repeticiones en tandem Repeticiones dispersas Satélites Microsatélites Minisatélites Transposones Retrotransposones Retrovirus Secuencias de inserción
I. Análisis funcional: detección Identificacion de ORFs (secuencias génicas transcritas) Codón de parada ATG RNAm ATG Proteína Frame 1 Frame 2 Frame 3 500 1000 1500 2000 X X Frame 4 2500 2000 1500 1000 500 Frame 5 Frame 6
I. Análisis funcional: detección Lista de ORFs (secuencias génicas transcritas) Procariotas Eucariotas
II. Asignación función: búsquedas de homología BLAST / FASTA Query= sp P03005 DNAB_ECOLI REPLICATIVE DNA HELICASE (EC3.6.1.-) - Escherichia coli. (471 letters) > Identities = 358/450 (79%), Positives = 407/450 (89%) Frame = +2 Query: 20 QVAGLKVPPHSIEAEQSVLGGLMLDNERWDDVAERVVADDFYTRPHRHIFTEMARLQESG 79 Q+ LK+PPHS+EAEQSVLGGLMLDNE+WD V+E VVADDF+++PHR IF EM +L + G Sbjct: 234608 QINRLKIPPHSLEAEQSVLGGLMLDNEQWDSVSEHVVADDFFSKPHRLIFQEMQKLLDLG 234787 Query: 80 SPIDLITLAESLERQGQLDSVGGFAYLAELSKNTPSAANISAYADIVRERAVVREMISVA 139 PIDLITL+ESLE++G+L+SVG F+YLAELSKNTPS ANI+AYADIVRERA+VREMI VA Sbjct: 234788 YPIDLITLSESLEQKGKLESVGRFSYLAELSKNTPSTANITAYADIVRERAIVREMILVA 234967 Query: 140 NEIAEAGFDPQGRTSEDLLDLAESRVFKIAESRANKDEGPKNIADVLDATVARIEQLFQQ 199 N+IA AG+D QGR SE+LLD AES VFKIAE R KD GPKN+ +LD TVA IE+LF Sbjct: 234968 NKIANAGYDTQGRKSEELLDYAESSVFKIAEKRFKKDSGPKNVEQILDETVASIEKLFLS 235147 Query: 200 PHDGVTGVNTGYDDLNKKTAGLQPSDLIIVAARPSMGKTTFAMNLVENAAMLQDKPVLIF 259 PHDGVTG+NTGY DLNKKT+GLQ S+LII+AARPSMGKTTFAMNL ENAAML DKPVLIF Sbjct: 235148 PHDGVTGINTGYQDLNKKTSGLQRSELIIIAARPSMGKTTFAMNLCENAAMLYDKPVLIF 235327 Query: 260 SLEMPSEQIMMRSLASLSRVDQTKIRTGQLDDEDWARISGTMGILLEKRNIYIDDSSGLT 319 SLEMP EQIMMR LASLSRV+Q +IRTGQL++EDWARISGT+ ILL+K+NIYIDDSS LT Sbjct: 235328 SLEMPGEQIMMRMLASLSRVNQARIRTGQLNNEDWARISGTINILLKKKNIYIDDSSALT 235507 Query: 320 PTEVRSRARRIAREHGGIGLIMIDYLQLMRVPALSDNRTLEIAEISRSLKALAKELNVPV 379 P+EVRSRARRI RE+ G+ LIM+DYLQLMRVP+LS+NRTLEIAEISR+LKALAKEL VPV Sbjct: 235508 PSEVRSRARRIYRENNGLTLIMVDYLQLMRVPSLSENRTLEIAEISRTLKALAKELQVPV 235687
SISTEMAS DE ANÁLISIS DE GENOMAS Homología sin función Posible función Sin homología Identificados anteriormente Homólogo con función encontrado