Biocomputación Licenciatura en Bioquímica José L. Oliver (oliver@ugr.es) http://bioinfo2.ugr.es/biocomp/
De ~nada a ~todo Biología Molecular: un gen una proteína un gen un laboratorio un gen una tesis Genómica : un genoma una tesis Antes se estudiaba el efecto de un gen ignorando así al 99.99% restante Ahora tenemos datos de todos los genes Qué hacer con ellos? Cómo derivar nuevo conocimiento? Es necesario un nuevo enfoque, un cambio de paradigma 2001 If you can t do Bioinformatics, you can t do Biology J.D. Tisdall, Beginning Perl for Bioinformatics, 2003
Qué es la Bioinformática? Biología Molecular Genómica Secuencias de genes y proteínas Estructuras 3D Expresión génica (microarrays) Interacción entre proteínas (interactoma) Secuenciación masiva Genómica personalizada Bases de datos Conocimiento biológico Programas Computación Algorítmica Salud Biotecnología Medio ambiente Genómica comparada Evolución
Cómo se define?
bioinformática informática médica usuarios informática en salud pública bases de datos algoritmos desarrolladores infrastructura
Explosión de datos
Secuenciación masiva 454 Pyrosequencing (PS) Illumina Reversible Termination (RT) SOLID Sequencing by Ligation (SBL)
Secuenciación masiva SANGER SECUENCIACIÓN MASIVA Di-deoxy terminator Roche 454 GS FLX (PS) Illumina HiSeq 2000 (RT) SOLID V4 (SBL) Salida por proceso 1.6 Mb 600 Mb 200 GB 100 GB Tiempo/Proceso 1h 10 h 9 d 11 d Longitud media reads 800 pbs 400 pb 100 pb 75 pb Salida por día 38.4 Mb 1.44 GB 22.2 GB 9 GB Usos frecuentes - Secuenciación de novo Captura de exones Resecuenciación Captura de exones Metagenómica Resecuenciación Captura de exones Metagenómica
Secuenciación masiva APLICACIONES Re-secuenciación Regulación Epigenómica SNVs y CNVs Inserciones y deleciones Expresión génica ARNs pequeños Metilación del ADN Histonas TFBSs Imágenes extraídas de Schweiger, 2010.
Los programas y bases de datos que utilizaremos funcionan en servidores web: Bases de datos públicas en línea: EBI, NCBI El software se ejecuta en servidores remotos de acceso público: Formularios Web: Copiar/pegar datos Resultados Ventajas: Datos actualizados on-line Acceso a software profesional permanentemente actualizado por sus propios autores No tendremos que instalar ningún programa ni base de datos en nuestra máquina local, todo lo haremos a través de un navegador web Podremos acceder a las prácticas del curso desde cualquier ordenador (Windows, Linux, Mac ) con acceso a Internet
Seminarios A lo largo del curso, cada alumno desarrollará un seminario tomando como punto de partida la secuencia anónima que se le asigne. El objetivo que se persigue es iniciar al alumno en las técnicas de análisis de secuencias de ADN y proteínas, así como en el manejo de las correspondientes bases de datos. Se valorará especialmente el grado de iniciativa a la hora de planear y desarrollar el trabajo y deberá exponerse oralmente. Este tipo de actividad aúna una serie de tareas fundamentales en la formación universitaria (búsqueda de información, análisis, síntesis, expresión escrita y expresión oral) que son de todo punto imprescindibles en la universidad actual.