Programa de bioinformática Joaquín Dopazo (CNIO) Co- coordinadores: Joaquín Dopazo (CNIO)
Objetivos, centros, actividades y resultados Generales: Los objetivos generales incluían la asesoría bioinformática, el servicio de análisis de datos, establecimiento de un programa de formación y la comunicación entre centros. Centros implicados en actividades bioinformáticas: CNIO (Madrid) CNB (Madrid) Centro de Investigación del Cáncer (Salamanca) Hospital Universitario Virgen de las Nieves (Granada). Actividades principales: Difusión (páginas de web) Formación (cursos presenciales y on-line, workshops, tesis e intercambios) Resultados: Publicaciones Herramientas de análisis de datos Bases de datos Proyectos.
Actividades: Formación EVENTOS CIENTÍFICOS y PROGRAMAS DE INTERCAMBIO 2004 Número de eventos Cursos de doctorado 2 Cursos de postgrado 3 Cursos internacionales 3 Masters 2 Workshops internacionales 1 Cursos on-line 6 Tesis doctorales 1
Actividades: cursos on-line
Resultados PUBLICACIONES 2004 CNIO CNB HUVN CIC Número 10 7 5 1 Bases de datos de resultados experimentales El HUVS ha desarrollado las siguientes bases de datos: Base de datos de líneas celulares de melanoma: constituida por datos del tipaje genómico, fenotipo HLA, análisis molecular de los fenotipos HLA alterados, antígenos tumorales y genes implicados en la apoptosis. (http://www.ebi.ac.uk/ipd/estdab). Base de datos de tumores criopreservados de acuerdo a su fenotipo HLA
Resultados: herramientas de análisis de datos desarrolladas en el CNIO GEPAS (análisis de microarrays y proteómica diferencial) FatiGO (análisis funcional) SNPs (diseño) sirna (diseño) GenomeGO CGH in silico
Los algoritmos se usan si están implementados en programas de fácil manejo: GEPAS
Pipeline de GEPAS Scanning, Array External tools Image processing EP, HAPI Two-conditions comparison Normalization Gene selection DNMAD Two-classes Multiple classes Unsupervised clustering Hierarchical SOM SOTA SomTree Preprocessor + hub Continuous variable Categorical variable survival Predictor tnasas Supervised clustering SVM Datamining FatiGO FatiWise In silico CGH Viewers SOTATree TreeView SOMplot
A G E F B C D
Aplicaciones en web de dominio publico para el análisis de datos de microarrays Program Clustering Gene selection Class prediction Other Cleaver (Stanford) Several methods Yes (no multiple testing) No -- CTWC (Weizmnann) Clusteing and biclustering No No -- EP (EBI) Several methods No No Finds TFBS in yeast GEDA Several methods Yes No Preprocessing GEPAS (CNIO) Several methods Yes (multiple Yes Normalization, preprocessing, information mining, CGH array support.. testing for classes, survival, etc) INKLUSive (UC Leuven) Several methods No No Finds TFBS R-cluster Several methods No No --
GEPAS statistics Más de 40,000 experimentos analizados por año. 200 por día.
CGH in silico Genera CGHs in silico superponiendo información de chips en el genoma Zoom Produce distintos tipos de gráficos con distintos tipos de datos (expresión, genómico)
SIDE High throughput sirna design. Específicos Termodinámicamente óptimos Con todos los requerimientos que aparecen en la bibliografía (opcionales)
High throughput search for putative interesting SNPs SNPs in TFs
Second step: one gene at a time selection - PupasView Information is applied as sequential filters Functional Frequencies LDs Final selection
PupasView Functional filtering An example: p53
Desarrollos en el PDG
ihop ihop (extracción automática de información funcional) Este sistema usa nombres de genes o proteínas para establecer vínculos entre frases relevantes desde el punto de vista biológico (función, patología, etc) presentes en la literatura científica. IHOP: http://www.pdg.cnb.uam.es/unipub/ihop/
Cooperaciones PDG-CNIO HCAD (Base de datos de translocaciones cromosómicas) El CNB y el CNIO en cooperación han desarrollado el sistema HCAD, que extrae automáticamente de la literatura científica las translocaciones reportadas así como los genes afectados (cuando se describen). NAR, in press.
Actividades para la siguiente anualidad Una de las actividades principales para la próxima anualidad consiste en la mejora de la plataforma de análisis de datos GEPAS en la que incluiremos nuevas herramientas de análisis así como mejoraremos su interconectividad con otras herramientas externas. Se continuará con el programa de formación impartiendo nuevas rondas de cursos y se pretende organizar un curso de carácter internacional, orientado a las necesidades de análisis de la red con participación de profesores expertos en diversas áreas del análisis de datos de microarrays. Además, se mejorará y aumentará el número de tutoriales y cursos on-line disponibles ya que constituyen un recurso de gran utilidad para los usuarios de las herramientas bioinformáticas. Para facilitar la comunicación intercentros, la página de web de la coordinación (http://bioinfo.cnio.es/rticcc), además de la del RTICCC, contendrá información de las actividades realizadas por nuestro grupo en el contexto de la red.