Integración de Datos Mediante Tecnologías Grid



Documentos relacionados
Aplicaciones de las Tecnologías Grid en las Ciencias de la Salud

Soporte a la toma de decisiones

SECRETARIADO Y RELACIONES PÚBLICAS

INSTITUTO DE EDUCACIÓN SUPERIOR TECNOLÓGICO HUAYCÁN (Decreto Supremo No ED y Resolución Directoral No ED)

Grupo de Computación Científica y Programación Paralela Universidad de Murcia

ASPECTOS TÉCNICOS Y LEGALES EN LA IMPLEMENTACIÓN DE LA HISTORIA CLÍNICA ELECTRÓNICA

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR INGENIERÍA EN TECNOLOGÍA COMPUTACIONAL. ASIGNATURA Programación I. Básica ETAPA DE FORMACIÓN.

UNIVERSIDAD TECNOLÓGICA DE PANAMÁ SECRETARÍA GENERAL FACULTAD DE INGENIERÍA INDUSTRIAL DESCRIPCION DE CURSO DE POSTGRADO EN ALTA GERENCIA

Ingeniería Informática

Catálogo de Cursos On Line

Nombre de la asignatura: Gestión de Costos. Créditos: Aportación al perfil

SISTEMAS OPERATIVOS SISTEMA DE ARCHIVOS

LAS TECNOLOGíAS DE INFORMACIÓN Y COMUNICACIÓN EN VENEZUELA

Introducción a la Geometría Computacional

Objetivos y Temario CURSO SQL SERVER 2012

Ciencias de la Ingeniería

Propuesta para la creación de un programa de e-ciencia. Área temática de Astrofísica

Seguridad e integridad de bases de datos USB

Manual avanzado Excel 2007

METODOLOGÍA COMMONKADS.

UN PLAN DE CALIDAD PARA OPERACIONES ESTADISTICAS: LA EXPERIENCIA DEL INSTITUTO VASCO DE ESTADISTICA. Cristina Prado y Marina Ayestarán

Microsoft Access 2003 (Completo)

Ingeniería en Informática. Data WareHouse

III Jornadas de la red temática DocenWeb. Docencia del Área de ISA en Informática y Computadores en la Universidad de Alicante

PROGRAMA DE CREACIÓN Y CONSOLIDACIÓN DE EMPRESAS INDUSTRIAS CULTURALES

ITIL V3 Entender el enfoque y adoptar las buenas prácticas

20415B Implementar una Infraestructura de Escritorio Windows Server 2012

CONFERENCIA INTERNACIONAL DE LOS COMISIONADOS DE PROTECCIÓN DE DATOS Y PRIVACIDAD

Capítulo III. Fundamentos de la Manufactura Global. 3.1 Definición de manufactura Global

DISEÑO CURRICULAR BASE DE DATOS II

Política Ambiental Global de Telefónica

Coffee: La red interna para el intercambio del conocimiento y la transformación de la cultura organizativa de Ferrovial

Anexo 5. ESTRATEGIAS DE ACCIÓN PARA LA IMPLEMENTACIÓN DEL PIGA

Definición de Sistema Operativo

UNIDAD DE REFERENCIA PARA LA ATENCIÓN A LAS PORFIRIAS SSPA

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

Contratación de personas beneficiarias de Protección Internacional

ARQUITECTURA Y DISEÑO DE SISTEMAS WEB Y C/S

Esquema de los Sistemas y Aplicaciones. CleanTec Esquema de los Sistemas y Aplicaciones cleantecsoftware.com - Tlf:

Ciencias de la Ingeniería

SERVICIOS Y ADMINISTRACIÓN DE IDENTIDADES EN OFFICE 365

Computación social hacia redes más inteligentes y detección de fallos

Oracle Data Guard 11g

LA INTEGRACIÓN DE SISTEMAS

Arquitectura y Diseño de Software

360ºde la gestión del expediente. José Novillo Especialista Técnico en Gestión Documental #START013, 6 Noviembre 2012

INSTITUTO TECNOLOGICO DE LAS AMERICAS CARRERA DE TECNOLOGO EN REDES DE LA INFORMACION SISTEMAS OPERATIVOS I

Mantener una base de datos de Microsoft SQL Server 2008 R2

IFCT0610 Administración y Programación en Sistemas de...

Interés profesional En el nuevo escenario de la Europa del Conocimiento y sus consecuencias en la educación, surgen nuevas demandas de formación que p

Análisis y Diseño de Sistemas Departamento de Sistemas - Facultad de Ingeniería

EN QUÉ CONSISTE UN SISTEMA DE GESTIÓN DE LA INNOVACIÓN?

Bloque 1. La sociedad de la información y el ordenador

Capítulo 3. Diseño de un Ambiente para Apoyar la Investigación Usando. Documentos Digitales

Temario prueba acceso Master Secundaria. Especialidad Economía y Empresa TEMARIO ECONOMÍA.

Smart Cities: Un enfoque práctico sobre una metrópolis y auditoría en Lima (Perú)

Técnico en Seguridad Informática. Informática, Diseño y Programación

Índice Introducción. Obligaciones legales. Reto de la administración de archivos. Administración de archivos. Acceso a la información y protección de

LA CALIDAD EN LA PROMOCIÓN DE LA AUTONOMÍA PERSONAL Y ATENCIÓN A LAS PERSONAS DEPENDIENTES

BASE DE DATOS. Qué es una base de datos?

PRESENTACIÓN CORPORATIVA

EcoProcura La implementación de la Compra Verde Pública en la Diputación de Barcelona

PRIORIDADES PARA EL PLAN ANUAL DE CALIDAD 2016

Proceso Salud / Enfermedad Salud Pública Epidemiología Conceptos Básicos

Guía del Curso Curso de Information System Management

INTRODUCCIÓN...11 CAPÍTULO 1. ELEMENTOS, ESTRUCTURA Y FUNCIONES DE UN SISTEMA OPERATIVO...13

Sugerencias para evaluar actividades pedagógicas con uso de TIC

TEMA 58: LA LEY GENERAL DE SANIDAD. SERVICIO NACIONAL DE SALUD.

Know-how en visión robótica para biometría, vigilancia y mapeado 3D

Dirección y Gestión de Proyectos

EL INGENIERO INDUSTRIAL ANTE EL SIGLO XXI. Presentación

Nueva ISO 14001:2015: Cómo afrontar los principales cambios

FUNDAMENTOS DE INFORMÁTICA. Principios Básicos de Sistemas Operativos. Definición de Sistema Operativo

ASIGNATURA Modelamiento III CAID CÓDIGO NIVEL 3 MODALIDAD P PROYECTUAL TECNOLÓGICA X TEÓRICA PLAN COMÚN INDUSTRIAL X GRÁFICO

BASES DE DATOS DOCUMENTOS O INSTRUMENTOS? DEBEN SOMETERSE A VALORACIÓN?

REGLAS DE CODD DEL MODELO RELACIONAL

Participantes ÍNDICE

Microsoft Cloud. Los 10 Mitos sobre Enterprise Mobility Suite (EMS)

EL MODELO DE CONTROL INTERNO DE GRUPO SANTANDER

ASIGNATURA: Fundamentos y diseños metodológicos para la investigación clínica y epidemiológica en trastornos mentales

Universidad Nacional del Nordeste Facultad de Humanidades

Plan de Estudios / Carrera de Ingeniería Agro Industrial

La estadística en Internet

MÁSTER EN INGENIERÍA INFORMÁTICA MATERIAS Y COMPETENCIAS

:Universidad Salesiana de Bolivia. :Ingeniería de Sistemas PLAN DE DISCIPLINA GESTIÓN II

LA AUTOEVALUACIÓN EFQM -

CURSO PRESENCIAL PROGRAMA FORMATIVO

Computación distribuida

MF1248_3: Proyectos de asesoría de imagen personal

MICROSOFT ACCESS 2007

DISEÑO CURRICULAR INTELIGENCIA ARTIFICIAL

DISPOSICIONES GENERALES

Introducción a Redes de Computadoras. Ing. Erlinda Gutierrez Poma

Comercios Urbanos del Futuro

Programación en Capas con Visual C#: desarrollo rápido de aplicaciones

Gestión de Materiales

Sistemas de Información para la Gestión

Guía del Curso Técnico Especialista TIC en Administración y Gestión de Servidores de Transferencia de Archivos: FTP

LINEAMIENTOS DE CONTENIDOS

Transcripción:

Grupo de Redes y Computación de Altas Prestaciones Integración de Datos Mediante Tecnologías Grid Ignacio Blanquer, Vicente Hernández GRyCAP www.grycap.upv.es INFSO-RI-508833

Grupo de Redes y Computación de Altas Prestaciones Objetivos Introducir el Concepto de Grid de Datos y su Aplicación como una Tecnología Integradora. Describir las Diferentes Aplicaciones de Estas Tecnologías en el Ámbito de los Datos Médicos. Destacar las Ventajas y Características Específicas de los Grids de Datos en Salud. Comentar Algunas de las Soluciones Actualmente en Desarrollo. INFSO-RI-508833 2

Grupo de Redes y Computación de Altas Prestaciones Contenidos El GRyCAP. Conceptos de Grid, DataGrids y HealthGrids. Aplicaciones del Grid en el Almacenamiento de Datos Médicos. Beneficios y Conclusiones. INFSO-RI-508833 3

El GRyCAP en una Diapositiva Grupo de Redes y Computación de Altas Prestaciones Grupo de Investigación con 20 Años de Actividad y Compuesto por 30 Investigadores. Con Experiencia en la Participación en más de 50 Proyectos (17 Europeos, Siendo V. Hernández el Project Manager en 10 de Ellos). 7 de Ellos en el Sector Médico (HIPERCIR, DISMEDI, VRSUR, IDEAS, EUTIST-M, TT@MED, EGEE). El GRyCAP se Encuentra Integrado en el Instituto de 450 400 350 Aplicaciones de las 300 Tecnologías de la Información 250 y Comunicaciones Avanzadas 200 150 (ITACA) y en el Centro en Red 100 de Ingeniería Biomédica 50 (CRIB). 0 www.grycap.upv.es Financiación (en Keuro) Europea Naciona Origen de los Fondos Privada Total 2002 2003 2004 INFSO-RI-508833 4

Grupo de Redes y Computación de Altas Prestaciones Conceptos Generales El Grid es una Infraestructura que Permite que Comunidades Virtuales Compartan Recursos Heterogéneos y Distribuidos con el Objetivo de Resolver un Problema Común Difícilmente Abordable Mediante Otras Tecnologías y Sin Comprometer la Independencia en la Gestión de los Recursos Individuales. El Grid es una Arquitectura Software (Middleware) y una Serie de Componentes que Proporcionan Altas Prestaciones, Alta Disponibilidad, Tolerancia a Fallos, Seguridad e Interoperabilidad de Datos y Computadores. Los Grids de Datos (DataGrids) Consideran como el Recurso a Compartir el Espacio de Almacenamiento y los Datos. INFSO-RI-508833 5

Grupo de Redes y Computación de Altas Prestaciones Conceptos Generales Los HealthGrids son Servicios Grid o Componentes Middleware que Resuelven Problemas Específicos del Proceso de Datos Médicos. Los Recursos en los HealthGrids son Bases de Datos, Capacidad de Proceso, e Incluso Experiencia Médica o Equipos Médicos. En la Actualidad se Están Utilizando para la Asistencia en Epidemiología y en Tratamiento Individualizado del Paciente: Integración de Grandes Bases de Datos y Extracción de Conocimiento. Ejecución de Simulaciones Complejas de Modelos Biomédicos. Procesamiento e Integración de Bases de Datos Genómicas y Proteómicas. Creación de Entornos Colaborativos para Compartir Datos y Herramientas en Investigación. INFSO-RI-508833 6

Aplicación de los DataGrids en Salud Grupo de Redes y Computación de Altas Prestaciones Las Aplicaciones de los Grids de Datos Pueden Considerarse: Creación de un Repositorio Distribuido para el Almacenamiento Masivo de Datos Médicos. Apropiado para el Almacenamiento de Datos Biomédicos (Signos Vitales, Imágenes, Información Biomolecular). Especialmente Interesante en el Almacenamiento a Largo Plazo. Se Aprovechan los Recursos de Almacenamiento de un Conjunto de Sistemas. Integración de Repositorios Distribuidos. Apropiado Cuando las Bases de Datos ya Existen. Especialmente Interesante para la Extracción de Conjuntos de Datos Relevantes que Requieran un Postproceso. Se Puede Combinar el Uso de Recursos de Procesamiento Intensivo. INFSO-RI-508833 7

Grupo de Redes y Computación de Altas Prestaciones Gestión de las Organizaciones Virtuales y Seguridad Organiza Usuarios, Grupos, Permisos de Acceso, Autenticación y Autorización. Gestión del Almacenamiento Organiza el Almacenamiento y el Acceso a Datos y Recursos Distribuidos, Además de la Catalogación, Replicación y Control del Acceso. Gestión de la Carga de Proceso Proporciona el Balance de Carga y la Selección de los Recursos Compatibles y Adecuados. Sistema de Información y Accounting Permite Organizar y Descubrir los Recursos Disponibles en el Sistema, Así como Registrar su Uso. Componentes Básicos de los DataGrid INFSO-RI-508833 8

Componentes Básicos de DataGrids Grupo de Redes y Computación de Altas Prestaciones Gestión de las Organizaciones Virtuales y Seguridad. El Grid No Requiere la Creación de Cuentas Individuales para Cada Usuario en Cada Recurso. Los Usuarios se Identifican a Través de un User Interface Mediante Certificados X.509 (EU-GridPMA) y la Creación de un Proxy que Representa las Credenciales del Usuario en Cada Recurso ( Single Sign-on ). La Autorización en el Acceso de los Recursos Se Realiza Mediante Listas de Usuarios Gestionados de Forma Centralizada (Actualizada de Forma Periódica Incluyendo Listas de Revocación de Permisos). Los Permisos Se Otorgan a Nivel de Organización Virtual, Aunque los Esquemas Actuales (VOMS) Permiten Definir Subgrupos y Asignar Permisos (Incluso en el Acceso a Datos) Diferentes para Cada Grupo. Las Transacciones se Realizan Sobre Protocolos Seguros Mediante el Uso de Certificados. INFSO-RI-508833 9

Componentes Básicos de DataGrids Grupo de Redes y Computación de Altas Prestaciones Gestión del Almacenamiento Diferentes Orientaciones Almacenamiento Masivo Los Grids Permiten Utilizar de Forma Cooperativa el Espacio de Almacenamiento de los Diferentes Recursos del Grid. Este Espacio de Almacenamiento Se Gestiona de Forma Global en la Forma de un Gran Directorio Virtual. Integración de Repositorios Individuales Los Grids Permiten Incluir Interfaces sobre los Catálogos Individuales Para Construir una Gran Base de Datos Virtual. Los Datos se Gestionan por Organización Virtual, Incluyendo la Gestión de Permisos a Grupos de Usuarios Individuales. Los Grids Permiten la Creación de Réplicas de los Datos Para Aumentar la Eficiencia en el Acceso y Proceso de los Datos. La Gestión de los Datos se Realiza Mediante Catálogos que Contienen Información de los Identificadores, Réplicas y Ubicación Física de Todas las Réplicas. INFSO-RI-508833 10

Componentes Básicos de DataGrids Grupo de Redes y Computación de Altas Prestaciones Gestión de la Carga de Proceso Una Importante Aportación de los Grids es el Uso Cooperativo de los Recursos de Proceso de Datos. Los Recursos de Proceso se Gestionan de Forma Semi-Centralizada sin Renunciar a la Autonomía de Cada Centro, Accediendo a Través de Front-Ends que se Integran en un Nivel Superior. Existen Gestores de Carga que Deciden, Sobre los Recursos Disponibles, Cuál es el Más Adecuado Atendiendo a Factores Como Requerimientos, la Proximidad de los Datos o la Carga del Recurso. Los Recursos se Pueden Compartir para Varias Organizaciones Virtuales y Ser Accedidos por Diferentes Gestores de Recursos, (Incluso Varias Infraestructuras Grid). Adicionalmente a la Gestión Individual, Existen Herramientas de Control del Flujo (TABERNA) que Permiten una Gestión a Mayor Nivel. INFSO-RI-508833 11

Componentes Básicos de DataGrids Grupo de Redes y Computación de Altas Prestaciones Monitorización y Accounting La Selección de los Recursos Más Adecuados para el Proceso o el Acceso a Datos Requiere Conocer el Estado Actual de cada uno de los Procesos. La Introducción de Nuevos Recursos Debe Ser lo Más Transparente Posible para los Usuarios y los Administradores. Los Diferentes Recursos Publican la Información Necesaria Para Su Descubrimiento y Gestión en un Esquema Jerárquico. Además los Recursos Registran Todas las Operaciones Realizadas por los Usuarios Individuales (Seguridad o Explotación). Tradicionalmente se ha Utilizado una Jerarquía de Servidores LDAP (GT-MDS), Aunque en la Actualidad se Están Sustituyendo por Sistemas Basados en Bases de Datos Relacionales (R-GMA). INFSO-RI-508833 12

Grupo de Redes y Computación de Altas Prestaciones Proyectos y Ejemplos de la Utilización de Grids en el Ámbito Médico INFSO-RI-508833 13

Grids para Salud en la Actualidad Grupo de Redes y Computación de Altas Prestaciones Áreas de Aplicación de los Grids en Salud Imagen Médica Federación de Archivos (BIRN, GRID-IT, EMBRACE). Mamografía (NDMA, MAMMOGRID, ediamond, GPCALMA). Proceso de Imágenes (DataGrid, EGEE-NA4). Terapia Simulación de Radioterapia (GATE, GEMSS-RADPT). Simulación Absorción de Fármacos (GEMSS-Cophit). INFSO-RI-508833 14

Grids para Salud en la Actualidad Grupo de Redes y Computación de Altas Prestaciones Áreas de Aplicación de los Grids en Salud Bio-computación Simulación de Dinámica de Proteínas y Ontologías Genéticas (BioGRID, GPS@, INFOGENMED, GenoGrid, mygrid ).. Simulación Biomédica y Planificación Quirúrgica Vascular (CROSSGRID, GEMSS-BloodSim). Maxilo-Facial (GEMSS). Actividad Cardiaca (gcamaec). INFSO-RI-508833 15

Gestión de un Almacenamiento Virtual de Imágenes Médicas Grupo de Redes y Computación de Altas Prestaciones Vista: (p.e. Pacientes entre 1 y 2 Años con Hallazgos en el Lóbulo Frontal) Experimento: (p.e. Neuroblastoma) Comunidad de Usuarios: (p.e. Neuroimágen Pediátrica) Conjunto de Datos: Totalidad de las Imágenes e Informes Compartidos Virtualiza un Repositorio Global Compuesto por Almacenes Individuales. Creación de Diferentes Niveles en los que Se Organizan Datos y Comunidades Virtuales. Definición de Ontologías y Esquemas que Permitan Indexar los Datos Semánticamente. Integración de Elementos de Pre- y Post- Proceso. Seguridad, Pseudo-Anonimización y Soporte a la Protección de la Privacidad. Sin Alteración de los Procesos Normales de la Práctica Clínica. INFSO-RI-508833 16

Grupo de Redes y Computación de Altas Prestaciones Entornos Peer-to-Peer Un Entorno Peer-to-Peer para Compartir Imágenes Médicas y Diagnósticos Proporcionando Búsquedas por Contenido. El Objetivo es Facilitar la Recogida de Casos Relativos a Patologías Infrecuentes o Para Completar una Muestra Suficientemente Grande Para Estudios Epidemiológicos. Aunque estos Estudios se Encuentran Disponibles en los Diferentes Centros, no Existe un Entorno Donde se Pueda Acceder de Forma Integral. La Herramienta Permite Compartir Estudios de Manera Individual, Uniendo Recursos Personales. Peer Implementa Autenticación, Anonimización Automática de los Datos, Búsquedas Distribuidas, Peer Transmisión Progresiva y Valoración de los Usuarios y Diagnósticos. INFSO-RI-508833 17 SERVER Peer

Proceso de Altas Prestaciones Grupo de Redes y Computación de Altas Prestaciones Renderizado de Imágenes Médicas de Muy Gran Dimensión Mediante Grids Corporativos Dataset del Visible Human Project (1500 Cortes). La Reconstrucción Volumétrica Tiene un Elevado Consumo de CPU, pero También de Memoria. La Tecnología Grid Permite Compartir los Recursos de los Computadores Conectados a una Red (Memoria y Tiempo de Procesamiento). Corregistración en Grid Almacenamiento Distribuido y la Corregistración Mediante Métodos Elásticos de Secuencias de MRI del Abdomen. Orientado al Estudio de la Farmacocinética. Reducción en un Factor de 12 del Tiempo de Proceso. INFSO-RI-508833 18

Grupo de Redes y Computación de Altas Prestaciones Infraestructuras Grid EGEE Enabling Grids for E-Science Crear una Infraestructura Grid en Producción Eficiente y de Calidad a Nivel Europeo. Actualmente Engloba 10000 Recursos de más de 27 países (Incluyendo Asia-Pacífico y Norteamérica). Más de 400 Computadores se Dedican a Biomedicina. Orientado al Despliegue de Aplicaciones en Producción para el Soporte a la e-ciencia en Diferentes Áreas Física de Altas Energías. Biomedicina. Otras: Geofísica, Meteorología, Astronomía. Miembros de la Asociación HealthGrid Vicente Hernández es uno de los Fundadores. El Objetivo de la Asociación es la Integración de Grupos e Investigadores en Grid con Interés en la Aplicación de estas Tecnologías sobre la Salud. Cuenta con 50 Socios y ha sido la Promotora del Libro Blanco sobre Grid para Salud, Encargado por la EC. La UPV ha Sido la Encargada de la Elaboración del Primer Capítulo de Dicho Libro. INFSO-RI-508833 19

Grupo de Redes y Computación de Altas Prestaciones Beneficios y Conclusiones Las Tecnologías Grid Permiten el Almacenamiento y Proceso de Datos a Gran Escala Utilizando Recursos Estándar ( Comodity ). En el Ámbito Médico Existen Numerosos Ejemplos Altamente Satisfactorios en el Uso de Estas Herramientas para Crear Bases de Datos Federadas. Además, el Grid Proporciona la Capacidad de Realizar Procesamiento Complejo e Intensivo. Las Áreas de Aplicación más Extendidas son Imagen Médica y Genómica, Aunque Existe un Gran Potencial en Otras Áreas. INFSO-RI-508833 20

Grupo de Redes y Computación de Altas Prestaciones Más Información Ignacio Blanquer Universidad Politécnica de Valencia Camino de Vera s/n 46022 Valencia, Spain Tel: +34-963877356 Fax. +34-963877359 E-mail: iblanque@dsic.upv.es INFSO-RI-508833 21