e s t i u 2 0 0 3 S7. 2n Seminari Internacional sobre imatge mèdica i les tecnologies de la informació La explosión del contenido digital fijo Angel García Ramos Director Almacenamiento CAS EMC Computer Systems s e g o n a e d i c i ó s a b a d e l l u n i v e r s i t a t 2003 EMC Corporation. All rights reserved. 1
2003 EMC Corporation. All rights reserved. 2 La Explosión del Contenido Digital Fijo Angel García Ramos Director Almacenamiento CAS EMC Computer Systems
2003 EMC Corporation. All rights reserved. 3 Problema: La explosión del contenido fijo 2005 24B 75% de la nueva información será contenido fijo objetos 40,000 AC pinturas de las cavernas 3500 escritura 0 C.E. papel 105 Mas información en los próximos dos años que en toda la historia de la humanidad Fuente: Universidad de Berkeley 1450 imprenta 1870 electricidad, telefono Ordenador de 1947 transistores 1950 Finales 1960s Internet (DARPA) 1993 La web 2004 12B 2003 6B 2002 3B 2001 GIGABYTES
2003 EMC Corporation. All rights reserved. 4 Pero Que es el contenido fijo? Objetos de datos invariables y con valor por largos periodos RAYOS - X Historiales Clínicos MRI RIS Contratos HIS Periódicos/Revistas Libros Presentaciones Manuales Originales CAD/CAM E-mail y anexos Material de entrenamiento MP3s Angiografías Grabaciones Transcripciones Fotos Profesionales Fotos de aficionado Videos Educacionales Videos de vigilancia Datos Sísmicos Datos Astronomía Hojas de Cálculo Gráficos Código Fuente Datos Genómicos Datos Proteomicos Resultados test clínicos Datos Biométricos Cuadernos de Lab. Backups Documentos Históricos Libros Contables Informes Mensuales Video conferencias Audio conferencias Documentos legales Registros del Gobierno etc., etc., etc.
El entorno sanitario produce ingente cantidad de información Hospital Information System Transcripción Voz a Web Instrumentación Clínica E-Learning Radiology Information System Cardiología HOSPITAL CRM para Sanidad Radiología Registros Médicos Administración 2003 EMC Corporation. All rights reserved. 5
2003 EMC Corporation. All rights reserved. 6 pero la mayor informacion se produce Tomografía Axial Computer. 250 MB por paciente Otros Ejemplos Cateterización Cardiaca: Angiografía: MRI Funcional: Radiografía Tratada 10 MB +1 GB / estudio +1 GB / estudio Radiografía Digital 10 MB 800 1.000 imágenes = 200 MB 250 MB / estudio Ultrasonido General / Cardiaco: 700 MB 1.5 GB / estudio Endoscopia y Colonoscopia: 1 2 GB / estudio
2003 EMC Corporation. All rights reserved. 7 Contenido Fijo: Nuevas demandas de uso El Contenido fijo se acumula rápidamente y necesita ser preservado por largos periodos, y su integridad debe estar asegurada: 21 años para información Pediátrica La vida del paciente para enfermos de cáncer 7 años para pacientes adultos Contratos/Documentación Financiera. Imágenes Facturas Requerimientos de Acceso en tiempo real humano (velocidad internet) La cinta y el Disco Optico no satisface ya los requerimientos de información frecuentemente accedida Mantener la información online incrementa su acceso y valor Mejor uso por los usuarios actuales > Mejoras de 10 x en la velocidad de acceso La disponibilidad Online del contenido reorienta a servicios de valor añadido el mismo ( Alzheimer Corporativo ) Posibilidad de enviar por web expedientes médicos a otros centros Información que necesita ser accedida simultáneamente por varios usuarios Compartir informes médicos entre distintos especialistas, i.e.
2003 EMC Corporation. All rights reserved. 8 Un poco de Jerga CUAL ES LA DIFERENCIA ENTRE BACKUP Y ARCHIVING? Archiving = 1ª Copia del dato puede tener copias en cualquier otro lugar. El Archiving se escribe aleatoriamente. El Archiving se lee aleatoriamente. El Archiving se controla con criterios de permanencia, autenticidad e integridad. Backup = 2ª Copia del dato La 2ª copia es ráramente usada. El Backup se escribe secuencialmente. El Backup se lee secuencialmente
2003 EMC Corporation. All rights reserved. 9 Estrategia Tradicional de (seudo) Archiving On - line RAID 1 4 segundos Número de Accesos por MB Near - Line Disco Optico / CINTA rápida 20 50 segundos Off-Line Cinta Tradic. 20 segundos 20 minutos Días Meses Años Tiempo
2003 EMC Corporation. All rights reserved. 10 Estrategia de Archiving ( Content Adressed Storage ) Direccionamiento por contenido Número de Accesos On-Line RAID Corto Plazo 1 4 segundos por MB Archiving On-Line CAS 5-20 segundos Dias Meses Tiempo Años
2003 EMC Corporation. All rights reserved. 11 Tiempos de llegada de imagen desde: LAN de 100 Mbps CX400, Centera, Cinta DLT Demostración en tiempo Real Dr. Radiólogo pide 10 Mb. imagen Dr. Radiólogo pide 250 Mb. imagen R-X Pecho Estudio MRI TIEMPOS DE LLEGADA DESDE CADA SOPORTE Dr. Cardiólogo pide + 1 Gb. Película DICOM Angiografía Disco RAID CAS CENTERA Cinta
2003 EMC Corporation. All rights reserved. 12 Necesidad de extender el ciclo on-line Antes Ahora Futuro Near/Off Line Ciclo On-line RAID Cinta/D.Optico Ciclo On-line RAID CAS 100% On-line RAID CAS Cinta/D.Optico Acceso más rápido a los contenidos que las cintas y/o dispositivos ópticos Optimización de contenidos, eliminando información duplicada Mejorar la calidad de servicio y la disponibilidad Gestión mas simplificada
2003 EMC Corporation. All rights reserved. 13 La Evolución en los Servicios Sanitarios El futuro de la Negocio Sanitario es totalmente dependiente de la gestión, compartición y la protección de la información digitalmente Sanidad Mañana Sanidad Ayer 1ª ERA Película y registros en papel Hospitales Autónomos Sistemas Departamentales Aplicaciones a medida Sanidad Hoy TRANSICION 2ª ERA Redes Hospitalarias / Adquisiciones Registros Médicos electrónicos PACS Aplicaciones Comerciales 3ª ERA Sector regulado por ley (HIPAA) 100% contenido digital Redes de distribuc. de información Sistemas Centralizados Posibilidad de acceso y envio por Internet de información clínica y médica
2003 EMC Corporation. All rights reserved. 14 Previsión del Negocio PACS en USA para 2003 2003, una oportunidad de negocio de almacenamiento de 800 M$ en: Archiving y hardware de almacenamiento Software de Archiving Mejoras Fuentes: Frost & Sullivan, IDC, GartnerGroup Mas de 2 billones radiografías son realizadas en el mundo cada año, que si fueran digitalizadas a una calidad de 8 MB por imagen, conllevarían 17 PetaBytes de almacenamiento anualmente, de acuerdo con la Universidad de Berkeley Según Frost & Sullivan, en el 2008, el 36% de los hospitales tendrán implementado una solución PACS
Como funciona CAS? 2003 EMC Corporation. All rights reserved. 15
Como Funciona CAS - Centera El Servidor PACS envía el estudio para ser escrito El Objeto es enviado a Centera sobre IP convencional Centera Se crea el estudio por el dispositivo/s correspondiente y es enviado al servidor PACS La Dirección por Contenido se retiene en la base de datos PACS para futuros accesos del estudio La Dirección por Contenido se devuelve al servidor PACS sobre IP Centera genera la dirección por contenido UNICA 2003 EMC Corporation. All rights reserved. 16
2003 EMC Corporation. All rights reserved. 17 Direccionamiento por contenido ( CAS ) Las Direcciones de contenido son huellas digitales de 128-bit 4PJGVL39UEK7ReDN9JM0A2HR3U6JM0A239UEKPJGVL3KWE47R937TR. 10111010 MD5a 27 caracteres Son Globalmente Únicas para cada Objeto y Completamente independientes de donde esté almacenado el objeto 11000101 MD5a 27 caracteres distintos 3C08JM40C8AMMe0N8ATEJHC2DQN45ERTYCV974DFGJDJ6D34FGK8JQ Como la huella digital, la dirección por contenido es UNICA
2003 EMC Corporation. All rights reserved. 18 Ejemplo práctico RADIOGRAFIA RADIOGRAFIA2
2003 EMC Corporation. All rights reserved. 19 Cual es la probabilidad de Colisión de una Dirección por Contenido basada en el algoritmo MD5-a? La probabilidad de colisión viene expresada por n x m 2 /2 k donde: n es el numero de objetos almacenados en el dispositivo/s m es el objeto mas grande en bits k es el tamaño de la Direccion por Contenido en bits (128 para Centera) Ejemplo: Para un pool 100TByte con objetos no mayores de 100MB, la probabilidad de colisión es: 1 en 10-17 Como se prevén cantidades inmensas de información, incluso cuando es posible una colisión, se alarga en dos bytes la Dirección por Contenido
2003 EMC Corporation. All rights reserved. 20 Arquitectura RAIN: Distribución Inteligente de Objetos & Auto regeneración En fallo de Disco, copia de Disco En fallo de Nodo, copia de Nodo En Fallo de Switch o puerto, todo tráfico se enruta por las conexiones LAN activas Private LAN 1 2 3 4 5 6 4 4 3 LAN IP En caso de fallo de una linea de Alimentación, se marcan todos los datos como Solo Lectura hasta que se restablece la linea de Alimentación Private LAN 3 6 1 5 2 6 1 5 2
2003 EMC Corporation. All rights reserved. 21 Por qué es importante el Direccionamiento por Contenido? La Dirección por contenido es independiente de la localización: No hay Gestión de recursos El sistema es un gran repositorio que se autoadministra Objetos idénticos solo se almacenan una única vez: Maximiza la Eficiencia MD5 detecta copias idénticas Absoluta seguridad de la autenticidad del contenido: Fiabilidad asegurada Proceso continuo background que chequea la integridad de los datos ( cumple con HIPAA, 21 CFR p11, DoD, SEC, ) Migraciones sin coste: Protección de la Inversión Nuevas capacidades y velocidades, no implican migrar datos, solo añadir a lo existente Reclamación del espacio: Medio Reutilizable Una vez expirado el periodo de retención prefijado, el sistema reclama el espacio liberado
2003 EMC Corporation. All rights reserved. 22 Propuesta de Valor CAS para PACS Altas Prestaciones, cache intermedia mínima y el archiving en tiempo real humano (experiencia internet) Mejora asistencial a la toma de decisiones clínicas al posibilitar ON-LINE capacidades inmensas (> 1 PetaByte) Posibilita centralizar los datos y recursos, al hacer uso de tecnología LAN IP ubicua totalmente accesible a Hospitales/servicios remotos Asegura la información, recuperación (DR) y continuidad del servicio
Compartición y Replicación para Accesos remotos Repositorio Central Archivo Historico Pueden ser almacenados decenas de años El Acceso puede ser auditado (HPPA) Veracidad del contenido garantizada Permite acceso a información distribuida Permite la recuperación frente a desastres Gestión Mínima Cumple con normativa HIPAA WAN IP WAN IP Hospital WAN IP Repositorio Corto plazo Repositorio Corto plazo Clinica Radiológica 2003 EMC Corporation. All rights reserved. 23
2003 EMC Corporation. All rights reserved. 24 Escenario PACS con CAS - CENTERA CT Rayos X Estaciones Radiológicas Acceso Web LAN IP UNIX Windows UNIX Servidores PACS Servidores RIS SAN Cache imágenes corto plazo CAS Archiving largo plazo ON-LINE Centera
2003 EMC Corporation. All rights reserved. 25 Mejoras en las aplicaciones PACS por uso de CAS Multi-nivel, Distribuido geográficamente, opción de inmensos repositorios ON- LINE multi-media Flexibilidad de Arquitectura CAS nueva opcion a las tradicionales SAN, NAS Centralización de la información y su administración, automatización, recuperación frente a desastres, continuidad de servicio Drástica reducción de la carga de los servidores al externalizar y reducir la recuperación/grabación de información
2003 EMC Corporation. All rights reserved. 26 CENTERA LO MEJOR DE VARIOS MUNDOS + + + Online, como el disco WORM, como los discos ópticos Coste de propiedad, como la cinta + Beneficios del CAS Nuevo + Autenticidad Garantizada y Verificable + Eliminación de duplicados + Protección de cambios tecnológicos + Autoconfigurable, Autogestionado y Autoregenerativo = EMC Centera Content Addressed Storage
2003 EMC Corporation. All rights reserved. 27 Validación del mensaje 90 % de las mayores redes asistenciales* de USA han adoptado almacenamiento de EMC, 2003 Una red hospitalaria española regional centraliza sobre 32 Terabytes de CENTERA la información PACS de 10 Hospitales La red hospitalaria de Nueva York North Bronx centraliza sobre 158 Terabytes de CENTERA los datos de 6 centros acerca de MRI, PACS, HIS, RIS 9 redes hospitalarias europeas centralizan sobre CENTERA su archiving Rogers Medical Intelligence, proveedor en USA de información sanitaria, clínica y biotecnológica a través de internet a centros hospitalarios, utiliza CENTERA como archiving central <<porque sus datos carecerían de valor sin la garantía de autenticidad inalterable y disponibilidad on-line para ser enviada al instante>> El condado de Nueva Escocia, Massachussets, centraliza la información de 34 hospitales de cada uno de los pacientes atendidos, en un proyecto a 3 años.. (*) Según la revista Modern Healthcare
2003 EMC Corporation. All rights reserved. 28 Muchas Gracias Angel García Ramos / garcia_angel@emc.com