Continuidad del Servicio de la Seguridad Social Gerencia de Informática de la Seguridad Social DINTEL 27 de Noviembre de 2012
Índice de contenidos 1. Introducción 2. Principal objetivo 3. Evolución 1: Respaldar los 4. Situación de la GISS 5. Verificación de Operatividad 6. Evolución 2 7. Beneficios 2
1. Introducción En la actualidad los datos que residen en los sistemas de información son el activo mas valioso para cualquier organización. Si cabe aún más importantes son para la Seguridad Social debido al impacto que pudiera tener la perdida total y/o parcial de estos en el conjunto de los ciudadanos. Por esto, la Gerencia de Informática de la Seguridad Social dispuso una estrategia en la que el principal objetivo era el de asegurar tanto la disponibilidad como la integridad de los datos. 3
2. Principal Objetivo Asegurar una copia fiable de los Datos. Los sistemas de copia de seguridad desplegados en el Centro de Respaldo se identifican como: 2ª Copia de datos: Sistema de replica en disco mediante la utilidad Copia Síncrona. Realiza una copia completa de los datos del almacenamiento principal. 3ª Copia de datos: Sistema de replica en disco mediante la utilidad Copia Asíncrona, realiza la copia del dato original en un momento dado, en el caso actual cada 4 segundos. La copia de datos es selectiva, es decir, solo se copian los datos identificados como más críticos y cuyos servicios se prueban con una periodicidad mensual. 4
2. Principal Objetivo C. Síncrona 5
2. Principal Objetivo Copia en Cinta: Sistema mediante el cual se realizan copias a cinta a través de políticas de backup preestablecidas. 6
3. Evolución 1: Respaldar los Una vez asegurados los datos, el segundo objetivo fue el respaldo de los servicios que permitiesen gestionar los datos, de tal manera que también se asegurase la disponibilidad de aquellos servicios de negocio identificados como críticos para la Seguridad Social. 7
3. Evolución 1: Respaldar los Estratégicos Centro de Respaldo Entidades Externas Colaboradoras en la gestión Procesos hacia Entidades externas Afiliación RED Internet Graduados Sociales Prestaciones Ciudadanos Recaudación Procesos de intercambio de datos Aplicaciones Pros@ Información Respaldada Entidades SEG-SOCIAL Internos Centro de Respaldo de correo Entidades Financieras 8
3. Evolución 1: Respaldar los Tipos de Contingencia. Total Cese total del servicio desde el Centro Principal Cubre la continuidad en el Centro de Respaldo para los servicios respaldados. Parcial Fallo parcial de algún componente físico o lógico Cubriría la continuidad de ese elemento tecnológico en el Centro de Respaldo, manteniendo el resto de servicios en el Centro Principal. 9
3. Evolución 1: Respaldar los Contingencia Total Centro Primario Centro Secundario (Torrejon) Servicio de Negocio 1 Servicio de Negocio 1 Servicio de Negocio 2 Servicio de Negocio 2 10
3. Evolución 1: Respaldar los Contingencia Total Centro Primario Centro Secundario (Torrejon) Servicio de Negocio 1 Servicio de Negocio 1 Servicio de Negocio 2 Servicio de Negocio 2 11
3. Evolución 1: Respaldar los Contingencia Total Centro Primario Centro Secundario Centro Secundario (Torrejon) Servicio de Negocio 1 Servicio de Negocio 1 1 Servicio de Negocio 2 Servicio de Negocio 2 2 12
3. Evolución 1: Respaldar los Contingencia Parcial Centro Primario Centro Secundario (Torrejon) Servicio de Negocio 1 Servicio de Negocio 1 Servicio de Negocio 2 Servicio de Negocio 2 13
3. Evolución 1: Respaldar los Contingencia Parcial Centro Primario Centro Secundario Servicio de Negocio 1 Servicio de Negocio 1 Servicio de Negocio 2 Servicio de Negocio 2 14
3. Evolución 1: Respaldar los Contingencia Parcial Centro Primario Centro Secundario Servicio de Negocio 1 Servicio de Negocio 1 Servicio de Negocio 2 Servicio de Negocio 2 15
4. Situación Actual Respaldo de la información actualizándose de forma síncrona en ambos Centros. Respaldo de los servicios de negocio críticos para la organización. Respaldo de las plataformas tecnológicas que dan soporte a estos de Negocio. Definidos los Planes Operativos donde se indica la operativa para la recuperación de los servicios ante contingencias. GARANTÍA DE LA CONTINUIDAD DE LOS SERVICIOS CRITICOS 16
4. Situación Actual La infraestructura de la que dispone el Centro de Respaldo está compuesta por 119 servidores con una capacidad total de proceso de: Sistemas Particionables 261 procesadores 3000 GB de memoria Sistemas no Particionables 65 procesadores 232 GB de memoria Almacenamiento Robótica;1,16 PB Disco; 582 TB 17
5. Verificación de Operatividad Probar, probar, probar. 18
5. Verificación de Operatividad La funcionalidad del Centro de Respaldo se garantiza mediante Pruebas Periódicas. Pruebas de aspecto Técnico Calendario de Pruebas Mensuales Pruebas de Contingencia Total (Arranque Completo del C.R.) Pruebas de Garantía del Servicio de Negocio Anuales Pruebas por Servicio de Negocio Pruebas de Comunicaciones 19
5. Verificación de Operatividad Probar, probar, probar. Pruebas de Contingencia Total; Se encuadran dentro de las pruebas mensuales y consisten en arrancar todos los servicios respaldados. El procedimiento definido para la consecución de las pruebas es el siguiente: Día 1; Día 2; Día 3; Día 4; Aislamiento a nivel de comunicaciones del Centro de Respaldo. Corte de la 3ª copia de datos. Arranque de la infraestructura. Ejecución de los procesos de inicio de la auditoría de rastros. Ejecución de pruebas unitarias y de arquitecturas de servicios. Activación y pruebas de los servicios de negocio respaldados. Ejecución de los procesos de cierre de la auditoría de rastros. Parada del Centro de Respaldo. Restablecimiento de la 3ª copia de datos. Restablecimiento de las comunicaciones entre centros. 20
5. Verificación de Operatividad Probar, probar, probar. Pruebas por Servicio de Negocio; Se encuadran dentro de las pruebas mensuales y consisten en la ejecución de un plan de pruebas funcionales, especifico por cada servicio de negocio respaldado, que elaboran los Centros de Desarrollo. Cada mes se invita a uno de estos centros para que lleve a cabo su plan de pruebas y emita un informe que certifique la disponibilidad de los servicios. Día 3; Ejecución del plan de pruebas funcionales definido por los Centro de Desarrollo. 21
5. Verificación de Operatividad Probar, probar, probar. Pruebas de Comunicaciones; Se encuadran dentro de las pruebas anuales y debido a sus características técnicas se realizan en momentos en los que se para la producción, por ejemplo, corte eléctrico por mantenimiento. Pruebas de Comunicaciones: consiste en la ejecución del protocolo de redirección definido por Telefónica para que todas las comunicaciones de la Organización sean dirigidas al Centro de Respaldo, de forma transparente para las oficinas y los usuarios, incluidos los servicios de Internet. Centro Respaldo Centro Principal 22
6. Evolución 2 Pero. Podemos permitirnos tener sistemas que cuestan permanentemente ociosos???? Entonces. DEBEMOS EVOLUCIONAR!!! 23
6. Evolución 2 Partíamos de.. CENTRO PRINCIPAL CENTRO DE RESPALDO PRODUCCIÓN EXTERNA SERVICIOS DE NEGOCIO PRODUCCIÓN EXTERNA SERVICIOS DE NEGOCIO A B C Z A B C H Usuarios Gestión TGSS, INSS, ISM (ciudadanos, EEFF, Graduados, etc.) Usuarios Gestión TGSS, INSS, ISM (ciudadanos, EEFF, Graduados, etc.) PRODUCCIÓN INTERNA DESARROLLO FORMACIÓN PREEXPLOTACIÓN 24
6. Evolución 2 FASE 1 Usar recursos del CPD del Centro de Respaldo para entornos colaterales a la Producción: Desarrollo, Test, Formación. Objetivo.- Conseguir que los recursos del Centro de Respaldo no estén infrautilizados y liberar al Centro Principal de la carga de esos entornos. Pasos dados.- En la actualidad algunos entornos de desarrollo, como integración Pros@, se alojan en el Centro de Respaldo almacenando los datos en el Centro Principal. Otros entornos candidatos a funcionar con esta tipología por no ser críticos son: Formación, otros entornos de Desarrollo, Pre explotación, etc. 25
6. Evolución 2 FASE 1 (cont.) En caso de contingencia los recursos utilizados para los entornos de Producción Interna son utilizados para dar soporte a los de Negocio durante el tiempo que se mantenga dicha situación. 26
6. Evolución 2 FASE 2 Incorporar infraestructura simple de servicios respaldados para reforzar la Producción del Centro Primario. Objetivo.- Reforzar los servicios de producción con recursos del Centro de Respaldo ante picos de trabajo. Pasos dados.- En la actualidad el servicio de presentación del Portal de la Intranet se encuentra balanceado con un servidor del Centro de Respaldo a través de una LAN extendida. Se están realizando pruebas en el laboratorio para ver otras opciones. 27
6. Evolución 2 Fase 3 Alta Disponibilidad. 28
6. Alta Disponibilidad Fase 3.- El Centro de Respaldo pasa a ser un centro en Alta Disponibilidad. Objetivo.- Los servicios se balancean entre ambos centros siendo el Principal el que decide el volumen de usuarios que deriva a los recursos del Centro de Respaldo. Pasos dados.- Se está realizando un estudio de diferentes soluciones para cada uno de los entornos. 29
6. Alta Disponibilidad 30
7. Beneficios Alta Disponibilidad. Los principales beneficios de esta evolución son: Ahorro de costes; Evita el sobre dimensionamiento del CPD principal al poder aprovechar la capacidad de proceso del Centro de Respaldo para picos de trabajo. Reduce la inversión en el CPD Principal destinada a entornos no productivos (desarrollo, formación, etc) ya que se aprovecha el equipamiento del Centro de Respaldo para estos entornos. 31
7. Beneficios Alta Disponibilidad. Aseguramiento de disponibilidad; Automatiza la actualización de los servicios respaldados y minimiza las intervenciones manuales con lo que se evitan errores. Prueba continua de las arquitecturas que soportan los servicios respaldados al encontrarse integradas en la propia producción, con lo que se asegura su correcto funcionamiento. 32
7. Beneficios Alta Disponibilidad. Respuesta ágil; Minimiza las intervenciones manuales y en consecuencia reduce los tiempos de activación del Centro de Respaldo al encontrarse los servicios activos. 33
Sistemas de Información de la Seguridad Social Gerencia de Informática de la Seguridad Social