Jorge Cossani Líder de Servicios de Datacenter jcossani@uy.ibm.com
Agenda Los desafíos de ayer y hoy. Infraestructura Física Misión Crítica Disponibilidad y Confiabilidad Mejores Prácticas 2
Donde vamos? CLOUD aprovisionar y medir cargas de trabajo estandarizadas Skills Processes Assets and Tools Information Analytics Entregar infraestructura COMPARTIDA basada en profiles predefinidos de carga VIRTUALIZAR servidores/aplicaciones para incrementar la utilización y la automatización CONSOLIDAR la infraestructura fisica para alcanzar los objetivos de transformación Entregar capacidad DINAMICA automatizada en función de las cargas de trabajo SIMPLIFICAR las operaciones con una arquitectura probada y una gestión e implementación estándar. Dedicated Server Management Virtualized Server Management Cloud Services 3
Que cambió? A que nos enfrentamos cuando queremos diseñar o mejorar la infraestructura física de nuestro Data Center? Qué debemos considerar al momento de enfrentarnos a la remodelación o reconstrucción de nuestro Data Center? DISPONIBILIDAD? REDUNDANCIA? CONFIABILIDAD? COSTOS DOWNTIME? DATA CENTER MISION CRITICA? 4
A que nos referimos cuando decimos Infraestructura Física? es un sistema formado por todos los componentes que garantizan que el Equipamiento IT tenga todo lo que necesite para poder tenerlo disponible cuando lo necesitemos. Esto está formado por: Cableado estructurado Power Cooling Estructura física y racks Seguridad física (control de acceso, CCTV, detección y extinción de incendios) - Servicios de monitoreo y gestión. 5
Cuál es la criticidad de nuestro Data Center? Es nuestro Data Center esencial en el funcionamiento de nuestro negocio? Es nuestro Data Center critico la llevar a cabo la misión de nuestra organización? Es nuestro Data Center de Misión Crítica? Si la respuesta es SI, una posible caida del Data Center debe ser manejada como una crisis dentro de la organización. 6
Qué caracteriza a las crisis? Las crisis son caracterizadas por estos elementos: Son una amenaza para las metas de la organización 1.El elemento sorpresa (el poco tiempo disponible para poder tomar una decisión). 2.Generan incertidumbre Otro factor que influye en el manejo de las crisis es que habitualmente se lidia con ellas cuando ya ocurrieron. 7
Costos de Indisponibilidad Por lo tanto si nuestro Data Center es de Misión Crítica, debemos trabajar con antelación sobre todas las posibles amenazas que puedan afectar su funcionamiento. La inversión en Infraestructura Física mitiga estos y otros riesgos, afectando directa e indirectamente Aumento de los ingresos Reducción de los costos Una mejor utilización de los activos Por lo tanto es más eficiente una estrategia que reduzca el tiempo de inactividad del Data Center ante cualquier causa, o dicho de otro modo: Una estrategia que aumente la disponibilidad y confiabilidad del Data Center 8
Confiabilidad y disponibilidad Confiabilidad (Reliability - hs): Es la habilidad de un sistema o un componente de llevar a cabo sus funciones requeridas bajo condiciones establecidas durante un periodo determinado de tiempo. Disponibilidad (Availability - %): Es el grado en el que un sistema o un componente esta operativo, o sea el porcentaje de tiempo que se compromete a que un sistema o componente sea operacional y accesible cuando es requerido. Ejemplo: para un sistema 7x24: La disponibilidad de 95% se traduce en 18 días y 6 horas en que no está disponible. 98% son 7 días 7 horas 12 minutos 99% son 3 días 15 horas 36 minutos 99,9% son 8 horas 45 minutos 36 seg 9
Calculo de Disponibilidad Para el cálculo de Disponibilidad es necesario tener en cuenta dos valores: MTBF (Mean time between failure) Es el tiempo promedio entre fallas inherentes al sistema. Su definición depende de que se considera una falla del sistema. MTTR (Mean time to recovery) Es el tiempo promedio esperado para recuperar un sistema de un estado de falla. Incluye los tiempos de diagnostico, reparación y puesta en marcha. Disponibilidad = MTBF MTBF + MTTR Entonces para aumentar la disponibilidad de nuestro Data Center, es necesario trabajar en aumentar nuestro MTBF y en disminuir nuestro MTTR. Esto se logra trabajando sobre nuestra REDUNDANCIA de equipos. 10
Niveles de redundancia Siendo N los requerimientos básicos de un sistema los distintos niveles de redundancia se clasifican en: N+1 Un módulo o componente adicional N+2 Dos módulos o componentes adicionales 2N Unidades completas duplicadas 2(N+1) Unidades completas con módulos adicionales y duplicadas 11
Conclusión Al enfrentarnos al diseño de un Data Center, o a una oportunidad de mejora de la infraestructura de uno existente: Primero debemos tener conciencia de que costos de Indisponibilidad que manejamos, para luego definir el nivel de Disponibilidad al que queremos llegar. Una vez definido el nivel de Disponibilidad, se puede comenzar a trabajar en nuestro diseño de Infraestructura Física. 12
Diseños adecuados a nuestros clientes. Scalable modular data center Enterprise modular data center Portable modular data center High density zone Hasta 20% menos que diseños tradicionales Implementación de 8 a12 semanas. Diferir el 40-50% del capex y el opex. Reducir hasta un 50% los costos operacionales. Fully functional data center Implementación en 12 a 14 semanas. 35% lower cost than site retrofit Sin impacto en las operaciones. Watch a video at :http://www-03.ibm.com/systems/data/flash/dynamicinfrastructure/datacenterdesignsolutions/
Herramientas globales, capacidad local.
Mejores Prácticas Globales En abril de 1999, un grupo de ingenieros y personal técnico de operaciones representativo de todos los Data Centers de IBM en EE.UU. se reunieron para intercambiar ideas y discutir un conjunto de normas por las cuales las instalaciones de los Data Centers de IBM podían ser diseñados y operados. El objetivo de este trabajo fue el de mejorar la confiabilidad (reliability) de las instalaciones y administrar los costos de operación de forma más eficaz. El grupo analizó la información existente de cortes de servicio previos en busca de las causas raíz relacionadas con las instalaciones físicas que produjeron los cortes de servicio. Así fue que se identificaron áreas de exposición donde se detectaron vulnerabilidades. Estas áreas se convirtieron en la base de los documentos de Mejores Practicas. 15
Implementación Local Este documento aborda los siguientes temas relacionados a la operación de los Data Centers: Requisitos de personal Mantenimiento preventivo Entrenamiento de los operadores Control de empresas contratadas / tercerizadas Gestión de cambios Biblioteca de documentos críticos Monitoreo y alarmas Análisis y seguimiento de cargas Sistemas EPO (Emergency Power Off) Pruebas en fabrica y puesta en marcha Acuerdos de nivel de servicio Proceso de diseño Procedimientos post eventos 16
Construir Adaptar, construir y remodelar los data centers eficientemente Diagnosticar Buscar datos para entender el uso actual de energia e identificar oportunidades de mejora IBM Datacenter Medir y Gerenciar Utilizar software y procesos Virtualizar Implementar virtualización como formas alternativas de tecnología Refrigerar Usar formas innovadoras de refrigeración
Nuestra visión y servicios. Diagnosticar Diseño de Data Centers Portable Modular Data Center Small Data Center Rack Construir Adaptar, construir y remodelar los data centers eficientemente Buscar datos para entender el uso actual de energia e identificar oportunidades de mejora IBM Datacenter Medir y Gerenciar Utilizar software para gerenciar el consumo de energia Gestión de Data Centers Consolidación y mudanza Virtualizar Implementar virtualización como formas alternativas de tecnología Refrigerar Usar formas innovadoras de refrigeración Scalable Modular Data Center
El tip Una estrategia que aumente la disponibilidad y confiabilidad del Data Center