Oracle Minilesson Aprenda de los mejores Mejores Practicas para Implementar Ambientes de Misión Critica Martín Cabarique Con el auspicio de:
Agenda Estrategia Opciones con Oracle 11g R2 Oracle HA infraestructure Snapshot Stanby Databases Oracle Performance Analyzer Oracle Database Reply Oracle Active Dataguard Oracle Real Application Clusters Oracle RAC One Node Oracle Recovery Advisor Servicios Disponibles Conclusiones & Cierre
Estrategia Siete factores clave para implementar ambientes de misión crítica: Analisis de riesgo e impacto al negocio No hable mas de su estrategia como un programa de IT o bajo objetivos de IT. Su plan de continuidad debe estar integrado a los procesos del negocio Enfoquese hacia la continuidad de los procesos
Estrategia (Cont.) Haga un plan a tres años que muestre los avances en el tiempo, por ejemplo, reduciendo riesgos, acelerando el tiempo de recuperacion, reduciendo la taza de errores, etc. Asegure que su estrategia no dependa de unas pocas personas entrenadas. Haga pruebas periodicas Referencia: Linda Tucci, Senior News Writer - SearchCIO.com
Oracle HA Infraestructure Administración automática de la infraestructura de la base de datos. Incluido en todas las versiones Pequeño Clusterware para un solo servidor Comandos similares a RAC Srvctl start asm Srvctl start listener Srvctl start database -d rp Recuperación inmediata de fallas del Listener, ASM y Base de Datos.
Administre su Ambiente de Pruebas Usando Snapshot Standby Databases Redo stream Physical standby database Redo stream Open database Back out changes Perform testing Snapshot standby database SQL> ALTER DATABASE CONVERT TO SNAPSHOT STANDBY;
SQL Performance Analyzer SQL Performance Analyzer es util en casos como los siguientes: Database upgrades Implementation of tuning recommendations Schema changes Statistics gathering Database parameter changes OS and hardware changes
SQL Performance Analyzer: Como usarle Capture la Carga en Producción Traslade la Carga a un ambiente de pruebas Obtenga estadísticas iniciales de desempeño Haga los cambios previstos Obtenga las estadísticas de desempeño posteriores a los cambios Compare los dos resultados Afine los SQL desfavorecidos por los cambios
SQL Performance Analyzer: Reporte de Comparación
Para que usar Oracle Database Reply La mayor parte de fallas en el servicio se debe a cambios en los sistemas (software y hardware) Necesidad de identificar el impacto de los cambios antes de hacerlos en producción Las pruebas exhaustivas son muy costosas y el éxito de las mismas bajo Muchas fallas no son detectadas Cambios pueden afectar el desempeño y disponibilidad de las Aplicaciones Causa del bajo éxito de las prueba: Imposible hacer pruebas de carga reales dejando muchos fallas sin detectar. Database Replay hace posible hacer pruebas reales Copyright 2007, Oracle. All rights reserved.
Process capture files Vista Global de RAT Prechange production system Clients/app servers Capture directory Shadow capture file Postchange test system Replay system Shadow capture file Production system Shadow capture file Shadow capture file Test system with changes Production database Database backup Can use Snapshot Standby as test system Copyright 2007, Oracle. All rights reserved. Database restore
Capturando la carga con Enterprise Manager Copyright 2007, Oracle. All rights reserved.
Preprocesar la Carga antes de hacer las pruebas Copyright 2007, Oracle. All rights reserved.
Repitiendo la carga en ambiente de pruebas Copyright 2007, Oracle. All rights reserved.
Que es? Movimiento Automático Redo Shipping Standby Físico Oracle Dataguard Producción Centro de Respaldo Solución para Protección ante desastres Mantenimiento de Standby Fisico en forma automática Switchover y Failover Compresion en la red Soportado en Versiones Standard y Standard Edition One
Recuperación de los servicios en menos de 10 minutos Protege su activo mas valioso: la información. Eficiente uso de la red (compresión) Activo/Pasivo Excelente relación costo/beneficio Transparente a las aplicaciones
One click Switchover and Failover
Que es Oracle Dataguard? Movimiento Automático Redo Shipping Standby Físico o Lógico Producción Oracle Dataguard Centro de Respaldo Solución para Protección ante desastres Mantenimiento de Standby Fisico o Lógico en forma automática Switchover y Failover Compresion en la red
Active Dataguard Anteriormente la Base Standby podia estar en dos modos mutuamente excluyentes: Modo de Recuperacion: se estan aplicando los cambios Modo de Solo Lectura Active Dataguard en 11g Permite mantener la BD standby abierta para lecturas al tiempo que se aplican los cambios sobre la BD
Que es Oracle Real Application Clusters RAC? Multiples instancias accediendo a la misma Base de Datos Instancias repartidas entre los servidores Acceso Físico a cada uno de los archivos de la BD Software controla en el acceso a los datos Instances run on each node Database files Interconnect Copyright 2007, Oracle. All rights reserved.
Porque usar RAC? Alta Disponibilidad: Servicio se mantiene durante caidas del servidor o de instancias Escalabilidad sin Limites: Adicione mas nodos cuando los necesite Pay as you grow: Pay for just what you need today Beneficios mas importantes de Grid Computing: Crezca o Redistribuya bajo demanda Un solo boton para adicionar o remover servidores Distribución automática de la carga y recursos
Case Study: M-Tel Founded in March 1994 Part of Mobilcom Austria Group Telecom leader in Bulgaria First production implementation on Oracle 11g GRID Best Exadata v1 Performance Results First successful Exadata v1 custom installation First Customer to run OLTP on Exadata v1 Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack
M-Tel s vs. DB Admins Challenges Provide highest quality of service Make every application highly available scalable dynamically manage application workload Be more flexible Online maintenance Service relocation Do more with less Consolidate, simplify, automate Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack
Problemas para adoptar RAC Unable to load balance between databases on the same node Most applications cannot share the same database (they aren't 100% isolated) Some applications aren t certified with RAC No unified approach for single instance database failover. Difficult database movement between servers No automatic actions in the event of node failure Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack
Oracle Database 11g Release 2 RAC ONE A grid of virtualized single instance databases Omotion DB-A from Node 1 to Node 8 Failover DB-B from Node 2 to Node 9 Rolling Patches DB-C Node 3 and Node 2 Online Upgrade DB-C to multi-node RAC instances
Resumen Beneficios RAC One Node: Better virtualization for databases Consolidation, workload management, Better HA Plus, online maintenance, and DB failover Better cluster failover Additional value (online migration, online maintenance) Single-vendor solution Ready to scale Online upgrade to multi-node RAC Standardized Environment Common toolset for both single-node and multinode Oracle database deployments
Data Recovery Advisor Rápida determinación, análisis y recuperación de fallas Minimiza tiempos de parada Puede Implementarse con: Enterprise Manager RMAN command line 1. Assess data failures. 2. List failures by severity. 3. Advise on repair. 4. Choose and execute repair. 5. Perform proactive checks.
Oracle Minilesson Aprenda de los mejores Administración al Minuto Que hacer cuando su BD esta en emergencia? Martín Cabarique Con el auspicio de:
Agenda Introducción Arquitecturas recomendadas Planes de acción Herramientas Disponibles Sitio Alterno Clusterización Recovery Manager Grid Control SQL*Plus
Introducción Emergencia es todo imprevisto que afecta la disponibilidad de los servicios de la Base de Datos, como: Crisis de desempeño Corrupción física de la Base de Datos Corrupción lógica de la información Aparición de Bugs Cambios imprevistos en comportamiento de aplicación Caida de la red Caida de un servidor de Aplicaciones
Introducción El procedimiento ante emergencias depende de los siguientes factores: Arquitectura en la que se encuentra implementada la Base de Datos Plan activo de recuperación ante desastres Herramientas implementadas para el monitoreo y pruebas La velocidad y calidad del resultado es directamente proporcional a la calidad de la arquitectura implementada.
Arquitecturas Recomendadas Oracle Real Application Clusters Instances run on each node Database files Interconnect
Oracle Active Dataguard Arquitecturas Recomendadas
Arquitecturas Recomendadas Automatic Transport Physical Standby Redo Shipping Production Site DBTwice Active Recovery Center
Oracle Real Application Testing Arquitecturas Recomendadas
Planes de Acción Base de Datos Caida Primero recupere los servicios, luego diagnostique Cambios a la BD de producción Pruebe los mismos antes de su implementación Mantenga copia de la versión anterior Crisis de Desempeño Mantenimiento predictivo Implementación Resource Manager Tome una imagen del estado actual de la BD Detecte la causa Si degradación general, kill de la sesion causante Si RAC, reubique los servicios afectados
Planes de Acción Corrupción física de datafiles Use sitio alterno Recupere los bloques dañados Use image copy de datafiles dañados Restaure y recupere los datafiles dañados Cargue los datos nuevamente de un import Corrupción lógica de la BD Flashback de las tablas, transacciones o BD dañadas Recupere de sitio alterno Recupere de un export
Planes de Acción Corrupción física de Current Redolog Use sitio alterno. Recuperación incompleta de la BD con rman. Restauración de último export disponible. Corrupción de Controlfile Use sitio alterno. Si multiplexado, intente subir de uno en uno. Recupere controlfile de backup. Recree Controlfile Bug de la Base de Datos Si fallo en SQL específico, implemente SQL Patch. Diagnóstico con Metalink.
Sitio Alterno Administrado con Oracle Dataguard Implemente Fast Start Failover Recuperación automática entre 20seg y 1min Observer Loss of connectivity > fast-start failover threshold Primary database Fast-start failover standby database
Oracle Real Application Clusters Evite crisis de desempeño con: Servicios Resource Manager Distribución de carga entre nodos Oracle Clusterware Recuperación automática de caidas de la BD ASM Cluster File System Clusterización de aplicaciones de terceros Versionamiento de aplicaciones
Oracle HA Infraestructure Incluido en todas las versiones Recuperación automática y en segundos de: Base de Datos Caida Falla del ASM Listener Caido
Oracle Recovery Manager RMAN Integrado con Oracle Active Dataguard Recuperación automática y transparente a usuarios de bloques corruptos Diagnóstico de fallas en la Base de Datos Generador de soluciones ante fallas Integrado con Librería de Cintas Elimina participación humana en recuperación desde cintas Integrado con Oracle Express Backup, incluido en todas las versiones
Oracle Enterprise Manager Grid Control Incluido en todas las versiones Con Tuning y Diagnostic Pack se tiene: Generación proactiva de alertas de BD y Servidor Afinamiento proactivo de la instancia Almacena historia de las sesiones consumidoras de recursos y generadoras de contención Afinamiento automático de sentencias SQL Facilita el diagnóstico en escenarios de congelación de la BD a través del monitoreo directo del SGA
Oracle SQL*Plus Cuando las herramientas gráficas no están disponibles, esta es su salvación Documente sus scripts de diagnóstico Explore en la Web, hay muchos ya hechos Agrúpelos por temas Bloqueos entre usuarios SQLs consumidores de recursos Sesiones consumidoras de recursos etc
En resumen Sea proactivo El resultado es tan bueno como la arquitectura y las medidas de alerta temprana Entrenese, el conocimiento es indispensable para los primeros auxilios y el mantenimiento de buenos niveles de servicios Mantenga un soporte de calidad para atención predictiva y las eventualidades que puedan presentarse
Estamos Para Servirlos y Queremos Servirlos Bien! Consultoría especializada y experimentada en asegurar la continuidad de su negocio. Real Application Clusters. Oracle Dataguard. dbtwice. Asistencia antes, durante y posterior a la implementación de ambiente para Recuperación ante Desastres. Mantenimiento Predictivo y Correctivo. Transferencia de conocimiento. Centro de soporte 24x7.
Para mayor información por favor contáctenos: Ricardo Cárdenas ricardo.cardenas@redpartner.com.pe Germán López german.lopez@redpartner.com.pe T: +51 1 6401000