SolucionesAnalíticas con Pentaho. Objetivo Obtener experiencia práctica con los siguientes componentes de la plataforma Pentaho: Pentaho Data Integration (Kettle) Pentaho Analysis Services (Mondrian) Pentaho Analysis Services (JPivot) Entender la arquitectura básica de Pentaho Data Integration y sus módulos Incluirdatos de diferentesfuentes Realizarmúltiplestransformaciones de datos Utilizar modelos ETL para poblar un Data Warehouse Realizartransformaciones y jobs complejos Desarrollar esquemas OLAP para implementarlos con PentahoAnalysis Implementar seguridad a los esquemas OLAP Utilizar agregados y otras técnicas para mejorar el desempeño de PentahoAnalysis Descripción El curso cubre desde los aspectos básicos de Business Intelligence, las soluciones analíticas y ETL pasando por el diseño de un esquema Data Warehouse de estrella y poblarlo usando transformaciones con Pentaho Data Integration (Kettle). Con el conocimiento obtenido usted podrá crear un esquema OLAP diseñando sus propios cubos y explotar la información a través de PentahoAnalysis (Mondrian). A quien esta dirigido La audiencia para este curso es para gerentes de tecnología, estudiantes y desarrolladores de aplicaciones para Inteligencia de Negocios (BI). Requisitos Este curso asume que se entiende los aspectos principales de administración de sistemas, conocimientos básicos de SQL, bases de datos relacionales y desarrollo de aplicaciones Web, y poder navegar estructuras de directorio así como editar archivos de configuración con un editor de texto Beneficios Al finalizar el curso usted podrá diseñar, construir e implementar un modelo OLAP usando Pentaho Data Integration (Kettle), PentahoAnalysis (Mondrian) en la plataforma BI de Pentaho. Usted podrá instalar todos los componentes de Pentaho partiendo de una estructura más avanzada que la típica demo PCI, así como la posibilidad de acceder a esquemas de bases de datos y presentar soluciones a través de un Portal Business Intelligence. Módulo 1: Soluciones analíticas con Pentaho Duración: 4 horas Módulo 2: ETL con Pentaho Data IntegrationKettle Duración: 12 horas Módulo 3: Construyendo soluciones analíticas con PentahoAnalysisMondrian Duración: 8 horas (10% teórico y 90% práctica)
TEMARIO Módulo 1: Soluciones analíticas con Pentaho Que es una solución analítica? Qué es OLAP? Características de soluciones analíticas Comparando tipos de aplicaciones Usuarios de soluciones analíticas Arquitectura de Solución analítica Arquitectura conceptual básica Componentes de arquitectura RDBMS vs Servidor OLAP Server Arquitectura OLAP de Pentaho Modelos de datos dimensionales Diseño dimensional Dimensional vs Tercera Forma Normal Hechos y Dimensiones Dimensiones: Marco Conceptual Dimensiones Conformadas Dimensiones que cambian lentamente Dimensiones Combinadas y Degeneradas Hechos Aditivos vs Semi-Aditivos Esquema Estrella vs Copo de Nieve Módulo 2: ETL con Pentaho Data Integration (Kettle) ETL y análisis de sistemas fuente Qué es ETL? Extracción Transformación Carga Transformaciones y tareas Precedencia de carga Procesamiento Delta Extracciones Incrementales Opciones de Extracción Unión de registros Diseño ETL Perfiles de datos Análisis de calidad de datos Análisis de dependencia de datos Diseño de base de datos destino Mapeo fuente a destino
Pentaho Data Integration Qué es KETTLE? Usos de KETTLE Ejemplo KETTLE Componentes KETTLE Transformaciones Pasos Saltos Repositorio Vista de log (Registro) Entradas y Salidas Entrada de Archivo de Texto Entrada de Tabla Entrada de Excel Entrda de XBase Generar Filas Obtener información del sistema Salida de Archivo de Texto Salida de Tabla Insertar/Actualizar Actualizar Borrar Salida XML Carga de dimensiones Consulta/Actualización de Dimensión Combinación Actualización/Consulta Consulta de Datos Consultas Búsqueda en base de datos Búsqueda en flujo Join de base de datos Llamada a procedimiento de base de datos Transformaciones de campos Agregar Secuencia Valor Java Script Separar Campos Mapeador de Valores Transformaciones de conjuntos Filtrar Filas Ordenar Filas Unir Filas Fusionar Filas
Filas únicas Filas Agregadas Agrupar por Transformaciones de pivote Normalizador de Fila Denormalizar Aplanador Tareas ETL Cargar la tabla de hechos Chef y tareas Componentes de chef Componentes de Tareas (Saltos de tarea) Configuración de tarea Tarea Tipos de tarea Inicio Dummy OK Error Transformación Tarea (Subtarea) Shell Correo Electrónico SQL FTP Tabla Existe Archivo Existe SFTP HTTP Opciones de Tarea Botones de Tarea Módulo 3: Construyendo soluciones analíticas con Pentaho Análisis Mondrian Visión General de Pentaho Análisis Services Arquitectura OLAP Pentaho Vista General de Mondrian Esquemas Mondrian Cubos y Jerarquéas Dimensiones y Medidas Niveles Miembros Constitución Básica de un CUBO Mondrian Mapeo de tablas dimensión en Mondrian Atributos de Dimensión Definición de medidas Orden y visualización de Miembros de Niveles de Di Dimensiones de tiempo Definiendo dimensiones de tiempo Jerarquéas Múltiples
Dimensiones compartidas Dimensiones multiuso Dimensiones degeneradas Optimización de Join Tablas en Línea Diseñador de cubos de Pentaho Caracteristicas MDX &JPivot MDX Sintaxis MDX Conceptos Básicos de MDX Celdas, Tuplas& Conjuntos MDX en la práctica JPivot Vista general funcional Medidas Vista previa de consultas MDX Ordenamiento Miembros Padres Spans Supresión de Filas/Columnas Intercambiar Ejes gráficos Propiedades de gráficos Imprimir Exportar a Excel Medidas calculadas y formateadas Definiendo miembros calculados Propiedad de miembro calculado Usar agregados para mejorar rendimiento Técnicas de agregación Diseño de agregados y Consideraciones de Nombres Definiendo agregados en esquema Mondrian