SISTEMA DE INFORMACION GERENCIAL Lic.Patricia Palacios Zuleta
Pentaho Open BI Suite La suite Pentaho cubre principalmente las siguientes áreas: integración de datos, reportes, análisis, alertas y dashboards, data mining y workflow.
Pentaho Data Integration Pentaho Data Integration Pentaho Data Integration abre, limpia e integra esta valiosa información y la pone en manos del usuario. Propiedades básicas Entorno gráfico de desarrollo. Uso de tecnologías estándar: Java, XML, JavaScript. Fácil de instalar y configurar. Multiplataforma: windows, macintosh, Linux.
Pentaho Análisis (OLAP) Ayuda a operar con máxima efectividad para ganar perspicacia y entender lo necesario para tomar optimas decisiones. Se basa en la herramienta de JPivot, cuyas características generales son: Vista dimensional de datos (por ventas, por periodo) (ver figura)
Pentaho Análisis (OLAP)
Pentaho Analysis Services Mondrian, ahora rebautizado como Pentaho Analysis Services. Mondrian es un motor ROLAP con caché, lo cual lo sitúa cerca del concepto de Hybrid OLAP. ROLAP significa que en Mondrian no residen datos (salvo en la caché) sino que estos residen en una Sistema de Gestion de Bases de Datos externo. Mondrian se encarga de recibir consultas dimensionales devolver los datos de un cubo,sólo que este cubo no es algo físico sino un conjunto de metadatos que definen como se han de mapear estas consultas.
Pentaho Analysis Services Algunas de las ventajas de este modelo son: El no tener que generar cubos estáticos ahorrando que cuesta generarlos y la memoria que ocupan. La posibilidad de utilizar siempre los datos residentes en la base de datos, de forma que se trabaja con datos actualizados.
Pentaho Analysis Services
Pentaho Reporting Todas las organizaciones utilizan reportes. Entre sus caracteristicas tenemos: Fácil despliegue de reportes basados en Web. Soporta una amplia fuente de datos incluyendo relacionales, OLAP, o datos basados en XML. Permite la distribución de los resultados del análisis en múltiples formatos - todos los informes incluyen la opción de imprimir o exportar a formato PDF, XLS, HTML y texto. (Ver figura)
Pentaho Reporting Formatos de reportes
Pentaho Reporting Posee un asistente que permite el diseño rápido y facilidad en la creación de reportes. Los reportes Pentaho permiten también programación de tareas y ejecución automática de informes con una determinada periodicidad.
Pentaho Dashboards Provee inmediata perspicacia en un rendimiento individual, departamental o empresarial. Para deliberar Métricas Clave en una atractiva e intuitiva interfaz visual, así les da a los usuarios de los negocios, información crítica que necesitan para entender y mejorar el rendimiento organizacional
Pentaho Dashboards Caracteristicas: Amplias mediciones que permiten la definición y rastreo de medidas críticas a nivel individual, departamental, o empresarial. Pantallas ricas e interactivas donde el usuario puede ver inmediatamente cuales mediciones requeridas van bien y cuales necesitan atención. Integración con Pentaho Reporting y Pentaho Analysis para que los usuarios puedan profundizar en los reportes y análisis para entender cuáles factores están contribuyendo a un buen o mal desempeño.
Pentaho Dashboards Caracteristicas: Integración a un portal para facilitar la entrega de mediciones relevantes para un número grande de usuarios. Alertas integradas para casos excepcionales y notificación al usuario para que tome una acción
Pentaho Dashboards
Pentaho Data Mining Una vez que se tienen los requerimientos de análisis, reportes y dashboards listos, es hora de llevar el BI al siguiente nivel añadiendo minería de datos (data mining) y workflow a la mezcla. Analizaremos lo que es el Weka que se denomina a sí mismo como un conjunto de librerías para tareas de minería de datos.
Pentaho Data Mining Vista del WEKA
Pentaho Data Mining Weka contiene herramientas para diferentes tareas básicas: Preprocess: Multitud de herramientas para el preprocesamiento de los datos (como por ejemplo discretización de variables). Classify: Algoritmos de clasificación, distribuidos por paquetes, como por ejemplo ID3 o C4.5 (Su uso se engloba en la búsqueda de hipótesis o reglas en él dado un conjunto de ejemplos). Cluster: Diferentes algoritmos de segmentación.
Pentaho Data Mining Associate: Algoritmos para encontrar relaciones de asociación entre variables (Apriori entre otros). Select atributtes: Aquí, una vez cargados los datos, Weka es capaz de buscar por nosotros las mejores variables del modelo. Visualize: Herramienta de visualización de datos en los ejes cartesianos, con muchas posibilidades.
Características y Beneficios de Data Mining en una solución BI Permite visualizar patrones ocultos y relaciones en los datos. Un ejemplo clásico de Data Mining es un minorista que descubre entre las ventas de pañales y cerveza los sábados en la tarde, dos productos que uno no consideraría como afines. La explicación es que los esposos que son enviados a comprar pañales les gusta tomar cerveza mientras están en la tienda algo que no hubiese sido reconocido como una venta significativa antes que el data mining lo descubriera.
Características y Beneficios de Data Mining en una solución BI Permite explotar las correlaciones para mejorar el desempeño organizacional. Continuando el ejemplo de arriba, muy frecuentemente los minoristas actúan en las relaciones que ellos descubren usando tácticas como situar productos afines separados en extremos de un pasillo para que en medio el cliente pase por otros productos y adquiera más de lo que iba a comprar. Todas las organizaciones pueden beneficiarse de una forma similar usando los nuevos patrones descubiertos y las correlaciones como la base para tomar acciones para mejorar su eficiencia y la efectividad.
Características y Beneficios de Data Mining en una solución BI Provee indicadores de desempeño futuro. Permite grabar recomendaciones en sus aplicaciones. Se pueden usar los resultados del data mining para mostrar un simple resumen y recomendación con aplicaciones operacionales. Por ejemplo, en una pantalla de crédito se podría agregar: Basado en este nuevo perfil hay un 85% de probabilidad que el cliente pague tarde. Se recomienda que requiera un 50% por adelantado en esta orden. Le permite tomar ventajas de un amplio rango de algoritmos de data mining
Características y Beneficios de Data Mining en una solución BI No todos los algoritmos son óptimos en todas las situaciones, se puede elegir el que mejor se adapte a cada situación. Si se encuentran varios algoritmos que se adaptan bien, se pueden usar todos por ejemplo: basado en el análisis de 3 modelos predictivos, la oportunidad de que el cliente pague a tiempo será; Modelo A: 95% (96% correcto), Modelo B: 89% (92% correcto), Modelo C: 76% (97% correcto).