Big Data y BAM con WSO2



Documentos relacionados
CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK.

De la Integración Continua a la Entrega Continua

Big Data con nombres propios

Estrategia de modernización de aplicaciones Oracle Forms y Reports

Conectores Pentaho Big Data Community VS Enterprise

Una propuesta de valor para la gran empresa: Atlassian Data Center

Posibilidades de integración de JIRA y Confluence

Requisitos tecnológicos

Una prueba de concepto con Git Essentials. Introducción

Capítulo VI. Estudio de Caso de Aplicación del Integrador de Información Desarrollado

Modulo I. Introducción a la Programación Web. 1.1 Servidor Web.

Arquitectura de sistema de alta disponibilidad

Descripción. Este Software cumple los siguientes hitos:

Sistema de SaaS (Software as a Service) para centros educativos

Capítulo 5. Cliente-Servidor.

SIEWEB. La intranet corporativa de SIE

La utilización de las diferentes aplicaciones o servicios de Internet se lleva a cabo respondiendo al llamado modelo cliente-servidor.

Hostaliawhitepapers. Las ventajas de los Servidores dedicados. Cardenal Gardoki, BILBAO (Vizcaya) Teléfono:

Cuál sería la distancia aproximada entre las gateways de cada instalación y los contadores Agua/Gas)?.

Eres consciente del estado actual de tu proyecto?

Capítulo VI. Conclusiones. En este capítulo abordaremos la comparación de las características principales y

Funcionalidades Software SAT GotelGest.Net (Software de Servicio de Asistencia Técnica)

Alfresco permite su integración y personalización en sistemas de gestión documental para implementar funcionalidades específicas

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Brindamos asesorías que involucran tecnología y personal calificado, estos hacen de DOCTUM su mejor aliado.

SISTEMAS DE INFORMACIÓN II TEORÍA

Hadoop. Cómo vender un cluster Hadoop?

QUÉ ES UN SERVIDOR Y CUÁLES SON LOS PRINCIPALES TIPOS DE SERVIDORES? (PROXY, DNS, WEB, FTP, SMTP, ETC.) (DV00408A)

arquitectura que maneja. Encontraremos también los diferentes servidores que

Movilidad. Pasa demasiado tiempo fuera de la oficina? Solución móvil Dynamics NAV

Microsoft SQL Server Conceptos.

Evaluación, Reestructuración, Implementación y Optimización de la Infraestructura de Servidores, Base de Datos, Página Web y Redes

Cloud Computing: Cloud híbrida y la solución de AWS

App para realizar consultas al Sistema de Información Estadística de Castilla y León

Gestor de Contenidos CMS. Prof: Ing. Henrry Servitá

MANUAL DE AYUDA. MODULO SAT (Anexo Integración AGIL SAT)

GeneXus BPM Suite X. Última actualización: 01 de Setiembre de 2008

Elementos requeridos para crearlos (ejemplo: el compilador)

Base de datos en Excel

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Eficiencia en la Automatización y Gestión de Servicios

REGISTRO DE EMPRESAS Y PERSONAS BASE DE INFORMACIÓN DE CLIENTES & CONTACTOS

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

Centro de Excelencia Liferay. Presentación de servicios

Comparación entre Active Reports, Crystal Reports, y MS Reporting Services

Portafolio de servicios

Integración de Magento & Dynamics NAV

1 EL SISTEMA R/3 DE SAP AG

Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva

Análisis y diseño del sistema CAPÍTULO 3

Manual de usuario Versión: 1.3 Edición: 05/02/2015 1

ArquitecturaTécnica de TRAVEL OPEN APPS. Breve definición técnica de la plataforma Travel Open Apps

INTRANET DE UNA EMPRESA RESUMEN DEL PROYECTO. PALABRAS CLAVE: Aplicación cliente-servidor, Intranet, Área reservada, Red INTRODUCCIÓN

Implantar Microsoft Software Updates Service (SUS)

Introducción a las redes de computadores

Conoce los Tipos de Hosting que Existen y Elige el Mejor para tus Necesidades

UNIVERSIDAD DE SALAMANCA

Presentación de Pyramid Data Warehouse

Archivo de correo con Microsoft Outlook contra Exchange Server

Volumen TECNOLOGÍA DE ADMINISTRACIÓN EMPRESARIAL SIMI EVOLUTION (9.0) Guía de usuario

PROGRAMACIÓN PÁGINAS WEB CON PHP

Presentaciones compartidas con Google Docs (tutorial)

Manual de uso de la plataforma para monitores. CENTRO DE APOYO TECNOLÓGICO A EMPRENDEDORES -bilib

Virtual-C: Una Herramienta para Administración de Contenidos en Sitios Web

Figura 1. Fuente: elaborada en el MSLab

Capítulo 2. Planteamiento del problema. Capítulo 2 Planteamiento del problema

David Erosa García Programador del C.G.A. de la D.G. de Innovación Educativa y Formación del Profesorado. Consejería de Educación, Junta de Andalucía

Proceso Unificado de Rational PROCESO UNIFICADO DE RATIONAL (RUP) El proceso de desarrollo de software tiene cuatro roles importantes:

Guía de inicio rápido a

Oracle vs Oracle por Rodolfo Yglesias Setiembre 2008

Capitulo 5. Implementación del sistema MDM

ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC

FUENTES SECUNDARIAS INTERNAS

Instructivo para la sincronización de servidores Intellect

EL PROGRAMA DE PRESENTACIONES IMPRESS (I)

(PHP y APACHE), y el programa de comunicación Skype, para controlar de manera

Entre los beneficios más importantes que obtendrá del sistema serán:

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.

*La Macromedia Dreamweaver

Curso de HTML5 y CSS3

Capítulo I. Definición del problema y objetivos de la tesis. En la actualidad Internet se ha convertido en una herramienta necesaria para todas

System Center. la plataforma para una gestión ágil de los entornos de TI IDG COMMUNICATIONS, S.A.

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

Capítulo 7. Implementación del Sistema

CORPORACIÓN MEXICANA DE INVESTIGACIÓN EN MATERIALES, S.A. DE CV

OPTIMA CONSULTING SAS

VISIÓN GENERAL HERRAMIENTAS COMERCIALES

Windows Server 2012: Infraestructura de Escritorio Virtual

Maxpho Commerce 11. Gestión CSV. Fecha: 20 Septiembre 2011 Versión : 1.1 Autor: Maxpho Ltd

Interoperabilidad de Fieldbus

Como El Internet Nos Genero $110,857 Dólares en menos de 90 días.

CAPÍTULO VI. RESULTADOS, PRUEBAS Y CONCLUSIONES DE LA APLICACIÓN.

Transcripción:

Mayo 2014 Big Data y BAM con Leonardo Torres Centro Experto en SOA/BPM en atsistemas ofrece una completa suite de productos Open Source SOA y son contribuidores de muchos de los productos de Apache, como Apache Axis, Apache Rampart, Apache Synapse, todos ellos distribuidos bajo licencia Apache. Una de sus características es que la versión de libre descarga de sus productos también es única y se trataría de la versión productiva, ya que no manejan una versión alternativa community, como otros vendedores. Por otro lado, el concepto Business Active Monitoring (BAM) describe los procesos y tecnologías que nos permiten el análisis de indicadores de negocio basados en datos en tiempo real. BAM es usado para mejorar la velocidad y efectividad de operaciones de negocio, manteniendo la pista de qué es lo que está pasando y haciendo visibles los posibles problemas. El concepto BAM puede ser implementado con muchos tipos de herramientas de software. nos ofrece un producto BAM de propósito general, es decir, uno que no sólo es para monitorizar indicadores de procesos de negocio, sino casi cualquier fuente de datos que conectemos usando su API. Uno de sus usos es el caso de Big Data, un conjunto de datos muy extenso y diverso difícil de procesar usando herramientas de base de datos o aplicaciones tradicionales de procesamiento de datos. En estos casos, BAM utiliza Hadoop para procesar tal cantidad de datos en poco tiempo, incluyendo las capacidades para capturar, subsanar, almacenar, buscar, transferir, analizar y visualizar estos datos. Además, incluye una función out-of-the-box, muy sencilla y simple de configurar, para monitorizar otros productos. Cómo funciona Paso 1 Los datos llegan de sistemas externo a través del API Data Agent, quien puede hacerlo de forma sincronizada o no. Es decir, en este primer instante, tendríamos un API REST para enviar los datos al servidor, entonces para ejecutar los datos del cliente podemos utilizar cualquier lenguaje. En el caso de utilizar Java, dispondríamos de librerías para hacerlo de forma más fácil. Paso 2 Los datos son recibidos por el componente Data Receiver, quien los carga en Cassandra, la base de datos en donde se almacenan los que no han sido procesados.

Paso 3 Para analizar los datos, se usa Apache Hive, encargado de recoger los datos de Cassandra, analizarlos, e insertarlos en la base de datos relacional (por defecto H2, pero también puede ser Oracle, MySQL, etc). En el caso de usar Apache Hive, nos ayudará a abstraernos de la fuente y destino de los datos; lo que nos permitiría centrarnos solamente en implementar los Querys Hive, los cuales son SQL friendly, y analizan los datos. Estos Querys se pueden programar para ejecutarse cada segundos. Apache Hive usa, por debajo, procesos Hadoop para ejecutar la analítica en paralelo, usando MapReduce. Paso 4 Los datos ya analizados, son insertados en la base de datos relacional, y están listos para ser explotados por las herramientas de visualización. Paso 5 A continuación, se extraen de la base de datos relacional los datos procesados, para poder ser presentados. A partir de aquí, tenemos tres componentes a usar: un Dashboard web, reportes con JasperReports; y gadgets con Gadget, estos últimos los más interesantes, descritos más adelante. Z ENGINE ANALZER HIVE 1 Notification Queue 3 4 5 RECEIVER 2 Cassandra H2 AGREGAR ANALIZAR PRESENTAR

Capacidad multitenancy En una organización grande, es muy común tener departamentos y dominios diferentes de datos, lo cual va unido a la necesidad de tener que separar totalmente la administración, la configuración y los datos que usa el producto. Gracias a esta capacidad, esto se puede lograr sin necesidad de crear otra instancia de éste. ENGINE ANALZER HIVE Cassandra H2 Seguridad de acceso Capacidad de visualización El input de los componentes de visualización es, por defecto, la base de datos relacional H2. Para esta capacidad se tiene tres componentes: Dashboard: para indicadores en tiempo real en una interfaz web, no consumible desde otra aplicación. Reports: para tener reportes impresos de JasperReports Gadgets: el componente más interesante de los tres. Los gadgets son pequeñas porciones consumibles, como portlets, que siguen las especificaciones de Google Gadgets; y que se pueden desplegar en cualquier servidor, como JIRA o Confluence, siempre y cuando soporte las especificaciones de Google. Este servidor, recibe los datos que llegan de un servicio REST implementado con Jaggery; y se encarga de formatearlos, usando sólo CSS, HTML5 y Javascript. Los gadgets pueden ser construidos desde cero o basándonos en uno generado con Gadget Generator Tool.

Capacidad de escalamiento y alta disponibilidad puede crecer horizontalmente, ya que cada uno de sus componentes se puede duplicar y ser parte de un cluster; pero también puede ser desplegado en alta disponibilidad. Los Data Receivers se pueden configurar y crecer en número, evitando posibles problemas de cuello de botella cuando hay alto tráfico de datos. La base de datos Cassandra puede formar un cluster usando varias máquinas, ya que reconoce esta configuración y la usa. Los procesos de análisis Hadoop se pueden hacer en varias máquinas, pudiendo sacar de ello un procesamiento intensivo y rápido. Finalmente, la aplicación web de visualización (Dashboard, Reports y Gadgets) también se puede clusterizar, ya que se ejecutaría sobre un servidor de aplicación Carbon. Z Notification Queue RECEIVER ENGINE ANALZER HIVE Cassandra Cassandra Cassandra Oracle RAC

En atsistemas somos más de 500 profesionales dedicados desde 1994 a la consultoría, servicios de IT y desarrollo de software. Nuestros servicios se caracterizan por la flexibilidad y la agilidad, lo que nos permite ayudar a grandes empresas de todos los sectores, aportando conocimiento y experiencia sobre el más amplio abanico de tecnologías. Nuestra cartera de clientes incluye más de 200 de las principales empresas del país, con representación de todos los sectores de actividad, a los que prestamos servicio desde nuestras oficinas de Madrid, Barcelona, Cádiz, Zaragoza y A Coruña. Nuestro portfolio de servicios abarca desde el desarrollo de software a medida hasta la integración de grandes soluciones de software empresarial, en áreas que van desde la más compleja arquitectura de sistemas hasta las soluciones más novedosas de comercio electrónico o aplicaciones móviles. Valle de Alcudia, 3 28230 Las Rozas, Madrid Passeig de Gràcia 55, 8º - 4ª 08007 Barcelona 902 888 902 info@