ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL

Tamaño: px
Comenzar la demostración a partir de la página:

Download "ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL"

Transcripción

1 ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL

2 AUTORIZACIÓN PARA LA DIGITALIZACIÓN, DEPÓSITO Y DIVULGACIÓN EN ACCESO ABIERTO (RESTRINGIDO) DE DOCUMENTACIÓN 1º. Declaración de la autoría y acreditación de la misma. El autor D., como de la UNIVERSIDAD PONTIFICIA COMILLAS (COMILLAS), DECLARA que es el titular de los derechos de propiedad intelectual, objeto de la presente cesión, en relación con la obra 1, que ésta es una obra original, y que ostenta la condición de autor en el sentido que otorga la Ley de Propiedad Intelectual como titular único o cotitular de la obra. En caso de ser cotitular, el autor (firmante) declara asimismo que cuenta con el consentimiento de los restantes titulares para hacer la presente cesión. En caso de previa cesión a terceros de derechos de explotación de la obra, el autor declara que tiene la oportuna autorización de dichos titulares de derechos a los fines de esta cesión o bien que retiene la facultad de ceder estos derechos en la forma prevista en la presente cesión y así lo acredita. 2º. Objeto y fines de la cesión. Con el fin de dar la máxima difusión a la obra citada a través del Repositorio institucional de la Universidad y hacer posible su utilización de forma libre y gratuita ( con las limitaciones que más adelante se detallan) por todos los usuarios del repositorio y del portal e-ciencia, el autor CEDE a la Universidad Pontificia Comillas de forma gratuita y no exclusiva, por el máximo plazo legal y con ámbito universal, los derechos de digitalización, de archivo, de reproducción, de distribución, de comunicación pública, incluido el derecho de puesta a disposición electrónica, tal y como se describen en la Ley de Propiedad Intelectual. El derecho de transformación se cede a los únicos efectos de lo dispuesto en la letra (a) del apartado siguiente. 1 Especificar si es una tesis doctoral, proyecto fin de carrera, proyecto fin de Máster o cualquier otro trabajo que deba ser objeto de evaluación académica

3 3º. Condiciones de la cesión. Sin perjuicio de la titularidad de la obra, que sigue correspondiendo a su autor, la cesión de derechos contemplada en esta licencia, el repositorio institucional podrá: (a) Transformarla para adaptarla a cualquier tecnología susceptible de incorporarla a internet; realizar adaptaciones para hacer posible la utilización de la obra en formatos electrónicos, así como incorporar metadatos para realizar el registro de la obra e incorporar marcas de agua o cualquier otro sistema de seguridad o de protección. (b) Reproducirla en un soporte digital para su incorporación a una base de datos electrónica, incluyendo el derecho de reproducir y almacenar la obra en servidores, a los efectos de garantizar su seguridad, conservación y preservar el formato.. (c) Comunicarla y ponerla a disposición del público a través de un archivo abierto institucional, accesible de modo libre y gratuito a través de internet. 2 (d) Distribuir copias electrónicas de la obra a los usuarios en un soporte digital. 3 4º. Derechos del autor. El autor, en tanto que titular de una obra que cede con carácter no exclusivo a la Universidad por medio de su registro en el Repositorio Institucional tiene derecho a: a) A que la Universidad identifique claramente su nombre como el autor o propietario de los derechos del documento. b) Comunicar y dar publicidad a la obra en la versión que ceda y en otras posteriores a través de cualquier medio. c) Solicitar la retirada de la obra del repositorio por causa justificada. A tal fin deberá ponerse en contacto con el vicerrector/a de investigación d) Autorizar expresamente a COMILLAS para, en su caso, realizar los trámites necesarios para la obtención del ISBN. 2 En el supuesto de que el autor opte por el acceso restringido, este apartado quedaría redactado en los siguientes términos: (c) Comunicarla y ponerla a disposición del público a través de un archivo institucional, accesible de modo restringido, en los términos previstos en el Reglamento del Repositorio Institucional 3 En el supuesto de que el autor opte por el acceso restringido, este apartado quedaría eliminado.

4 d) Recibir notificación fehaciente de cualquier reclamación que puedan formular terceras personas en relación con la obra y, en particular, de reclamaciones relativas a los derechos de propiedad intelectual sobre ella. 5º. Deberes del autor. El autor se compromete a: a) Garantizar que el compromiso que adquiere mediante el presente escrito no infringe ningún derecho de terceros, ya sean de propiedad industrial, intelectual o cualquier otro. b) Garantizar que el contenido de las obras no atenta contra los derechos al honor, a la intimidad y a la imagen de terceros. c) Asumir toda reclamación o responsabilidad, incluyendo las indemnizaciones por daños, que pudieran ejercitarse contra la Universidad por terceros que vieran infringidos sus derechos e intereses a causa de la cesión. d) Asumir la responsabilidad en el caso de que las instituciones fueran condenadas por infracción de derechos derivada de las obras objeto de la cesión. 6º. Fines y funcionamiento del Repositorio Institucional. La obra se pondrá a disposición de los usuarios para que hagan de ella un uso justo y respetuoso con los derechos del autor, según lo permitido por la legislación aplicable, y con fines de estudio, investigación, o cualquier otro fin lícito. Con dicha finalidad, la Universidad asume los siguientes deberes y se reserva las siguientes facultades: a) Deberes del repositorio Institucional: - La Universidad informará a los usuarios del archivo sobre los usos permitidos, y no garantiza ni asume responsabilidad alguna por otras formas en que los usuarios hagan un uso posterior de las obras no conforme con la legislación vigente. El uso posterior, más allá de la copia privada, requerirá que se cite la fuente y se reconozca la autoría, que no se obtenga beneficio comercial, y que no se realicen obras derivadas. - La Universidad no revisará el contenido de las obras, que en todo caso permanecerá bajo la responsabilidad exclusiva del autor y no estará obligada a ejercitar acciones legales en nombre del autor en el supuesto de infracciones a derechos de propiedad intelectual derivados del depósito y archivo de las obras. El autor renuncia a cualquier reclamación frente a la Universidad por las formas no ajustadas a la legislación vigente en que los usuarios hagan uso de las obras.

5 - La Universidad adoptará las medidas necesarias para la preservación de la obra en un futuro. b) Derechos que se reserva el Repositorio institucional respecto de las obras en él registradas: - retirar la obra, previa notificación al autor, en supuestos suficientemente justificados, o en caso de reclamaciones de terceros. Madrid, a 27 de Agosto de 2014 ACEPTA Fdo

6 Proyecto realizado por el alumno: Pablo Liste García Fdo.: Fecha: 27 / 08 / 2014 Autorizada la entrega del proyecto cuya información no es de carácter confidencial EL DIRECTOR DEL PROYECTO David Contreras Bárcena Fdo. : Fecha: 27 / 08 / 2014 Vº Bº DEL COORDINADOR DE PROYECTOS Israel Alonso Martínez Fdo. : Fecha: 27 / 08 / 2014

7

8 Agradecimientos Quiero expresar mi más sincero agradecimiento a todas las personas que me ha apoyado durante estos años de carrera en I.C.A.I. En primer lugar a mi padre y a mi madre, principales responsables de mi elección de carrera universitaria en este centro. Son las personas que siempre han estado a mi lado, dándome las energías necesarias para estudiar en los momentos más complicados y ayudándome a darme cuenta de que con esfuerzo, trabajo y sobre todo ganas de conseguir lo que uno se propone, los resultados siempre son positivos. En segundo lugar, quiero agradecer a mi hermano, y compañero de universidad, el ánimo que me ha dado durante estos años y los buenos momentos que hemos pasado juntos compartiendo universidad y clase en algunas ocasiones. El tenerle todos los días en situaciones parecidas a las que me encontraba yo ha sido una suerte ya que nos teníamos el uno al otro en todo momento para ayudarnos a conseguir superarlas. En tercer lugar, quiero agradecer especialmente a mis abuelos el apoyo que me han mostrado durante todos estos años. A pesar de estar muy lejos de mí, siempre han estado dispuestos a ayudarme en lo que fuera necesario, y nunca han dejado de preocuparse por mí. Sin ellos sé que el haber estudiado en esta universidad de prestigio nacional hubiera sido mucho más complicado, atreviéndome a decir casi imposible. En cuarto lugar, quiero agradecer a mis amigos desde la infancia el haberme apoyado y hacerme sentir el mejor en todo lo que hacía, y capaz de superar cualquier adversidad que se me presentara tanto a nivel personal como a nivel académico. Sin olvidarme, por supuesto, de los nuevos compañero y amigos hechos en la universidad día a día durante estos 5 años de carrera. Son ellos los que hacen que el refrán de que los amigos se pueden contar con los dedos de una mano sea totalmente falso para mí. Sé que puedo contar con todos ellos para lo que sea. En quinto lugar, a todos mis profesores, tanto del colegio como del instituto, como de la universidad, ya que a pesar de que no nos demos cuenta durante el paso de los años como

9 estudiantes de la influencia que provocan en nosotros, es ahora que se acaba mi etapa estudiantil cuando me doy cuenta de que todos y cada uno de ellos han influido de un modo u otro en los pasos que he ido dando hasta llegar a la situación en la que me encuentro en la actualidad. Sin ellos muy probablemente no estaría escribiendo estos agradecimientos. Quiero hacer una mención especial a David Contreras Bárcena, mi director del proyecto de Fin de Carrera, que me han apoyado estos meses y me han ayudado en todo lo que he necesitado, si no fuera por ellos no hubiera podido terminar el proyecto a tiempo. Muchas gracias a todos.

10 ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL Autor: Director: Liste García, Pablo Contreras Bárcena, David Entidad colaboradora: ICAI Universidad Pontificia Comillas RESUMEN DEL PROYECTO Objetivos La gestión de grandes volúmenes de datos se ha convertido en un aspecto crítico para el crecimiento sostenible de las empresas y en un factor diferencial de la operativa de cualquier negocio en la Era de la Información. Por lo tanto, las organizaciones necesitan disponer de soluciones tecnológicas que les permitan analizar los masivos volúmenes de datos para desarrollar con éxito sus planes estratégicos y operativos. El propósito principal de este proyecto es realizar el análisis de la plataforma Big Data de IBM y de otras tecnologías complementarias que ofrecen una solución a esta problemática. Los objetivos específicos del proyecto son los siguientes: Estudio de tecnologías Big Data destinadas a la manipulación, gestión y análisis de grandes volúmenes de datos de todo tipo. Análisis de las tecnologías complementarias a Big Data. Estudio de la plataforma de software InfoSphere BigInsights. Definición, desarrollo y ejecución de casos prácticos mediante las tecnologías Hadoop y Big SQL con el fin de comprobar que ofrecen los resultados que manifiestan teóricamente.

11 Introducción La capacidad de recopilar y procesar enormes cantidades de datos en tiempo real es algo que el ser humano nunca ha tenido antes. Hoy en día, el "Universo Digital", es decir, la cantidad de datos digitales que se producen a nivel mundial está creciendo de manera exponencial, y seguirá aumentando. Terabytes de datos se generan a diario por millones de dispositivos que nos rodean. Figura 1: Áreas de aplicación Big Data Además, el aumento de las redes sociales y el crecimiento exponencial de los datos generados a partir de diferentes fuentes, tales como smartphones, sensores, o cualquier otro dispositivo móvil contribuyen a este crecimiento con datos de diferente naturaleza (estructurado y no estructurado) y tipos (texto, imágenes, audio o video). Figura 2: Las cinco V de Big Data

12 Para hacer frente a tal cantidad de datos no convencionales y no estructurados, que pueden alcanzar petabytes, exabytes o zettabytes, una nueva tecnología llamada "Big Data" ha surgido. El concepto de Big Data se refiere a la enorme cantidad de información que no puede ser procesada o analiza utilizando procesos o herramientas tradicionales. El Big data comenzó como una tecnología innovadora hasta llegar a transformarse en un mercado y finalmente en una industria. El sistema más utilizado en esta industria es Hadoop, que significo la aparición de un sistema de software prácticamente análogo al término Big Data. Apache Hadoop es una nueva forma para las empresas de almacenar y analizar datos, es un framework que permite procesar grandes volúmenes de datos mediante la utilización de clústers a través de un modelo de programación sencillo, asimismo, replica sus datos en varios equipos, por lo que si uno se cae, los datos se procesan en uno de los equipos replicados. En este proyecto se ha realizado un análisis de la plataforma Big Data de IBM estudiando en profundidad InfoSphere BigInsights, que es una plataforma de software para descubrir, analizar y visualizar los diferentes tipos de datos provenientes de fuentes heterogéneas, así como de las tecnologías de código abierto que vienen incluidas en InfoSphere BigInsights. Figura 3: Plataforma Big Data de IBM

13 El software es empleado con el fin de analizar el volumen, la variedad y velocidad de datos que de manera continuada y día a día se introducen en una organización, ayudando a ésta a entender y analizar tanto volúmenes masivos de información no estructurada como pequeños volúmenes de información. Finalmente, se han configurado e implementado casos prácticos con el fin de corroborar que las tecnologías analizadas ofrecen las prestaciones que manifiestan teóricamente. El contenido de estos casos prácticos se resume en las siguientes tareas: Creación de una conexión a un servidor Big SQL. Creación y carga de tablas Big SQL en diferentes escenarios. Desarrollo de consultas Big Data mediante Big SQL. Creación, desarrollo y ejecución de una aplicación Big SQL. Utilización de Jsqsh para generar scripts Big SQL. Configuración de clúster Big Data para soportar funcionalidad multi-nodo. Definición y configuración de comunicación entre nodos del clúster. Configuración e implementación de servicios a los nodos del clúster. Configuración y administración de un clúster Hadoop con BigInsights Resultado y Conclusiones Es evidente que hoy en día si una empresa quiere competir en una economía integrada a escala global necesita comprender los mercados, clientes, productos, competidores, proveedores, empleados, las normativas y mucho más de manera exhaustiva. Para lograr esta comprensión es necesario el uso eficaz de la información y la analítica de datos. De hecho, para la mayoría de las empresas el activo más valioso y diferenciador que poseen es la información.

14 Con la aparición y la creciente aceptación de Big Data se están descubriendo formas completamente nuevas de obtener información muy valiosa para la incrementar la competitividad. Las empresas se encuentran en un proceso de transformación con el fin de aprovechar el amplio abanico de información de la que disponen para mejorar la toma de decisiones, además de su rendimiento. En los diferentes sectores del mercado existe la posibilidad de utilizar grandes volúmenes de datos, así como de nuevas tecnologías para el análisis de datos, y es por esto por lo que cada vez toma más fuerza la frase: Los expertos del Big Data de hoy serán los líderes del mañana.

15 IBM BIGINSIGHTS INFOSPHERE ANALYSIS: CONFIGURATION AND IMPLEMENTATION OF CASE STUDIES WITH HADOOP AND BIG-SQL Author: Liste García, Pablo Supervisor: Contreras Bárcena, David Affiliation: ICAI Universidad Pontificia Comillas ABSTRACT Purpose Managing large amounts of data has become a critical issue for sustainable business growth. On top of that, it also is a differential factor in any business operation within the Information Age. Therefore, the organizations need technology solutions that allow them to analyse massive amounts of data in order to successfully develop their strategic and operational plans. The main purpose of this project is to make an analysis of the IBM Big Data platform and also from other complementary technologies that are able to offer a solution to this problem. The specific objectives of the project are the following: Studying of Big Data technologies for the manipulation, management and analysis of all kinds of large data volumes. Analysing of complementary Big Data technologies. Studying of InfoSphere BigInsights software platform. Definition, development and implementation of case studies by using the Big Hadoop and SQL technologies to verify that they offer the results that show theoretically.

16 Introduction The ability to collect and process vast amounts of data in real time is something that human beings have never had before. Today, the "Digital Universe", I mean, the amount of digital data being produced worldwide is growing exponentially, and will continue to increase. Terabytes of data are generated every day by millions of devices around us. Picture 1: Big Data Application Areas In addition, the rise of social networks and the exponential growth of data generated from different sources, such as smartphones, sensors, or any other mobile device are contributing to this growth with data of a different nature (structured and unstructured) and diverse types such as text, images, audio or video. Picture 2: The Big Data five V

17 To face so many unconventional and unstructured data, which can reach petabytes, exabytes or zettabytes, a new technology called "Big Data" has emerged. The concept of Big Data refers to the huge amount of information that can not be processed or analyzed using traditional tools or processes. Big Data began as an innovative technology up to become a market and eventually in an industry. The system most commonly used in this industry is Hadoop, I mean, the occurrence of a software system practically analogous to the Big Data concept. Apache Hadoop is a new way for companies to store and analyze data, is a framework that allows to process large volumes of data using clústers through a simple programming model, and in the same way, it allows to replicate data on multiple computers. Thus, if one of this computers falls, the data are processed in one of the computers replicated. In this project it has been an analysis of the IBM Big Data platform, studying in depth the InfoSphere BigInsights technology, which is a software platform to discover, analyze and visualize different types of data from heterogeneous sources by using open source technologies that are included in InfoSphere BigInsights. Picture 3: IBM Big Data platform

18 This software is used to analyze the volume, variety and velocity of data that continuously and on a daily bases it is introduced into an organization, helping it to understand and analyze both massive volumes of unstructured information such small volumes of information. Finally, it have been configured and implemented several case studies in order to confirm that the technologies discussed offer the benefits that manifest theoretically. The content of these case studies are summarized in the following tasks: Creating a connection to a Big SQL server. Creating and loading Big SQL tables in different scenarios. Development by Big Data Queries by using Big SQL. Definition, development and implementation of a Big SQL application. Using Big Jsqsh to generate SQL scripts. Big Data cluster configuration in order to support multi-node functionalities Definition and configuration of communication between cluster nodes. Configuration and implementation of services for the cluster nodes. Configuring and managing a Hadoop cluster within BigInsights Results and Conclusions It is clear that today if a company wants to compete in a globally integrated economy, he needs to understand markets, customers, products, competitors, suppliers, employees, policy and much more in a comprehensively way. For achieving this understanding it is necessary to use information and data analysis in an effective way. In fact, for most companies the most valuable and differentiating asset that it has is information. With the emergence and growing acceptance of Big Data, it is finding completely new ways of obtaining valuable information in order to increase competitiveness.

19 Companies are following a process of transformation in order to take advantage of the wide range of information available to them to improve decision-making and performance. In different market sectors is possible to use large volumes of data, as well as new technologies for data analysis, and that is why increasingly the phrase "Big Data experts of today are the leaders of tomorrow" is taking more strength.

20 Índice de la Capítulo 1 Introducción 1 Capítulo 2 Definición del proyecto Objetivos Del Proyecto Metodología y Recursos 7 Capítulo 3 Big Data Concepto de Big Data Las cinco V Tipos de información Arquitectura de Big Data 13 Capítulo 4 Hadoop Concepto de Hadoop Componentes Hadoop 16 Capítulo 5 Plataforma Big Data de IBM Aspectos clave del análisis de datos Manifiesto de la plataforma Big Data Estrategia Big Data de IBM Principales prestaciones de la plataforma Big Data IBM 24 Capítulo 6 IBM InfoSphere BigInsights Componentes principales de BigInsights Sistema de archivos MapReduce Frameworks Componentes adicionales de BigInsights Text Analytics 41

21 6.4 IBM Big SQL Consola InfoSphere BigInsights Herramientas InfoSphere BigInsights para eclipse Integración con otros productos de IBM 45 Capítulo 7 Laboratorio Big SQL Preparación del entorno Arranque de los componentes de BigInsights Arranque de eclipse Creación de una conexión al clúster de Hadoop desde eclipse Creación de una conexión al servidor Big SQL desde eclipse Consultas de datos medianre Big SQL Creación de un proyecto y un scrip Big SQL Creación de tablas y carga de datos Ejecución de consultas sql básicas Análisis de datos mediante Big SQL Creación y manejo de vistas Uso de Big SQL desde una aplicación cliente JDBC 71 Capítulo 8 Laboratorio Hadoop Gestión de un clúster Hadoop Preparación de entorno para un clúster multi-nodo Agregación de un nodo del clúster Eliminación de un nodo Administración de Hadoop Administración de servicios específicos Configuración predeterminada de Hadoop Aumento del tamaño del bloque de almacenamiento Asignación de espacio en disco para DataNode Configuración del factor de replicación 93 Capítulo 9 Conclusiones 95 Capítulo 10 Bibliografía 97

22 Índice de Figuras Figura 1: Áreas de aplicación Big Data 9 Figura 2: Las cinco V de Big Data 11 Figura 3: Tipos de datos Big Data 13 Figura 4: Arquitectura Big Data 13 Figura 5: Manifiesto de la plataforma Big Data: Imperativos y tecnología subyacente 21 Figura 6: Puntos de entrada de la plataforma Big Data de IBM 23 Figura 7: Plataforma Big Data de IBM 25 Figure 8: Ediciones de InfoSphere BigInsights 28 Figura 9: Ejemplo MapReduce 36 Figura 10: Pestaña de Bienvenida de la consola de InfoSphere BigInsight 44 Figura 11: Inicio componente de BigInsights 50 Figura 12: Clúster Status 51 Figure 13:Task Launcher for Big Data 52 Figura 14: Creación de un servidor BigInsights 53 Figura 15: Comprobación servidor BigInsights 53 Figura 16: Perspectiva Database Development 54 Figura 17: Conexión Big SQL JDBC 54 Figura 18: Información de la conexión JDBC 55 Figura 19: Panel Data Source Explorer 55 Figura 20: Creación proyecto BigInsights 57

23 Figura 21: Cambio de perspectiva 57 Figure 22: Creación de Script SQL 58 Figura 23: Conexión Big SQL 58 Figura 24: Contenido fichero README.txt 60 Figuro 25: Ejecución script setup.sh 60 Figura 26: Mensaje cargando datos 61 Figura 27: Tablas creadas 61 Figura 28: Contenido del fichero GOSALESDW_ddl.sql. 62 Figura 29: Contenido del fichero GOSALESDW_load.sql. 62 Figura 30: Contenido o datos cargados 63 Figura 31: Select de la tabla GO_REGION_DIM 64 Figura 32: Contenido de la tabla GO_REGION_DIM 64 Figura33: Select de regiones filtrada 64 Figura 34: Resultado de regiones 65 Figura 35: Select unión de tablas 65 Figura 36: Resultado unión de tablas 66 Figura 37: Select de producto,cantidad y método de venta 67 Figura 38: Resultados de la Select de producto,cantidad y método de venta 67 Figura 39: Select para obtener número de productos según atributos 68 Figura 40: Número total de productos según atributos 68 Figura 41: Creación de vista 69 Figura 42: Vista myview 70 Figura 43: Resultados select limit Figura 44: External JARs 72

24 Figura 45: Creación de paquete 72 Figura 46: Creación de una clase java 73 Figura 47: Código de la clase java 75 Figura 48: Ejecución como una aplicación java 76 Figura 49: Resultados obtenidos por la aplicación java 76 Figura 50: Icono Convert to Data Node 78 Figura 51: Cambio de hostname 79 Figura 52: Comprobación del hostname 79 Figura 53: Dirección IP del Master 80 Figura 54: Dirección IP del nodo Child 80 Figura 55: Hosts 80 Figura 56: Comprobación de acceso al nodo 81 Figura 57: Inicio componentes de BigInsights 82 Figura 58: Resultado del inicio de componentes BigInsights 82 Figura 58: Login a la consola BigInsights 83 Figura 59: Nodos del clúster 83 Figura 60: Ventana añadir nodos 84 Figura 61: Disponibilidad del nodo 84 Figura 62: Ventana añadir servicios 85 Figura 63: Resultados de añadir servicios 85 Figura 64: Nodos en ejecución 86 Figura 65: Host de los 3 nodos 86 Figura 66: Comando addnode 87 Figura 67: Mensaje de nodo añadido con éxito 87

25 Figura 68: Nuevos nodos en ejecución 87 Figura 69: Comando removenode 88 Figura 70: Eliminación de nodo exitosa 88 Figura 71: Ejecución del script listnode.sh 89 Figura 72: Servicios de un nodo en ejecución 90 Figura 73: Comando stop.sh 90 Figura 74: Contenido del directorio $BIGINSIGHTS_HOME/hdm/hadoop-conf-staging 92 Figura 75: Tamaño del bloque 93 Figura 76: Asignación de espacio en disco 93 Figura 77: Diferentes factores de replicación 94

26 Índice de Tablas Tabla 1: Comparativa entre HDFS y GPFS 33 Tabla 2: Tecnologías Hadoop adicionales 40 Tabla 3: Aplicaciones analíticas 42 Tabla 4: Productos de IBM integrados con InfoSphereBigInsights 48 Tabla 5: Información de usuarios 49 Tabla 6: Información de login 77

27 Capítulo 1 INTRODUCCIÓN La inestable situación económica en la que se encuentran muchas empresas ha obligado a tomar nuevas decisiones en busca de optimizar los recursos y reducir los gastos. Entre las medidas que se han empezado a utilizar, están las que afectan a los departamentos de TI. La revolución tecnológica que comenzó hace varios años ha supuesto que aumente el número de opciones de dispositivos que tiene cada usuario. Al ordenador portátil, herramienta fundamental en el ámbito empresarial desde su llegada, hace unos años que se le añadió el Smartphone y más recientemente la Tablet. Lo que ocurre es que se vive en un mundo hiperconectado, en el que los Smartphone, las Tablets y otros dispositivos están transformando nuestros modos, capacidades y formas de trabajar, y eso lleva asociado la necesidad de gestionar más cantidad de información y hacerlo en el menor tiempo posible. Según un informe de IDC [GANT12], se prevé que el universo digital (información digital creada y copiada) alcance los 40 zegabytes en 2020, una cifra que supera las previsiones que se habían hecho anteriormente en un 14%. Esto supone que el universo digital se duplicará cada dos años hasta el En la actualidad se crea y replica información a un ritmo vertiginoso, y estas masas de datos no tienen la forma tradicional de información estructurada en grandes bases de datos, sino que hoy invariablemente llegan en enormes cantidades de datos no estructurados, conocidos como Big Data. Y es éste un fenómeno de altísimo impacto para el mundo empresarial. Según el mencionado informe, únicamente se está aprovechando una parte insignificante del potencial de Big Data. Actualmente, solo un 3% de los datos potencialmente útiles están clasificados, y el porcentaje de ellos que se analiza es todavía inferior. El volumen de datos útiles se expande al ritmo que crece el universo digital. Page 1 of 123

28 En 2020 [GANT1], el 33% del universo digital (más de exabytes) tendrá valor si esta información está clasificada y es susceptible de ser analizada, y entonces, el valor de negocio de esta información será incuestionable. La proliferación de dispositivos como los PCs y los Smartphones, el incremento del acceso a Internet en los mercados emergentes y el aumento de datos generados por máquinas, como cámaras de videovigilancia o detectores inteligentes, han sido clave en el desarrollo imparable de los Big Data. De hecho, la información generada por máquinas se ha incrementado desde el 11% registrado en 2005 a más del 40% que se prevé en 2020 [GANT12]. Este es sin duda el principal factor que influye en la expansión del universo digital. Nuestro mundo está lleno de sensores inteligentes con capacidad para recibir información permanentemente y en casi cualquier lugar, que puede ser tratada por entornos M2M (Máquina a Máquina). Las aplicaciones de software que se pueden descargar permiten a las personas hacer casi cualquier cosa desde sus teléfonos móviles y tabletas, mientras que las aplicaciones geoespaciales como Google Maps generan enormes cantidades de datos todos los días. A esto, hay que añadir el consumo masivo de fotografía y video digital todos los días. La industria de las TI está respondiendo al reto que representa Big Data con productos innovadores de hardware y software. Entre estos hay nuevas arquitecturas de almacenamiento de escalabilidad horizontal diseñados específicamente para almacenar y gestionar volúmenes únicos de información no estructurada que escalan de forma lineal hasta decenas de Petabytes, aplicaciones, software y dispositivos para entornos analíticos y de Business Intelligence. La inversión en Tecnologías de la Información, considerada la infraestructura del universo digital, crecerá un 40% hasta el 2020[GANT12]. En este contexto, la inversión en áreas como gestión de almacenamiento, seguridad, Big Data y Cloud Computing crecerá considerablemente más rápido, y las arquitecturas de nube supondrán un facilitador clave para poder procesar entornos de Big Data. De esta forma, el tipo de datos almacenados en la nube experimentará una transformación radical durante los próximos años. En 2020, IDC predice que el 46,7% de la información almacenada en la nube va a estar relacionada con el entretenimiento [GANT12], es decir, que no serán datos corporativos. Los Page 2 of 123

ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL

ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL ANÁLISIS DE IBM INFOSPHERE BIGINSIGHTS: CONFIGURACIÓN E IMPLEMENTACIÓN DE CASOS PRÁCTICOS CON HADOOP Y BIGSQL Autor: Director: Liste García, Pablo Contreras Bárcena, David Entidad colaboradora: ICAI Universidad

Más detalles

REGLAMENTO SOBRE EL RÉGIMEN DE LOS TRABAJOS FINALES PARA LA OBTENCIÓN DE LOS TÍTULOS PROPIOS DE MÁSTER QUE SE IMPARTEN EN LA ICADE BUSINESS SCHOOL

REGLAMENTO SOBRE EL RÉGIMEN DE LOS TRABAJOS FINALES PARA LA OBTENCIÓN DE LOS TÍTULOS PROPIOS DE MÁSTER QUE SE IMPARTEN EN LA ICADE BUSINESS SCHOOL REGLAMENTO SOBRE EL RÉGIMEN DE LOS TRABAJOS FINALES PARA LA OBTENCIÓN DE LOS TÍTULOS PROPIOS DE MÁSTER QUE SE IMPARTEN EN LA ICADE BUSINESS SCHOOL (Aprobado por la Junta de Gobierno en la sesión celebrada

Más detalles

Conceptos básicos de Big Data

Conceptos básicos de Big Data Conceptos básicos de Big Data Este documento no podrá ser reproducido, total o parcialmente, sin el permiso expreso de TRC Informática, S.L. Correos electrónicos, mensajes de textos, datos en formularios

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,

Más detalles

ANÁLISIS Y DESARROLLO DE UNA PLATAFORMA BIG DATA

ANÁLISIS Y DESARROLLO DE UNA PLATAFORMA BIG DATA ANÁLISIS Y DESARROLLO DE UNA PLATAFORMA BIG DATA Autor: de la Cierva Perreau de Pinninck, Leticia Director: Sonia García, Mario Tenés Entidad Colaboradora: VASS RESUMEN DEL PROYECTO Tras la realización

Más detalles

Jornadas INCATEC 2015

Jornadas INCATEC 2015 Jornadas INCATEC 2015 Dr. Pedro Nolasco Bonillo Ramos Ingeniero en Computación. USB Magíster en Ingeniería de Sistemas. USB Magíster en Gerencia de las Finanzas. UNY Doctor en Ciencias de la Computación.

Más detalles

El ABC de Big Data: Analytics, Bandwidth and Content

El ABC de Big Data: Analytics, Bandwidth and Content Documento técnico El ABC de Big Data: Analytics, Bandwidth and Content Richard Treadway e Ingo Fuchs, NetApp, Noviembre de 2011 WP-7147 RESUMEN EJECUTIVO Las empresas entran en una nueva era en la que

Más detalles

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop

Más detalles

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Ana María Bisbé York Servicios Profesionales sp@danysoft.com 916 638683 www.danysoft.com Abril 2015 Sala 1 SQL Server

Más detalles

Soluciones de virtualización de datos

Soluciones de virtualización de datos Soluciones de virtualización de datos Cómo obtener una ventaja competitiva gracias al uso de los datos El contexto de cambio vertiginoso en las diferentes actividades de negocio requiere en la actualidad

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

Minería de datos en la nube. Patricia Rayón Villela

Minería de datos en la nube. Patricia Rayón Villela Minería de datos en la nube Patricia Rayón Villela 1 Contenido Big-Data BI en la nube Analítica Texto Video Visual 2 Big data Problemas que eran difíciles o imposibles de resolver antes de ahora son manejables.

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

INFORME EJECUTIVO DE IDC

INFORME EJECUTIVO DE IDC INFORME EJECUTIVO DE IDC De qué forma Big Data transforma la protección y el almacenamiento de datos Agosto 2012 Escrito por Carla Arend Patrocinado por CommVault Introducción: De qué forma Big Data transforma

Más detalles

Nuevos requisitos para los comerciales de hoy en día

Nuevos requisitos para los comerciales de hoy en día de la solución SAP SAP Customer Relationship Management SAP 360 Customer Objetivos Nuevos requisitos para los comerciales de hoy en día Satisfacción de las crecientes expectativas del cliente Satisfacción

Más detalles

Este proyecto tiene como finalidad la creación de una aplicación para la gestión y explotación de los teléfonos de los empleados de una gran compañía.

Este proyecto tiene como finalidad la creación de una aplicación para la gestión y explotación de los teléfonos de los empleados de una gran compañía. SISTEMA DE GESTIÓN DE MÓVILES Autor: Holgado Oca, Luis Miguel. Director: Mañueco, MªLuisa. Entidad Colaboradora: Eli & Lilly Company. RESUMEN DEL PROYECTO Este proyecto tiene como finalidad la creación

Más detalles

Aumente la velocidad del negocio con un software conectado, intuitivo y basado en la nube

Aumente la velocidad del negocio con un software conectado, intuitivo y basado en la nube de la solución SAP SAP Business ByDesign Objetivos Aumente la velocidad del negocio con un software conectado, intuitivo y basado en la nube Software integrado y en la nube, fácil de implementar y adaptar

Más detalles

Prosperar en la economía digital: Cuatro razones por las que el mundo de las finanzas está entusiasmado con el futuro

Prosperar en la economía digital: Cuatro razones por las que el mundo de las finanzas está entusiasmado con el futuro Resumen ejecutivo acerca de los resultados de la investigación Elaborado por CFO Research en colaboración con SAP CFO research Prosperar en la economía digital: Cuatro razones por las que el mundo de las

Más detalles

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora Juan Carlos Olarte B Innovation and Business Development Management BIG DATA & ANALYTICS: El Futuro es Ahora Temas a Tratar Evolución y Tendencias Big Data & Analytics Data Mining, Data Science y Big Data

Más detalles

BUSINESS INTELLIGENCE Y REDSHIFT

BUSINESS INTELLIGENCE Y REDSHIFT Whitepaper BUSINESS INTELLIGENCE Y REDSHIFT BEE PART OF THE CHANGE hablemos@beeva.com www.beeva.com LAS SOLUCIONES QUE TU BI NECESITA Con Amazon Web Services (AWS) es posible disponer con solo unos clics

Más detalles

PARA 2013 TOP. será un GRAN año para el crecimiento de la inteligencia de negocios INTELIGENCIA DE NEGOCIOS LAS 10 TENDENCIAS

PARA 2013 TOP. será un GRAN año para el crecimiento de la inteligencia de negocios INTELIGENCIA DE NEGOCIOS LAS 10 TENDENCIAS 0 Esté TOP 10 INTELIGENCIA DE NEGOCIOS LAS 10 TENDENCIAS PARA 2013 será un GRAN año para el crecimiento de la inteligencia de negocios Vaya año que fue 2012 para la inteligencia de negocios! El serio viejo

Más detalles

Conectores Pentaho Big Data Community VS Enterprise

Conectores Pentaho Big Data Community VS Enterprise Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com info@stratebi.com Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community

Más detalles

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración

Más detalles

RESUMEN DE LA SOLUCIÓN CA ERwin Modeling. Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial?

RESUMEN DE LA SOLUCIÓN CA ERwin Modeling. Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial? RESUMEN DE LA SOLUCIÓN CA ERwin Modeling Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial? CA ERwin Modeling ofrece una perspectiva centralizada sobre las definiciones

Más detalles

Desarrollar conexiones con los clientes. Cómo aumentar el valor de las relaciones con los clientes

Desarrollar conexiones con los clientes. Cómo aumentar el valor de las relaciones con los clientes Desarrollar conexiones con los clientes Cómo aumentar el valor de las relaciones con los clientes 1 Programa Tendencias y desafíos del mercado Implicaciones empresariales Valor de Microsoft Imperativos

Más detalles

SOFISTICACION ANALITICA PARA EL CONOCIMIENTO DEL CLIENTE Y PERSONALIZACIÓN DE LA PROPUESTA DE VALOR

SOFISTICACION ANALITICA PARA EL CONOCIMIENTO DEL CLIENTE Y PERSONALIZACIÓN DE LA PROPUESTA DE VALOR SOFISTICACION ANALITICA PARA EL CONOCIMIENTO DEL CLIENTE Y PERSONALIZACIÓN DE LA PROPUESTA DE VALOR Carlos Mendoza Astroz SAS INSTITUTE Domain Expert carlos.mendoza@sas.com AGENDA 1. La nueva visión del

Más detalles

El valor de una infraestructura optimizada

El valor de una infraestructura optimizada El valor de una infraestructura optimizada El Estudio del Estado del CIO 2006 (CIO Research, 2006) muestra que los CIO están buscando, cada vez más, introducir, de forma proactiva, soluciones de tecnología

Más detalles

Anuncio de software ZP12-0060 de IBM Europe, Middle East, and Africa con fecha 21 de febrero de 2012

Anuncio de software ZP12-0060 de IBM Europe, Middle East, and Africa con fecha 21 de febrero de 2012 con fecha 21 de febrero de 2012 IBM InfoSphere Master Data Management for Healthcare crea vistas fiables de activos de datos de servicios sanitarios y permite mejorar la efectividad de los procesos empresariales

Más detalles

Principales beneficios para una pyme del uso de la plataforma Microsoft Office 365

Principales beneficios para una pyme del uso de la plataforma Microsoft Office 365 Portal de la competitividad - Office 365. Escenario Necesito movilidad y colaboración: estar fuera de la oficina y tener acceso a la información Hoja de Producto Técnica (para Pymes). Todas las empresas

Más detalles

5. MODELOS DE CLIENTE Y SERVIDOR ORIENTADOS A AGENTES MÓVILES

5. MODELOS DE CLIENTE Y SERVIDOR ORIENTADOS A AGENTES MÓVILES SISTEMAS DISTRIBUIDOS DE REDES 5. MODELOS DE CLIENTE Y SERVIDOR ORIENTADOS A AGENTES MÓVILES Programación remota: Introducción y generalidades INTRODUCCIÓN Debido a la dificultad de la arquitectura actual

Más detalles

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1 ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones

Más detalles

Cómo aprovechar la potencia de la analítica avanzada con IBM Netezza

Cómo aprovechar la potencia de la analítica avanzada con IBM Netezza IBM Software Information Management White Paper Cómo aprovechar la potencia de la analítica avanzada con IBM Netezza Un enfoque de appliance simplifica el uso de la analítica avanzada Cómo aprovechar la

Más detalles

Servicios avanzados de supercomputación para la ciència y la ingeniería

Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería HPCNow! provee a sus clientes de la tecnología y soluciones

Más detalles

makeanet Crea tu propia red privada Mejora la eficiencia corporativa Implantada por

makeanet Crea tu propia red privada Mejora la eficiencia corporativa Implantada por makeanet Crea, personaliza y comparte tu red privada Crea tu propia red privada Mejora la eficiencia corporativa Implantada por Aumenta la productividad de tu Organización y ahorra costes, usando la solución

Más detalles

Microsoft Business Solutions Navision le ofrece una forma eficaz de optimizar su negocio y aumentar la productividad.

Microsoft Business Solutions Navision le ofrece una forma eficaz de optimizar su negocio y aumentar la productividad. MICROSOFT BUSINESS SOLUTIONS NAVISION MICROSOFT BUSINESS SOLUTIONS NAVISION Le ofrece la libertad para centrarse en su negocio. Beneficios principales: Aumente su productividad Marque su ventaja sobre

Más detalles

IBM InfoSphere Foundation Tools permite ofrecer información de confianza

IBM InfoSphere Foundation Tools permite ofrecer información de confianza ZP06-0517, con fecha 15 de diciembre del 2009 IBM InfoSphere Foundation Tools permite ofrecer información de confianza Índice 1 Visión general 2 Fecha de comercialización prevista 2 Requisitos previos

Más detalles

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting NewPoint IT Consulting BIG DATA WHITE PAPER NewPoint Information Technology Consulting Contenido 1 Big Data: Reto y Oportunidad para la Empresa... 3 2 Los drivers Técnicos y de Negocio de BIG DATA... 9

Más detalles

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS Sistemas de Información para la Gestión UNIDAD 3: RECURSOS DE TECNOLOGÍA DE INFORMACIÓN Aplicaciones UNIDAD 2: RECURSOS DE TI Aplicaciones 1. Administración de bases de datos e información: Sistemas de

Más detalles

RODRIGO TAPIA SANTIS (rtapiasantis@gmail com) has a. non-transferable license to use this Student Guide

RODRIGO TAPIA SANTIS (rtapiasantis@gmail com) has a. non-transferable license to use this Student Guide Introducción Objetivos del Curso Al finalizar este curso, debería estar capacitado para: Instalar, crear y administrar Oracle Database 11g Versión 2 Configurar la base de datos para una aplicación Utilizar

Más detalles

Implementación, aprovisionamiento y actualización de Windows Server con System Center

Implementación, aprovisionamiento y actualización de Windows Server con System Center Implementación automatizada y centralizada, aprovisionamiento y actualización de Windows Server La implementación y el mantenimiento de Windows Server en sistemas operativos de centros de datos y entornos

Más detalles

SAP Extended Warehouse Management llega a la mayoría de edad. La evolución del mercado de sistemas de gestión de almacenes

SAP Extended Warehouse Management llega a la mayoría de edad. La evolución del mercado de sistemas de gestión de almacenes INFORME DE ARC 23 DE SEPTIEMBRE DE 2013 SAP Extended Warehouse Management llega a la mayoría de edad Por Clint Reiser Resumen En 2010, ARC Advisory Group se preguntaba si SAP Extended Warehouse Management

Más detalles

Claves Tecnológicas. Cloud, big data, redes sociales, consumerización, seguridad...

Claves Tecnológicas. Cloud, big data, redes sociales, consumerización, seguridad... núm. 02 Noviembre 2012 Claves Tecnológicas Cloud, big data, redes sociales, consumerización, seguridad... Retrato Grady Booch, Evangelist & IBM Fellow SAPPHIRE NOW Sven Denecken, VP & Head of Co-Innovation

Más detalles

VISIÓN GENERAL HERRAMIENTAS COMERCIALES

VISIÓN GENERAL HERRAMIENTAS COMERCIALES VISIÓN GENERAL El servidor de MS SQL se ha convertido en un estándar en muchas partes de la América corporativa. Puede manejar volúmenes de datos grandes y se integra bien con otros productos de Microsoft.

Más detalles

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Programa de Capacitación y Certificación. INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Contenido PERFIL DE UN ESPECIALISTA EN BASES DE DATOS.... 3 6231. MANTENIENDO UNA BASE DE DATOS DE SQL SERVER 2008

Más detalles

Desarrollando valor en un entorno complejo

Desarrollando valor en un entorno complejo Estudio sobre finanzas de alto rendimiento 2011 Desarrollando valor en un entorno complejo El nuevo reto en la Organización Financiera Estudio sobre finanzas de alto rendimiento 2011 Resumen ejecutivo

Más detalles

Los 6 beneficios del Cloud para los profesionales de RRHH

Los 6 beneficios del Cloud para los profesionales de RRHH Los 6 beneficios del Cloud para los profesionales de RRHH Copyright 2013, Meta4 Spain, S.A. All rights reserved Copyright 2014, Meta4 Spain, S.A. All rights reserved Agenda Introducción al Cloud Beneficios

Más detalles

Emprendiendo negocios juntos

Emprendiendo negocios juntos Emprendiendo negocios juntos Definiendo Cloud Computing Un modelo que permite de manera muy sencilla el acceso a una red de recursos informáticos, los cuales con poco esfuerzo son configurables por el

Más detalles

Almacenamiento en la nube

Almacenamiento en la nube white paper Almacenamiento en la nube Ventajas y retos. Almacenamiento en la nube: Ventajas y retos 1 En el nuevo ecosistema TI en que se mueven hoy las organizaciones cualquier planificación del almacenamiento

Más detalles

El cambio en la adquisición de soluciones informáticas. El cambio en la adquisición de soluciones informáticas

El cambio en la adquisición de soluciones informáticas. El cambio en la adquisición de soluciones informáticas El cambio en la adquisición de soluciones informáticas El cambio en la adquisición de soluciones informáticas Mayo de 2014 El nuevo comprador de tecnología... y la nueva mentalidad de adquisiciones Hoy

Más detalles

10 Razones Fundamentales para Cambiarse a unipaas

10 Razones Fundamentales para Cambiarse a unipaas 10 Razones Fundamentales para Cambiarse a unipaas Octubre 2008 Documento de Posicionamiento Magic Software es una marca registrada de Magic Software Enterprises Ltd. Los restantes productos y compañías

Más detalles

La empresa, el conocimiento y las redes sociales Fernando Piera 1

La empresa, el conocimiento y las redes sociales Fernando Piera 1 Número 48. Diciembre 2013 La empresa, el conocimiento y las redes sociales Fernando Piera 1 Resumen Nos encontramos en el tiempo de la explosión de los datos. Hasta se está hablado de la ciencia de los

Más detalles

Análisis de sentimientos de tweets.

Análisis de sentimientos de tweets. Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red

Más detalles

INTERNET - INTRANET - EXTRANET

INTERNET - INTRANET - EXTRANET INTERNET - INTRANET - EXTRANET Definiciones Internet es "una red de computación de alcance mundial constituida a su vez por miles de redes de computación que conectan entre sí millones de computadoras,

Más detalles

ESTUDIO, ANÁLISIS Y EVALUACIÓN DEL ENTORNO DE TRABAJO HADOOP. Entidad Colaboradora: ICAI Universidad Pontificia Comillas

ESTUDIO, ANÁLISIS Y EVALUACIÓN DEL ENTORNO DE TRABAJO HADOOP. Entidad Colaboradora: ICAI Universidad Pontificia Comillas ESTUDIO, ANÁLISIS Y EVALUACIÓN DEL ENTORNO DE TRABAJO HADOOP. Autor: Director: Rubio Echevarria, Raquel Contreras Bárcena, David Entidad Colaboradora: ICAI Universidad Pontificia Comillas RESUMEN DEL PROYECTO

Más detalles

1. CONDICIONES GENERALES Y SU ACEPTACIÓN

1. CONDICIONES GENERALES Y SU ACEPTACIÓN 1. CONDICIONES GENERALES Y SU ACEPTACIÓN Estas condiciones generales (en adelante Condiciones Generales ) regulan el uso del servicio VerifactGasto (en adelante Servicio ) que la sociedad mercantil EASYFAC,

Más detalles

Tendencias Tecnológicas Estratégicas Gartner Group

Tendencias Tecnológicas Estratégicas Gartner Group Tendencias Tecnológicas Estratégicas Gartner Group María Esther Ordóñez O. mordonez@ordonezasesores.com.co Ordóñez Ordóñez y Asociados Ltda. Agosto 2013 Convergencia de Fuerzas Tecnologías Estratégicas

Más detalles

Unidad 5. Conceptos y Estructuras de Archivos

Unidad 5. Conceptos y Estructuras de Archivos Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar

Más detalles

Cobaires Software Factory

Cobaires Software Factory Cobaires Software Factory Desarrollo Web COBAIRES ARGENTINA Tel: +54.11.6385.0637 Mail: comercial@cobaires.com.ar Web: www.cobaires.com.ar Nota de Confidencialidad La información contenida en las páginas

Más detalles

Hoja de datos: Protección de datos OpsCenter Analytics

Hoja de datos: Protección de datos OpsCenter Analytics Presentación El crecimiento de los datos complica cada vez más las operaciones de copia de seguridad y archivado, y los clientes descubren grandes ganancias en productividad operativa mediante la utilización

Más detalles

Cómo pueden las empresas emergentes favorecer su crecimiento y proteger su información empresarial importante?

Cómo pueden las empresas emergentes favorecer su crecimiento y proteger su información empresarial importante? INFORME DE LA SOLUCIÓN: CA ARCSERVE BACKUP PARA MICROSOFT ESSENTIAL BUSINESS SERVER Cómo pueden las empresas emergentes favorecer su crecimiento y proteger su información empresarial importante? CA ARCserve

Más detalles

Telefonía IP. telefonía ip > DOSSIER INFORMÁTIVO // > / SEPT, 2006. evolución natural. Jesús Martínez Martínez jesus.martinez@inove.

Telefonía IP. telefonía ip > DOSSIER INFORMÁTIVO // > / SEPT, 2006. evolución natural. Jesús Martínez Martínez jesus.martinez@inove. Telefonía IP evolución natural Jesús Martínez Martínez jesus.martinez@inove.es España, Murcia 2006 telefonía ip > DOSSIER INFORMÁTIVO // > / SEPT, 2006 2006 Inove Servicios Telemáticos. All rights reserved.

Más detalles

Core Solutions of Microsoft SharePoint Server 2013 CURSO PRESENCIAL DE 25 HORAS

Core Solutions of Microsoft SharePoint Server 2013 CURSO PRESENCIAL DE 25 HORAS Core Solutions of Microsoft SharePoint Server 2013 CURSO PRESENCIAL DE 25 HORAS CURSO DESCRIPCIÓN DEL CURSO... 2 TEMARIO... 3 Administración de bases de datos Microsoft SQL Server Duración: 25 horas Después

Más detalles

Big Data: Qué es y por qué es relevante?

Big Data: Qué es y por qué es relevante? Big Data: Qué es y por qué es relevante? 01000111101001110111001100110110011001 Volumen 10x Aumento del volumen de información cada cinco años Gran Información Velocidad 4.3 Número de dispositivos conectados

Más detalles

Autor: Ing. Jorge Tesler - Director Ejecutivo de TGI Argentina SA Consultores en Tecnología, Gestión e Innovación Empresaria

Autor: Ing. Jorge Tesler - Director Ejecutivo de TGI Argentina SA Consultores en Tecnología, Gestión e Innovación Empresaria REVISTA ENFASIS Autor: Ing. Jorge Tesler - Director Ejecutivo de TGI Argentina SA Consultores en Tecnología, Gestión e Innovación Empresaria Título: La Tecnología como soporte a la actividad Logística

Más detalles

LA UBICACIÓN DEL CONOCIMIENTO EN LAS ORGANIZACIONES

LA UBICACIÓN DEL CONOCIMIENTO EN LAS ORGANIZACIONES Cuadernos de Gestión del Conocimiento Empresarial Número 25. Septiembre de 2010 LA UBICACIÓN DEL CONOCIMIENTO EN LAS ORGANIZACIONES Por Fernando Piera Gómez, vicepresidente 1º de ATI Al final de la primera

Más detalles

SharePoint. La solución más amplia a las necesidades empresariales.

SharePoint. La solución más amplia a las necesidades empresariales. SharePoint. La solución más amplia a las necesidades empresariales. De la amplísima gama de productos de Microsoft, SharePoint es uno de los más interesantes por la cantidad de implicaciones que tiene

Más detalles

configuración, no codificación

configuración, no codificación INFORME OFICIAL septiembre de 2012 configuración, no codificación Cómo CA Nimsoft Service Desk acelera la implementación y el tiempo de posicionamiento agility made possible tabla de contenido resumen

Más detalles

Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server

Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server Sobre el Profesor Master en Tecnologías de Bases de Datos (Administración de Bases de Datos e Inteligencia

Más detalles

Servicios de infraestructura. Aplicaciones web

Servicios de infraestructura. Aplicaciones web 10 Julio 2013 Servicios de infraestructura Compílela o tráigala y nosotros la ejecutamos Windows Azure proporciona infraestructura a petición que se escala y se adapta a las necesidades cambiantes de cada

Más detalles

Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014

Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014 Libere el conocimiento que vive en cualquier dato Mario Ochoa 10/09/2014 En qué se diferencian las empresas exitosas de la actualidad? Datos. Valor La innovación de tecnología acelera el valor Machine

Más detalles

Cloud Computing. Octubre 2011 / White paper

Cloud Computing. Octubre 2011 / White paper Cloud Computing Octubre 2011 / White paper Cloud Computing El modelo de Computación en la Nube está reemplazando el modelo tradicional de TI para numerosas organizaciones que no han podido seguir el ritmo

Más detalles

Boletín de Asesoría Gerencial* Business Process Management (BPM)

Boletín de Asesoría Gerencial* Business Process Management (BPM) Espiñeira, Sheldon y Asociados * No. 11-2009 *connectedthinking Contenido Haga click en los enlaces para navegar a través del documento Haga click en los enlaces para llegar directamente a cada sección

Más detalles

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD Informe técnico Solución empresarial Hadoop de EMC NAS de escalamiento horizontal Isilon y Greenplum HD Por Julie Lockner, analista ejecutivo, y Terri McClure, analista ejecutivo Febrero de 2012 Este Informe

Más detalles

Introducción En los años 60 s y 70 s cuando se comenzaron a utilizar recursos de tecnología de información, no existía la computación personal, sino que en grandes centros de cómputo se realizaban todas

Más detalles

Getronics Gana Flexibilidad y Competitividad en Servicios de TI con Soluciones de CA Technologies

Getronics Gana Flexibilidad y Competitividad en Servicios de TI con Soluciones de CA Technologies CUSTOMER SUCCESS STORY Julio 2013 Getronics Gana Flexibilidad y Competitividad en Servicios de TI con Soluciones de CA Technologies PERFIL DEL CLIENTE Industria: Servicios de TI Compañía: Getronics Empleados:

Más detalles

SMS Marketing. Manual de usuario. By DIDIMO Servicios Móviles

SMS Marketing. Manual de usuario. By DIDIMO Servicios Móviles SMS Marketing Manual de usuario By DIDIMO Servicios Móviles Manual de usuario SMS Marketing Madrid Network Marketplace INDICE INDICE... 2 1 QUÉ ES SMS MARKETING?... 3 2 MENÚ PRINCIPAL... 4 2.1 CAMPAÑAS...4

Más detalles

Tecnologías de la Información en la Gestión Empresarial

Tecnologías de la Información en la Gestión Empresarial Tecnologías de la Información en la Gestión Empresarial 1 Sesión No.8 Nombre: Procesos de Negocio y Gestión en Business Intelligence Objetivo: Al término de la sesión, el alumno ilustrará un proceso de

Más detalles

Presentando. Una fuente de ideas para la acción. Ideas de las personas que dan forma al mundo de negocios. wobi.com. Powered by

Presentando. Una fuente de ideas para la acción. Ideas de las personas que dan forma al mundo de negocios. wobi.com. Powered by Presentando Una fuente de ideas para la acción. Ideas de las personas que dan forma al mundo de negocios. wobi.com Powered by Ideas en Acción Por más de 20 años hemos seleccionado, producido y distribuido

Más detalles

Soluciones FastTrack BI para SAP Business One

Soluciones FastTrack BI para SAP Business One Soluciones FastTrack BI para SAP Business One Mejore la capacidad de análisis y agilice la toma de decisiones de su información almacenada en SAP Business One con las soluciones de Clariba. Muchas pymes

Más detalles

Convierta sus datos en conocimiento para generar utilidades.

Convierta sus datos en conocimiento para generar utilidades. Microsoft SQL Server Business Intelligence ofrece una plataforma integral fortaleciendo a las organizaciones para construir y desplegar soluciones de BI seguras, escalables y manejables. Convierta sus

Más detalles

En el siguiente apartado se detallan ciertos conceptos que ayudan a comprender en mayor medida el Proyecto.

En el siguiente apartado se detallan ciertos conceptos que ayudan a comprender en mayor medida el Proyecto. APÉNDICES En el siguiente apartado se detallan ciertos conceptos que ayudan a comprender en mayor medida el Proyecto. APÉNDICE 1. Herramientas Las herramientas que se usaron en el análisis, desarrollo

Más detalles

Los firmantes reconocen las iniciativas ya establecidas, así como los acuerdos de autorregulación nacionales y europeos existentes.

Los firmantes reconocen las iniciativas ya establecidas, así como los acuerdos de autorregulación nacionales y europeos existentes. Principios para un uso seguro de los dispositivos con conexión a Internet y los servicios en línea en la Unión Europea por parte de los niños y los jóvenes Este documento recoge una serie de principios

Más detalles

Sybase almacenamiento y acceso a grandes volúmenes de datos para su análisis y generación de informes. Información en tiempo real para el negocio

Sybase almacenamiento y acceso a grandes volúmenes de datos para su análisis y generación de informes. Información en tiempo real para el negocio Sybase almacenamiento y acceso a grandes volúmenes de datos para su análisis y generación de informes Información en tiempo real para el negocio Obtener los datos relevantes en el momento más adecuado,

Más detalles

La fuerte demanda de servicios de 'cloud computing', debido a su bajo coste, obliga a las empresas a desarrollar nuevos paquetes tecnológicos.

La fuerte demanda de servicios de 'cloud computing', debido a su bajo coste, obliga a las empresas a desarrollar nuevos paquetes tecnológicos. El boom de las soluciones en la 'nube' La fuerte demanda de servicios de 'cloud computing', debido a su bajo coste, obliga a las empresas a desarrollar nuevos paquetes tecnológicos. 04/10/2011 El mundo

Más detalles

Construcción de cubos OLAP utilizando Business Intelligence Development Studio

Construcción de cubos OLAP utilizando Business Intelligence Development Studio Universidad Católica de Santa María Facultad de Ciencias e Ingenierías Físicas y Formales Informe de Trabajo Construcción de cubos OLAP utilizando Business Intelligence Development Studio Alumnos: Solange

Más detalles

Anuncio de software de IBM Europe, Middle East and Africa ZP09-0157, con fecha 2 de junio de 2009

Anuncio de software de IBM Europe, Middle East and Africa ZP09-0157, con fecha 2 de junio de 2009 ZP09-0157, con fecha 2 de junio de 2009 La gama IBM Optim ya es compatible con el desarrollo de bases de datos de Oracle: las soluciones de administración se han ampliado y se ha mejorado la integración

Más detalles

CURSO DE ESPECIALIZACION EN ADMINISTRACION Y CREACION DE SOLUCIONES CORPORATIVAS PARA SHAREPOINT SERVER 2013

CURSO DE ESPECIALIZACION EN ADMINISTRACION Y CREACION DE SOLUCIONES CORPORATIVAS PARA SHAREPOINT SERVER 2013 CURSO DE ESPECIALIZACION EN ADMINISTRACION Y CREACION DE SOLUCIONES CORPORATIVAS PARA SHAREPOINT SERVER 2013 PRESENTACION DEL CURSO DE ESPECIALIZACION EN ADMINISTRACION Y CREACION DE SOLUCIONES CORPORATIVAS

Más detalles

Solicitar la competencia Business Intelligence Solutions

Solicitar la competencia Business Intelligence Solutions Solicitar la competencia Business Intelligence Solutions Guía paso a paso de la inscripción En Microsoft Partner Program, las competencias de Microsoft definen sus áreas de especialización, ayudándole

Más detalles

GUÍA DE IMPLANTACIÓN DE UN SISITEMA DE GESTIÓN DE SEGURIDAD DE LA INFORMACIÓN UNE ISO/IEC 27001:2007 CON LA HERRAMIENTA GLOBALSGSI

GUÍA DE IMPLANTACIÓN DE UN SISITEMA DE GESTIÓN DE SEGURIDAD DE LA INFORMACIÓN UNE ISO/IEC 27001:2007 CON LA HERRAMIENTA GLOBALSGSI GUÍA DE IMPLANTACIÓN DE UN SISITEMA DE GESTIÓN DE SEGURIDAD DE LA INFORMACIÓN UNE ISO/IEC 27001:2007 CON LA HERRAMIENTA GLOBALSGSI POWERED BY AUDISEC www.audisec.es Febrero de 2010 ÍNDICE 1. PRESENTACIÓN...

Más detalles

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO asoto@solidq.com @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en

Más detalles

Fernando Gutiérrez-Cabello. Data Discovery y visualizaciones en MicroStrategy 10

Fernando Gutiérrez-Cabello. Data Discovery y visualizaciones en MicroStrategy 10 Fernando Gutiérrez-Cabello Data Discovery y visualizaciones en MicroStrategy 10 Clientes Beta de MicroStrategy 10 Por primera vez, MicroStrategy 10 ofrece una plataforma de analítica que combina una experiencia

Más detalles

Minimice los riesgos para la migración de red del centro de datos

Minimice los riesgos para la migración de red del centro de datos Minimice los riesgos para la migración de red del centro de datos Optimice su arquitectura e inversión de TI y, al mismo tiempo, reduzca la complejidad y los riesgos Los Servicios de migración de centros

Más detalles

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES agcastro@pragsis.com antoniogonzalezcastro.es @agonzaca linkedin.com/in/agonzaca

Más detalles

Estos datos fluyen a velocidades cada vez mayores.

Estos datos fluyen a velocidades cada vez mayores. Big Data La solución La información 1 2 Las nuevas tecnologías han incrementado enormemente la cantidad de información producida. Estos datos fluyen a velocidades cada vez mayores. 3 Se necesita una manera

Más detalles

XDR. Big Data solution.

XDR. Big Data solution. XDR Big Data solution. Objetivo Principal Xdr es una solución que utiliza una arquitectura sencilla, de bajo costo y totalmente integrada a la infraestructura de los negocios de las empresas de Telecomunicaciones.

Más detalles