ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1



Documentos relacionados
ÍNDICE. Introducción... Capítulo 1. Inteligencia de negocios y sistemas de información. Informes... 1

MS_20467 Designing Self-Service Business Intelligence and Big Data Solutions

XII Encuentro Danysoft en Microsoft Abril Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

BUSINESS INTELLIGENCE

SQL Server 2014 Implementación de una solución de Business Intelligence (SQL Server, Analysis Services, Power BI...)

Big data A través de una implementación

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

Soluciones Big Data & Analytics Martes 10 de junio de 2014 Museu Nacional d'art de Catalunya

Big Data Analytics: propuesta de una arquitectura

Fernando Gutiérrez-Cabello. Data Discovery y visualizaciones en MicroStrategy 10

ÍNDICE. Capítulo 1. Conceptos de base de datos de SQL Azure... 1

Temario. Herramientas Microsoft BI Performance Point Dashboard

MS_80221 Installation and Configuration for Microsoft Dynamics AX 2012

Hadoop. Cómo vender un cluster Hadoop?

Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server

Contenido CAPÍTULO 2 FUENTES DE GRANDES VOLÚMENES DE DATOS Parte I. La era de Big Data CAPÍTULO 1 QUÉ ES BIG DATA?... 1

MS_20696 Managing Enterprise Devices and Apps using System Center Configuration Manager

Temario

SharePoint Foundation 2010 Construir una Intranet colaborativa en PYMES

Inteligencia de Negocios. & Microsoft Excel 2013

Conectores Pentaho Big Data Community VS Enterprise

CURSO DE EXCEL AVANZADO Y PROGRAMACION VBA Y BUSINESS INTELLIGENCE MÁSTER EN DESARROLLO DE APLICACIONES WEB CON JAVA ENTERPRISE EDITION

Soluciones Big Data & Analytics Miércoles 4 de junio de 2014 Estadio Santiago Bernabeu

HDInsight. Big Data, al estilo Microsoft

Manual avanzado Windows Server 2012 (c) Francisco Charte Ojeda

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

MS_10777 Implementing a Data Warehouse with Microsoft SQL Server 2012

CURSOS PREPARACIÓN PARA CERTIFICACIÓN MICROSOFT SQL SERVER

CL_55049 PowerPivot, Power Viewand SharePoint 2013 Business Intelligence Center for Analysts

Construyendo una Intranet colaborativa para PyMES con SharePoint 2010

MS_10971 Storage and High Availability with Windows Server 2012

serra Access y SQL Server Qué es mejor en cada caso? Valentín Playá, Serra GTS 22 de enero de 2009 Bases de datos 1

Técnico Profesional en SQL Server 2014: Especialista Business Intelligence

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop

CL_55115 Planning, Deploying and Managing Microsoft Project Server 2013

Descripción de los Servicios Oracle contemplados en el Instrumento de Agregación de Demanda

Microsoft SQL Azure. Administración y desarrollo en la nube. María Pérez Marqués

Software Libre para Aplicaciones de Big Data

ÍNDICE. Introducción y características Capítulo 1. Requisitos, instalación, configuración e inicio... 3

ÍNDICE. Introducción... Capítulo 1. Novedades, mejoras y requisitos para la instalación... 1

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Técnico Profesional en SQL Server 2014: Especialista Business Intelligence

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

PREVIEW BIDOOP 2.0. Big Data Brunch

MS_10979 Microsoft Azure Fundamentals

PROGRAMA FORMATIVO Administrador Big Data Cloudera Apache Hadoop

MS_20463 Implementing a Data Warehouse with Microsoft SQL Server

Big Data con nombres propios

Monitorización de actividades de datos InfoSphere Guardium para Big Data

Implementación de un almacén de datos con Microsoft SQL Server

MS_10174 Configuring and Managing Microsoft SharePoint 2010

MOC Microsoft Project Server 2010 Technical Boot Camp

BUSINESS INTELLIGENCE Y REDSHIFT

Postgrado en SQL Server 2014: Especialista Business Intelligence

La combinación perfecta

Implementación de un Data Warehouse con Microsoft SQL Server Cursos Especialización. Versión 1.0

10778 Implementing Data Models and Reports with Microsoft SQL Server 2012

MS_20247 Configuring and Deploying a Private Cloud

MS_20462 Administering Microsoft SQL Server Databases

Guía de usuario CUBO TI

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

SAS Data Scientist. Plan de Formación

Instalación de Microsoft SQL Server 2005

Soluciones y Servicios. Ofrecidos a nuestros clientes

CONFIGURACIÓN Y DESARROLLO

MASTER DE SYSTEM CENTER 2012

RODRIGO TAPIA SANTIS com) has a. non-transferable license to use this Student Guide

Implementing a Data Warehouse with Microsoft SQL Server

CURSO DE ADMINISTRACIÓN Y PROGRAMACIÓN EN SQL SERVER 2008 BUSINESS INTELLIGENCE

MÁSTER: MÁSTER EXPERTO BIG DATA

Características Generales Eduardo Santana Abadía

Oracle BI for Microsoft Excel

Introducción a BusinessObjects XI Release 2 Service Pack 2 / Productivity Pack

Luis Reina Juliá IBM Software Group Arquitecto de Datos. Data Warehousing: el reto de extraer el valor de los datos

La Analítica de Datos no Estructurados

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

POSTGRADO. Ingeniería EXPERTO EN BIG DATA

SolucionesAnalíticas con Pentaho.

Implementación de Microsoft SQL Server Oracle 10g 80. Microsoft SQL Server 2008 Transact-SQL 80. SQL Server DISEÑO CERTIFICACIÓN

PowerPivot y Modelo Tabular con SQL Server Analysis Services 2012

Microsoft SQL Server Conceptos.

Comparación de características entre las ediciones Estándar y Enterprise

Project Online Introducción La voz del cliente Qué es Project Online? Características del producto

Curso Big Data: Herramientas Tecnológicas y Aplicaciones para Negocio

FORMACIÓN PARA LA CERTIFICACIÓN OFICIAL MICROSOFT. MCSA: SQL Server Solutions Associate

Facultad Politécnica UNA Ing. Julio Paciello

INTRODUCCIÓN Y NOVEDADES EN WINDOWS

MOC Administración SharePoint 2013 Core & Advanced

MS_10978 Introduction to Azure for Developers

Transcripción:

ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones de Social Media... 6 Patrones de modelado y gestión de riesgo... 7 Big Data y el sector de la energía... 8 Big Data en el Call Center... 9 Capítulo 2. Componentes de una plataforma de Big Data... 11 Plataforma de código abierto Hadoop... 11 Hadoop Distributed File System (HDFS)... 12 Hadoop MapReduce... 13 Hadoop Common... 14 Aplicaciones de desarrollo en Hadoop... 14 Avro... 15 Cassandra... 15 Chukwa... 15 Flume... 15 Hbase (NoSQL)... 16 Hive... 16 Jaql... 17 Lucene... 17 Oozie... 17 Pig... 18 ZooKeeper... 18 Hadoop streaming... 19 Situar datos en Hadoop... 19

BIG DATA. TÉCNICAS, HERRAMIENTAS Y APLICACIONES Copia de datos básica... 19 Big Data y el campo de la investigación... 20 Capítulo 3. Big Data con herramientas de IBM... 23 IBM Power Systems... 23 Hardware... 24 Sistemas operativos... 25 Software System... 26 Herramientas... 26 Analytics con Power System... 27 IBM Solution for Hadoop Power Systems Edition... 27 IBM Solution for Analytics Power Systems Edition... 27 IBM BLU Acceleration Solution Power Systems Edition... 29 IBM AIX Solution Editions para Cognos y SPSS... 29 IBM PureData System for Operational Analytics (US)... 31 Big Data Solution with InfoSphere BigInsights and Streams... 32 IBM i para Business Intelligence (US)... 33 IBM DB2 Web Query for i... 33 Cloud Computing en Power Systems... 34 Virtualization Foundation Solutions... 36 IBM SmartCloud Entry for Power Systems... 37 IBM Power Systems Solution Edition for Cloud... 37 IBM Power Systems Solution Edition for Scale Out Cloud... 37 Herramientas Avanzadas en la nube... 38 IBM SPSS Modeler... 38 Usando el ratón... 42 Ayuda en Modeler... 42 El menú Herramientas de Modeler... 43 Ejemplo de trabajo con IBM SPSS Modeler... 48 Insertar un nodo fuente (origen) de datos en el área de trabajo... 48 Enlazar un nodo con una fuente de datos... 50 Controlar la carga de datos con un nodo Tabla... 51 Definir variables predictoras con el nodo Tipo... 53 Utilizar un nodo de modelado... 56 Ejecutar de una ruta... 57 Predecir con un modelo... 59 Guardar un modelo... 59 Nodos de orígenes de datos... 60 Nodos de operaciones con registros... 61 VI RC Libros

ÍNDICE Nodos de operaciones con campos... 62 Nodos para gráficos... 63 Nodos para modelado... 64 Nodos de resultado... 66 Nodos de exportación... 67 IBM SPSS Modeler e IBM SPSS Statistics... 67 Capítulo 4. Big Data con herramientas de Oracle... 69 Oracle y el Big Data... 69 Oracle Big Data Appliance... 71 Oracle Big Data Connectors... 73 Oracle NoSQL Database... 76 Oracle Exadata Database... 78 Oracle Exalytics In-Memory Machine... 79 Oracle Business Analytics... 80 Oracle Business Intelligence Foundation Suite... 80 Enterprise Performance Management... 84 Aplicaciones analíticas... 84 Information Discovery... 87 Advanced Analytics... 87 Nube... 87 Soluciones de datos rápidos de Oracle... 88 Oracle Social Cloud... 89 Capítulo 5. Big Data con herramientas de Microsoft... 91 Microsoft y el Big Data... 91 Solución Big Data de Microsoft... 92 Acceso a Hadoop... 93 Adaptación de Hadoop para la empresa... 94 Aprovechamiento de información... 95 El papel de SQL Server... 96 Los orígenes de Hadoop. La nube... 97 HDInsight... 98 Escalamiento con total flexibilidad a petición... 99 Análisis de datos semiestructurados, estructurados y no estructurados... 99 Desarrollo en el lenguaje favorito. Hardware... 100 Excel para visualizar datos de Hadoop... 100 Los clusters locales de Hadoop y la nube... 100 RC Libros VII

BIG DATA. TÉCNICAS, HERRAMIENTAS Y APLICACIONES HDInsight y HBase... 101 Conceptos esenciales en Azure HDInsight... 102 Datos de gran tamaño... 102 Apache Hadoop... 102 MapReduce... 102 HDInsight... 103 El ecosistema Hadoop en Azure... 104 Pig... 105 Hive... 105 Sqoop... 106 Herramientas de Business Intelligence y conectores... 106 Escenarios de datos de gran tamaño en HDInsight... 106 Introducción al uso de HDInsight de Azure... 107 Requisitos previos... 107 Configuración de un entorno local para ejecutar PowerShell... 108 Aprovisionamiento de un cluster de HDInsight... 108 Ejecución de un trabajo WordCount de MapReduce... 111 Conexión a las herramientas de inteligencia empresarial de Microsoft... 118 Uso de MapReduce con HDInsight... 121 Escenario... 121 Ejecución de la muestra con Azure PowerShell... 122 El código Java para el programa de recuento de palabras de MapReduce.. 126 Carga de datos en HDInsight... 129 Carga de datos en el almacenamiento de blobs usando AzCopy... 130 Carga de datos en el almacenamiento de blobs usando Azure PowerShell. 131 Carga de datos en el almacenamiento de blobs usando el explorador de almacenamiento de Azure... 132 Carga de datos en el almacenamiento de blobs usando la línea de comandos de Hadoop... 134 Importación de datos a HDFS desde base de datos SQL o SQL Server usando Sqoop... 136 Administración de HDInsight con PowerShell... 138 Aprovisionamiento de un cluster de HDInsight... 138 Enumeración y visualización de clusters... 141 Eliminación de un cluster... 141 Concesión/Revocación del acceso a los servicios de HTTP... 142 Envío de trabajos de MapReduce... 142 Envío de trabajos de Hive... 144 Introducción al emulador de HDInsight... 145 Instalación del emulador de HDInsight... 145 VIII RC Libros

ÍNDICE Ejecución de un trabajo de MapReduce de recuento de palabras... 147 Ejecución de los ejemplos de introducción... 150 Los escenarios de datos del registro de IIS w3c... 150 Carga de los datos de ejemplo del registro de w3c... 151 Ejecución de trabajos de MapReduce de Java... 152 Ejecución de trabajos de Hive... 154 Ejecución de trabajos de Pig... 157 Recompilación de los ejemplos... 158 Almacenamiento de blobs de Azure... 159 Conexión con el emulador de almacenamiento... 159 Conexión con el almacenamiento de blobs de Azure... 160 Uso de un contenedor de almacenamiento de blobs de Azure como sistema de archivos predeterminado... 162 Ejecución de HDInsight PowerShell... 164 Uso del almacenamiento de blobs de Azure con HDInsight... 165 Arquitectura de almacenamiento de HDInsight... 165 Ventajas del almacenamiento de blobs de Azure... 167 Preparación de un contenedor para el almacenamiento de blobs... 168 Creación de un contenedor de blobs para HDInsight usando el Portal de administración... 168 Creación de un contenedor usando Azure PowerShell.... 169 Archivos de dirección en almacenamiento de blobs... 170 Acceso a un blob usando Azure PowerShell... 171 Capítulo 6. Hive, Pig, Oozie, MapReduce y Excel en HDInsight... 175 Utilizando Hive con HdInsight... 175 Uso de Hive... 176 Carga de archivos de datos al almacenamiento de blobs... 177 Ejecución de las consultas de Hive usando PowerShell... 178 Utilizando Pig con HDInsight... 183 Uso de Pig... 183 Carga de archivos de datos al almacenamiento de blobs... 185 Descripción de Pig Latin... 186 Ejecución de Pig Latin usando PowerShell... 189 Utilizando Oozie con HDInsight... 192 Definición del flujo de trabajo de Oozie y el script de HiveQL relacionado.. 194 Implementación del proyecto de Oozie y preparación del ejemplo... 201 Ejecución de proyecto de Oozie... 207 RC Libros IX

BIG DATA. TÉCNICAS, HERRAMIENTAS Y APLICACIONES Desarrollo de programas MapReduce de Java para HDInsight... 216 Desarrollo de un programa de MapReduce para el recuento de palabras en Java... 216 Prueba del programa en el emulador... 221 Carga de archivos de datos al almacenamiento de blobs de Azure... 224 Ejecución del programa de MapReduce en HDInsight de Azure... 229 Recuperación del resultado del trabajo de MapReduce... 235 Conexión de Excel a HDInsight con Power Query... 236 Instalación de Microsoft Power Query para Excel... 237 Importación de datos de HDInsight a Excel... 237 Conexión de Excel a HDInsight con Microsoft Hive ODBC driver... 240 Instalación de Microsoft Hive ODBC driver... 240 Creación de un origen de datos de Hive ODBC... 241 Importación de datos a Excel desde un cluster de HDInsight... 242 Capítulo 7. Business intelligence y Big Data con Microsoft SQL Server... 245 SQL Server 2014 y el Big Data... 245 Características de Big Data y Business Intelligence en Microsoft BI SQL Server... 247 PowerPivot para SharePoint 2013... 247 PowerPivot para SharePoint 2010... 250 Power View para SharePoint Server: crear, guardar e imprimir informes... 252 Crear un informe en Power View para SharePoint Server... 252 Abrir un informe existente de Power View... 253 Guardar un informe... 253 Permisos para Power View... 254 Exportar a PowerPoint desde Power View en SharePoint... 254 Actualizar los datos del informe... 255 Imprimir vistas en un informe de Power View para SharePoint Server... 255 Informes de Power View basados en modelos de datos... 256 Descripción de los objetos de modelo multidimensional de Power View... 257 Gráficos y otras visualizaciones en Power View... 259 Gráficos circulares... 262 Gráficos de dispersión y de burbujas... 262 Gráficos de líneas, barras y columnas... 263 Gráficos de barras... 264 Gráficos de columnas... 264 Gráficos de líneas... 264 Mapas... 265 X RC Libros

ÍNDICE Múltiplos: un conjunto de gráficos con los mismos ejes... 266 Matrices... 266 Tarjetas... 266 Mosaicos... 267 Analysis Services, Integration Services y Reporting Services... 268 Informes de Reporting Services (SSRS)... 269 SQL Server Integration Services... 271 Analysis services... 274 Capítulo 8. Herramientas de Big Data en SAS... 279 Hadoop y Big Data en SAS... 279 SAS, Hadoop y el proceso analítico... 281 Big Data y soluciones Hadoop de SAS... 282 Acceso y administración de datos de Hadoop... 282 Explorar, visualizar y tratar datos científicos... 283 Analizar y modelizar... 283 Implementar e integrar... 284 SAS/ACCESS interface to Hadoop... 284 Características... 286 Requisitos del sistema... 287 Software de SAS requerido... 288 SAS Data Management... 288 Características... 292 Requisitos del sistema... 300 SAS servidor de federación... 302 Características... 305 Requisitos del sistema... 306 Software SAS Base... 307 Características... 309 Requisitos del sistema... 313 Herramientas para explorar y visualizar datos científicos... 313 SAS Visual Analytics... 314 Características... 318 Requisitos del sistema. Entorno de servidor... 322 Requisitos del sistema. Entorno del cliente... 323 Software necesario... 323 Soporte al cliente de BI móvil SAS... 324 RC Libros XI

BIG DATA. TÉCNICAS, HERRAMIENTAS Y APLICACIONES SAS In-Memory Statistics for Hadoop... 325 Características... 327 Requisitos del sistema... 332 Índice analítico... 335 XII RC Libros