CURSO DE APACHE SPARK_

Tamaño: px
Comenzar la demostración a partir de la página:

Download "CURSO DE APACHE SPARK_"

Transcripción

1 DURACIÓN: 72 HORAS

2 Apache Spark es un motor de procesamiento distribuido construido para aumentar la velocidad de procesamiento de grandes cantidades de datos añadiendo facilidad de uso y un análisis sofisticado. Diseñado para aumentar el rendimiento, Spark puede ser 100 veces mas rápido que Hadoop debido a que procesa los los datos en memoria RAM y ademas tiene otras optimizaciones. Spark es también rápido cuando almacena datos en disco. Spark tiene una API fácil de usar para operar en grandes volúmenes de datos. Esto incluye una colección de alrededor de 100 operadores para transformar datos. Spark tiene incluido librerías de alto nivel para hacer SQL queries, manipular datos en Streaming, machine learning y procesamiento de graphs. Estas librerías estándar incrementa la productividad de los desarrolladores y puede crear complejos flujos de trabajo sin problemas. En muchas ocasiones las empresas tienen que echar mano de perfiles similares como analistas web, matemáticos y estadísticos para cubrir determinadas vacantes o tareas. El problema, es que estos perfiles carecen de una formación específica en el campo Big Data y Data Science y, en la mayoría de los casos tampoco pueden acceder a ella por la importante barrera de entrada que suponen los conocimientos en programación: se necesita entender cómo funciona un lenguaje de programación y saber cuáles son sus estructuras básicas.

3 01/ Porque Spark Introducción a Apache Spark Procesamiento distribuido con el framework de Spark. Ventajas de Spark. Quien usa Spark? Casos de uso. Beneficios de Spark. Spark Vs MapReduce. 02/ Conceptos Básicos de Spark Que es Apache Spark?. Spark Shell. Spark Context. RDDs: Resilient Distributed Datasets. Creación de un RDD. RDD a traves de ficheros. Ejemplo: RDD basado en ficheros. RDD a traves de ficheros. Operaciones con RDDs. Operaciones con RDDs: Acciones. Operaciones con RDDs: Transformaciones. Ejemplo Map y Filter. Lazy execution. Transformaciones. Transformación funcional en Spark. Paso de funciones como parámetros. Ejemplo: paso de funciones. Funciones anonimas. Ejemplo: funciones anonimas. 03/ Trabajando con RDDs RDDs. Creación de un RDD desde una colección. Otras operaciones con RDDs. Pair RDDs. Crear un Pair RDD. Ejemplo: Pair RDD. Pairs con datos complejos. MapReduce en Spark. MapReduce ejemplo wordcount. Otras operaciones con Pair RDD. 04/ Hadoop Distributed File System Por que HDFS?. Almacenamiento de los datos. Lectura y escritura. Ejemplo HDFS DFS. Ejemplo HDFS en Spark. Uso de HDFS por defecto. 05/ Spark en un cluster Opciones de Spark en un cluster. Por que ejecutar Spark en un cluster?. Procesamiento distribuido. Terminología de un cluster en Spark. Programa driver en Spark. Inicio de Spark Shell en el cluster. Spark Standalone cluster. Ejecucion de Spark en Standalone cluster. Spark Standalone web UI. Spark Standalone web UI: Aplicacion. Spark Standalone web UI: Worker. Opciones de despliegue de Spark. Modo cliente y modo cluster.

4 06/ Programación paralela con Spark Spark cluster. RDDs en cluster. Particionado por ficheros: fichero único. Particionado por ficheros: ficheros múltiples. Operaciones con particiones. HDFS y localidad de los datos. Operaciones con particiones. Ejemplo: media del tamaño de las palabras. Stages y tasks. Resumen terminología Spark. Control del nivel de paralelismo. Cálculo de las Stages. Ejecución Spark: Scheduling. Stages en Spark Application UI 07/ Cacheo y persistencia Linaje de un RDD. Cacheo. Cacheo y tolerancia a fallos. Niveles de persistencia. Cambio de los niveles de persistencia. Persistencia en disco. Persistencia en disco-replicación. Checkpointing. 08/ Aplicaciones con Spark Spark shell Vs Spark aplications. Ejemplo Python wordcount. Ejemplo Scala wordcount. Aplicaciones Spark: Scala o Java. Ejecución de una aplicación de Spark. Configuración de aplicaciones Spark. Configuración en tiempo de ejecución. Configuración a través de la programación. Ejemplo sparkcontext Python. Ejemplo sparkcontext Scala. Visualización de las propiedades de Spark. Logging. Ficheros de log en Spark. Ficheros de log en Spark web UI. Configuración de Spark logging. 09/ Spark Streaming Que es Spark Streaming?. Por que Spark Streaming?. Características de Spark Streaming. Ejemplo: Streaming request count. Dstreams. Origenes para un Dstream. Operaciones de un Dstream. Transformaciones de un Dstream. Operaciones de salida de un Dstream. Salida Dstream a fichero. Uso de Spark Streaming con Spark-Shell. Estado de un Dstream. Operaciones con ventanas. Desarrollo de aplicaciones de Spark Streaming. Tolerancia a fallos de Spark. Aplicaciones Spark UI.

5 10/ Patrones comunes de desarrollo Casos de uso de Spark. Mllib, machine learning en Spark. Ejemplo K-means, clustering. 11/ Mejoras de rendimiento Variables Broadcast. Variables Broadcast, ejemplo. Ejemplo: enviar una tabla de datos como parámetro. Acumuladores. Acumuladores, ejemplo word length. Rendimiento, particiones pequeñas.

CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS.

CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS. CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Spark 2 3 Spark Shell 2.1 SparkContext Introducción a RDDs (Resilient Distributed Datasets) 3.1 Creación

Más detalles

CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN.

CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN. CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN www.formacionhadoop.com Índice 1 Por qué realizar el curso de Apache Spark? 2 Requisitos previos del curso 3 Bloques del curso 4 Objetivos 5 Tutor del curso

Más detalles

Acelerando la innovación con Apache Spark. Ricardo Barranco Fragoso IBM Big Data & Analytics Specialist

Acelerando la innovación con Apache Spark. Ricardo Barranco Fragoso IBM Big Data & Analytics Specialist Acelerando la innovación con Apache Ricardo Barranco Fragoso Big Data & Analytics Specialist [email protected] México Big Data y la Ciencia de Datos Entonces, la Ciencia de Datos es...? Es realmente

Más detalles

Uso de la biblioteca Spark Streaming

Uso de la biblioteca Spark Streaming Título: Uso de la biblioteca Spark Streaming Autor: Gabriel Guerrero Fecha: 20150705 Ref: gg20150705_usosparkstreaming Descripción: Se introduce el concepto de torrentes de datos en un ambiente Spark utilizando

Más detalles

Taller Big Data - Parte 1

Taller Big Data - Parte 1 Taller Big Data - Parte 1 Carlos Eiras Franco Department of Computer Science University of A Coruña (Spain) Carlos Eiras Franco EVIA - Junio 2016 1/25 Big data y Data Science Data Science es el arte de

Más detalles

MÁSTER: MÁSTER BIG DATA ANALYTICS

MÁSTER: MÁSTER BIG DATA ANALYTICS MÁSTER: MÁSTER BIG DATA ANALYTICS Información detallada del máster www.formacionhadoop.com El máster online Big Data Analytics de 190 horas tiene como objetivo formar a profesionales expertos en Big Data

Más detalles

CURSO: CURSO APACHE SPARK

CURSO: CURSO APACHE SPARK CURSO: CURSO APACHE SPARK Información detallada del curso www.formacionhadoop.com Este curso online de 40 horas está recomendadoa desarrolladores que quieran aprender la tecnología de procesamiento de

Más detalles

CURSO: ANÁLISIS DE DATOS CON APACHE SPARK

CURSO: ANÁLISIS DE DATOS CON APACHE SPARK CURSO: ANÁLISIS DE DATOS CON APACHE SPARK Información detallada del curso www.formacionhadoop.com El curso online Análisis de datos con Apache Spark de 60 horas está recomendado para todos aquellos profesionales

Más detalles

YO, CIENCIA DE DATOS. BIG DATA DAY Facultad de Ciencias, UNAM Ciudad de México, marzo 2016

YO, CIENCIA DE DATOS. BIG DATA DAY Facultad de Ciencias, UNAM Ciudad de México, marzo 2016 YO, CIENCIA DE DATOS BIG DATA DAY Facultad de Ciencias, UNAM Ciudad de México, marzo 2016 Qué es CIENCIA DE DATOS? La ciencia de datos es un campo interdisciplinario que involucra los procesos y sistemas

Más detalles

MÁSTER EN BIG DATA MANAGEMENT & DATA ENGINEERING. Master

MÁSTER EN BIG DATA MANAGEMENT & DATA ENGINEERING. Master MÁSTER EN BIG DATA MANAGEMENT & DATA ENGINEERING Master MÁSTER EN BIG DATA MANAGEMENT & DATA ENGINEERING MBD_MÓDULO 1: FUNDAMENTOS DE BIG DATA 1. Qué es Big Data y qué no es Big Data 2. Business Intelligence

Más detalles

BIG DATA: Una mirada tecnológica

BIG DATA: Una mirada tecnológica BIG DATA: Una mirada tecnológica Dr. Rubén Casado [email protected] @ruben_casado AGENDA 1. Qué y cómo es Big Data? 2. Batch processing 3. Real-time processing 4. Hybrid computation model 5. Casos

Más detalles

CURSOS BIGDATA. Para más información y costos: Lic. Nayana Guerrero

CURSOS BIGDATA. Para más información y costos: Lic. Nayana Guerrero CURSOS BIGDATA Curso: Introducción al mundo BigData Duración: 3 sesiones 12 horas Conocimientos previos: No se requieren conocimientos de programación Sesión I. Qué es Big Data? De dónde surge? Cómo se

Más detalles

CURSO: CURSO APACHE SPARK

CURSO: CURSO APACHE SPARK CURSO: CURSO APACHE SPARK Información detallada del curso www.formacionhadoop.com Este curso online está recomendado a desarrolladores que quieran aprender la tecnología de procesamiento de datos in-memory

Más detalles

Big Data Analytics & IBM BIG INSIGHT

Big Data Analytics & IBM BIG INSIGHT Big Data Analytics & IBM BIG INSIGHT En la actualidad se generan grandes volumenes de datos de diversos tipos, a gran velocidad y con diferentes frecuencias. Las tecnologıas disponibles permiten efectuar

Más detalles

Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores

Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores Enrique Costa-Montenegro1, Alexander Tsybanev1, Héctor Cerezo-Costas2, Francisco Javier González-Castaño 1,

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 2: INTRODUCCIÓN A HADOOP www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Qué es Hadoop? 3 Historia de Hadoop 4 Por qué utilizar Hadoop? 5 Core Hadoop

Más detalles

INTRODUCCIÓN A APACHE SPARK CON PYTHON

INTRODUCCIÓN A APACHE SPARK CON PYTHON Ls INTRODUCCIÓN A APACHE SPARK CON PYTHON Introducción a Apache Spark Jortilles.com [email protected] Índice de contenido 1.Descripción...3 2.Cual es su ventaja competitiva...3 3.Instalación...3 4.Conceptos

Más detalles

ANALÍTICA DE BIG DATA (BDA)

ANALÍTICA DE BIG DATA (BDA) ANALÍTICA DE BIG DATA (BDA) Tendencias Retos Oportunidades Fabián García Nocetti IIMAS-UNAM CAACFMI-UNAM AMIAC Ciencia de Datos y Big Data Analítica de Big Data (BDA) Aplicaciones Arquitectura General

Más detalles

CURSO ONLINE: ARQUITECTURAS BIG DATA

CURSO ONLINE: ARQUITECTURAS BIG DATA CURSO ONLINE: ARQUITECTURAS BIG DATA Información detallada del curso www.formacionhadoop.com Este curso online de 70 horas está enfocado a técnicos que quieran conocer las herramientas más importantes

Más detalles

IFCT0109_SEGURIDAD INFORMÁTICA (RD 686/2011, de 13 de mayo modificado por el RD 628/2013, de 2 de agosto)

IFCT0109_SEGURIDAD INFORMÁTICA (RD 686/2011, de 13 de mayo modificado por el RD 628/2013, de 2 de agosto) El programa formativo adjunto incluye el certificado de profesionalidad IFCT0109 Seguridad Informática, la Especialización IFCT24 Analista de Datos Big Data Cloudera Apache Hadoop y el módulo de prácticas

Más detalles

Introducción a Apache Spark

Introducción a Apache Spark Máster 17/03/2017 en Big Data y Data Science Ecosistema Spark Gonzalo Martínez Muñoz Introducción a Apache Spark Hadoop Map-Reduce. Contar palabras Map Reduce Map Reduce En un lugar de la Mancha, de cuyo

Más detalles

Big Data. Plan de Estudio

Big Data. Plan de Estudio Big Data Plan de Estudio Descripción Big Data, inteligencia de datos o datos masivos, se refiere a conjuntos de datos tan grandes que aplicaciones informáticas tradicionales de procesamiento de datos no

Más detalles

Unidad 1 - Surgimiento y Conceptualización de Bases de Datos

Unidad 1 - Surgimiento y Conceptualización de Bases de Datos TEMARIO Curso: Big Data Base de Datos NoSQL MongoDB. Unidad 1 - Surgimiento y Conceptualización de Bases de Datos 1. Valor de las Bases de Datos NoSQL 2. Cambios en la evolución tecnológica de las BD 3.

Más detalles

Jesús Fernández Bes MLG 3JUN2013

Jesús Fernández Bes MLG 3JUN2013 Jesús Fernández Bes MLG 3JUN2013 Índice 1. Instrucciones de instalación 2. Visión general de Spark 3. PySpark 1. Uso interacivo 2. Uso standalone 4. Uso de Spark en nuestro cluster 5. Integración con Amazon

Más detalles

TP3 - Sistemas Distribuidos Map-Reduce

TP3 - Sistemas Distribuidos Map-Reduce TP3 - Sistemas Distribuidos Map-Reduce DC - FCEyN - UBA Sistemas Operativos 2c - 2014 Quote Map-reduce is a programming model for expressing distributed computations on massive amounts of data and an execution

Más detalles

Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM.

Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM. Qué es la ciencia de datos? Es muy difícil encontrar una definición

Más detalles

HADOOP LIVE. 12 de diciembre de 2017

HADOOP LIVE. 12 de diciembre de 2017 HADOOP LIVE 12 de diciembre de 2017 Presentación Jesús Javier Moralo García Bioinformático por la UAM & CSIC Máster Big Data & Analytics de Datahack Gestión, Análisis e Integración de Datos Global Biodiversity

Más detalles

MÁSTER: MÁSTER EXPERTO BIG DATA

MÁSTER: MÁSTER EXPERTO BIG DATA MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster

Más detalles

ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA

ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenieros de Telecomunicación ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA TRABAJO FIN DE MÁSTER Mario Pérez Esteso 2015 Universidad

Más detalles

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER 2016 + Big Data DESCRIPCIÓN Este curso está orientado a brindar a los alumnos los fundamentos necesarios en el campo del Business Intelligence

Más detalles

Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI

Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI- 100105-2014-192 Código: Fecha: 11/12/2014 Persona de Contacto: Carlos Vicente Corral

Más detalles

Big Analytics: de la información al conocimiento

Big Analytics: de la información al conocimiento Programa Introducción Arquitectura/Bases de datos relacionados /Infraestructuras (AMAZON) R Introducción al análisis masivo de datos: descriptivos y visualización de Big Data Hackathon + Series Temporales

Más detalles

Arquitectura Big Data de Ingesta en Real Time. Autor: Ferran Fernández Garrido Consultor: David Cabanillas Barbacil PRA: Josep Curto Díaz

Arquitectura Big Data de Ingesta en Real Time. Autor: Ferran Fernández Garrido Consultor: David Cabanillas Barbacil PRA: Josep Curto Díaz Arquitectura Big Data de Ingesta en Real Time Autor: Ferran Fernández Garrido Consultor: David Cabanillas Barbacil PRA: Josep Curto Díaz Índice 1. Problema Planteado a. Descripción general b. Casos similares

Más detalles

Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros

Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros Título: Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros Autor: Gabriel Guerrero Fecha: 20150711 Ref: gg20150711_streamingtwitter_1 Introducción Una de las aplicaciones de

Más detalles

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?

Más detalles

Mitos y Realidades del Big Data -Introducción al Big Data-

Mitos y Realidades del Big Data -Introducción al Big Data- Jornada: Mitos y Realidades del Big Data -Introducción al Big Data- Urko Zurutuza Dpto. Electrónica e Informática Mondragon Goi Eskola Politeknikoa JMA Mondragon Unibertsitatea Agenda Introducción al Big

Más detalles

Hora 1 1. Introducción 2. Web semántica 2.1 Ontologías 2.2 Lenguajes 2.3 Ejemplos 2.4 Estado actual Microformatos 2.4.

Hora 1 1. Introducción 2. Web semántica 2.1 Ontologías 2.2 Lenguajes 2.3 Ejemplos 2.4 Estado actual Microformatos 2.4. 1 Hora 1 1. Introducción 2. Web semántica 2.1 Ontologías 2.2 Lenguajes 2.3 Ejemplos 2.4 Estado actual 2.4.1 Microformatos 2.4.2 Microdatos Hora 2 3. Big Data 4. Arquitecturas de servicio 4.1 Arquitecturas

Más detalles

en Big Data y Business Analytics

en Big Data y Business Analytics en Big Data y Business Analytics 600 horas (60 ECTS) Programa MÓDULO 1: INTRODUCCIÓN AL BIG DATA... 2 MÓDULO 2: BBDD RELACIONALES: SQL. DISEÑO DE UN DATAWAREHOUSE... 2 MÓDULO 3: BBDD NoSQL y HDFS... 3

Más detalles

PROGRAMA FORMATIVO: ANALISTA DE DATOS BIG DATA CLOUDERA

PROGRAMA FORMATIVO: ANALISTA DE DATOS BIG DATA CLOUDERA PROGRAMA FORMATIVO: ANALISTA DE DATOS BIG DATA CLOUDERA Julio 2017 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES Área Profesional: SISTEMAS Y TELEMÁTICA 2. Denominación:

Más detalles

UNIVERSIDAD POLITÉCNICA DE MADRID TRABAJO FIN DE GRADO

UNIVERSIDAD POLITÉCNICA DE MADRID TRABAJO FIN DE GRADO UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INFORMÁTICOS TRABAJO FIN DE GRADO COMPARATIVA DE RENDIMIENTO ENTRE ALGORITMOS DE MACHINE LEARNING SOBRE PLATAFORMAS DE PROCESAMIENTO

Más detalles

Introducción a la Ciencia de Datos

Introducción a la Ciencia de Datos 25 de septiembre de 2015 Documento protegido por GFDL Copyright (c) 2015. e-mail: guillermo(en)movimientolibre.com http://www.movimientolibre.com/ Se otorga permiso para copiar, distribuir y/o modificar

Más detalles

www.consultec.es Introducción a Big Data

www.consultec.es Introducción a Big Data Introducción a Big Data Quiénes somos? Gorka Armen+a Developer [email protected] @joruus Iñaki Elcoro Developer [email protected] @iceoverflow Índice 1. Introducción 2. Qué no es Big Data? 3. Qué

Más detalles

Big Data y Análisis de Sentimiento

Big Data y Análisis de Sentimiento Big Data y Análisis de Sentimiento Daniel Robins, Director de Tecnología de KUNAN SA Profesor de Bases de Datos II Universidad Nacional de Chilecito [email protected] Agenda Introducción a Big

Más detalles

PROGRAMA FORMATIVO: ADMINISTRADOR BIG DATA CLOUDERA

PROGRAMA FORMATIVO: ADMINISTRADOR BIG DATA CLOUDERA PROGRAMA FORMATIVO: ADMINISTRADOR BIG DATA CLOUDERA Julio 2017 1 DATOS GENERALES DEL CURSO 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES Área Profesional: SISTEMAS Y TELEMÁTICA 2. Denominación:

Más detalles

SPARK-SCALA TRABAJO FIN DE MÁSTER. Jesús Salvador Renero Quintero

SPARK-SCALA TRABAJO FIN DE MÁSTER. Jesús Salvador Renero Quintero Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenieros de Telecomunicación SPARK-SCALA TRABAJO FIN DE MÁSTER Jesús Salvador Renero Quintero 2016 Universidad Politécnica de Madrid Escuela

Más detalles

JAVA 7 Los fundamentos del lenguaje Java

JAVA 7 Los fundamentos del lenguaje Java Presentación 1. Historia 9 1.1 Por qué Java? 9 1.2 Objetivos del diseño de Java 10 1.3 Auge de Java 11 2. Características de Java 12 2.1 El lenguaje de programación Java 12 2.1.1 Sencillo 13 2.1.2 Orientado

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

Introducción a Big Data y su aplicación en el entono asegurador. Fernando Turrado García Octubre 2016

Introducción a Big Data y su aplicación en el entono asegurador. Fernando Turrado García Octubre 2016 Introducción a Big Data y su aplicación en el entono asegurador Fernando Turrado García Octubre 2016 Presentación Ponente Fernando Turrado García Matemático, Máster en Investigación Informática (UCM) Arquitecto

Más detalles

CREACIÓN DE UN ENTORNO PARA EL ANÁLISIS

CREACIÓN DE UN ENTORNO PARA EL ANÁLISIS Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenieros de Telecomunicación CREACIÓN DE UN ENTORNO PARA EL ANÁLISIS DE DATOS GEOGRÁFICOS UTILIZANDO TÉCNICAS DE BIG DATA, GEOMESA Y APACHE

Más detalles

DATA SCIENCE EN EL MUNDO REAL

DATA SCIENCE EN EL MUNDO REAL DATA SCIENCE EN EL MUNDO REAL Estás preparado para ser el CDO (Chief Data Officer) que necesita la empresa? Rafael García Gallardo Fundador MSMK Big Talent + Big Data = Big Opportunities POR QUÉ MSMK -

Más detalles

Máster en Big Data & Analytics Curso:

Máster en Big Data & Analytics Curso: Máster en Big Data & Analytics Curso: 2018-19 Online Máster en Big Data & Analytics Datos básicos Créditos ECTS: 60 Modalidad: Online Tipo de posgrado: Título propio Idioma en el que se imparte: Español

Más detalles

Storm: Procesamiento distribuido de datos.

Storm: Procesamiento distribuido de datos. Pablo Acuña. Except where otherwise noted, this work is licensed under: http://creativecommons.org/licenses/by-nc-sa/3.0/ c_b_n_a Contenidos - Presentación - Qué es Storm? - Arquitectura y componentes

Más detalles

CURSO PRESENCIAL: Apache Spark

CURSO PRESENCIAL: Apache Spark CURSO PRESENCIAL: Apache Spark Información detallada del curso www.formacionhadoop.com El curso se desarrolla en 2 semanas seguidas. Se trata de un curso formato ejecutivo que permite compaginar la formación

Más detalles

CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA

CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA Información detallada del curso www.formacionhadoop.com El curso se desarrolla a lo largo de 48 horas. Se trata de un curso de verano en horario de tarde

Más detalles

Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio

Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio 1 Agenda Big data y NAS de escalamiento horizontal EMC Isilon La promesa

Más detalles

Objetivos y Temario CURSO JAVA 7

Objetivos y Temario CURSO JAVA 7 Objetivos y Temario CURSO JAVA 7 OBJETIVOS Este curso se dirige a todos aquellos informáticos que quieran desarrollar en Java. Tanto si es principiante como si ya tiene experiencia con otro lenguaje, el

Más detalles

Business Intelligence y Big Data

Business Intelligence y Big Data Master en Business Intelligence y Big Data Aragón (Blended) En colaboración con El Master en Business Intelligence y Big Data tiene como misión principal responder al reto de formación cualificada de los

Más detalles

Escalabilidad y Sharding. Pierre-Yves Duquesnoy Sales Engineer

Escalabilidad y Sharding. Pierre-Yves Duquesnoy Sales Engineer Escalabilidad y Sharding Pierre-Yves Duquesnoy Sales Engineer La importancia de la Escalabilidad La plataforma InterSystems IRIS permite: La Escalabilidad Vertical y Horizontal Escalar en Número de Usuarios

Más detalles

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO [email protected] @antoniosql

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO [email protected] @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en

Más detalles

Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!!

Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!! Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!! Autor: Dr. Gabriel Guerrero Ref: www.saxsa.com.mx/articulos/rdd Descripción: Una breve introducción al concepto de Conjuntos Distribuidos

Más detalles

Desarrollo de una aplicación para el análisis social en Twitter mediante tecnologías Big Data. Caso de

Desarrollo de una aplicación para el análisis social en Twitter mediante tecnologías Big Data. Caso de Desarrollo de una aplicación para el análisis social en Twitter mediante tecnologías Big Data. Caso de estudio: @urjc Autor: Nazareth Guerrero Yébenes Tutor: Felipe Alonso Atienza Índice Introducción Twitter

Más detalles

Tecnologías Big Data. y su impacto en la organización

Tecnologías Big Data. y su impacto en la organización Tecnologías Big Data y su impacto en la organización Francisco Javier Antón Vique Presidente de la Fundación Big Data Madrid, 24 de abril de 2014 Modelos de crecimiento y tecnologías Entorno económico

Más detalles