Mitos y Realidades del Big Data -Introducción al Big Data-

Documentos relacionados
MÁSTER EN BIG DATA MANAGEMENT & DATA ENGINEERING. Master

MÁSTER: MÁSTER BIG DATA ANALYTICS

MÁSTER: MÁSTER EXPERTO EN BIG DATA

BIG DATA: Una mirada tecnológica

Arancha Pintado. Perfiles Big Data.

ANALÍTICA DE BIG DATA (BDA)

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data

CURSO ONLINE: ARQUITECTURAS BIG DATA

Hadoop. Cómo vender un cluster Hadoop?

MÁSTER EN ARQUITECTURA Y TECNOLOGÍA BIG DATA ASIGNATURAS OBLIGATORIAS

HADOOP LIVE. 12 de diciembre de 2017

Marco Tulio Gómez. Business Intelligence Consultant Soluciones Computarizadas. #sqlsatmexico. Data Factory

Curso Big Data: Herramientas Tecnológicas y Aplicaciones para Negocio

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Fernando Gutiérrez-Cabello. Data Discovery y visualizaciones en MicroStrategy 10

en Big Data y Business Analytics

Curso Big Data: Herramientas Tecnológicas y Aplicaciones para Negocio

CURSO: CURSO APACHE SPARK

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1

PROGRAMA FORMATIVO: ANALISTA DE DATOS BIG DATA CLOUDERA

Software Libre para Aplicaciones de Big Data

Guía docente de la asignatura

CURSO: ANÁLISIS DE DATOS CON APACHE SPARK

CURSO: DESARROLLADOR PARA APACHE HADOOP

Developer Training for Spark and Hadoop

Big Data Analytics & IBM BIG INSIGHT

IFCT0109_SEGURIDAD INFORMÁTICA (RD 686/2011, de 13 de mayo modificado por el RD 628/2013, de 2 de agosto)

CURSO DE APACHE SPARK_

Tabla de Contenido. iii

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO

Noviembre18, 2017 Concepción, Chile. #sqlsatconce

Curso Big Data: Herramientas Tecnológicas y Aplicaciones para Negocio

DATA SCIENCE EN EL MUNDO REAL

Introducción a Big Data y su aplicación en el entono asegurador. Fernando Turrado García Octubre 2016

YO, CIENCIA DE DATOS. BIG DATA DAY Facultad de Ciencias, UNAM Ciudad de México, marzo 2016

Abril 1, 2017 Santiago, Chile

Cloud School Universidad Carlos III

IaaS PaaS SaaS. Cloud Computing. Microsoft Azure. Servicios de aplicaciones. Cómputo Virtual machines

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS)

II TALLER DE ESPECIALIZACIÓN EN: BIG DATA APLICADO (Aprobado con Acuerdo de Consejo Universitario No )

Acelerando la innovación con Apache Spark. Ricardo Barranco Fragoso IBM Big Data & Analytics Specialist

Buenas prácticas para la implementación de herramientas de Ciencia de Datos Leonardo Alfonso Ramos Corona Facultad de Geografía, UAEM.

Diplomado Big Data. Educación Profesional Escuela de Ingeniería Pontificia Universidad Católica de Chile 1

Big data A través de una implementación

Diplomado en Big Data (DBD)

CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA

Andres Felipe Rojas / Nancy Gelvez. UNESCO UNIR ICT & Education Latam Congress 2016

CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN.

Analítica y BI/BIG Real Time E6iciencia industrial con BIG Data

Plataformas tecnológicas de Big Data

PROGRAMA FORMATIVO: DESARROLLADOR SPARK BIG DATA CLOUDERA

Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI

Tecnologías Hadoop. Una introducción al ecosistema Hadoop

Big Data. The Big Picture

Plan Académico

Unidad 1 - Surgimiento y Conceptualización de Bases de Datos

Introducción a Big Data

sábado 3 de agosto de 13 Modelos de Servicio

MÁster en Data Science y Arquitectura Big Data_ DURACIÓN: 248 HORAS

CICLO INTEGRAL BIG DATA PARA EL DESARROLLO DE APLICACIONES PRODUCTIVAS

Tecnologías Big Data. y su impacto en la organización

Big Data. The Big Picture

Big Data. Plan de Estudio

Diplomado en Big Data

Escalabilidad y Sharding. Pierre-Yves Duquesnoy Sales Engineer

BUSINESS ANALYTICS & BIG DATA UNIVERSIDAD NACIONAL DE INGENIERIA. II y III PROGRAMA DE ESPECIALIZACION EN

Big Data. Rodolfo Campos

Diplomado en Gestión de Grandes Volúmenes de Datos (Big Data)

Safe Harbor Statement

Objetivos: Descripción del curso. Curso: Dirigido a: Big Data - Administración I UNIVERSIDAD NACIONAL DE INGENIERÍA Ê Ê Ê Ê Ê.

Introducción al Cloud Computing

Big Data con nombres propios

MÓDULO MATERIA ASIGNATURA CURSO SEMESTRE CRÉDITOS CARÁCTER BREVE DESCRIPCIÓN DE CONTENIDOS (SEGÚN MEMORIA DE VERIFICACIÓN DEL MÁSTER)

Buscando el valor del Big Data Rafael Berlanga Llavori Grupo Bases de Conocimiento Temporal Universitat Jaume I

PROGRAMA SUPERIOR EN INTERNET DE LAS COSAS E INDUSTRIA 4.0. Programa Superior

II TALLER DE ESPECIALIZACIÓN EN:

Big Data, MapReduce y. Hadoop. el ecosistema. Bases de Datos No Relacionales Instituto de Computación, FING, UdelaR 2016

[Webcast] La Nube como centro de Cómputo. Microsoft Azure IaaS + PaaS

CURSO FORMATIVO. Big Data Processing. 199 horas. Contenido desarrollado por Sinergyc Partners

Especialidad en Sistemas de Información

SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP. Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano

Especialidad en Sistemas de Información

BIG DATA EN EL SISTEMA DATATUR- ESTADISTICAS TURISTICAS DE TURESPAÑA

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

jueves 13 de octubre de 16 Plataformas Tecnológicas Avanzadas

PROGRAMA FORMATIVO: ADMINISTRADOR BIG DATA CLOUDERA

Curso: Introducción a Hadoop & Big Data Comprende los orígenes principales del Big Data

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Data Lake: La evolución da paso a la Revolución. César Tapias Herranz Isilon Regional Territory Manager


APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

NECESITA INCORPORAR: Experiencia demostrable en algunas de las siguientes tecnologías Big Data (más de un año):

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

Fundamentos de la Computación en la Nube para la información geográfica

Máster Profesional. Master en Big Data

Big Data M E C D. 15 de noviembre de 2016

Iniciativa académica: UNAM Parte 1 Aquiles Loranca Sánchez.

GUÍA DOCENTE CURSO FICHA TÉCNICA DE LA ASIGNATURA. Datos de la asignatura Nombre Arquitectura de Servicios en Red

Transcripción:

Jornada: Mitos y Realidades del Big Data -Introducción al Big Data- Urko Zurutuza Dpto. Electrónica e Informática Mondragon Goi Eskola Politeknikoa JMA Mondragon Unibertsitatea

Agenda Introducción al Big Data (Urko Zurutuza) Caso Práctico 1: (Adolfo Cortés) Big Data para eficiencia energética en PYMEs Caso Práctico 2 (Mario Íñiguez/Pedro ) Big Data para prever modelos de fuga de clientes Big Data para eficiencia en hornos y procesos industriales en condiciones extremas de temperatura

Índice 1. Introducción 2. Instalo y uso una BBDD NoSQL. Hago Big Data? 3. Tengo una plataforma basada en Hadoop instalada en mi equipo, Tengo Big Data? 4. Conozco y aplico técnicas de Machine Learning y Data Mining en la empresa. Soy Big Data? 5. Entonces, cómo hago, tengo y soy Big Data?

Data 50 x CRECIMIENTO DE DATOS PARA EL 2020

Big Data Big Data hace referencia al conjunto de información que es demasiado compleja como para ser procesada mediante TI tradicionales de manera aceptable Min Chen, Shiwen Mao, and Yunhao Liu. Big Data: A Survey. Mobile Networks and Applications, 19(2):171 209, 2014.

Big Data Big Data hace referencia al conjunto de información que es demasiado compleja como para ser procesada mediante TI tradicionales de manera aceptable Min Chen, Shiwen Mao, and Yunhao Liu. Big Data: A Survey. Mobile Networks and Applications, 19(2):171 209, 2014.

Big Data V olume elocity ariety

Instalo y uso una BBDD NoSQL. Hago Big Data?

NoSQL (Not Only SQL) Base de Datos de nueva generación que en su mayoría aborda algunas de las siguientes características: no relacional, distribuida, open-source, y horizontalmente escalable [fuente: http://nosql-database.org/]

NoSQL (Not Only SQL) - Tipos Tipo Descripción Clave-Valor Cada elemento tiene una clave y su valor asociado. Familias de Columnas Para consultas sobre grandes conjuntos de datos. Enfoque en columnas no en filas Documentos Empareja una clave con una estructura de datos o documento. Grafos Guarda nodos y sus relaciones. RRSS, estructuras de redes, Ejemplo emcached

Instalo y uso una BBDD NoSQL. Hago Big Data?

Tengo una plataforma basada en Hadoop instalada en mi equipo, Tengo Big Data?

Hadoop Sistema que permite una computación Fiable, Escalable, y Distribuida Un Framework que permite el procesamiento distribuido de grandes conjuntos de datos sobre clusters de ordenadores.

Ecosistema Hadoop (simplificado) Machine Learning Colector de datos Apache Pig: Scripting Data Warehouse Procesamiento Distribuido de datos Conector BBDDR-HDFS YARN Zookeeper: Coordina la distribución Gestiona recursos del Cluster Almacenamiento redundante y fiable S.O. S.O. S.O. S.O. S.O. S.O. S.O. S.O. S.O.

Map-Reduce Split Map Shuffle & Sort Reduce, 4, 2, 4, 4, 2, 4, 3, 3 assigns Master assigns

Tengo una plataforma basada en Hadoop instalada en mi equipo, Tengo Big Data?

Conozco y aplico técnicas de Machine Learning y Data Mining en la empresa. Soy Big Data?

Conozco y aplico técnicas de Machine Learning y Data Mining en la empresa. Soy Big Data? El fin del Big Data es extraer valor de tantos datos Análisis de Datos (Big Data Analytics) Recomendación basada en el comportamiento de usuarios Agrupación de documentos de texto parecidos (por ejemplo) Clasificación o predicción en base a casos anteriores

Conozco y aplico técnicas de Machine Learning y Data Mining en la empresa. Soy Big Data? In-Memory Analytics vs. In-Hadoop Analytics El fondo es el mismo, pero ahora: Distribuido Escalable Herramientas R Spark (Mllib) TODOS: RapidMiner, SAS, Teradata,

Conozco y aplico técnicas de Machine Learning y Data Mining en la empresa. Soy Big Data?

Entonces, cómo hago, tengo y soy Big Data? 1. Objetivos: Qué valor añadido quiero obtener? 2. Selecciona la infraestructura: en la empresa, o en la nube (IaaS, PaaS, SaaS) 3. Fórmate/contrata expertos 4. Une las piezas (requisitos técnicos) 5. Realiza implementaciones ágiles e iterativas 6. Empieza con objetivos simples e integra los resultados

Objetivos: Qué valor añadido quiero obtener? Alinea la necesidad de Big Data con los objetivos de negocio Implementar Big Data es decisión de negocio, no de TI Evalúa los requisitos de los datos (V s!)

Selecciona la infraestructura En casa? Hardware (mínimo): 2*6core CPU, 24-64GB RAM, 1-2TB HDD Distribuciones Hadoop: Cloudera, MapR, Hortonworks En la nube? IaaS (Amazon Elastic Compute Cloud, Azure, ) PaaS (Amazon Elastic MapReduce, Azure HDInsight, ) SaaS (Teradata, sqlstream, )

Fórmate Administración del cluster NoSQL Desarrollo (Java, Python, R, ) Machine Learning / Data Mining Visual analytics (d3.js, CartoDB, Gephi, Tableu, )

Une las piezas Qué preguntas debo responder? Cómo recojo los datos? Cómo los almaceno? Cómo los analizo? Cómo muestro los resultados?

Realiza implementaciones ágiles e iterativas

Empieza con objetivos simples e integra los resultados Según se van obteniendo pequeños resultados, aparecen nuevas preguntas a responder. Integrar resultados con el Sistema de Producción/ Sistema de Gestión actual

Conclusiones Objetivos, estrategia, ROI Datos: Estamos preparados? Infraestructura Local o en la Nube? Big Data está relacionado con: Análisis de Datos = Data Science Analizas tus datos en Small Data ahora?

Eskerrik asko Urko Zurutuza Mondragon Unibertsitatea uzurutuza@mondragon.edu https://es.linkedin.com/in/uzurutuza/ @urkovain www.mondragon.edu