Madrid Python Meetup PYTHON Y FLINK

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Madrid Python Meetup PYTHON Y FLINK"

Transcripción

1 Madrid Python Meetup PYTHON Y FLINK GMV, 2016 Propiedad de GMV Todos los derechos reservados

2 ÍNDICE INTRODUCCIÓN APACHE FLINK EXPERIENCIA PYTHON CONCLUSIONES Madrid Python Meetup 2016/03/10 Página 2

3 QUIÉNES SOMOS? GMV

4 QUIÉNES SOMOS UN GRUPO TECNOLÓGICO GLOBAL Grupo multinacional tecnológico Sede principal en España (Madrid) Más de empleados Aeronáutica, Espacio, Defensa, Seguridad, Sanidad, Transporte, Banca y finanzas, y Tecnologías de la Información y la Comunicación Fundado en 1984 Capital privado Oficinas en 10 países Origen vinculado al sector espacial y defensa Ingeniería, desarrollo e integración de sistemas, software, hardware, servicios y productos especializados Madrid Python Meetup 2016/03/10 Página 4

5 INTRODUCCIÓN

6 INTRODUCCIÓN ACLARACIONES Apache Flink no es un servidor web ni un jefe indio No vamos a contar palabras Qué sabéis de Big Data? Madrid Python Meetup 2016/03/10 Página 8

7 POR QUÉ APACHE FLINK? MADUREZ DEL BIGDATA Streaming Procesar Almacenar Descartar Madrid Python Meetup 2016/03/10 Página 9

8 POR QUÉ APACHE FLINK? ARQUITECTURA TÍPICA Data adquisition Stream Processing Serving DB Es común almacenar también la información en crudo La base de la arquitectura suele ser un clúster con HDFS Madrid Python Meetup 2016/03/10 Página 10

9 POR QUÉ APACHE FLINK? DESPLIEGUE Clúster de Kafka Clúster de HDFS + Flink K1 K2 Kn C1 C2 C3 M1 W4 W1 W2 W5 W3 W6 C4 C5 C6 Wn Clúster de Cassandra Madrid Python Meetup 2016/03/10 Página 11

10 POR QUÉ APACHE FLINK?

11 POR QUÉ APACHE FLINK? APACHE FLINK El core de Flink es un motor de procesamiento de flujos de datos en streaming. Proporciona distribución de los datos, comunicación y tolerancia a fallos para realizar computación distribuida con streams de datos. Sobre ese core se han desarollado dos API y varias librerías en Scala, Java y Python Madrid Python Meetup 2016/03/10 Página 13

12 FLINK: CARACTERÍSTICAS DIFERENCIADORAS VENTANAS 2s s Ventanas temporales stream.timewindowall(time.seconds(1)). sum(); Ventanas deslizantes stream.timewindowall(time.seconds(1),t ime.milliseconds(500)).sum(); Madrid Python Meetup 2016/03/10 Página 14

13 FLINK: CARACTERÍSTICAS DIFERENCIADORAS VENTANAS POR CLAVE 2s 1s (A,5) (B,2) (A,6) (C,3) (C,7) (A,5) (B,3) (C,8) (B,2) (A,1) (C,9) (B,4) Ventanas fijas por clave (A,5) (A,6) (A,5) (A,1) (B,2) (B,3) (B,2) (B,4) (C,3) (C,7) (C,8) (C,9) (A,11)(B,2)(C,3) (A,5)(B,3)(C,15) (A,1)(B,6)(C,9) stream.keyby(0).timewindow (Time.seconds(1)).sum(1) Ventanas por número de elementos (A,5) (A,6) (A,5) (A,1) (B,2) (B,3) (B,2) (B,4) (C,3) (C,7) (C,8) (C,9) (A,11)(B,5) (C,10) (A,6) (C,17) (B,6) stream.keyby(0).countwindow( 2).sum(1) Madrid Python Meetup 2016/03/10 Página 15

14 DATASTREAM API TRIGGERS Y EVICTORS Triggers A Pueden cancelar el procesado de los elementos de una ventana Permiten adelantar el procesado de una ventana Evictors Podemos controlar los elementos que llegan de las ventanas antes de evaluarlos Madrid Python Meetup 2016/03/10 Página 16

15 DATASTREAM API EL TIEMPO ES IMPORTANTE Qué tiempo utilizar para construir las ventanas? El momento en el que se generó el evento El momento en que se procesa el evento El momento en que se recibe el evento Flink maneja relojes diferentes para cada uno de ellos Madrid Python Meetup 2016/03/10 Página 17

16 COMPARATIVA RENDIMIENTO Lo deseable es mantener un alto caudal con una latencia baja Flink permite ajustar los tamaños de los buffers internos para aumentar el caudal a costa de aumentar la latencia y viceversa. Madrid Python Meetup 2016/03/10 Página 18

17 COMPARATIVA FUNCIONALIDADES Streaming true mini batches true API low-level high-level high-level Fault tolerance tuple-level ACKs RDD-based (lineage) coarse checkpointing State not built-in external internal Exactly once at least once exactly once exactly once Windowing not built-in restricted flexible Latency low medium low Throughput medium high high Madrid Python Meetup 2016/03/10 Página 19

18 EXPERIENCIA CON PYTHON

19 EXPERIENCIA CON PYTHON SEGÚN LA DOCUMENTACIÓN La mayoría de las API no están disponibles. No está disponible la API para Streams!! El API para procesado en batch tiene todas las operaciones (alguna más que en scala) Los conectores de E/S son muchos menos y con menos opciones Madrid Python Meetup 2016/03/10 Página 21

20 EXPERIENCIA CON PYTHON PRUEBA BÁSICA class Adder(GroupReduceFunction): def reduce(self, iterator, collector): count, event = iterator.next() count += sum([x[0] for x in iterator]) collector.collect((event, count)) data \.map(lambda x: (1, x[5])) \.group_by(1) \.reduce_group(adder()) \.map(lambda x: 'Event: %s. Freq: %s' % (x[0],x[1]))\.write_text(output_file,write_mode=writemode.overwrite) if name == " main ": output_file = 'out.txt' env = get_environment() data = env.read_csv("/home/jordi/development/pythonflink/final-dataset.csv",\ (INT, STRING, STRING, STRING, STRING, STRING, STRING, STRING, BOOL, BOOL, INT, INT, INT, INT, STRING, INT, INT, STRING, STRING, FLOAT, FLOAT, STRING)) env.execute(local=true) El rendimiento es más bajo que el mismo programa en scala. Levanta un intérprete Python que envía el código al core de Flink Madrid Python Meetup 2016/03/10 Página 22

21 EXPERIENCIA CON PYTHON POCA ACIVIDAD El último commit de la parte de Python fue hace varios meses: En proporción, hay muy poco código Python: Madrid Python Meetup 2016/03/10 Página 23

22 EXPERIENCIA CON PYTHON CONCLUSIONES Madrid Python Meetup 2016/03/10 Página 24

23 GRACIAS José Carlos Baquero Pablo González Jordi Redondo

24 BACKUP SLIDES GMV

25 PERFORMANCE TERASORT Terasort es una prueba para medir el rendimiento de tecnologías BigData. Se trata de ordenar 1 Tb de datos (o más) en el menor tiempo posible Madrid Python Meetup 2016/03/10 Página 51

26 PERFORMANCE TERASORT Madrid Python Meetup 2016/03/10 Página 52

27 PERFORMANCE STREAMING - YAHOO The job of the benchmark is to read various JSON events from Kafka, identify the relevant events, and store a windowed count of relevant events per campaign into Redis. Madrid Python Meetup 2016/03/10 Página 53

28 PERFORMANCE STREAMING - YAHOO Madrid Python Meetup 2016/03/10 Página 54

29 PERFORMANCE STREAMING - YAHOO Madrid Python Meetup 2016/03/10 Página 55

30 VENTANAS CONSTRUCCIÓN DE VENTANAS Madrid Python Meetup 2016/03/10 Página 56

31 VENTANAS CONSTRUCCIÓN DE VENTANAS Madrid Python Meetup 2016/03/10 Página 57

BIG DATA: Una mirada tecnológica

BIG DATA: Una mirada tecnológica BIG DATA: Una mirada tecnológica Dr. Rubén Casado ruben.casado@treelogic.com @ruben_casado AGENDA 1. Qué y cómo es Big Data? 2. Batch processing 3. Real-time processing 4. Hybrid computation model 5. Casos

Más detalles

Storm: Procesamiento distribuido de datos.

Storm: Procesamiento distribuido de datos. Pablo Acuña. Except where otherwise noted, this work is licensed under: http://creativecommons.org/licenses/by-nc-sa/3.0/ c_b_n_a Contenidos - Presentación - Qué es Storm? - Arquitectura y componentes

Más detalles

CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN.

CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN. CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN www.formacionhadoop.com Índice 1 Por qué realizar el curso de Apache Spark? 2 Requisitos previos del curso 3 Bloques del curso 4 Objetivos 5 Tutor del curso

Más detalles

Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros

Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros Título: Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros Autor: Gabriel Guerrero Fecha: 20150711 Ref: gg20150711_streamingtwitter_1 Introducción Una de las aplicaciones de

Más detalles

Big Data Analytics & IBM BIG INSIGHT

Big Data Analytics & IBM BIG INSIGHT Big Data Analytics & IBM BIG INSIGHT En la actualidad se generan grandes volumenes de datos de diversos tipos, a gran velocidad y con diferentes frecuencias. Las tecnologıas disponibles permiten efectuar

Más detalles

Introducción a Big Data y su aplicación en el entono asegurador. Fernando Turrado García Octubre 2016

Introducción a Big Data y su aplicación en el entono asegurador. Fernando Turrado García Octubre 2016 Introducción a Big Data y su aplicación en el entono asegurador Fernando Turrado García Octubre 2016 Presentación Ponente Fernando Turrado García Matemático, Máster en Investigación Informática (UCM) Arquitecto

Más detalles

CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS.

CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS. CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Spark 2 3 Spark Shell 2.1 SparkContext Introducción a RDDs (Resilient Distributed Datasets) 3.1 Creación

Más detalles

Bases de datos en memoria

Bases de datos en memoria Bases de datos en memoria Bases de Datos No Relacionales Instituto de Computación, FING, UdelaR 2017 CC-BY Lorena Etcheverry lorenae@fing.edu.uy Agenda SSDs vs HDDs Bases de datos sobre SSDs Bases de datos

Más detalles

Toda nuestra Experiencia a tu alcance

Toda nuestra Experiencia a tu alcance Informática y Big Data Developer con Cloudera Apache Hadoop Con este curso aprenderás a elaborar código sobre la API de Hadoop, así como a depurar programas Mapreduce y optimizar su funcionamiento Toda

Más detalles

Oportunidad para CIOs en Retail: Mayor flexibilidad en la nube con Openbravo Openbravo Inc. Todos los derechos reservados.

Oportunidad para CIOs en Retail: Mayor flexibilidad en la nube con Openbravo Openbravo Inc. Todos los derechos reservados. Oportunidad para CIOs en Retail: Mayor flexibilidad en la nube con Openbravo Ponentes de hoy Geoff Nairn Enterprise Solutions Specialist Openbravo Xavier Places Product Marketing Director Openbravo Aumentar

Más detalles

CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA

CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA Información detallada del curso www.formacionhadoop.com El curso se desarrolla a lo largo de 48 horas. Se trata de un curso de verano en horario de tarde

Más detalles

Arancha Pintado. Perfiles Big Data. www.madridschoolofmarketing.es

Arancha Pintado. Perfiles Big Data. www.madridschoolofmarketing.es Arancha Pintado Perfiles Big Data www.madridschoolofmarketing.es De dónde venimos? De dónde venimos? Cuál es la diferencia? Si se supiera cómo tratar esa información, cómo "sacarle el jugo", eso proporcionaría

Más detalles

CEP GUÍA DE REFERENCIA

CEP GUÍA DE REFERENCIA CEP GUÍA DE REFERENCIA NOVIEMBRE 2014 1 INDICE 1 INDICE... 2 2 INTRODUCCIÓN... 3 2.1 OBJETIVOS Y ALCANCE DEL PRESENTE DOCUMENTO... 3 3 SINTAXIS DEL CEP DE SOFIA2... 4 3.1 CONCEPTOS PREVIOS... 4 3.2 DEFINICIÓN

Más detalles

CURSO ONLINE: ARQUITECTURAS BIG DATA

CURSO ONLINE: ARQUITECTURAS BIG DATA CURSO ONLINE: ARQUITECTURAS BIG DATA Información detallada del curso www.formacionhadoop.com Este curso online de 70 horas está enfocado a técnicos que quieran conocer las herramientas más importantes

Más detalles

PA JOSÉ MANUEL BURBANO CARVAJAL

PA JOSÉ MANUEL BURBANO CARVAJAL PA121-01 SISTEMA DE GESTIÓN DEL CONOCIMIENTO PARA LA DEFINICIÓN DE ESTRATEGIAS QUE EVITEN LA DESERCIÓN ESCOLAR EN LOS COLEGIOS DE MOCOA PUTUMAYO EN EL NIVEL DE EDUCACIÓN BÁSICA SECUNDARIA JOSÉ MANUEL BURBANO

Más detalles

Tabla de Contenido. iii

Tabla de Contenido. iii Tabla de Contenido 1. Introducción... 1 1.1. Contexto... 1 1.2. Oportunidad de mejora... 2 1.3. Objetivos de la tesis... 3 1.4. Propuesta de solución... 3 2. Marco teórico... 4 2.1. Big Data... 4 2.1.1.

Más detalles

1. Escalabilidad de transacciones de un motor de búsqueda Web.

1. Escalabilidad de transacciones de un motor de búsqueda Web. Enfoque Token 1. Escalabilidad de transacciones de un motor de búsqueda Web. 2. Simulador de aplicaciones sobre utilización de dispositivos móviles como unidades de procesamiento. Tabla ruteo Red 3G/4G

Más detalles

Big Data: retos y oportunidades para la investigación Arquitectura geográfica BIG DATA

Big Data: retos y oportunidades para la investigación Arquitectura geográfica BIG DATA Reunión de seguimiento SocialBigdata-CM Borja Moya-Gómez (tgis) Madrid, 29 de junio de 2017 Big Data: retos y oportunidades para la investigación Arquitectura geográfica BIG DATA 1. El objetivo 2. La arquitectura

Más detalles

Big Data para operadores de red y DNS. GORE 18 Madrid, Octubre 2016 Sebastian Castro NZRS

Big Data para operadores de red y DNS. GORE 18 Madrid, Octubre 2016 Sebastian Castro NZRS Big Data para operadores de red y DNS GORE 18 Madrid, Octubre 2016 Sebastian Castro NZRS 2 Qué es Big Data? like teenage sex... Algo que no cabe en Excel Las tres V Volumen Velocidad Variedad 3 Big Data

Más detalles

ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA

ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenieros de Telecomunicación ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA TRABAJO FIN DE MÁSTER Mario Pérez Esteso 2015 Universidad

Más detalles

HDInsight. Big Data, al estilo Microsoft

HDInsight. Big Data, al estilo Microsoft HDInsight Big Data, al estilo Microsoft PABLO DOVAL SQL/BI Team Lead palvarez@plainconcepts.com http://geeks.ms/blogs/palvarez @PabloDoval Big Data ALGUNAS ESTADÍSTICAS DE SQL SERVER Categoría Metrica

Más detalles

CALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2018

CALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2018 CALENDARIO UNIVERSITY CUATRIMESTRAL 2018 Febrero - Abril Centro Panamá Corea Edificio 169, Ciudad del Saber, Clayton Panamá FEBRERO 8:00 a.m. 4:00 19-23/ p.m. Febrero PROGRAM WITH PL/SQL ( 40 horas) desarrollo

Más detalles

CURSO PRESENCIAL: DESARROLLADOR BIG DATA

CURSO PRESENCIAL: DESARROLLADOR BIG DATA CURSO PRESENCIAL: DESARROLLADOR BIG DATA Información detallada del curso www.formacionhadoop.com El curso se desarrolla durante 3 semanas de Lunes a Jueves. Se trata de un curso formato ejecutivo que permite

Más detalles

Smart Sound Processing for the digital living: Smart COmpuTing. SSPressing Scot. Universidad de Oviedo (UOVI) Parte II: Deep Computing

Smart Sound Processing for the digital living: Smart COmpuTing. SSPressing Scot. Universidad de Oviedo (UOVI) Parte II: Deep Computing Smart Sound Processing for the digital living: Smart COmpuTing SSPressing Scot Universidad de Oviedo (UOVI) Parte II: Deep Computing Febrero 3, 2017 Valencia SSPressing Scot Deep Computing MOTIVACIÓN Intensidad

Más detalles

CURSO: ANÁLISIS DE DATOS CON APACHE SPARK

CURSO: ANÁLISIS DE DATOS CON APACHE SPARK CURSO: ANÁLISIS DE DATOS CON APACHE SPARK Información detallada del curso www.formacionhadoop.com El curso online Análisis de datos con Apache Spark de 60 horas está recomendado para todos aquellos profesionales

Más detalles

Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio

Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio 1 Agenda Big data y NAS de escalamiento horizontal EMC Isilon La promesa

Más detalles

Ingeniería de Aplicaciones Web

Ingeniería de Aplicaciones Web Ingeniería de Aplicaciones Web Diego C. Martínez Departamento de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur Frameworks Framework Unused Library Classes Framework library Framework

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 2: INTRODUCCIÓN A HADOOP www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Qué es Hadoop? 3 Historia de Hadoop 4 Por qué utilizar Hadoop? 5 Core Hadoop

Más detalles

Decodificando la Estrategia de almacenamiento de EMC

Decodificando la Estrategia de almacenamiento de EMC 1 Decodificando la Estrategia de almacenamiento de EMC Las empresas enfrentan cambios masivos: El software está redefiniendo a las empresas Copyright 2014 EMC Corporation. Todos los derechos reservados.

Más detalles

MÁSTER: MÁSTER EXPERTO BIG DATA

MÁSTER: MÁSTER EXPERTO BIG DATA MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster

Más detalles

Aplicaciones en el Web y redes inhalámbricas. Universidad del Valle Cali - Colombia

Aplicaciones en el Web y redes inhalámbricas. Universidad del Valle Cali - Colombia Aplicaciones en el Web y redes inhalámbricas Universidad del Valle Cali - Colombia Resumen 2 Arquitecturas de aplicaciones en el Web Una arquitectura de software de un programa o de un sistema computacional

Más detalles

Bienvenido a Indra OFERTAS DE EMPLEO. Enero 2014

Bienvenido a Indra OFERTAS DE EMPLEO. Enero 2014 Bienvenido a Indra OFERTAS DE EMPLEO Enero 2014 Indra QUIÉNES SOMOS Multinacional de Consultoría y Tecnología número 1 en España y de las principales de Europa y Latinoamérica Tecnología propia I+D+i:

Más detalles

Andres Felipe Rojas / Nancy Gelvez. UNESCO UNIR ICT & Education Latam Congress 2016

Andres Felipe Rojas / Nancy Gelvez. UNESCO UNIR ICT & Education Latam Congress 2016 Distributed processing using cosine similarity for mapping Big Data in Hadoop (Procesamiento distribuido usando similitud de coseno para mapear Big Data en Haddop) Andres Felipe Rojas / Nancy Gelvez UNESCO

Más detalles

Big Data y Seguridad

Big Data y Seguridad Big Data y Seguridad Introducción Análisis de datos y su proceso de madurez Se han analizado datos desde hace mucho tiempo, ahora la calidad y cantidad están aumentando. 2500 petabytes generados por día.

Más detalles

Gestión de Eventos 911 con PostgreSQL. Desarrollado en la Policia de la Provincia de Buenos Aires Radioestación Matanza

Gestión de Eventos 911 con PostgreSQL. Desarrollado en la Policia de la Provincia de Buenos Aires Radioestación Matanza Gestión de Eventos 9 con PostgreSQL Desarrollado en la Policia de la Provincia de Buenos Aires Radioestación Matanza Presentación General Sistema crítico en tiempo real Gestión de Llamadas 9 Despacho de

Más detalles

Arquitectura Lambda vs Arquitectura Kappa

Arquitectura Lambda vs Arquitectura Kappa Arquitectura Lambda vs Arquitectura Kappa Cuál es el mejor enfoque para implementar un ambiente de trabajo para procesar big data? Josué Careaga El mundo de la industria y los negocios se transforma a

Más detalles

ARQUITECTURAS DE DB2 LUW

ARQUITECTURAS DE DB2 LUW ARQUITECTURAS DE DB2 LUW Luis Reina IBM Analytics @luisrei luis_reina@es.ibm.com 1 de Julio de 2016 1 2016 IBM Corporation AGENDA Introducción Arquitectura Shared Disk Arquitectura Shared Nothing Dream

Más detalles

Bases de datos distribuidas Fernando Berzal, berzal@acm.org

Bases de datos distribuidas Fernando Berzal, berzal@acm.org Bases de datos distribuidas Fernando Berzal, berzal@acm.org Acceso a los datos Bases de datos relacionales: SQL O/R Mapping Bases de datos distribuidas Bases de datos NoSQL Bases de datos multidimensionales:

Más detalles

La importancia de Big Data en finanzas

La importancia de Big Data en finanzas La importancia de Big Data en finanzas Jornada sobre Tecnologías de la computación en el Sector Financiero Emilio Parrado Hernández (emilio. parrado@bbva.com) Global Strategies and Data Science Outline

Más detalles

Big Data con nombres propios

Big Data con nombres propios Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán

Más detalles

INTRODUCCIÓN Y FUNDAMENTOS DE OPEN STACK

INTRODUCCIÓN Y FUNDAMENTOS DE OPEN STACK INTRODUCCIÓN Y FUNDAMENTOS DE OPEN STACK OCT 7 OCT 15 Inicio 07/10/2016 20 h. Presencial Madrid Fin 15/10/2016 KSCHOOL.COM ÍNDICE NÚMEROS DE KSCHOOL ESCUELA BIG DATA SCIENCE DE KSCHOOL DESCRIPCIÓN Y OBJETIVOS

Más detalles

Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI

Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI- 100105-2014-192 Código: Fecha: 11/12/2014 Persona de Contacto: Carlos Vicente Corral

Más detalles

Software Libre para Aplicaciones de Big Data

Software Libre para Aplicaciones de Big Data Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! hope@aceptus.com Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs

Más detalles

Gestión de la Información Práctica 1

Gestión de la Información Práctica 1 Gestión de la Información Práctica 1 Departamento de Lenguajes y Ciencias de la Computación UNIVERSIDAD DE MÁLAGA SQL - Server SQL Server 2008 es la base datos cliente-servidor de Microsoft. Su lenguaje

Más detalles

CURSO: CURSO APACHE SPARK

CURSO: CURSO APACHE SPARK CURSO: CURSO APACHE SPARK Información detallada del curso www.formacionhadoop.com Este curso online está recomendado a desarrolladores que quieran aprender la tecnología de procesamiento de datos in-memory

Más detalles

Empleo Digital_. Big Data Processing. Synergic Partners CURSO FORMATIVO. Coordinador Académico Antonio José Martín Sierra. Contenido desarollado por

Empleo Digital_. Big Data Processing. Synergic Partners CURSO FORMATIVO. Coordinador Académico Antonio José Martín Sierra. Contenido desarollado por Empleo Digital_ CURSO FORMATIVO Big Data Processing Coordinador Académico Antonio José Martín Sierra Contenido desarollado por Synergic Partners Empleo Digital_ 1.- PRESENTACIÓN Y OBJETIVOS... 01 2.- QUÉ

Más detalles

Tecnologías Hadoop. Una introducción al ecosistema Hadoop

Tecnologías Hadoop. Una introducción al ecosistema Hadoop Tecnologías Hadoop Una introducción al ecosistema Hadoop Quien soy Angel Llosa Guillen Architecture Manager in Capgemini https://es.linkedin.com/in/anllogui https://twitter.com/anllogui Esta charla Introducción

Más detalles

Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece. Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer

Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece. Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer Supercomputadores 2 Qué es un supercomputador? Top500

Más detalles

Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!!

Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!! Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!! Autor: Dr. Gabriel Guerrero Ref: www.saxsa.com.mx/articulos/rdd Descripción: Una breve introducción al concepto de Conjuntos Distribuidos

Más detalles

INTRODUCCIÓN A APACHE SPARK CON PYTHON

INTRODUCCIÓN A APACHE SPARK CON PYTHON Ls INTRODUCCIÓN A APACHE SPARK CON PYTHON Introducción a Apache Spark Jortilles.com info@jortilles.com Índice de contenido 1.Descripción...3 2.Cual es su ventaja competitiva...3 3.Instalación...3 4.Conceptos

Más detalles

Tema 2 Introducción a la Programación en C.

Tema 2 Introducción a la Programación en C. Tema 2 Introducción a la Programación en C. Contenidos 1. Conceptos Básicos 1.1 Definiciones. 1.2 El Proceso de Desarrollo de Software. 2. Lenguajes de Programación. 2.1 Definición y Tipos de Lenguajes

Más detalles

Mitos y Realidades del Big Data -Introducción al Big Data-

Mitos y Realidades del Big Data -Introducción al Big Data- Jornada: Mitos y Realidades del Big Data -Introducción al Big Data- Urko Zurutuza Dpto. Electrónica e Informática Mondragon Goi Eskola Politeknikoa JMA Mondragon Unibertsitatea Agenda Introducción al Big

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

V https://www.google.com/analytics/resources/white-paper-mit-tr-analytics-machine-learning.html?utm_source=twitter&utm_medium=social-owned&utm_campaign=2016-q4-gbl-all-ga360-suite&utm_content=mit-whitepaper

Más detalles

LarrainVial. LV FinTech. Ofertas Laborales Q2-2017

LarrainVial. LV FinTech. Ofertas Laborales Q2-2017 LarrainVial LV FinTech Ofertas Laborales Q2-2017 1- Programador Procesos Big Data/Stream processing Funciones Desarrollo de procesos de flujos de datos y artefactos java, documentando, formalizando y automatizando

Más detalles

Cambios en Ingeniería de Software

Cambios en Ingeniería de Software Cambios en Ingeniería de Software Material tomado del artículo de Casallas Rubby, Villalobos, Jorge. El actual ingeniero de Software. Revista ACIS. Edición Nº 93 Julio - Septiembre de 2005. Preparado por

Más detalles

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1 ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones

Más detalles

Sofis Solutions. Centro de Capacitación Catálogo 2015

Sofis Solutions. Centro de Capacitación Catálogo 2015 Sofis Solutions Centro de Capacitación Catálogo 2015 Centro de Capacitación El Centro de Capacitación de Sofis Solutions ofrece soluciones de capacitaciones personalizadas a las necesidades específicas

Más detalles

Análisis de sentimientos de tweets.

Análisis de sentimientos de tweets. Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red

Más detalles

CURSO PRESENCIAL: Apache Spark

CURSO PRESENCIAL: Apache Spark CURSO PRESENCIAL: Apache Spark Información detallada del curso www.formacionhadoop.com El curso se desarrolla en 2 semanas seguidas. Se trata de un curso formato ejecutivo que permite compaginar la formación

Más detalles

SAS EVENT STREAM PROCESSING

SAS EVENT STREAM PROCESSING SAS FORUM ARGENTINA 2015 5 DE MAYO SAS EVENT STREAM PROCESSING Sergio Uassouf Líder de Práctica de Gestión de Información e Infraestructura STREAMING ANALYTICS ANALYTICS AND INSIGHTS ON STREAMING DATA

Más detalles

GPGPU en el Lab. de Ciencias de las Imágenes

GPGPU en el Lab. de Ciencias de las Imágenes GPGPU en el Lab. de Ciencias de las Imágenes Universidad Nacional del Sur Pablo Odorico pablo.odorico@uns.edu.ar Laboratorio de Ciencias de las Imágenes Parte del Departamento de Ingeniería Eléctrica y

Más detalles

Unidad Didáctica 2. Elementos básicos del lenguaje Java Tipos, declaraciones, expresiones y asignaciones

Unidad Didáctica 2. Elementos básicos del lenguaje Java Tipos, declaraciones, expresiones y asignaciones Unidad Didáctica 2 Elementos básicos del lenguaje Java Tipos, declaraciones, expresiones y asignaciones Fundamentos de Programación Departamento de Lenguajes y Sistemas Informáticos Versión 1.0.3 Índice

Más detalles

Afinación y Rendimiento de Bases de Datos

Afinación y Rendimiento de Bases de Datos DIPLOMADO Afinación y Rendimiento de Bases de Datos TEMARIO DURACIÓN: 250 hrs. 1. Introducción a los Sistemas de Información y RDBMS (30 hrs.) 1. Sistemas de Información y RDBMS (30 hrs.) 1.1 Introducción

Más detalles

Redes de Nueva Generación Área de Ingeniería Telemática. Enterprise network

Redes de Nueva Generación Área de Ingeniería Telemática. Enterprise network Enterprise network Elementos en la red empresarial Red de Campus Intranet Server Farm Internet Server Farm Sedes remotas Private WAN Core Extranet Server Farm Sedes remotas/ usuarios con VPN Sedes remotas/

Más detalles

Driving Customer Engagement. Digital Assistant for Enterprise Social Networks

Driving Customer Engagement. Digital Assistant for Enterprise Social Networks Driving Customer Engagement Digital Assistant for Enterprise Social Networks Agenda 1 Vocalia Technologies 2 Carmen. Digital Assistant in the cloud 3 Added value 4 Added value II 5 Technology 6 Projects

Más detalles

Iniciativa académica: UNAM Parte 1 Aquiles Loranca Sánchez.

Iniciativa académica: UNAM Parte 1 Aquiles Loranca Sánchez. IBM Information Management Iniciativa académica: UNAM Parte 1 Aquiles Loranca Sánchez. aloranca@mx1.ibm.com 27 de marzo de 2014 IBM Corporation Agenda 2 Breve historia de Informix. Elementos claves de

Más detalles

Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores

Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores Enrique Costa-Montenegro1, Alexander Tsybanev1, Héctor Cerezo-Costas2, Francisco Javier González-Castaño 1,

Más detalles

Ingeniería del Software

Ingeniería del Software Ingeniería del Software Alfredo Goñi Despacho: 269 alfredo@ehu.eus Especialidad: Ingeniería del Software Qué es la Ingeniería del Software? Asignaturas de la especialidad Contexto de las asignaturas de

Más detalles

Alta Disponibilidad con PostgreSQL. Lenin Hernández Junio 2012

Alta Disponibilidad con PostgreSQL. Lenin Hernández Junio 2012 Alta Disponibilidad con PostgreSQL Lenin Hernández Junio 2012 Por que estamos aqui? Divulgar el Software Libre Profundizar el uso de Software Libre Potenciar las capacidades de desarrollo tecnológico Aprender,

Más detalles

Arquitectura de Computadores II Clase #9

Arquitectura de Computadores II Clase #9 Arquitectura de Computadores II Clase #9 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Rendimiento Rendimiento (Performance) Ver a través de la niebla del

Más detalles

Estrategia de almacenamiento de EMC. Andrés Felipe García L. Assoc Systems Engineer

Estrategia de almacenamiento de EMC. Andrés Felipe García L. Assoc Systems Engineer Estrategia de almacenamiento de EMC Andrés Felipe García L. Assoc Systems Engineer andres.garcia@emc.com 1 El software está redefiniendo a las empresas 2 EL NEGOCIO 3 LA INFRAESTRUCTURA I think the pic

Más detalles

Análisis de datos de movilidad del transporte público de Montevideo

Análisis de datos de movilidad del transporte público de Montevideo Análisis de datos de movilidad del transporte público de Montevideo 8vas Jornadas de Latinoamérica y el Caribe de gvsig Renzo Massobrio Sergio Nesmachnow Facultad de Ingeniería Universidad de la República

Más detalles

ANALIZANDO LA INTERNET DE LAS COSAS SAS FORUM 2015 SANTIAGO FAINSTEIN, GERENTE DE SOLUCIONES Y DESARROLLO DE NEGOCIOS

ANALIZANDO LA INTERNET DE LAS COSAS SAS FORUM 2015 SANTIAGO FAINSTEIN, GERENTE DE SOLUCIONES Y DESARROLLO DE NEGOCIOS ANALIZANDO LA INTERNET DE LAS COSAS SAS FORUM 2015 SANTIAGO FAINSTEIN, GERENTE DE SOLUCIONES Y DESARROLLO DE NEGOCIOS ACUERDO SAS FORUM 2015 SOLO 10 MINUTOS Big Data Internet Of Things Nuevo Paradigma

Más detalles

CALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2017

CALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2017 CALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2017 Centro Panamá Corea Edificio 169, Ciudad del Saber, Clayton Panamá Mayo Agosto Cursos para aquellas convenio de Regularización de MAYO 8:00 a.m. 4:00 p.m.

Más detalles

EVOLUCIÓN DE LOS ENTORNOS BIG DATA Y LOS RETOS PARA EL ARQUITECTO DE DATOS

EVOLUCIÓN DE LOS ENTORNOS BIG DATA Y LOS RETOS PARA EL ARQUITECTO DE DATOS EVOLUCIÓN DE LOS ENTORNOS BIG DATA Y LOS RETOS PARA EL ARQUITECTO DE DATOS CARLOS GONZÁLEZ CANTALAPIEDRA Big Data Architect EVERLYN VERGARA SOLER Big Data Consultant Cuando se habla de entornos y aplicaciones

Más detalles

PROYECTO ÁRBOLES. Centro: IES Vicente Aleixandre. Curso: 4º ESO. Grupo: Grupo 6.

PROYECTO ÁRBOLES. Centro: IES Vicente Aleixandre. Curso: 4º ESO. Grupo: Grupo 6. PROYECTO ÁRBOLES Centro: IES Vicente Aleixandre. Curso: 4º ESO. Grupo: Grupo 6. Trabajo realizado por: Pablo Guerrero Huerga y Ana Rodríguez Pappalardo. Fecha de realización: 12/06/2016 1 Índice 1. Finalidad

Más detalles

Analítica de datos e Inteligencia de Negocios. Manuel Terán

Analítica de datos e Inteligencia de Negocios. Manuel Terán Analítica de datos e Inteligencia de Negocios Que es Business Intelligence? Business Intelligence (BI) comprises the set of strategies, processes, applications, data, technologies and technical architectures

Más detalles

Laboratorio de Programación III

Laboratorio de Programación III Laboratorio de Programación III Profesor René Sandoval Ingeniero (E) Informática rene2160@gmail.com Qué es JDBC? JDBC es el acrónimo de Java DataBase Conectivity Es una especificación de un conjunto de

Más detalles

Modelo de programación MapReduce

Modelo de programación MapReduce Sistemas Distribuidos Modelo de programación Tecnologías procesado masivo de datos Modelo de programación Alm. lógico Alm. físico Serv. genéricos Pregel... BigTable GFS Serv. genéricos 2 Vamos a contar

Más detalles

CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS

CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS Leopoldo N. Gaxiola, Juan J. Tapia Centro de Investigación y Desarrollo de Tecnología Digital Instituto Politécnico Nacional Avenida

Más detalles

Introducción a Python

Introducción a Python Introducción a Python Rodrigo Chang Universidad de San Carlos de Guatemala com4.e6.usac@gmail.com 22 de febrero de 2015 Rodrigo Chang (USAC) Laboratorio de Comunicaciones 4 22 de febrero de 2015 1 / 23

Más detalles

Arquitectura de Software El Rol del Arquitecto de Software

Arquitectura de Software El Rol del Arquitecto de Software Arquitectura de Software El Rol del Arquitecto de Software Centro de Posgrados y Actualización Profesional Instituto de Computación - Facultad de Ingeniería Contenido Propósito del Arquitecto Rol del Arquitecto

Más detalles

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER 2016 + Big Data DESCRIPCIÓN Este curso está orientado a brindar a los alumnos los fundamentos necesarios en el campo del Business Intelligence

Más detalles

Arquitectura Web Multicapa. Tema 6.a: Arquitectura sistema en capas. Ventajas de los sistemas. distribuidos. Arquitectura software en capas

Arquitectura Web Multicapa. Tema 6.a: Arquitectura sistema en capas. Ventajas de los sistemas. distribuidos. Arquitectura software en capas Tema 6.a: Arquitectura Web Multicapa 46 Arquitectura software en capas Capa Presentación: genera pantallas, crea código formato. Capa Lógica negocio: objetos aplicación que generan, manipulan y organizan

Más detalles

JBuilder Una sólida base Open Source con valor añadido.

JBuilder Una sólida base Open Source con valor añadido. 1 JBuilder 2007. Una sólida base Open Source con valor añadido. Eclipse. En los últimos años, el modelo Open Source ha impactado con fuerza en el mundo del desarrollo de software. Un puñado de proyectos

Más detalles

Sistemas de Información 12/13 Introducción

Sistemas de Información 12/13 Introducción 12/13 Introducción Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Aplicaciones Empresariales Características Arquitecturas Tecnologías de desarrollo

Más detalles

Rendimiento. Introducción a la Computación Clase 18 Patricia Borensztejn

Rendimiento. Introducción a la Computación Clase 18 Patricia Borensztejn Rendimiento Introducción a la Computación Clase 18 Patricia Borensztejn Un programa ejemplo from random import randrange def rellena (talla, rango): valores = [0] * talla for i in range(talla): valores[i]

Más detalles

UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA

UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA Copyright(c) 2.014 Víctor Manuel Cano Arquero Todos los derechos reservados Pág. 1 / 10 Registro de Cambios

Más detalles

EL MÉTODO EQUALS EN JAVA. DIFERENCIA ENTRE IGUALDAD E IDENTIDAD. COMPARAR OBJETOS. EJEMPLOS. (CU00662B)

EL MÉTODO EQUALS EN JAVA. DIFERENCIA ENTRE IGUALDAD E IDENTIDAD. COMPARAR OBJETOS. EJEMPLOS. (CU00662B) APRENDERAPROGRAMAR.COM EL MÉTODO EQUALS EN JAVA. DIFERENCIA ENTRE IGUALDAD E IDENTIDAD. COMPARAR OBJETOS. EJEMPLOS. (CU00662B) Sección: Cursos Categoría: Curso Aprender programación Java desde cero Fecha

Más detalles

FACULTAD DE INGENIERÍA

FACULTAD DE INGENIERÍA FACULTAD DE INGENIERÍA FORMACIÓN EN INGENIERÍA DE SOFTWARE Y BASES DE DATOS EN LOS ESTUDIANTES DE LA CARRERA DE ING. EN COMPUTACIÓN DE LA FI, UNAM EN EL PLAN DE ESTUDIOS 2015 MAYO, 2015 Porcentaje de alumnos

Más detalles

Diplomado Big Data. Educación Profesional Escuela de Ingeniería Pontificia Universidad Católica de Chile 1

Diplomado Big Data. Educación Profesional Escuela de Ingeniería Pontificia Universidad Católica de Chile  1 Diplomado Big Data 1 DESCRIPCIÓN En la era digital, la masiva producción de datos abre infinitas oportunidades para un efectivo análisis de la información. El diplomado Big Data proporciona una sólida

Más detalles

Introducción a la Computación. Testing en Python. Maximiliano Geier. Facultad de Ciencias Exactas y Naturales, UBA 13/11/2017

Introducción a la Computación. Testing en Python. Maximiliano Geier. Facultad de Ciencias Exactas y Naturales, UBA 13/11/2017 Introducción a la Computación Testing en Python Maximiliano Geier Facultad de Ciencias Exactas y Naturales, UBA 13/11/2017 Maximiliano Geier (UBA) Testing en Python 13/11/2017 1 / 12 Testing Qué era testing?

Más detalles

2da etapa del proyecto

2da etapa del proyecto Construcción de un marco general y su correspondiente plataforma de software para la generación de información estadística a partir de datos disponibles en la web incorporando tecnologías de Big Data 2da

Más detalles

Introducción a Arduino

Introducción a Arduino Introducción a Arduino Federico Davoine, Gabriel Eirea Taller de Electrónica Libre, Instituto de Ingeniería Eléctrica 10 de abril de 2013 TEL (Taller de Electrónica Libre) Introducción a Arduino 10 de

Más detalles

THOMSON REUTERS ENTERPRISE PLATFORM FOR EXCHANGES

THOMSON REUTERS ENTERPRISE PLATFORM FOR EXCHANGES THOMSON REUTERS ENTERPRISE PLATFORM FOR EXCHANGES Adolfo Espinosa, Finance & Risk Director North LatAm Eduardo Castañeda, Head of Solutions Services North LatAm Octubre 2015 Thomson Reuters - We believe

Más detalles

Sistemas de Información

Sistemas de Información Sistemas de Información Introducción a los Sistemas de Información: El Modelo Cliente/Servidor 1 El Sistema de Información moderno y el modelo Cliente/Servidor!El Sistema de Información moderno "Administra

Más detalles

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?

Más detalles

Introducción a Haskell. Cecilia Manzino

Introducción a Haskell. Cecilia Manzino Paradigmas de programación Un paradigma de programación representa un estilo particular o filosofía para la construcción del software. Los más comunes dan lugar a los siguientes tipos de programación:

Más detalles

Gestión de Alumbrado Público con Software Libre

Gestión de Alumbrado Público con Software Libre Gestión de Alumbrado Público con Software Libre Manuel Rábade García Universidad Nacional Autónoma de México Facultad de Ingeniería II Coloquio Universitario de Software Libre Laboratorio de Investigación

Más detalles