Madrid Python Meetup PYTHON Y FLINK
|
|
- Jorge Duarte Iglesias
- hace 6 años
- Vistas:
Transcripción
1 Madrid Python Meetup PYTHON Y FLINK GMV, 2016 Propiedad de GMV Todos los derechos reservados
2 ÍNDICE INTRODUCCIÓN APACHE FLINK EXPERIENCIA PYTHON CONCLUSIONES Madrid Python Meetup 2016/03/10 Página 2
3 QUIÉNES SOMOS? GMV
4 QUIÉNES SOMOS UN GRUPO TECNOLÓGICO GLOBAL Grupo multinacional tecnológico Sede principal en España (Madrid) Más de empleados Aeronáutica, Espacio, Defensa, Seguridad, Sanidad, Transporte, Banca y finanzas, y Tecnologías de la Información y la Comunicación Fundado en 1984 Capital privado Oficinas en 10 países Origen vinculado al sector espacial y defensa Ingeniería, desarrollo e integración de sistemas, software, hardware, servicios y productos especializados Madrid Python Meetup 2016/03/10 Página 4
5 INTRODUCCIÓN
6 INTRODUCCIÓN ACLARACIONES Apache Flink no es un servidor web ni un jefe indio No vamos a contar palabras Qué sabéis de Big Data? Madrid Python Meetup 2016/03/10 Página 8
7 POR QUÉ APACHE FLINK? MADUREZ DEL BIGDATA Streaming Procesar Almacenar Descartar Madrid Python Meetup 2016/03/10 Página 9
8 POR QUÉ APACHE FLINK? ARQUITECTURA TÍPICA Data adquisition Stream Processing Serving DB Es común almacenar también la información en crudo La base de la arquitectura suele ser un clúster con HDFS Madrid Python Meetup 2016/03/10 Página 10
9 POR QUÉ APACHE FLINK? DESPLIEGUE Clúster de Kafka Clúster de HDFS + Flink K1 K2 Kn C1 C2 C3 M1 W4 W1 W2 W5 W3 W6 C4 C5 C6 Wn Clúster de Cassandra Madrid Python Meetup 2016/03/10 Página 11
10 POR QUÉ APACHE FLINK?
11 POR QUÉ APACHE FLINK? APACHE FLINK El core de Flink es un motor de procesamiento de flujos de datos en streaming. Proporciona distribución de los datos, comunicación y tolerancia a fallos para realizar computación distribuida con streams de datos. Sobre ese core se han desarollado dos API y varias librerías en Scala, Java y Python Madrid Python Meetup 2016/03/10 Página 13
12 FLINK: CARACTERÍSTICAS DIFERENCIADORAS VENTANAS 2s s Ventanas temporales stream.timewindowall(time.seconds(1)). sum(); Ventanas deslizantes stream.timewindowall(time.seconds(1),t ime.milliseconds(500)).sum(); Madrid Python Meetup 2016/03/10 Página 14
13 FLINK: CARACTERÍSTICAS DIFERENCIADORAS VENTANAS POR CLAVE 2s 1s (A,5) (B,2) (A,6) (C,3) (C,7) (A,5) (B,3) (C,8) (B,2) (A,1) (C,9) (B,4) Ventanas fijas por clave (A,5) (A,6) (A,5) (A,1) (B,2) (B,3) (B,2) (B,4) (C,3) (C,7) (C,8) (C,9) (A,11)(B,2)(C,3) (A,5)(B,3)(C,15) (A,1)(B,6)(C,9) stream.keyby(0).timewindow (Time.seconds(1)).sum(1) Ventanas por número de elementos (A,5) (A,6) (A,5) (A,1) (B,2) (B,3) (B,2) (B,4) (C,3) (C,7) (C,8) (C,9) (A,11)(B,5) (C,10) (A,6) (C,17) (B,6) stream.keyby(0).countwindow( 2).sum(1) Madrid Python Meetup 2016/03/10 Página 15
14 DATASTREAM API TRIGGERS Y EVICTORS Triggers A Pueden cancelar el procesado de los elementos de una ventana Permiten adelantar el procesado de una ventana Evictors Podemos controlar los elementos que llegan de las ventanas antes de evaluarlos Madrid Python Meetup 2016/03/10 Página 16
15 DATASTREAM API EL TIEMPO ES IMPORTANTE Qué tiempo utilizar para construir las ventanas? El momento en el que se generó el evento El momento en que se procesa el evento El momento en que se recibe el evento Flink maneja relojes diferentes para cada uno de ellos Madrid Python Meetup 2016/03/10 Página 17
16 COMPARATIVA RENDIMIENTO Lo deseable es mantener un alto caudal con una latencia baja Flink permite ajustar los tamaños de los buffers internos para aumentar el caudal a costa de aumentar la latencia y viceversa. Madrid Python Meetup 2016/03/10 Página 18
17 COMPARATIVA FUNCIONALIDADES Streaming true mini batches true API low-level high-level high-level Fault tolerance tuple-level ACKs RDD-based (lineage) coarse checkpointing State not built-in external internal Exactly once at least once exactly once exactly once Windowing not built-in restricted flexible Latency low medium low Throughput medium high high Madrid Python Meetup 2016/03/10 Página 19
18 EXPERIENCIA CON PYTHON
19 EXPERIENCIA CON PYTHON SEGÚN LA DOCUMENTACIÓN La mayoría de las API no están disponibles. No está disponible la API para Streams!! El API para procesado en batch tiene todas las operaciones (alguna más que en scala) Los conectores de E/S son muchos menos y con menos opciones Madrid Python Meetup 2016/03/10 Página 21
20 EXPERIENCIA CON PYTHON PRUEBA BÁSICA class Adder(GroupReduceFunction): def reduce(self, iterator, collector): count, event = iterator.next() count += sum([x[0] for x in iterator]) collector.collect((event, count)) data \.map(lambda x: (1, x[5])) \.group_by(1) \.reduce_group(adder()) \.map(lambda x: 'Event: %s. Freq: %s' % (x[0],x[1]))\.write_text(output_file,write_mode=writemode.overwrite) if name == " main ": output_file = 'out.txt' env = get_environment() data = env.read_csv("/home/jordi/development/pythonflink/final-dataset.csv",\ (INT, STRING, STRING, STRING, STRING, STRING, STRING, STRING, BOOL, BOOL, INT, INT, INT, INT, STRING, INT, INT, STRING, STRING, FLOAT, FLOAT, STRING)) env.execute(local=true) El rendimiento es más bajo que el mismo programa en scala. Levanta un intérprete Python que envía el código al core de Flink Madrid Python Meetup 2016/03/10 Página 22
21 EXPERIENCIA CON PYTHON POCA ACIVIDAD El último commit de la parte de Python fue hace varios meses: En proporción, hay muy poco código Python: Madrid Python Meetup 2016/03/10 Página 23
22 EXPERIENCIA CON PYTHON CONCLUSIONES Madrid Python Meetup 2016/03/10 Página 24
23 GRACIAS José Carlos Baquero Pablo González Jordi Redondo
24 BACKUP SLIDES GMV
25 PERFORMANCE TERASORT Terasort es una prueba para medir el rendimiento de tecnologías BigData. Se trata de ordenar 1 Tb de datos (o más) en el menor tiempo posible Madrid Python Meetup 2016/03/10 Página 51
26 PERFORMANCE TERASORT Madrid Python Meetup 2016/03/10 Página 52
27 PERFORMANCE STREAMING - YAHOO The job of the benchmark is to read various JSON events from Kafka, identify the relevant events, and store a windowed count of relevant events per campaign into Redis. Madrid Python Meetup 2016/03/10 Página 53
28 PERFORMANCE STREAMING - YAHOO Madrid Python Meetup 2016/03/10 Página 54
29 PERFORMANCE STREAMING - YAHOO Madrid Python Meetup 2016/03/10 Página 55
30 VENTANAS CONSTRUCCIÓN DE VENTANAS Madrid Python Meetup 2016/03/10 Página 56
31 VENTANAS CONSTRUCCIÓN DE VENTANAS Madrid Python Meetup 2016/03/10 Página 57
BIG DATA: Una mirada tecnológica
BIG DATA: Una mirada tecnológica Dr. Rubén Casado ruben.casado@treelogic.com @ruben_casado AGENDA 1. Qué y cómo es Big Data? 2. Batch processing 3. Real-time processing 4. Hybrid computation model 5. Casos
Más detallesStorm: Procesamiento distribuido de datos.
Pablo Acuña. Except where otherwise noted, this work is licensed under: http://creativecommons.org/licenses/by-nc-sa/3.0/ c_b_n_a Contenidos - Presentación - Qué es Storm? - Arquitectura y componentes
Más detallesCURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN.
CURSO: APACHE SPARK CAPÍTULO 1: INTRODUCCIÓN www.formacionhadoop.com Índice 1 Por qué realizar el curso de Apache Spark? 2 Requisitos previos del curso 3 Bloques del curso 4 Objetivos 5 Tutor del curso
Más detallesAplicación de Spark para procesamiento continúo de datos de Twitter sin filtros
Título: Aplicación de Spark para procesamiento continúo de datos de Twitter sin filtros Autor: Gabriel Guerrero Fecha: 20150711 Ref: gg20150711_streamingtwitter_1 Introducción Una de las aplicaciones de
Más detallesBig Data Analytics & IBM BIG INSIGHT
Big Data Analytics & IBM BIG INSIGHT En la actualidad se generan grandes volumenes de datos de diversos tipos, a gran velocidad y con diferentes frecuencias. Las tecnologıas disponibles permiten efectuar
Más detallesIntroducción a Big Data y su aplicación en el entono asegurador. Fernando Turrado García Octubre 2016
Introducción a Big Data y su aplicación en el entono asegurador Fernando Turrado García Octubre 2016 Presentación Ponente Fernando Turrado García Matemático, Máster en Investigación Informática (UCM) Arquitecto
Más detallesCURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS.
CURSO: APACHE SPARK CAPÍTULO 3: SPARK CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Spark 2 3 Spark Shell 2.1 SparkContext Introducción a RDDs (Resilient Distributed Datasets) 3.1 Creación
Más detallesBases de datos en memoria
Bases de datos en memoria Bases de Datos No Relacionales Instituto de Computación, FING, UdelaR 2017 CC-BY Lorena Etcheverry lorenae@fing.edu.uy Agenda SSDs vs HDDs Bases de datos sobre SSDs Bases de datos
Más detallesToda nuestra Experiencia a tu alcance
Informática y Big Data Developer con Cloudera Apache Hadoop Con este curso aprenderás a elaborar código sobre la API de Hadoop, así como a depurar programas Mapreduce y optimizar su funcionamiento Toda
Más detallesOportunidad para CIOs en Retail: Mayor flexibilidad en la nube con Openbravo Openbravo Inc. Todos los derechos reservados.
Oportunidad para CIOs en Retail: Mayor flexibilidad en la nube con Openbravo Ponentes de hoy Geoff Nairn Enterprise Solutions Specialist Openbravo Xavier Places Product Marketing Director Openbravo Aumentar
Más detallesCURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA
CURSO PRESENCIAL EN MADRID: ARQUITECTURAS BIG DATA Información detallada del curso www.formacionhadoop.com El curso se desarrolla a lo largo de 48 horas. Se trata de un curso de verano en horario de tarde
Más detallesArancha Pintado. Perfiles Big Data. www.madridschoolofmarketing.es
Arancha Pintado Perfiles Big Data www.madridschoolofmarketing.es De dónde venimos? De dónde venimos? Cuál es la diferencia? Si se supiera cómo tratar esa información, cómo "sacarle el jugo", eso proporcionaría
Más detallesCEP GUÍA DE REFERENCIA
CEP GUÍA DE REFERENCIA NOVIEMBRE 2014 1 INDICE 1 INDICE... 2 2 INTRODUCCIÓN... 3 2.1 OBJETIVOS Y ALCANCE DEL PRESENTE DOCUMENTO... 3 3 SINTAXIS DEL CEP DE SOFIA2... 4 3.1 CONCEPTOS PREVIOS... 4 3.2 DEFINICIÓN
Más detallesCURSO ONLINE: ARQUITECTURAS BIG DATA
CURSO ONLINE: ARQUITECTURAS BIG DATA Información detallada del curso www.formacionhadoop.com Este curso online de 70 horas está enfocado a técnicos que quieran conocer las herramientas más importantes
Más detallesPA JOSÉ MANUEL BURBANO CARVAJAL
PA121-01 SISTEMA DE GESTIÓN DEL CONOCIMIENTO PARA LA DEFINICIÓN DE ESTRATEGIAS QUE EVITEN LA DESERCIÓN ESCOLAR EN LOS COLEGIOS DE MOCOA PUTUMAYO EN EL NIVEL DE EDUCACIÓN BÁSICA SECUNDARIA JOSÉ MANUEL BURBANO
Más detallesTabla de Contenido. iii
Tabla de Contenido 1. Introducción... 1 1.1. Contexto... 1 1.2. Oportunidad de mejora... 2 1.3. Objetivos de la tesis... 3 1.4. Propuesta de solución... 3 2. Marco teórico... 4 2.1. Big Data... 4 2.1.1.
Más detalles1. Escalabilidad de transacciones de un motor de búsqueda Web.
Enfoque Token 1. Escalabilidad de transacciones de un motor de búsqueda Web. 2. Simulador de aplicaciones sobre utilización de dispositivos móviles como unidades de procesamiento. Tabla ruteo Red 3G/4G
Más detallesBig Data: retos y oportunidades para la investigación Arquitectura geográfica BIG DATA
Reunión de seguimiento SocialBigdata-CM Borja Moya-Gómez (tgis) Madrid, 29 de junio de 2017 Big Data: retos y oportunidades para la investigación Arquitectura geográfica BIG DATA 1. El objetivo 2. La arquitectura
Más detallesBig Data para operadores de red y DNS. GORE 18 Madrid, Octubre 2016 Sebastian Castro NZRS
Big Data para operadores de red y DNS GORE 18 Madrid, Octubre 2016 Sebastian Castro NZRS 2 Qué es Big Data? like teenage sex... Algo que no cabe en Excel Las tres V Volumen Velocidad Variedad 3 Big Data
Más detallesANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA
Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenieros de Telecomunicación ANÁLISIS DE ARQUITECTURAS DE PROCESADO DE STREAMING BIG DATA TRABAJO FIN DE MÁSTER Mario Pérez Esteso 2015 Universidad
Más detallesHDInsight. Big Data, al estilo Microsoft
HDInsight Big Data, al estilo Microsoft PABLO DOVAL SQL/BI Team Lead palvarez@plainconcepts.com http://geeks.ms/blogs/palvarez @PabloDoval Big Data ALGUNAS ESTADÍSTICAS DE SQL SERVER Categoría Metrica
Más detallesCALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2018
CALENDARIO UNIVERSITY CUATRIMESTRAL 2018 Febrero - Abril Centro Panamá Corea Edificio 169, Ciudad del Saber, Clayton Panamá FEBRERO 8:00 a.m. 4:00 19-23/ p.m. Febrero PROGRAM WITH PL/SQL ( 40 horas) desarrollo
Más detallesCURSO PRESENCIAL: DESARROLLADOR BIG DATA
CURSO PRESENCIAL: DESARROLLADOR BIG DATA Información detallada del curso www.formacionhadoop.com El curso se desarrolla durante 3 semanas de Lunes a Jueves. Se trata de un curso formato ejecutivo que permite
Más detallesSmart Sound Processing for the digital living: Smart COmpuTing. SSPressing Scot. Universidad de Oviedo (UOVI) Parte II: Deep Computing
Smart Sound Processing for the digital living: Smart COmpuTing SSPressing Scot Universidad de Oviedo (UOVI) Parte II: Deep Computing Febrero 3, 2017 Valencia SSPressing Scot Deep Computing MOTIVACIÓN Intensidad
Más detallesCURSO: ANÁLISIS DE DATOS CON APACHE SPARK
CURSO: ANÁLISIS DE DATOS CON APACHE SPARK Información detallada del curso www.formacionhadoop.com El curso online Análisis de datos con Apache Spark de 60 horas está recomendado para todos aquellos profesionales
Más detallesAsumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio
Asumir el control de big data: soluciones de análisis y almacenamiento para obtener información de gran impacto sobre el negocio 1 Agenda Big data y NAS de escalamiento horizontal EMC Isilon La promesa
Más detallesIngeniería de Aplicaciones Web
Ingeniería de Aplicaciones Web Diego C. Martínez Departamento de Ciencias e Ingeniería de la Computación Universidad Nacional del Sur Frameworks Framework Unused Library Classes Framework library Framework
Más detallesCURSO: DESARROLLADOR PARA APACHE HADOOP
CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 2: INTRODUCCIÓN A HADOOP www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Qué es Hadoop? 3 Historia de Hadoop 4 Por qué utilizar Hadoop? 5 Core Hadoop
Más detallesDecodificando la Estrategia de almacenamiento de EMC
1 Decodificando la Estrategia de almacenamiento de EMC Las empresas enfrentan cambios masivos: El software está redefiniendo a las empresas Copyright 2014 EMC Corporation. Todos los derechos reservados.
Más detallesMÁSTER: MÁSTER EXPERTO BIG DATA
MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster
Más detallesAplicaciones en el Web y redes inhalámbricas. Universidad del Valle Cali - Colombia
Aplicaciones en el Web y redes inhalámbricas Universidad del Valle Cali - Colombia Resumen 2 Arquitecturas de aplicaciones en el Web Una arquitectura de software de un programa o de un sistema computacional
Más detallesBienvenido a Indra OFERTAS DE EMPLEO. Enero 2014
Bienvenido a Indra OFERTAS DE EMPLEO Enero 2014 Indra QUIÉNES SOMOS Multinacional de Consultoría y Tecnología número 1 en España y de las principales de Europa y Latinoamérica Tecnología propia I+D+i:
Más detallesAndres Felipe Rojas / Nancy Gelvez. UNESCO UNIR ICT & Education Latam Congress 2016
Distributed processing using cosine similarity for mapping Big Data in Hadoop (Procesamiento distribuido usando similitud de coseno para mapear Big Data en Haddop) Andres Felipe Rojas / Nancy Gelvez UNESCO
Más detallesBig Data y Seguridad
Big Data y Seguridad Introducción Análisis de datos y su proceso de madurez Se han analizado datos desde hace mucho tiempo, ahora la calidad y cantidad están aumentando. 2500 petabytes generados por día.
Más detallesGestión de Eventos 911 con PostgreSQL. Desarrollado en la Policia de la Provincia de Buenos Aires Radioestación Matanza
Gestión de Eventos 9 con PostgreSQL Desarrollado en la Policia de la Provincia de Buenos Aires Radioestación Matanza Presentación General Sistema crítico en tiempo real Gestión de Llamadas 9 Despacho de
Más detallesArquitectura Lambda vs Arquitectura Kappa
Arquitectura Lambda vs Arquitectura Kappa Cuál es el mejor enfoque para implementar un ambiente de trabajo para procesar big data? Josué Careaga El mundo de la industria y los negocios se transforma a
Más detallesARQUITECTURAS DE DB2 LUW
ARQUITECTURAS DE DB2 LUW Luis Reina IBM Analytics @luisrei luis_reina@es.ibm.com 1 de Julio de 2016 1 2016 IBM Corporation AGENDA Introducción Arquitectura Shared Disk Arquitectura Shared Nothing Dream
Más detallesBases de datos distribuidas Fernando Berzal, berzal@acm.org
Bases de datos distribuidas Fernando Berzal, berzal@acm.org Acceso a los datos Bases de datos relacionales: SQL O/R Mapping Bases de datos distribuidas Bases de datos NoSQL Bases de datos multidimensionales:
Más detallesLa importancia de Big Data en finanzas
La importancia de Big Data en finanzas Jornada sobre Tecnologías de la computación en el Sector Financiero Emilio Parrado Hernández (emilio. parrado@bbva.com) Global Strategies and Data Science Outline
Más detallesBig Data con nombres propios
Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán
Más detallesINTRODUCCIÓN Y FUNDAMENTOS DE OPEN STACK
INTRODUCCIÓN Y FUNDAMENTOS DE OPEN STACK OCT 7 OCT 15 Inicio 07/10/2016 20 h. Presencial Madrid Fin 15/10/2016 KSCHOOL.COM ÍNDICE NÚMEROS DE KSCHOOL ESCUELA BIG DATA SCIENCE DE KSCHOOL DESCRIPCIÓN Y OBJETIVOS
Más detallesArquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI
Arquitectura de sistemas: Título: AnalyticsMOOC- Solución TIC Big Data para entornos MOOC Número de expediente: TSI- 100105-2014-192 Código: Fecha: 11/12/2014 Persona de Contacto: Carlos Vicente Corral
Más detallesSoftware Libre para Aplicaciones de Big Data
Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! hope@aceptus.com Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs
Más detallesGestión de la Información Práctica 1
Gestión de la Información Práctica 1 Departamento de Lenguajes y Ciencias de la Computación UNIVERSIDAD DE MÁLAGA SQL - Server SQL Server 2008 es la base datos cliente-servidor de Microsoft. Su lenguaje
Más detallesCURSO: CURSO APACHE SPARK
CURSO: CURSO APACHE SPARK Información detallada del curso www.formacionhadoop.com Este curso online está recomendado a desarrolladores que quieran aprender la tecnología de procesamiento de datos in-memory
Más detallesEmpleo Digital_. Big Data Processing. Synergic Partners CURSO FORMATIVO. Coordinador Académico Antonio José Martín Sierra. Contenido desarollado por
Empleo Digital_ CURSO FORMATIVO Big Data Processing Coordinador Académico Antonio José Martín Sierra Contenido desarollado por Synergic Partners Empleo Digital_ 1.- PRESENTACIÓN Y OBJETIVOS... 01 2.- QUÉ
Más detallesTecnologías Hadoop. Una introducción al ecosistema Hadoop
Tecnologías Hadoop Una introducción al ecosistema Hadoop Quien soy Angel Llosa Guillen Architecture Manager in Capgemini https://es.linkedin.com/in/anllogui https://twitter.com/anllogui Esta charla Introducción
Más detallesComputación de Altas Prestaciones Sin miedo, es más fácil de lo que parece. Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer
Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer Supercomputadores 2 Qué es un supercomputador? Top500
Más detallesTítulo: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!!
Título: Yo RDD (Resilient Distributed Datasets) con la Bujía (SPARK)!!! Autor: Dr. Gabriel Guerrero Ref: www.saxsa.com.mx/articulos/rdd Descripción: Una breve introducción al concepto de Conjuntos Distribuidos
Más detallesINTRODUCCIÓN A APACHE SPARK CON PYTHON
Ls INTRODUCCIÓN A APACHE SPARK CON PYTHON Introducción a Apache Spark Jortilles.com info@jortilles.com Índice de contenido 1.Descripción...3 2.Cual es su ventaja competitiva...3 3.Instalación...3 4.Conceptos
Más detallesTema 2 Introducción a la Programación en C.
Tema 2 Introducción a la Programación en C. Contenidos 1. Conceptos Básicos 1.1 Definiciones. 1.2 El Proceso de Desarrollo de Software. 2. Lenguajes de Programación. 2.1 Definición y Tipos de Lenguajes
Más detallesMitos y Realidades del Big Data -Introducción al Big Data-
Jornada: Mitos y Realidades del Big Data -Introducción al Big Data- Urko Zurutuza Dpto. Electrónica e Informática Mondragon Goi Eskola Politeknikoa JMA Mondragon Unibertsitatea Agenda Introducción al Big
Más detallesCURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com
CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido
Más detallesV https://www.google.com/analytics/resources/white-paper-mit-tr-analytics-machine-learning.html?utm_source=twitter&utm_medium=social-owned&utm_campaign=2016-q4-gbl-all-ga360-suite&utm_content=mit-whitepaper
Más detallesLarrainVial. LV FinTech. Ofertas Laborales Q2-2017
LarrainVial LV FinTech Ofertas Laborales Q2-2017 1- Programador Procesos Big Data/Stream processing Funciones Desarrollo de procesos de flujos de datos y artefactos java, documentando, formalizando y automatizando
Más detallesCambios en Ingeniería de Software
Cambios en Ingeniería de Software Material tomado del artículo de Casallas Rubby, Villalobos, Jorge. El actual ingeniero de Software. Revista ACIS. Edición Nº 93 Julio - Septiembre de 2005. Preparado por
Más detallesÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1
ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones
Más detallesSofis Solutions. Centro de Capacitación Catálogo 2015
Sofis Solutions Centro de Capacitación Catálogo 2015 Centro de Capacitación El Centro de Capacitación de Sofis Solutions ofrece soluciones de capacitaciones personalizadas a las necesidades específicas
Más detallesAnálisis de sentimientos de tweets.
Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red
Más detallesCURSO PRESENCIAL: Apache Spark
CURSO PRESENCIAL: Apache Spark Información detallada del curso www.formacionhadoop.com El curso se desarrolla en 2 semanas seguidas. Se trata de un curso formato ejecutivo que permite compaginar la formación
Más detallesSAS EVENT STREAM PROCESSING
SAS FORUM ARGENTINA 2015 5 DE MAYO SAS EVENT STREAM PROCESSING Sergio Uassouf Líder de Práctica de Gestión de Información e Infraestructura STREAMING ANALYTICS ANALYTICS AND INSIGHTS ON STREAMING DATA
Más detallesGPGPU en el Lab. de Ciencias de las Imágenes
GPGPU en el Lab. de Ciencias de las Imágenes Universidad Nacional del Sur Pablo Odorico pablo.odorico@uns.edu.ar Laboratorio de Ciencias de las Imágenes Parte del Departamento de Ingeniería Eléctrica y
Más detallesUnidad Didáctica 2. Elementos básicos del lenguaje Java Tipos, declaraciones, expresiones y asignaciones
Unidad Didáctica 2 Elementos básicos del lenguaje Java Tipos, declaraciones, expresiones y asignaciones Fundamentos de Programación Departamento de Lenguajes y Sistemas Informáticos Versión 1.0.3 Índice
Más detallesAfinación y Rendimiento de Bases de Datos
DIPLOMADO Afinación y Rendimiento de Bases de Datos TEMARIO DURACIÓN: 250 hrs. 1. Introducción a los Sistemas de Información y RDBMS (30 hrs.) 1. Sistemas de Información y RDBMS (30 hrs.) 1.1 Introducción
Más detallesRedes de Nueva Generación Área de Ingeniería Telemática. Enterprise network
Enterprise network Elementos en la red empresarial Red de Campus Intranet Server Farm Internet Server Farm Sedes remotas Private WAN Core Extranet Server Farm Sedes remotas/ usuarios con VPN Sedes remotas/
Más detallesDriving Customer Engagement. Digital Assistant for Enterprise Social Networks
Driving Customer Engagement Digital Assistant for Enterprise Social Networks Agenda 1 Vocalia Technologies 2 Carmen. Digital Assistant in the cloud 3 Added value 4 Added value II 5 Technology 6 Projects
Más detallesIniciativa académica: UNAM Parte 1 Aquiles Loranca Sánchez.
IBM Information Management Iniciativa académica: UNAM Parte 1 Aquiles Loranca Sánchez. aloranca@mx1.ibm.com 27 de marzo de 2014 IBM Corporation Agenda 2 Breve historia de Informix. Elementos claves de
Más detallesAplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores
Aplicación de Apache Spark y su librería MLlib para el desarrollo de sistemas recomendadores Enrique Costa-Montenegro1, Alexander Tsybanev1, Héctor Cerezo-Costas2, Francisco Javier González-Castaño 1,
Más detallesIngeniería del Software
Ingeniería del Software Alfredo Goñi Despacho: 269 alfredo@ehu.eus Especialidad: Ingeniería del Software Qué es la Ingeniería del Software? Asignaturas de la especialidad Contexto de las asignaturas de
Más detallesAlta Disponibilidad con PostgreSQL. Lenin Hernández Junio 2012
Alta Disponibilidad con PostgreSQL Lenin Hernández Junio 2012 Por que estamos aqui? Divulgar el Software Libre Profundizar el uso de Software Libre Potenciar las capacidades de desarrollo tecnológico Aprender,
Más detallesArquitectura de Computadores II Clase #9
Arquitectura de Computadores II Clase #9 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Rendimiento Rendimiento (Performance) Ver a través de la niebla del
Más detallesEstrategia de almacenamiento de EMC. Andrés Felipe García L. Assoc Systems Engineer
Estrategia de almacenamiento de EMC Andrés Felipe García L. Assoc Systems Engineer andres.garcia@emc.com 1 El software está redefiniendo a las empresas 2 EL NEGOCIO 3 LA INFRAESTRUCTURA I think the pic
Más detallesAnálisis de datos de movilidad del transporte público de Montevideo
Análisis de datos de movilidad del transporte público de Montevideo 8vas Jornadas de Latinoamérica y el Caribe de gvsig Renzo Massobrio Sergio Nesmachnow Facultad de Ingeniería Universidad de la República
Más detallesANALIZANDO LA INTERNET DE LAS COSAS SAS FORUM 2015 SANTIAGO FAINSTEIN, GERENTE DE SOLUCIONES Y DESARROLLO DE NEGOCIOS
ANALIZANDO LA INTERNET DE LAS COSAS SAS FORUM 2015 SANTIAGO FAINSTEIN, GERENTE DE SOLUCIONES Y DESARROLLO DE NEGOCIOS ACUERDO SAS FORUM 2015 SOLO 10 MINUTOS Big Data Internet Of Things Nuevo Paradigma
Más detallesCALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2017
CALENDARIO ORACLE UNIVERSITY CUATRIMESTRAL 2017 Centro Panamá Corea Edificio 169, Ciudad del Saber, Clayton Panamá Mayo Agosto Cursos para aquellas convenio de Regularización de MAYO 8:00 a.m. 4:00 p.m.
Más detallesEVOLUCIÓN DE LOS ENTORNOS BIG DATA Y LOS RETOS PARA EL ARQUITECTO DE DATOS
EVOLUCIÓN DE LOS ENTORNOS BIG DATA Y LOS RETOS PARA EL ARQUITECTO DE DATOS CARLOS GONZÁLEZ CANTALAPIEDRA Big Data Architect EVERLYN VERGARA SOLER Big Data Consultant Cuando se habla de entornos y aplicaciones
Más detallesPROYECTO ÁRBOLES. Centro: IES Vicente Aleixandre. Curso: 4º ESO. Grupo: Grupo 6.
PROYECTO ÁRBOLES Centro: IES Vicente Aleixandre. Curso: 4º ESO. Grupo: Grupo 6. Trabajo realizado por: Pablo Guerrero Huerga y Ana Rodríguez Pappalardo. Fecha de realización: 12/06/2016 1 Índice 1. Finalidad
Más detallesAnalítica de datos e Inteligencia de Negocios. Manuel Terán
Analítica de datos e Inteligencia de Negocios Que es Business Intelligence? Business Intelligence (BI) comprises the set of strategies, processes, applications, data, technologies and technical architectures
Más detallesLaboratorio de Programación III
Laboratorio de Programación III Profesor René Sandoval Ingeniero (E) Informática rene2160@gmail.com Qué es JDBC? JDBC es el acrónimo de Java DataBase Conectivity Es una especificación de un conjunto de
Más detallesModelo de programación MapReduce
Sistemas Distribuidos Modelo de programación Tecnologías procesado masivo de datos Modelo de programación Alm. lógico Alm. físico Serv. genéricos Pregel... BigTable GFS Serv. genéricos 2 Vamos a contar
Más detallesCÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS
CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS Leopoldo N. Gaxiola, Juan J. Tapia Centro de Investigación y Desarrollo de Tecnología Digital Instituto Politécnico Nacional Avenida
Más detallesIntroducción a Python
Introducción a Python Rodrigo Chang Universidad de San Carlos de Guatemala com4.e6.usac@gmail.com 22 de febrero de 2015 Rodrigo Chang (USAC) Laboratorio de Comunicaciones 4 22 de febrero de 2015 1 / 23
Más detallesArquitectura de Software El Rol del Arquitecto de Software
Arquitectura de Software El Rol del Arquitecto de Software Centro de Posgrados y Actualización Profesional Instituto de Computación - Facultad de Ingeniería Contenido Propósito del Arquitecto Rol del Arquitecto
Más detallesDESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data
DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER 2016 + Big Data DESCRIPCIÓN Este curso está orientado a brindar a los alumnos los fundamentos necesarios en el campo del Business Intelligence
Más detallesArquitectura Web Multicapa. Tema 6.a: Arquitectura sistema en capas. Ventajas de los sistemas. distribuidos. Arquitectura software en capas
Tema 6.a: Arquitectura Web Multicapa 46 Arquitectura software en capas Capa Presentación: genera pantallas, crea código formato. Capa Lógica negocio: objetos aplicación que generan, manipulan y organizan
Más detallesJBuilder Una sólida base Open Source con valor añadido.
1 JBuilder 2007. Una sólida base Open Source con valor añadido. Eclipse. En los últimos años, el modelo Open Source ha impactado con fuerza en el mundo del desarrollo de software. Un puñado de proyectos
Más detallesSistemas de Información 12/13 Introducción
12/13 Introducción Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Aplicaciones Empresariales Características Arquitecturas Tecnologías de desarrollo
Más detallesRendimiento. Introducción a la Computación Clase 18 Patricia Borensztejn
Rendimiento Introducción a la Computación Clase 18 Patricia Borensztejn Un programa ejemplo from random import randrange def rellena (talla, rango): valores = [0] * talla for i in range(talla): valores[i]
Más detallesUNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA
UNIDAD 1 ESTUDIO DE UNA APLICACIÓN DISTRIBUIDA: HADOOP HDFS PARA EL ALMACENAMIENTO DE BIG DATA Copyright(c) 2.014 Víctor Manuel Cano Arquero Todos los derechos reservados Pág. 1 / 10 Registro de Cambios
Más detallesEL MÉTODO EQUALS EN JAVA. DIFERENCIA ENTRE IGUALDAD E IDENTIDAD. COMPARAR OBJETOS. EJEMPLOS. (CU00662B)
APRENDERAPROGRAMAR.COM EL MÉTODO EQUALS EN JAVA. DIFERENCIA ENTRE IGUALDAD E IDENTIDAD. COMPARAR OBJETOS. EJEMPLOS. (CU00662B) Sección: Cursos Categoría: Curso Aprender programación Java desde cero Fecha
Más detallesFACULTAD DE INGENIERÍA
FACULTAD DE INGENIERÍA FORMACIÓN EN INGENIERÍA DE SOFTWARE Y BASES DE DATOS EN LOS ESTUDIANTES DE LA CARRERA DE ING. EN COMPUTACIÓN DE LA FI, UNAM EN EL PLAN DE ESTUDIOS 2015 MAYO, 2015 Porcentaje de alumnos
Más detallesDiplomado Big Data. Educación Profesional Escuela de Ingeniería Pontificia Universidad Católica de Chile 1
Diplomado Big Data 1 DESCRIPCIÓN En la era digital, la masiva producción de datos abre infinitas oportunidades para un efectivo análisis de la información. El diplomado Big Data proporciona una sólida
Más detallesIntroducción a la Computación. Testing en Python. Maximiliano Geier. Facultad de Ciencias Exactas y Naturales, UBA 13/11/2017
Introducción a la Computación Testing en Python Maximiliano Geier Facultad de Ciencias Exactas y Naturales, UBA 13/11/2017 Maximiliano Geier (UBA) Testing en Python 13/11/2017 1 / 12 Testing Qué era testing?
Más detalles2da etapa del proyecto
Construcción de un marco general y su correspondiente plataforma de software para la generación de información estadística a partir de datos disponibles en la web incorporando tecnologías de Big Data 2da
Más detallesIntroducción a Arduino
Introducción a Arduino Federico Davoine, Gabriel Eirea Taller de Electrónica Libre, Instituto de Ingeniería Eléctrica 10 de abril de 2013 TEL (Taller de Electrónica Libre) Introducción a Arduino 10 de
Más detallesTHOMSON REUTERS ENTERPRISE PLATFORM FOR EXCHANGES
THOMSON REUTERS ENTERPRISE PLATFORM FOR EXCHANGES Adolfo Espinosa, Finance & Risk Director North LatAm Eduardo Castañeda, Head of Solutions Services North LatAm Octubre 2015 Thomson Reuters - We believe
Más detallesSistemas de Información
Sistemas de Información Introducción a los Sistemas de Información: El Modelo Cliente/Servidor 1 El Sistema de Información moderno y el modelo Cliente/Servidor!El Sistema de Información moderno "Administra
Más detallesBig Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo
Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?
Más detallesIntroducción a Haskell. Cecilia Manzino
Paradigmas de programación Un paradigma de programación representa un estilo particular o filosofía para la construcción del software. Los más comunes dan lugar a los siguientes tipos de programación:
Más detallesGestión de Alumbrado Público con Software Libre
Gestión de Alumbrado Público con Software Libre Manuel Rábade García Universidad Nacional Autónoma de México Facultad de Ingeniería II Coloquio Universitario de Software Libre Laboratorio de Investigación
Más detalles