Alessandro Chacón Ernesto Level Ricardo Santana

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928"

Transcripción

1 Alessandro Chacón Ernesto Level Ricardo Santana

2 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce

3 UNIVERSO DIGITAL 161 EB 2006 Fuente: International Data Corporation

4 UNIVERSO DIGITAL 161 EB 988 EB Fuente: International Data Corporation

5 UNIVERSO DIGITAL 161 EB 988 EB 35 ZB Fuente: International Data Corporation

6 UNIVERSO DIGITAL 1320 MB 4.4 MB/s 1990

7 UNIVERSO DIGITAL 1320 MB 4.4 MB/s TB 200 MB/s 2010

8 UNIVERSO DIGITAL 1320 MB 4.4 MB/s TB 200 MB/s DD 200 MB 200 MB/s

9 UNIVERSO DIGITAL 1320 MB 4.4 MB/s TB 200 MB/s DD 200 MB 200 MB/s Qué pasa si falla el Hardware?

10 UNIVERSO DIGITAL 1320 MB 4.4 MB/s TB 200 MB/s DD 200 MB 200 MB/s Qué pasa si falla el Hardware? Qué pasa si se quieren combinar datos de DD distintos?

11 Creado por Doug Cutting y promovido por The Apache Software Foundation.

12 Creado por Doug Cutting y promovido por The Apache Software Foundation. Sistema confiable de almacenamiento y análisis distribuido.

13 Creado por Doug Cutting y promovido por The Apache Software Foundation. Sistema confiable de almacenamiento y análisis distribuido. El almacenamiento lo provee HDFS.

14 Creado por Doug Cutting y promovido por The Apache Software Foundation. Sistema confiable de almacenamiento y análisis distribuido. El almacenamiento lo provee HDFS. El análisis lo provee MapReduce.

15

16 Por qué no usar RDBMS? RDBMS MapReduce

17 Por qué no usar RDBMS? Tamaño RDBMS Gigabytes MapReduce Petabytes

18 Por qué no usar RDBMS? Tamaño Acceso RDBMS Gigabytes Interactivo y lote MapReduce Petabytes Lote

19 Por qué no usar RDBMS? Tamaño Acceso Actualización RDBMS Gigabytes Interactivo y lote Escribe y lee varias veces MapReduce Petabytes Lote Escribe una vez, lee varias

20 Por qué no usar RDBMS? Tamaño Acceso Actualización Estructura RDBMS Gigabytes Interactivo y lote Escribe y lee varias veces Esquema estático MapReduce Petabytes Lote Escribe una vez, lee varias Esquema dinámico

21 Por qué no usar RDBMS? Tamaño Acceso Actualización Estructura Integridad RDBMS Gigabytes Interactivo y lote Escribe y lee varias veces Esquema estático Alta MapReduce Petabytes Lote Escribe una vez, lee varias Esquema dinámico Baja

22 Por qué no usar RDBMS? Tamaño Acceso Actualización Estructura Integridad Escalabilidad RDBMS Gigabytes Interactivo y lote Escribe y lee varias veces Esquema estático Alta No lineal MapReduce Petabytes Lote Escribe una vez, lee varias Esquema dinámico Baja Lineal

23 Por qué no usar Grids? Son buenos para cómputo intensivo, presenta problemas al acceder a datos de gran tamaño porque se presenta un cuello de botella al trabajar en redes.

24 Por qué no usar Grids? Son buenos para cómputo intensivo, presenta problemas al acceder a datos de gran tamaño porque se presenta un cuello de botella al trabajar en redes. Utilizan MPI, pero el programador es quien explicitamente maneja el flujo de datos; mientras que MapReduce es de alto nivel, haciendo transparente al usuario.

25 Por qué no usar Grids? Son buenos para cómputo intensivo, presenta problemas al acceder a datos de gran tamaño porque se presenta un cuello de botella al trabajar en redes. Utilizan MPI, pero el programador es quien explicitamente maneja el flujo de datos; mientras que MapReduce es de alto nivel, haciendo transparente al usuario. MapReduce es tolerante a fallos, mientras que al usar MPI el usuario debe decidir cómo manejar esto.

26 Por qué no usar Sistemas de Computación Distribuida? Ambos dividen el problema en varias partes para ser procesado en distintos nodos.

27 Por qué no usar Sistemas de Computación Distribuida? Ambos dividen el problema en varias partes para ser procesado en distintos nodos. Los Sistemas de Computación Distribuida se enfocan en el cómputo a nivel de CPU haciéndola apropiada para correr en cientos de computadoras alrededor del mundo, despreciando el tiempo de transmisión de datos.

28 Por qué no usar Sistemas de Computación Distribuida? Ambos dividen el problema en varias partes para ser procesado en distintos nodos. Los Sistemas de Computación Distribuida se enfocan en el cómputo a nivel de CPU haciéndola apropiada para correr en cientos de computadoras alrededor del mundo, despreciando el tiempo de transmisión de datos. MapReduce se enfoca en el trabajo que requiere poco tiempo, utilizando hardware dedicado de alta disponibilidad, con redes de baja latencia.

29

30 Sistema de Archivos Distribuido diseñado para almacenar archivos de gran tamaño en nodos de un cluster.

31 Sistema de Archivos Distribuido diseñado para almacenar archivos de gran tamaño en nodos de un cluster. Fue diseñado con la idea de que el patrón más eficiente de acceso a datos es: escribir una vez y leer varias veces.

32 Bloques Utiliza bloques de datos de 64 MB.

33 Bloques Utiliza bloques de datos de 64 MB. Razón: Minimizar los tiempos de búsqueda.

34 Tolerancia a Fallas Replica información en discos distintos.

35 Tolerancia a Fallas Replica información en discos distintos. No requiere discos duros con almacenamiento RAID.

36 Tolerancia a Fallas Replica información en discos distintos. No requiere discos duros con almacenamiento RAID. Si un disco falla, se puede leer la información de otro disco, siendo transparente para el cliente.

37 Nodos del Cluster Nodos Maestros (Namenode): Árbol de sistema de archivos y metadatos de todos los archivos en el árbol.

38 Nodos del Cluster Nodos Maestros (Namenode): Árbol de sistema de archivos y metadatos de todos los archivos en el árbol. Nodos Trabajadores (Datanode): Almacenan y extraen archivos cuando se le indican.

39

40

41 Limitaciones Acceso a datos en baja latencia.

42 Limitaciones Acceso a datos en baja latencia. Almacenar muchos archivos de pequeño tamaño.

43 Limitaciones Acceso a datos en baja latencia. Almacenar muchos archivos de pequeño tamaño. Múltiples escrituras, modificaciones arbitrarias.

44

45 Framework inspirado en las funciones map y reduce de los lenguajes funcionales.

46 Framework inspirado en las funciones map y reduce de los lenguajes funcionales. Se utiliza para procesar grandes volúmenes de datos que sean distribuibles, utilizando varios nodos para este análisis.

47 Framework inspirado en las funciones map y reduce de los lenguajes funcionales. Se utiliza para procesar grandes volúmenes de datos que sean distribuibles, utilizando varios nodos para este análisis. Permite la creación de programas en diferentes lenguajes: Java, Phyton, Ruby y C++.

48 División de Procesamiento

49 División de Procesamiento Map

50 División de Procesamiento Map Reduce

51 Se tiene un volumen muy grande de datos que se quiere procesar. Hadoop divide el archivo en el múltiples pedazos (input-splits), asignándole un pedazo a cada uno de los nodos del sistema distribuido.

52 Map Aplicación de una función a cada uno de los input-splits, para procesar los datos y obtener una salida para ser reducida. Salida es guardada en un archivo de formal local, evitando réplicas innecesarias en el sistema de archivos.

53 Shuffle Combinación de los resultados del map, en una especie de clave-valor, pudiéndose repetir las claves.

54 Reduce El resultado de la combinación es luego reducido a un solo resultado por clave.

55 Ejemplo Se quiere obtener la temperatura máxima por año, entre un conjunto de datos que tienen todas la información del clima de todo el país en distintas ciudades. La información está incluida en un archivo separado por líneas, donde cada línea es una entrada.

56 MapReduce se encarga de todo el procesamiento en una forma de muy alto nivel.

57 MapReduce se encarga de todo el procesamiento en una forma de muy alto nivel. Funciona asignando un Job, el cual divide todo el trabajo en tasks, map-tasks y reduce-tasks. Cada uno de los procesamientos se realizan en task-trackers, mientras que se coordina en un job-tracker.

58 MapReduce se encarga de todo el procesamiento en una forma de muy alto nivel. Funciona asignando un Job, el cual divide todo el trabajo en tasks, map-tasks y reduce-tasks. Cada uno de los procesamientos se realizan en task-trackers, mientras que se coordina en un job-tracker. Hadoop trata de asignar los task-trackers a archivos que se encuentren en su propia máquina para mayor procesamiento.

59

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data y Supercómputo Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data 2 Hasta qué cantidad de datos podemos procesar en nuestra

Más detalles

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Francisco Magaz Villaverde Consultor: Víctor Carceler Hontoria Junio 2012 Contenido Introducción Qué es Cloud Compu5ng?

Más detalles

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop

Más detalles

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 3: HADOOP CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Hadoop 1.1 Proyecto Hadoop 1.2 Conceptos de Hadoop 2 Cluster Hadoop 2.1 Demonios

Más detalles

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO asoto@solidq.com @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en

Más detalles

Hadoop. Cómo vender un cluster Hadoop?

Hadoop. Cómo vender un cluster Hadoop? Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

Conectores Pentaho Big Data Community VS Enterprise

Conectores Pentaho Big Data Community VS Enterprise Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com info@stratebi.com Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community

Más detalles

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES agcastro@pragsis.com antoniogonzalezcastro.es @agonzaca linkedin.com/in/agonzaca

Más detalles

Qué significa Hadoop en el mundo del Big Data?

Qué significa Hadoop en el mundo del Big Data? Qué significa Hadoop en el mundo del Big Data? Un contenido para perfiles técnicos 2 ÍNDICE Qué significa Hadoop en el Universo Big Data?.... 3 El planteamiento: big data y data science.... 3 Los desafíos

Más detalles

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD Informe técnico Solución empresarial Hadoop de EMC NAS de escalamiento horizontal Isilon y Greenplum HD Por Julie Lockner, analista ejecutivo, y Terri McClure, analista ejecutivo Febrero de 2012 Este Informe

Más detalles

Global File System (GFS)...

Global File System (GFS)... Global File System (GFS)... Diferente a los sistemas de ficheros en red que hemos visto, ya que permite que todos los nodos tengan acceso concurrente a los bloques de almacenamiento compartido (a través

Más detalles

Cocinando con Big Data

Cocinando con Big Data Cocinando con Big Data Javier Sánchez BDM Big Data jsanchez@flytech.es 91.300.51.09 21/11/2013 Javier Sánchez 1 Agenda Qué es Big Data? Receta Punto de Partida Para qué Big Data? Conclusiones 21/11/2013

Más detalles

Evaluación de la herramienta de código libre Apache Hadoop Universidad Carlos III de Madrid Escuela Politécnica Superior

Evaluación de la herramienta de código libre Apache Hadoop Universidad Carlos III de Madrid Escuela Politécnica Superior Evaluación de la herramienta de código libre Apache Hadoop Universidad Carlos III de Madrid Escuela Politécnica Superior Proyecto Fin de Carrera INGENIERÍA TÉCNICA DE TELECOMUNICACIÓN: TELEMÁTICA Autora:

Más detalles

Modelo de Gobierno de Datos con SPARK

Modelo de Gobierno de Datos con SPARK Página1 Configuración de la máquina maestra Para un sistema de Hadoop Para configurar una máquina como maestra en un cluster de Hadoop, es necesario modificar algunos archivos que se encuentran dentro

Más detalles

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN PARALELIZACIÓN DE UN ALGORITMO PARA LA DETECCIÓN DE CÚMULOS DE GALAXIAS MEMORIA PARA OPTAR AL

Más detalles

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica Fundamentos Título de de Big la Data presentación utilizando MATLAB Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica 1 Agenda Qué es Big Data? Buenas prácticas en el manejo de memoria.

Más detalles

:Arquitecturas Paralela basada en clusters.

:Arquitecturas Paralela basada en clusters. Computación de altas prestaciones: Arquitecturas basadas en clusters Sesión n 1 :Arquitecturas Paralela basada en clusters. Jose Luis Bosque 1 Introducción Computación de altas prestaciones: resolver problemas

Más detalles

Comprender un poco más de los que es Apache Pig y Hadoop. El tutorial de cerdo muestra cómo ejecutar dos scripts de cerdo en modo local y el

Comprender un poco más de los que es Apache Pig y Hadoop. El tutorial de cerdo muestra cómo ejecutar dos scripts de cerdo en modo local y el APACHE PIG CONTENIDO 1. Introducción 3 1.1. Apache Pig 3 1.2. Propiedades 4 1.3. Requisitos para Apache Pig 4 1.4. Instalación de Hadoop 5 1.5. Instalación de java 5 1.6. Instalación de Pig 6 1.7. Ejecución

Más detalles

Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com

Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com Contenidos Clúster de Investigación Aplicada Proyectos HPC Clúster Hadoop para tecnologías de BI Una nube privada para la Administración

Más detalles

Petabytes de información: Repensando el modelamiento de base de datos. Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008

Petabytes de información: Repensando el modelamiento de base de datos. Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008 Petabytes de información: Repensando el modelamiento de base de datos Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008 Modelos de bases de datos para todos los gustos (según la

Más detalles

HDInsight. Big Data, al estilo Microsoft

HDInsight. Big Data, al estilo Microsoft HDInsight Big Data, al estilo Microsoft PABLO DOVAL SQL/BI Team Lead palvarez@plainconcepts.com http://geeks.ms/blogs/palvarez @PabloDoval Big Data ALGUNAS ESTADÍSTICAS DE SQL SERVER Categoría Metrica

Más detalles

Tecnologías de Big Data para resultados en tiempo casi real

Tecnologías de Big Data para resultados en tiempo casi real DOCUMENTO TÉCNICO Procesadores Intel Xeon Unidades de disco de estado sólido Intel (Intel SSDs) Adaptadores de Red Convergente Intel Ethernet Distribución de Intel para el software Hadoop* Tecnologías

Más detalles

Software Libre para Aplicaciones de Big Data

Software Libre para Aplicaciones de Big Data Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! hope@aceptus.com Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs

Más detalles

SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP. Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano

SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP. Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano Descripción general 2 El Problema Motivación Objetivos Metodología del proyecto

Más detalles

UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA

UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA Historia del Arte: El Big Data o Datos Masivos se refieren a sistemas informáticos basados en la acumulación a gran escala de datos y

Más detalles

2875: INTEGRACIÓN DE HADOOP CON PLANIFICADORES BATCH

2875: INTEGRACIÓN DE HADOOP CON PLANIFICADORES BATCH 2875: INTEGRACIÓN DE HADOOP CON PLANIFICADORES BATCH Memoria del Proyecto Fin de Carrera de Ingeniería en Informática realizado por José Fidel Díaz Cañizares y dirigido por Porfidio Hernández Budé Bellaterra,

Más detalles

TRABAJO FIN DE GRADO Grado en Ingeniería Informática

TRABAJO FIN DE GRADO Grado en Ingeniería Informática Universidad Autónoma de Madrid Escuela Politécnica Superior TRABAJO FIN DE GRADO Grado en Ingeniería Informática TDC (Twitter Data Collection): Creación de una gran base de datos de Tweets Borja Gil Pérez

Más detalles

Estamos inmersos en la era de la información, donde. Big data. Procesando los datos en la sociedad digital

Estamos inmersos en la era de la información, donde. Big data. Procesando los datos en la sociedad digital Big data Procesando los datos en la sociedad digital Francisco Herrera Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada Estamos inmersos en la era de la

Más detalles

ES 2 425 447 A2 ESPAÑA 11. Número de publicación: 2 425 447. Número de solicitud: 201230550 G06F 9/00 (2006.01) 12.04.2012

ES 2 425 447 A2 ESPAÑA 11. Número de publicación: 2 425 447. Número de solicitud: 201230550 G06F 9/00 (2006.01) 12.04.2012 19 OFICINA ESPAÑOLA DE PATENTES Y MARCAS ESPAÑA 11 21 Número de publicación: 2 42 447 Número de solicitud: 2012300 1 Int. CI.: G06F 9/00 (2006.01) 12 SOLICITUD DE PATENTE A2 22 Fecha de presentación: 12.04.2012

Más detalles

Escalar aplicaciones a cantidades masivas de datos Usando computadoras baratas muchas

Escalar aplicaciones a cantidades masivas de datos Usando computadoras baratas muchas Hadoop Problema Escalar aplicaciones a cantidades masivas de datos Usando computadoras baratas muchas Problemas de fiabilidad: alta probabilidad de que falle una o más computadoras Necesitamos algo que

Más detalles

Sistema de reportes y análisis sobre tendencias en la Web de la ESPOL usando Hadoop para el procesamiento masivo de los datos.

Sistema de reportes y análisis sobre tendencias en la Web de la ESPOL usando Hadoop para el procesamiento masivo de los datos. Sistema de reportes y análisis sobre tendencias en la Web de la ESPOL usando Hadoop para el procesamiento masivo de los datos. Gallardo Luis, Bermeo Fabricio, Cedeño Vanessa Msc. Facultad de Ingeniería

Más detalles

Memoria Compartida Distribuida (DSM) Sistema de Archivos

Memoria Compartida Distribuida (DSM) Sistema de Archivos Memoria Compartida Distribuida (DSM) La memoria compartida distribuida es una abstracción que se propone como alternativa a la comunicación por mensajes. Memoria compartida basada en páginas: este esquema

Más detalles

Instalación Hadoop. Guía para Debian y derivados

Instalación Hadoop. Guía para Debian y derivados Instalación Hadoop Guía para Debian y derivados Índice Instalación Hadoop Hadoop Distributed File System a. NameNode b. DataNode. Requisitos Diferentes modos de configuración Instalación Java Instalación

Más detalles

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop Julio 2015 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES (IFC) Área Profesional: SISTEMAS

Más detalles

PLANIFICACIÓN DE TRABAJOS EN CLUSTERS HADOOP COMPARTIDOS

PLANIFICACIÓN DE TRABAJOS EN CLUSTERS HADOOP COMPARTIDOS Escola d Enginyeria Departament d Arquitectura de Computadors i Sistemes Operatius PLANIFICACIÓN DE TRABAJOS EN CLUSTERS HADOOP COMPARTIDOS Tesis doctoral presentada por Aprigio Augusto Lopes Bezerra para

Más detalles

PLATAFORMA CLÚSTER BASADA EN CENTOS

PLATAFORMA CLÚSTER BASADA EN CENTOS PLATAFORMA CLÚSTER BASADA EN CENTOS Área de conocimiento: Redes y Telecomunicaciones Raúl Hernández Palacios, Felipe de Jesús Núñez Cárdenas, Javier Hervert Hernández, Miriam De la Cruz Bautista. Área

Más detalles

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Clusters Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Introducción Aplicaciones que requieren: Grandes capacidades de cómputo: Física de partículas, aerodinámica, genómica, etc. Tradicionalmente

Más detalles

Big Data. Analisís de grandes cantidades de datos. Sergio Marchena Quirós

Big Data. Analisís de grandes cantidades de datos. Sergio Marchena Quirós Big Data Analisís de grandes cantidades de datos Sergio Marchena Quirós Índice 1.0 Introducción...3 1.1 Objetivos del proyecto...3 1.1.1 Estudio Teórico...3 2.0 Big Data...3 2.1 las 5 V...3 2.2 Tipos de

Más detalles

Big Data con nombres propios

Big Data con nombres propios Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán

Más detalles

IV Jornada de Coordinación del SIC

IV Jornada de Coordinación del SIC IV Jornada de Coordinación del SIC Alta disponibilidad en Oracle Juan Rafael García Santana 26 de noviembre de 2004 Índice 1. Antigua configuración. 2. Entorno de hardware. 3. Entorno de software. 4. Organización

Más detalles

Manual de instalación y configuración de hadoop 1.0.3 en linux

Manual de instalación y configuración de hadoop 1.0.3 en linux Manual de instalación y configuración de hadoop 1.0.3 en linux Índice...2 Software utilizado...2 Requisitos...2 Java...2 Sistema Operativo...2 Crear grupo y usuario...2 Creación del grupo...2 Creación

Más detalles

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Ana María Bisbé York Servicios Profesionales sp@danysoft.com 916 638683 www.danysoft.com Abril 2015 Sala 1 SQL Server

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

Big Data. Jose Alvarez Gómez jose.alvarez@oracle.com OCM - Oracle Database 11g Certified Master Oracle University

Big Data. Jose Alvarez Gómez jose.alvarez@oracle.com OCM - Oracle Database 11g Certified Master Oracle University Big Data Jose Alvarez Gómez jose.alvarez@oracle.com OCM - Oracle Database 11g Certified Master Oracle University Agenda Introducción a Big Data Casos de Uso Tecnología Adquirir Organizar Analizar y Decidir

Más detalles

GlusterFS. Una visión rápida a uno de los más innovadores sistema de archivos distribuido

GlusterFS. Una visión rápida a uno de los más innovadores sistema de archivos distribuido GlusterFS Una visión rápida a uno de los más innovadores sistema de archivos distribuido Qué es GlusterFS? Es un sistema de archivos de alta disponibilidad y escalabilidad que puede brindar almacenamiento

Más detalles

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores Capítulo 9 Fundamentos de hardware avanzado para servidores Servidores para redes Un servidor es un computador en una red que es compartido por múltiples usuarios. El término servidor se refiere al hardware

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 1: INTRODUCCIÓN www.formacionhadoop.com Índice 1 Por qué realizar el curso de desarrollador para Apache Hadoop? 2 Requisitos previos del curso 3 Bloques

Más detalles

Desarrollo de un entorno basado en MapReduce para la ejecución distribuida de algoritmos genéticos paralelos

Desarrollo de un entorno basado en MapReduce para la ejecución distribuida de algoritmos genéticos paralelos UNIVERSIDADE DA CORUÑA FACULTAD DE INFORMÁTICA Departamento de Electrónica y Sistemas PROYECTO FIN DE CARRERA DE INGENIERÍA INFORMÁTICA Desarrollo de un entorno basado en MapReduce para la ejecución distribuida

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 APROXIMACIÓN PRÁCTICA A LA CIENCIA DE DATOS Y BIG DATA: HERRAMIENTAS KNIME, R, HADOOP Y MAHOUT. Entorno de Procesamiento Hadoop Sara Del Río García 1 Qué es Hadoop? Es un proyecto

Más detalles

Clase 3. Discos Duros (continuación)

Clase 3. Discos Duros (continuación) Instituto Tecnológico de Costa Rica Escuela de Ingeniería Electrónica Programa Mantenimiento de PC's Clase 3 Discos Duros (continuación) Introducción Organización de la información La información dentro

Más detalles

OpenNebula y Hadoop: Cloud Computing con herramientas Open Source. [Memoria del proyecto]

OpenNebula y Hadoop: Cloud Computing con herramientas Open Source. [Memoria del proyecto] OpenNebula y Hadoop: Cloud Computing con herramientas Open Source [Memoria del proyecto] [Francisco Magaz Villaverde] Consultor: Victor Carceler Hontoria Junio 2012 I. Resumen Cloud Computing (Computación

Más detalles

Tema 5. Sistemas de ficheros avanzados

Tema 5. Sistemas de ficheros avanzados Departamento de Ingeniería y Tecnología de Computadores Universidad de Murcia Índice 1 2 3 Sistemas de ficheros transaccionales Sistemas de ficheros con estructura de registro 4 Rendimiento de las operaciones

Más detalles

Resumen. Abstract. Palabras Claves: Hive, Hadoop, MapReduce, ESPOL.

Resumen. Abstract. Palabras Claves: Hive, Hadoop, MapReduce, ESPOL. Análisis de la información de una base de Datos Transaccional usando Hive sobre Hadoop Mercedes Alcívar (1), Iván Espinoza (2), Vanessa Cedeño (3) Facultad de Ingeniería en Electricidad y Computación (1)

Más detalles

PARADIGMA NOSQL: BASES DE DATOS COLUMNARES PARA AMBIENTE DATA WAREHOUSE

PARADIGMA NOSQL: BASES DE DATOS COLUMNARES PARA AMBIENTE DATA WAREHOUSE Universidad de San Carlos de Guatemala Facultad de Ingeniería Escuela de Ingeniería en Ciencias y Sistemas PARADIGMA NOSQL: BASES DE DATOS COLUMNARES PARA AMBIENTE DATA WAREHOUSE Erick Steve de la Cruz

Más detalles

Evaluación de MapReduce, Pig y Hive, sobre la plataforma Hadoop

Evaluación de MapReduce, Pig y Hive, sobre la plataforma Hadoop Informe de materia de graduación Evaluación de MapReduce, Pig y Hive, sobre la plataforma Hadoop Franklin Parrales Bravo Marco Calle Jaramillo Contenido o Herramientas o Motivación o Servicios y herramientas

Más detalles

Sistemas de Archivos Distribuidos. Daniel Leones Andrea Salcedo

Sistemas de Archivos Distribuidos. Daniel Leones Andrea Salcedo Sistemas de Archivos Distribuidos Daniel Leones Andrea Salcedo Qué es un Sistema de Archivos Distribuido? Un sistema de archivos distribuido clásico es una aplicación cliente/servidor que permite a los

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET LA PLATAFORMA GOOGLE CLOUD PLATFORM. GOOGLE APP ENGINE Pedro A. Castillo Valdivieso Universidad de Granada http://bit.ly/unia2014

Más detalles

Big Data y NO-SQL el futuro de la Arquitectura de Información

Big Data y NO-SQL el futuro de la Arquitectura de Información Big Data y NO-SQL el futuro de la Arquitectura de Información Jorge Mario Calvo L. EMPRENDEMICO = EMPRENdedor + academico http://jorgemariocalvo.net http://www.emprendemico.com Twitter: @Emprendemico Conocimiento

Más detalles

Replicación de datos en PVFS2 para conseguir tolerancia a fallos

Replicación de datos en PVFS2 para conseguir tolerancia a fallos Replicación de datos en PVFS2 para conseguir tolerancia a fallos Erik Nieto Tovar 1, Raúl Hernández Palacios 1, Hugo E. Camacho Cruz 1, Antonio F. Díaz García 1, Mancia Anguita López 1, Julio Ortega Lopera

Más detalles

Google BigQuery. Luis Villalba 59191

Google BigQuery. Luis Villalba 59191 Google BigQuery Luis Villalba 59191 Universidad Católica de Asunción, Departamento de Ciencias y Tecnologías, Sede Santa Librada, Asunción, Paraguay villalba.luifer@gmail.com Abstract. En este paper estaremos

Más detalles

Soluciones para entornos HPC

Soluciones para entornos HPC Dr.. IT Manager / Project Leader @ CETA-Ciemat abelfrancisco.paz@ciemat.es V Jornadas de Supercomputación y Avances en Tecnología INDICE 1 2 3 4 HPC Qué? Cómo?..................... Computación (GPGPU,

Más detalles

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos. RAIDS MODO LINEAL Es un tipo de raid que muestra lógicamente un disco pero se compone de 2 o más discos. Solamente llena el disco 0 y cuando este está lleno sigue con el disco 1 y así sucesivamente. Este

Más detalles

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?

Más detalles

TRANSFORME SU INFRAESTRUCTURA DE BASE DE DATOS

TRANSFORME SU INFRAESTRUCTURA DE BASE DE DATOS TRANSFORME SU INFRAESTRUCTURA DE BASE DE DATOS Las bases de datos como Oracle y SQL Server exigen una latencia baja constante y un rendimiento de I/O excepcional para responder al instante a las consultas

Más detalles

Almacenamiento magnético, 4

Almacenamiento magnético, 4 Almacenamiento magnético, 4 RAID (1) o R.edundant o A.rray o I.nexpensive (I.ndependent) o D.isk Agrupación redundante de discos baratos RAID (2) o Años 80 o Los sistemas de disco se habían ya convertido

Más detalles

Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación

Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación "Data Analytics, procesamiento de grandes volúmenes de información para generar inteligencia de negocios" Proyecto de Graduación

Más detalles

PVFS (Parallel Virtual File System)

PVFS (Parallel Virtual File System) Sergio González González Instituto Politécnico de Bragança, Portugal sergio.gonzalez@hispalinux.es Jónatan Grandmontagne García Universidad de Bragança, Portugal thestalker44@hotmail.com Breve explicación

Más detalles

Instalación y configuración de herramientas software para Big Data

Instalación y configuración de herramientas software para Big Data Escola Tècnica Superior d Enginyeria Informàtica Universitat Politècnica de València Instalación y configuración de herramientas software para Big Data Trabajo Fin de Grado Grado en Ingeniería Informática

Más detalles

ANÁLISIS BIOINFORMÁTICOS SOBRE LA TECNOLOGÍA HADOOP

ANÁLISIS BIOINFORMÁTICOS SOBRE LA TECNOLOGÍA HADOOP ANÁLISIS BIOINFORMÁTICOS SOBRE LA TECNOLOGÍA HADOOP Memoria del proyecto de Ingeniería Técnica en Informática de Sistemas realizado por Albert Gutiérrez Millà y dirigido por Antonio Espinosa Morales Escola

Más detalles

IT@Intel Cómo TI de Intel migró con éxito hacia Cloudera Apache Hadoop*

IT@Intel Cómo TI de Intel migró con éxito hacia Cloudera Apache Hadoop* Documento técnico de IT@Intel Marzo de 2015 IT@Intel Cómo TI de Intel migró con éxito hacia Cloudera Apache Hadoop* A partir de nuestra experiencia original con el software Apache Hadoop, TI de Intel identificó

Más detalles

MÁSTER: MÁSTER EXPERTO BIG DATA

MÁSTER: MÁSTER EXPERTO BIG DATA MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster

Más detalles

Manual para la instalación de los Contenidos Educativos de Educación Media

Manual para la instalación de los Contenidos Educativos de Educación Media Manual para la instalación de los Contenidos Educativos de Educación Media CONTENIDO EDUCATIVO Manual para la descarga e instalación de los Recursos Educativos Digitalizados para el Aprendizaje (RDA) del

Más detalles

Almacenamiento y estructura de archivos

Almacenamiento y estructura de archivos Bases de Datos Almacenamiento y estructura de archivos Almacenamiento y Estructura de Archivos Introducción a los medios de almacenamiento Discos Magnéticos RAID Almacenamiento Terciario Acceso de almacenamiento

Más detalles

FAMILIA EMC VPLEX. Disponibilidad continua y movilidad de datos en los centro de datos y entre ellos

FAMILIA EMC VPLEX. Disponibilidad continua y movilidad de datos en los centro de datos y entre ellos FAMILIA EMC VPLEX Disponibilidad continua y movilidad de datos en los centro de datos y entre ellos MOVILIDAD DE DATOS Y DISPONIBILIDAD CONTINUAS PARA APLICACIONES DE MISIÓN CRÍTICA La infraestructura

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA División de Ingeniería Eléctrica Bases de datos NoSQL: solución en sistemas distribuidos y de alto desempeño. TESIS PROFESIONAL para obtener

Más detalles

Análisis de sentimientos de tweets.

Análisis de sentimientos de tweets. Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red

Más detalles

Introducción a Hadoop

Introducción a Hadoop Introducción a Hadoop Patrocinado por Bahía Software Tomás Fernández Pena Centro Singular de Investigación en Tecnoloxías da Información Universidade de Santiago de Compostela citius.usc.es Qué es MapReduce?

Más detalles

Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014

Libere el conocimiento que vive en cualquier dato. Mario Ochoa 10/09/2014 Libere el conocimiento que vive en cualquier dato Mario Ochoa 10/09/2014 En qué se diferencian las empresas exitosas de la actualidad? Datos. Valor La innovación de tecnología acelera el valor Machine

Más detalles

LIBRO BLANCO QUANTUM LATTUS: Almacenamiento de objetos de última generación para archivos Big Data

LIBRO BLANCO QUANTUM LATTUS: Almacenamiento de objetos de última generación para archivos Big Data LIBRO BLANCO QUANTUM LATTUS: Almacenamiento de objetos de última generación para archivos Big Data ÍNDICE Resumen...3 Los límites de las soluciones de almacenamiento tradicionales....3 Almacenamiento de

Más detalles

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS PLIEGO DE PRESCRIPCIONES TÉCNICAS. EXPTE 2/2015 Adquisición e instalación

Más detalles

Desarrollo de herramientas empresariales para la búsqueda de información utilizando Biginsights, Java y otras tecnologías de la informática

Desarrollo de herramientas empresariales para la búsqueda de información utilizando Biginsights, Java y otras tecnologías de la informática Desarrollo de herramientas empresariales para la búsqueda de información utilizando Biginsights, Java y otras tecnologías de la informática Índice Introducción Capítulo 1: Contexto General 1.1 Descripción

Más detalles

MÓDULO DE RECOMENDACIONES DE PÁGINAS A VISITAR EN LA WIKIPEDIA, BASADO EN LAS APORTACIONES EFECTUADAS POR LA COMUNIDAD DE USUARIOS USANDO HADOOP

MÓDULO DE RECOMENDACIONES DE PÁGINAS A VISITAR EN LA WIKIPEDIA, BASADO EN LAS APORTACIONES EFECTUADAS POR LA COMUNIDAD DE USUARIOS USANDO HADOOP ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniería en Electricidad y Computación MÓDULO DE RECOMENDACIONES DE PÁGINAS A VISITAR EN LA WIKIPEDIA, BASADO EN LAS APORTACIONES EFECTUADAS POR LA

Más detalles

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

SISTEMAS DE ARCHIVOS DISTRIBUIDOS SISTEMAS DE ARCHIVOS DISTRIBUIDOS Tema # VII Sistemas de operación II Abril-Julio 2008 Yudith Cardinale Introducción Requisitos Aspectos de Diseño Servicios de archivos Servicios de directorios Módulo

Más detalles

Arquitecturas de Bases de Datos. Carlos A. Olarte (carlosolarte@puj.edu.co) BDII

Arquitecturas de Bases de Datos. Carlos A. Olarte (carlosolarte@puj.edu.co) BDII Carlos A. Olarte (carlosolarte@puj.edu.co) BDII Contenido 1 Introducción 2 Arquitectura Centralizada 3 Arquitectura Cliente-Servidor 4 Arquitecturas Paralelas 5 Bases de Datos Distribuidas Introducción

Más detalles

La Analítica de Datos no Estructurados

La Analítica de Datos no Estructurados La Analítica de Datos no Estructurados Análisis Big Data con Hadoop Big Data es Más Que Solamente Hadoop Que me podría decir de Big Data? Quiero saber de Hadoop. Big Data es mucho mas que Hadoop! Nuestros

Más detalles

Almacenamiento orientado a las necesidades del negocio. Sistema de almacenamiento Scale-out Multi-Petabyte FUJITSU ETERNUS CD10000

Almacenamiento orientado a las necesidades del negocio. Sistema de almacenamiento Scale-out Multi-Petabyte FUJITSU ETERNUS CD10000 Almacenamiento orientado a las necesidades del negocio Sistema de almacenamiento Scale-out Multi-Petabyte FUJITSU ETERNUS CD10000 Abra paso a nuevas oportunidades de negocio. Libere el potencial de los

Más detalles

GESTIÓN DE DATOS Y ALMACENAMIENTO DISTRIBUIIDO una posible ruta hacia la biblioteca total. Ricardo Marcelín Jiménez Noviembre, 2015

GESTIÓN DE DATOS Y ALMACENAMIENTO DISTRIBUIIDO una posible ruta hacia la biblioteca total. Ricardo Marcelín Jiménez Noviembre, 2015 GESTIÓN DE DATOS Y ALMACENAMIENTO DISTRIBUIIDO una posible ruta hacia la biblioteca total Ricardo Marcelín Jiménez Noviembre, 2015 El autor (y su equipo) participa/colabora en proyectos de Innovación y

Más detalles

Tema 1: Implementación del sistema de archivos

Tema 1: Implementación del sistema de archivos Tema 1: Implementación del sistema de archivos 1. Introducción 2. Implementación 3. Estructura del almacenamiento secundario Dpto. Tema Lenguajes 1: Implementación y Sistemas del Informáticos. sistema

Más detalles

Universidad Autónoma de Aguascalientes Luis Eduardo Bautista Villalpando

Universidad Autónoma de Aguascalientes Luis Eduardo Bautista Villalpando Universidad Autónoma de Aguascalientes Luis Eduardo Bautista Villalpando Qué es Cloud Computing? Quién utiliza Cloud Computing? Plataformas utilizadas en Cloud Computing Investigación en Cloud Computing

Más detalles

Introducción. TEMA 3: Clusters de Computadores Personales

Introducción. TEMA 3: Clusters de Computadores Personales Introducción TEMA 3: Clusters de Computadores Personales Laboratorio de Arquitecturas Avanzadas de Computadores 5º de Ingeniería Superior de Informática 2008/09 Alberto Sánchez alberto.sanchez@urjc.es

Más detalles

Resumen. Abstract. 1. Introducción

Resumen. Abstract. 1. Introducción Utilización de la plataforma Hadoop para la implementación de un programa que permita determinar mensajes spam Gustavo Crespo P. (1) Susana Véliz M. (2) Vanessa Cedeño M. Msc. (3) (1) (2) (3) Facultad

Más detalles

Infraestructura de Big Data para el análisis y procesamiento de información generada por redes de sensores

Infraestructura de Big Data para el análisis y procesamiento de información generada por redes de sensores Infraestructura de Big Data para el análisis y procesamiento de información generada por redes de sensores Seminario internacional: Big Data para la Información Oficial y la Toma de Decisiones José A.

Más detalles

18 y 19 Sistemas de Archivos Distribuidos y Tarea 05

18 y 19 Sistemas de Archivos Distribuidos y Tarea 05 18 y 19 Sistemas de Archivos Distribuidos y Tarea 05 Prof. Edgardo Adrián Franco Martínez http://computacion.cs.cinvestav.mx/~efranco efranco.docencia@gmail.com Estructuras de datos (Prof. Edgardo A. Franco)

Más detalles