Análisis de sentimientos de tweets.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Análisis de sentimientos de tweets."

Transcripción

1 Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red social. Key words: Big data, Hadoop, MapReduce, tweets, análisis de sentimientos 1. Introducción Las herramientas de Big Data[1] (de forma particular para este trabajo se utiliza Hadoop[2], Cloudera CDH[3], MapReduce[4]) son hoy en día herramientas en constante crecimiento a nivel mundial para procesamiento de grandes volúmenes de datos. Por ello en el siguiente trabajo de investigación desarrollamos de forma inextensa todo lo concerniente al tratamiento de grandes cantidades de datos, en este caso, realizamos el análisis sentimental de los tweets. 2. Motivaciones Big Data hoy en día acarrea una enorme cantidad de problemas, relacionados con el volumen, velocidad y la variedad de los datos (comúnmente denominados las tres V s de Big Data), la cantidad de información que se genera hoy en día es mayor a la capacidad de procesamiento, como ejemplo tenemos, de acuerdo con la propia investigación de Twitter a principios de 2012, se ven más o menos 175 millones tweets de todos los días, y tiene más de 465 millones de cuentas [5], así también tenemos a Youtube, según estudios los usuarios de YouTube sube 48 horas de video nuevo cada minuto del día [6], y por último tenemos a otro de los colosos de internet, Facebook, quien revela que se suben 100 terabytes de datos por día al mismo, se comparten 30 mil millones de posts cada mes [6]. Estas estadísticas nos dan una pauta sobre el nivel de información extremadamente alto con el que se lidia, y todo esto viene de forma diversa, los datos no se encuentran completamente estructurados, se debe tratar con archivos de texto, imágenes, videos entre otros, todo esto es lo que Big Data intenta abordar y tratar. Esto conlleva al motivo de este proyecto, el tratamiento de datos tanto estructurados como no estructurados con un gran volumen de datos utilizando metodologías y arquitecturas tales como Hadoop y MPP[7], con lo cual esperamos obtener de forma eficiente y efectiva resultados sobre los sentimientos en las expresiones de los tweets. Otro motivo fue tener una idea sobre la complejidad real de implementar este tipo de arquitecturas en la vida real, así como la medición de la perfomance del mismo.

2 2 3. Descripción del problema El tratamiento de datos es el problema principal. Tres pilares caracterizan este problema: Volumen: Los datos ocupan Gigabytes a Terabytes de espacio en disco. Es común que incluso ocupen más espacio del que se puede almacenar en un disco físico. Se necesitan mecanismos para almacenar los datos de forma eficiente y tolerante a fallos. Velocidad: La latencia en el procesado de los datos, contra la demanda por interactividad requerida. Variedad: Diversidad de fuentes, formatos, calidad y estructura de los datos. Específicamente, nos enfrentaremos a estos problemas al analizar los tweets que contengan cierta información que particularmente nos resulte interesante, como son los trending topics de Twitter. Necesitamos encontrar mecanismos que nos ayuden a tratar esta masiva cantidad de datos. Una vez obtenidos estos datos, realizar el analisis de sentimientos (ya sea negativo, positivo o neutro) sobre el tema obtenido, de esta manera, obtener una tendencia general negativa o positiva sobre el tópico estudiado. 4. Descripción esquemática de la solución planteada Hipótesis. El análisis de sentimientos de los tweets (masiva cantidad de información) en conjunto con el framework Hadoop, para obtener una tendencia sentimental de si el hashtag obtenido está siendo debatido de forma positiva o negativa. Utilizacion de herramientas de Big Data para efectuar las pruebas. La estructura de la solución planteada se basa principalmente en la recolección de datos de tweets referentes a un tema especificado por un hashtag, como primera fase del experimento, el cual fue realizado mediante la utilización de la API de twitter, llamada Streaming API. Este proceso de recolección tuvo una duración aproximada de 4 horas ininterrumpidas, durante el cual se llegó a recolectar más tweets para el experimento. La siguiente fase, el análisis de los datos recolectados guardados dentro de el sistema de ficheros HDFS de Hadoop[8], el cual posibilitó la obtención de los resultados haciendo uso del motor de procesamiento Map Reduce [4]. 5. Resolución Fase 1 - Recoleccion de datos - Streaming API La forma en que los investigadores y otras personas pueden obtener grandes cantidades de datos públicos disponibles en Twitter es mediante su API 1. La API de Twitter tiene dos enfoques o formas de trabajo : RESTful y Streaming. REST API ofrece a los desarrolladores el acceso al core de los 1 API, Interfaz de Programación de Aplicación (Application Programming Interface)

3 Análisis de sentimientos de tweets. 3 datos de Twitter. Todas las operaciones que se pueden hacer vía web son posibles realizarlas desde el API. Streaming API proporciona un subconjunto del flujo total de tweets en tiempo real. Para el experimento usamos Streaming API, lo que nos permitió recolectar los datos en tiempo real. Optamos por esta API porque a diferencia del RESTful, no existe una limitación de 150 peticiones/hora por usuario o por IP si la conexión no está autenticada. Luego de 4 horas de recolección, obtuvimos aproximadamente tweets sobre el tópico twitter. Fase 2 - Tratamiento de los datos Los datos recolectados están codificados en JSON 2, el cual es una forma elegante de codificar complejas estructuras de datos. En el caso de un tweets, la estructura de datos o la información disponible en ella, es muy completa. Para fines del experimento, el cual es analizar el sentimiento de un tweet, solo nos interesa el campo que posee el mensaje en sí. Para ello, la información recolectada pasa por un filtro, el cual permite obtener solo aquellos campos que nos interesa del tweet (mensaje y tiempo de generación del tweet), desechando la información restante. Fase 3 - Función de Evaluación Para analizar el sentimiento de un tweets, se analiza el mensaje en sí del tweet contra una lista de palabras calificadas según el sentimiento, los cuales poseen un peso según expresen sentimientos negativos o positivos, del -5 (más negativo) al +5 (más positivo). A cada tweet se le asigna un puntaje basado en la suma del puntaje del sentimiento asociado a cada palabra que compone el tweet. Fase 4 - Analisis - Map Reduce La función map toma como entrada un tweet y devuelve como salida una tupla compuesta por la clave ([sentimiento], [timestamp]) y valor [score] Map(tweet) (([sentimiento], [timestamp]), [score]) donde sentimiento es negativo si es puntaje es menor a 0, neutral si el puntaje es 0 y positivo si el puntaje es mayor a 0. La función reduce acepta como entrada la tupla producida por map y devuelve una tupla Reduce(([sentimiento], [timestamp]), [score]) (([sentimiento], [timestamp]), [total]) Reduce utiliza como clave de agrupamiento ([sentimiento], [timestamp]), sumando los puntajes cuyas claves sean iguales para obtener el resultado total. Fase5 - Obtención de resultados Los resultados presentan una clasificación del total de tweets recolectados según el sentimiento (o tendencia) que tuvieron hacia lo positivo, negativo o neutral. 2 JavaScript Object Notation

4 4 6. Conclusiones Hemos podido observar como con herramientas de procesamiento podemos mejorar de forma substancial el procesamiento de los datos. Una de las ventajas que obtenemos tratando los problemas a través de Hadoop es que los datos no deben ser estructurados de forma tradicional (no es un requisito tenerlos en forma de entradas en una base de datos) ya que justamente esta versatilidad de Hadoop nos permite trabajar con fuentes heterogéneas de datos (archivos de texto, listas, entradas de una base de datos). Por otro lado, concerniente al trabajo realizado, hemos podido lleguar a las siguientes conclusiones, primeramente el costo de desarrollo fue relativamente bajo, ya que las herramientas se encuentran documentadas de forma extensa, son de uso simple y la configuración no involucra mayores complicaciones, lo cual es sumamente importante para la incorporación de este tipo de soluciones a problemas similares. En cuanto a los resultados obtenidos podemos ver, si bien el tema es bastante genérico, al utilizar como hashtag twitter, que constantemente tenemos resultados mayormente positivos o neutrales por sobre los negativos, esto puede ser observado a lo largo de periodo de recolección, con esto podemos pensar de forma razonable que los usuarios que escriben esto están hablando positivamente sobre el Twitter, es decir están contentos con el sistema o lo encuentran interesante. Podemos ver la importancia de este tipo de análisis, ya que a través de los sentimientos de estos tweets podemos concluir acerca del nivel de aceptación que está teniendo la herramienta Twitter sobre sus usuarios, por lo tanto es una forma indirecta de hacer censo a los usuarios para obtener datos relevantes sobre la aceptación del servicio. Referencias 1. (Big data) 2. (Apache hadoop) 3. (Cloudera cdh) 4. (Mapreduce: Simplified data processing on large clusters) 5. Dawson, K., Ziv, D.D.: (A conversation on the role of big data in marketing and customer service) 6. (A comprehensive list of big data statistics) 7. (Massive parallel computing) 8. (Apache hadoop)

5 Análisis de sentimientos de tweets. Integrantes Jorge José Jara Ruiz JIT-CITA 2013 Manuel Antonio Nuñez Gonzalez Stefano Leonardo Pezzino Castro Profesor: Iván Prieto Materia: Sistemas Paralelos y Distribuidos Departamento: Departamento de Electrónica e Informática Universidad: Universidad Católica Nuestra Señora de la Asunción Resumen El trabajo consiste en la investigación de tecnologías de Big Data (Hadoop, utilizado en conjunto con Cloudera, MapReduce e implementado en Python) implementando un análisis de sentimientos sobre tweets obtenidos en tiempo real desde internet, utilizando la API de Twitter para obtener los tweets en tiempo real, los cuales son distribuidos en ciertos nodos (que realizan el trabajo de evaluación de cada uno de los tweets), para, de forma final, sacar un resultado sobre el conceso de todos los tweets analizados de forma independiente. Se utiliza Hadoop que es el framework que permite trabajar con los nodos creados y es utilizado para realizar aplicaciones distribuidas. Se muestra el proceso de análisis, de segmentación y distribución de las tareas mediante estas herramientas mencionadas previamente). Key words: Big data, Hadoop, MapReduce, tweets, análisis de sentimientos Áreas de trabajo 5. redes, sistemas y/o arquitectura, y 8. algoritmos, lenguajes y programación.

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

BIG DATA MARÍA PARRA AMAT. Almería, 5 junio 2015

BIG DATA MARÍA PARRA AMAT. Almería, 5 junio 2015 BIG DATA MARÍA PARRA AMAT Almería, 5 junio 2015 BIG DATA "Petróleo del XXI" Nuevo enfoque en el entendimiento y la toma de decisiones Conjunto de técnicas y herramientas ORIGEN Estadística Metodologías

Más detalles

MÁSTER: MÁSTER EXPERTO BIG DATA

MÁSTER: MÁSTER EXPERTO BIG DATA MÁSTER: MÁSTER EXPERTO BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los ingenieros que quieran aprender el despliegue y configuración de un cluster

Más detalles

Hadoop. Cómo vender un cluster Hadoop?

Hadoop. Cómo vender un cluster Hadoop? Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las

Más detalles

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 1: INTRODUCCIÓN www.formacionhadoop.com Índice 1 Por qué realizar el curso de desarrollador para Apache Hadoop? 2 Requisitos previos del curso 3 Bloques

Más detalles

Qué significa Hadoop en el mundo del Big Data?

Qué significa Hadoop en el mundo del Big Data? Qué significa Hadoop en el mundo del Big Data? Un contenido para perfiles técnicos 2 ÍNDICE Qué significa Hadoop en el Universo Big Data?.... 3 El planteamiento: big data y data science.... 3 Los desafíos

Más detalles

Conectores Pentaho Big Data Community VS Enterprise

Conectores Pentaho Big Data Community VS Enterprise Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com info@stratebi.com Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community

Más detalles

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop

Más detalles

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica Fundamentos Título de de Big la Data presentación utilizando MATLAB Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica 1 Agenda Qué es Big Data? Buenas prácticas en el manejo de memoria.

Más detalles

Conceptos básicos de Big Data

Conceptos básicos de Big Data Conceptos básicos de Big Data Este documento no podrá ser reproducido, total o parcialmente, sin el permiso expreso de TRC Informática, S.L. Correos electrónicos, mensajes de textos, datos en formularios

Más detalles

Google BigQuery. Luis Villalba 59191

Google BigQuery. Luis Villalba 59191 Google BigQuery Luis Villalba 59191 Universidad Católica de Asunción, Departamento de Ciencias y Tecnologías, Sede Santa Librada, Asunción, Paraguay villalba.luifer@gmail.com Abstract. En este paper estaremos

Más detalles

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO

BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES agcastro@pragsis.com antoniogonzalezcastro.es @agonzaca linkedin.com/in/agonzaca

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

CURSO PRESENCIAL: Apache Spark

CURSO PRESENCIAL: Apache Spark CURSO PRESENCIAL: Apache Spark Información detallada del curso www.formacionhadoop.com El curso se desarrolla en 2 semanas seguidas. Se trata de un curso formato ejecutivo que permite compaginar la formación

Más detalles

CURSO PRESENCIAL: DESARROLLADOR BIG DATA

CURSO PRESENCIAL: DESARROLLADOR BIG DATA CURSO PRESENCIAL: DESARROLLADOR BIG DATA Información detallada del curso www.formacionhadoop.com El curso se desarrolla durante 3 semanas de Lunes a Jueves. Se trata de un curso formato ejecutivo que permite

Más detalles

PROGRAMA FORMATIVO Desarrollador Big Data Cloudera Apache Hadoop

PROGRAMA FORMATIVO Desarrollador Big Data Cloudera Apache Hadoop PROGRAMA FORMATIVO Desarrollador Big Data Cloudera Apache Hadoop Julio 2015 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES (IFC) Área Profesional: DESARROLLO 2.

Más detalles

CURSO: DESARROLLADOR PARA APACHE HADOOP

CURSO: DESARROLLADOR PARA APACHE HADOOP CURSO: DESARROLLADOR PARA APACHE HADOOP CAPÍTULO 3: HADOOP CONCEPTOS BÁSICOS www.formacionhadoop.com Índice 1 Introducción a Hadoop 1.1 Proyecto Hadoop 1.2 Conceptos de Hadoop 2 Cluster Hadoop 2.1 Demonios

Más detalles

SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP. Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano

SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP. Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano SISTEMA PARA GENERAR GRÁFICAS A PARTIR DE LOGS TCPDUMP USANDO HADOOP Ángel Stalin Cruz Palaquibay Pedro Alfredo Torres Arellano Descripción general 2 El Problema Motivación Objetivos Metodología del proyecto

Más detalles

MÁSTER: MÁSTER DESARROLLADOR BIG DATA

MÁSTER: MÁSTER DESARROLLADOR BIG DATA MÁSTER: MÁSTER DESARROLLADOR BIG DATA Información detallada del máster www.formacionhadoop.com Este máster online está enfocado a los desarrolladores que quieran aprender a construir potentes aplicaciones

Más detalles

CURSO: CURSO DESARROLLADOR HADOOP

CURSO: CURSO DESARROLLADOR HADOOP CURSO: CURSO DESARROLLADOR HADOOP Información detallada del curso www.formacionhadoop.com Este curso online está enfocado a los desarrolladores que quieran aprender a construir potentes aplicaciones de

Más detalles

BIG DATA Desde que se cronometran las carreras, se corre más rápido

BIG DATA Desde que se cronometran las carreras, se corre más rápido BIG DATA Desde que se cronometran las carreras, se corre más rápido Santa Cruz, Bolivia 2014 Manual para aprender @sorprendida @sorprendida HACE UN BILLÓN DE: HORAS nació el homo sapiens MINUTOS empezó

Más detalles

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO asoto@solidq.com @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en

Más detalles

Big Data con nombres propios

Big Data con nombres propios Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán

Más detalles

TRABAJO ACADÉMICAMENTE DIRIGIDO

TRABAJO ACADÉMICAMENTE DIRIGIDO TRABAJO ACADÉMICAMENTE DIRIGIDO Diseño y contrucción de un prototipo para la extracción de información de redes sociales para su uso en sistemas de recomendación Profesor: Alumno: D. José Carpio Cañada

Más detalles

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo Big Data & Machine Learning MSc. Ing. Máximo Gurméndez Universidad de Montevideo Qué es Big Data? Qué es Machine Learning? Qué es Data Science? Ejemplo: Predecir origen de artículos QUÉ DIARIO LO ESCRIBIÓ?

Más detalles

TweetAlert: Sistema de Análisis Semántico de la Voz de los Ciudadanos en Redes Sociales en la Ciudad del Futuro

TweetAlert: Sistema de Análisis Semántico de la Voz de los Ciudadanos en Redes Sociales en la Ciudad del Futuro TweetAlert: Sistema de Análisis Semántico de la Voz de los Ciudadanos en Redes Sociales en la Ciudad del Futuro Julio Villena-Román 1,2, Adrián Luna-Cobos 1,3, José Carlos González-Cristóbal 3,1 1 DAEDALUS

Más detalles

UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA

UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA UNIVERSIDAD TECNICA DEL NORTE Ing. Lenin Omar Lara Castro. BIG DATA Historia del Arte: El Big Data o Datos Masivos se refieren a sistemas informáticos basados en la acumulación a gran escala de datos y

Más detalles

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop

PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop PROGRAMA FORMATIVO Analista de Datos Big Data Cloudera Apache Hadoop Julio 2015 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES (IFC) Área Profesional: SISTEMAS

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

INTRODUCCIÓN A APACHE SPARK CON PYTHON

INTRODUCCIÓN A APACHE SPARK CON PYTHON Ls INTRODUCCIÓN A APACHE SPARK CON PYTHON Introducción a Apache Spark Jortilles.com info@jortilles.com Índice de contenido 1.Descripción...3 2.Cual es su ventaja competitiva...3 3.Instalación...3 4.Conceptos

Más detalles

PREVIEW BIDOOP 2.0. Big Data Brunch

PREVIEW BIDOOP 2.0. Big Data Brunch PREVIEW BIDOOP 2.0 Big Data Brunch 08 de Julio 2014 Quién soy? Trabajando con Hadoop desde 2010 sluangsay@pragsis.com @sourygna CTO de Pragsis Responsable departamento sistemas Preventa Instructor de Hadoop

Más detalles

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,

Más detalles

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source

Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Proyecto Fin de Carrera OpenNebula y Hadoop: Cloud Computing con herramientas Open Source Francisco Magaz Villaverde Consultor: Víctor Carceler Hontoria Junio 2012 Contenido Introducción Qué es Cloud Compu5ng?

Más detalles

Desarrollo de portales web con Drupal. Por Juan M. Rivero. http://www.hipermedio.com

Desarrollo de portales web con Drupal. Por Juan M. Rivero. http://www.hipermedio.com Desarrollo de portales web con Drupal. Por Juan M. Rivero. http://www.hipermedio.com Juan Manuel Rivero Egresado del Bachillerato Tecnológico de Informática y la Tecnicatura en Redes y Telecomunicaciones

Más detalles

Programación de red con Cisco Application Centric Infrastructure

Programación de red con Cisco Application Centric Infrastructure Informe técnico Programación de red con Cisco Application Centric Infrastructure Descripción general En este documento se examina la compatibilidad de la programación de Cisco Application Centric Infrastructure

Más detalles

Roadmap para la adopción de nuevas arquitecturas de información

Roadmap para la adopción de nuevas arquitecturas de información Roadmap para la adopción de nuevas arquitecturas de información Qué es Big Data..? es el nombre que se le da a conjuntos de información que crecen de una manera tan exponencial que resulta prohibitivo

Más detalles

UNIVERSIDAD TECNOLÓGICA PRIVADA DE SANTA CRUZ FACULTAD DE CIENCIAS Y TECNOLOGIA. CARRERA: Ingeniería en Sistemas

UNIVERSIDAD TECNOLÓGICA PRIVADA DE SANTA CRUZ FACULTAD DE CIENCIAS Y TECNOLOGIA. CARRERA: Ingeniería en Sistemas UNIVERSIDAD TECNOLÓGICA PRIVADA DE SANTA CRUZ FACULTAD DE CIENCIAS Y TECNOLOGIA CARRERA: Ingeniería en Sistemas Perfil de Tesis para Proyecto Empresarial Aplicación para mejorar la evaluación del desempeño

Más detalles

Marketing Online. Pymerbi Sa De Cv

Marketing Online. Pymerbi Sa De Cv Marketing Online Marketing Online Incrementando ventas mediante medios de comunicación en linea. En Las Redes Sociales más Importantes. -Te ayudamos hacer diseños para atraer clientes -Has promociones

Más detalles

CURSO: CURSO ADMINISTRADOR HADOOP

CURSO: CURSO ADMINISTRADOR HADOOP CURSO: CURSO ADMINISTRADOR HADOOP Información detallada del curso www.formacionhadoop.com Este curso online está enfocado a administradores de sistemas que quieran aprender a realizar el despliegue y mantenimiento

Más detalles

Soluciones Integrales en Inteligencia de Negocios

Soluciones Integrales en Inteligencia de Negocios Soluciones Integrales en Inteligencia de Negocios QUIENES SOMOS NUESTRA MISIÓN DATAWAREHOUSE MINERÍA DE DATOS MODELOS PREDICTIVOS REPORTERÍA Y DASHBOARD DESARROLLO DE APLICACIONES MODELOS DE SIMULACIÓN

Más detalles

Evaluación de MapReduce, Pig y Hive, sobre la plataforma Hadoop

Evaluación de MapReduce, Pig y Hive, sobre la plataforma Hadoop Informe de materia de graduación Evaluación de MapReduce, Pig y Hive, sobre la plataforma Hadoop Franklin Parrales Bravo Marco Calle Jaramillo Contenido o Herramientas o Motivación o Servicios y herramientas

Más detalles

CUANDO CLOUD CONVERGE CON BIG DATA

CUANDO CLOUD CONVERGE CON BIG DATA CUANDO CLOUD CONVERGE CON BIG DATA CISCO Rock the Cloud Alejandro Giménez Advisory Technology Consultant 1 EN ESTA DÉCADA EL UNIVERSO DIGITAL CRECERÁ 44X DESDE 0.9 ZETTABYTES A 35.2 ZETTABYTES KILO 10

Más detalles

Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación

Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación Instituto Tecnológico de Costa Rica Escuela de Ingeniería en Computación "Data Analytics, procesamiento de grandes volúmenes de información para generar inteligencia de negocios" Proyecto de Graduación

Más detalles

CURSO PRESENCIAL: ADMINISTRADOR HADOOP

CURSO PRESENCIAL: ADMINISTRADOR HADOOP CURSO PRESENCIAL: ADMINISTRADOR HADOOP Información detallada del curso www.formacionhadoop.com El curso se desarrolla a lo largo de 4 semanas seguidas. Se trata de un curso formato ejecutivo que permite

Más detalles

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting NewPoint IT Consulting BIG DATA WHITE PAPER NewPoint Information Technology Consulting Contenido 1 Big Data: Reto y Oportunidad para la Empresa... 3 2 Los drivers Técnicos y de Negocio de BIG DATA... 9

Más detalles

Big Data. Análisis de herramientas y soluciones

Big Data. Análisis de herramientas y soluciones Big Data Análisis de herramientas y soluciones Big Data es el sector emergente dentro del área de las tecnologías de la información y la comunicación que se preocupa de cómo almacenar y tratar grandes

Más detalles

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD

Solución empresarial Hadoop de EMC. NAS de escalamiento horizontal Isilon y Greenplum HD Informe técnico Solución empresarial Hadoop de EMC NAS de escalamiento horizontal Isilon y Greenplum HD Por Julie Lockner, analista ejecutivo, y Terri McClure, analista ejecutivo Febrero de 2012 Este Informe

Más detalles

Como extender la capacidad Analítica conectando fuentes de datos Big Data en ArcGIS

Como extender la capacidad Analítica conectando fuentes de datos Big Data en ArcGIS Como extender la capacidad Analítica conectando fuentes de datos Big Data en ArcGIS César Rodríguez Reinaldo Cartagena Agenda Fundamentos para Big Data La Analítica y Big Data generar conocimiento ArcGIS

Más detalles

Software Libre para Aplicaciones de Big Data

Software Libre para Aplicaciones de Big Data Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! hope@aceptus.com Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs

Más detalles

3. Acceso granular a su información. 4. Información no estructurada. 5. Privilegios de accesos granulares. 6. Almacenamiento de conocimiento

3. Acceso granular a su información. 4. Información no estructurada. 5. Privilegios de accesos granulares. 6. Almacenamiento de conocimiento ÍNDICE 1. Introducción 2. Análisis Forense 3. Acceso granular a su información 4. Información no estructurada 5. Privilegios de accesos granulares 6. Almacenamiento de conocimiento 7. Patrones de comportamiento

Más detalles

Visión general CIUDADANO SECTOR PÚBLICO. Necesidades y servicios alineados. Toma de decisiones HERRAMIENTAS. Mejora de la trazabilidad del dato

Visión general CIUDADANO SECTOR PÚBLICO. Necesidades y servicios alineados. Toma de decisiones HERRAMIENTAS. Mejora de la trazabilidad del dato Plataforma DATUNE Solución Big Open Data para las administraciones que permite relacionar los datos del ciudadano y de los servicios públicos para una administración orientada a datos. Proyecto cofinanciado

Más detalles

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora Juan Carlos Olarte B Innovation and Business Development Management BIG DATA & ANALYTICS: El Futuro es Ahora Temas a Tratar Evolución y Tendencias Big Data & Analytics Data Mining, Data Science y Big Data

Más detalles

Monitorización de actividades de datos InfoSphere Guardium para Big Data

Monitorización de actividades de datos InfoSphere Guardium para Big Data Monitorización de actividades de datos InfoSphere Guardium para Big Data Amal Mashlab IBM Software Group, Information Management Responsable de Ventas de Gobierno de la Información para Europa Cumplir

Más detalles

Big Data Analytics: propuesta de una arquitectura

Big Data Analytics: propuesta de una arquitectura Big Data Analytics: propuesta de una arquitectura Jonathan Solano Rodriguez y Estefany Leiva Valverde Escuela de Ingeniería, Universidad Latinoamericana de Ciencia y Tecnología, ULACIT, Urbanización Tournón,

Más detalles

Diplomado en Big Data

Diplomado en Big Data 160 horas Diplomado en Big Data BROCHURE, 2015 Contenido Quienes somos?... 3 Presentación del Programa... 4 Perfíl del Facilitador. 5 Objetivos.. 6 Información General.. 7 Plan de Estudio... 8-9 Plan de

Más detalles

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data y Supercómputo Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data 2 Hasta qué cantidad de datos podemos procesar en nuestra

Más detalles

PINOT. La ingestión near real time desde Kafka complementado por la ingestión batch desde herramientas como Hadoop.

PINOT. La ingestión near real time desde Kafka complementado por la ingestión batch desde herramientas como Hadoop. PINOT Stratebi Paper (2015 info@stratebi.com www.stratebi.com) Pinot es la herramienta de análisis en tiempo real desarrollada por LinkedIn que la compañía ha liberado su código bajo licencia Apache 2.0,

Más detalles

Big Data y NO-SQL el futuro de la Arquitectura de Información

Big Data y NO-SQL el futuro de la Arquitectura de Información Big Data y NO-SQL el futuro de la Arquitectura de Información Jorge Mario Calvo L. EMPRENDEMICO = EMPRENdedor + academico http://jorgemariocalvo.net http://www.emprendemico.com Twitter: @Emprendemico Conocimiento

Más detalles

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN PARALELIZACIÓN DE UN ALGORITMO PARA LA DETECCIÓN DE CÚMULOS DE GALAXIAS MEMORIA PARA OPTAR AL

Más detalles

Especialista en Creación de Portales Web con Joomla 3.3

Especialista en Creación de Portales Web con Joomla 3.3 Especialista en Creación de Portales Web con Joomla 3.3 TITULACIÓN DE FORMACIÓN CONTINUA BONIFICADA EXPEDIDA POR EL INSTITUTO EUROPEO DE ESTUDIOS EMPRESARIALES Especialista en Creación de Portales Web

Más detalles

Una metodología basada en XML para la configuración y despliegue de aplicaciones DDS

Una metodología basada en XML para la configuración y despliegue de aplicaciones DDS Una metodología basada en XML para la configuración y despliegue de aplicaciones DDS Dirigido por Juan M. López Soler Departamento de Teoría de la Señal, Telemática Y Comunicaciones E.T.S. Ingenierías

Más detalles

Estamos inmersos en la era de la información, donde. Big data. Procesando los datos en la sociedad digital

Estamos inmersos en la era de la información, donde. Big data. Procesando los datos en la sociedad digital Big data Procesando los datos en la sociedad digital Francisco Herrera Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada Estamos inmersos en la era de la

Más detalles

COURSE: Computación Distribuida

COURSE: Computación Distribuida COURSE: Computación Distribuida DEGREE: Grado en Ingeniería en Tecnologías de Telecomunicación YEAR: 014/015 TERM: 1 La asignatura tiene 9 sesiones que se distribuyen a lo largo de 14 semanas. Los laboratorios

Más detalles

Integración de Metodologías Ágiles en el Desarrollo de un Sistema de Monitoreo Inalámbrico para Medir la Contaminación del Aire en Tiempo Real.

Integración de Metodologías Ágiles en el Desarrollo de un Sistema de Monitoreo Inalámbrico para Medir la Contaminación del Aire en Tiempo Real. Integración de Metodologías Ágiles en el Desarrollo de un Sistema de Monitoreo Inalámbrico para Medir la Contaminación del Aire en Tiempo Real. Walter Fuertes, Diego Carrera, César Villacís, Fernando Galárraga,

Más detalles

Jornadas INCATEC 2015

Jornadas INCATEC 2015 Jornadas INCATEC 2015 Dr. Pedro Nolasco Bonillo Ramos Ingeniero en Computación. USB Magíster en Ingeniería de Sistemas. USB Magíster en Gerencia de las Finanzas. UNY Doctor en Ciencias de la Computación.

Más detalles

Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com

Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com Contenidos Clúster de Investigación Aplicada Proyectos HPC Clúster Hadoop para tecnologías de BI Una nube privada para la Administración

Más detalles

Big Data. Analisís de grandes cantidades de datos. Sergio Marchena Quirós

Big Data. Analisís de grandes cantidades de datos. Sergio Marchena Quirós Big Data Analisís de grandes cantidades de datos Sergio Marchena Quirós Índice 1.0 Introducción...3 1.1 Objetivos del proyecto...3 1.1.1 Estudio Teórico...3 2.0 Big Data...3 2.1 las 5 V...3 2.2 Tipos de

Más detalles

PROYECTO SMART DESARROLLO SISTEMA GESTOR DE CONTENIDOS Y SERVIDOR DE ENTREGA DE CONTENIDOS DESCRIPCIÓN DE LA ARQUITECTURA

PROYECTO SMART DESARROLLO SISTEMA GESTOR DE CONTENIDOS Y SERVIDOR DE ENTREGA DE CONTENIDOS DESCRIPCIÓN DE LA ARQUITECTURA ESTRATEGIA 2011-2015 SUBPROGRAMA COMPETITIVIDAD I+D PROYECTO SMART DESARROLLO SISTEMA GESTOR DE CONTENIDOS Y SERVIDOR DE ENTREGA DE CONTENIDOS DESCRIPCIÓN DE LA ARQUITECTURA ÍNDICE 1 DESARROLLO SISTEMA

Más detalles

Ciclo Formativo de Grado Superior Desarrollo de Aplicaciones Web

Ciclo Formativo de Grado Superior Desarrollo de Aplicaciones Web Ciclo Formativo de Grado Superior Desarrollo de Aplicaciones Web Proyecto Propio de Ampliación con Programación de Dispositivos Móviles e Inteligentes Paseo de la Puerta del Ángel, s/n 28011 Madrid www.iesellago.net

Más detalles

Introducción a las bases de datos

Introducción a las bases de datos Introducción a las bases de datos Juan Ignacio Rodríguez de León Abstract Aplicaciones de los sistemas de bases de datos. Sistemas de bases de datos frente a sistemas de archivos. Visión de los datos.

Más detalles

Projecte/Treball Fi de Carrera

Projecte/Treball Fi de Carrera Projecte/Treball Fi de Carrera Estudi: Eng. Tècn. Informàtica de Gestió. Pla 2001 Títol: Catalogador de música MP3 y reproductor de música vía Web con búsquedas de música basadas en la definición de unas

Más detalles

MAPREDUCE EL MODELO DETRÁS DE

MAPREDUCE EL MODELO DETRÁS DE EL MODELO DETRÁS DE MAPREDUCE MapReduce es un modelo de programación orientado al procesamiento de grandes volúmenes de datos, desarrollado específicamente para sacar ventaja del poder de procesamiento

Más detalles

Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana Master Experto en Cloud Computing U-TAD

Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana Master Experto en Cloud Computing U-TAD Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana Master Experto en Cloud Computing U-TAD Proyecto Final Master Felix Rodriguez Araujo 1 DESCRIPCIÓN GLOBAL DEL PROYECTO 2 TECNOLOGÍAS USADAS 3 WORKFLOW

Más detalles

El ABC de Big Data: Analytics, Bandwidth and Content

El ABC de Big Data: Analytics, Bandwidth and Content Documento técnico El ABC de Big Data: Analytics, Bandwidth and Content Richard Treadway e Ingo Fuchs, NetApp, Noviembre de 2011 WP-7147 RESUMEN EJECUTIVO Las empresas entran en una nueva era en la que

Más detalles

Cómo aprovechar la potencia de la analítica avanzada con IBM Netezza

Cómo aprovechar la potencia de la analítica avanzada con IBM Netezza IBM Software Information Management White Paper Cómo aprovechar la potencia de la analítica avanzada con IBM Netezza Un enfoque de appliance simplifica el uso de la analítica avanzada Cómo aprovechar la

Más detalles

Motores de Búsqueda Web Tarea Tema 2

Motores de Búsqueda Web Tarea Tema 2 Motores de Búsqueda Web Tarea Tema 2 71454586A Motores de Búsqueda Web Máster en Lenguajes y Sistemas Informáticos - Tecnologías del Lenguaje en la Web UNED 30/01/2011 Tarea Tema 2 Enunciado del ejercicio

Más detalles

Módulo: Modelos de programación para Big Data

Módulo: Modelos de programación para Big Data Program. paralela/distribuida Módulo: Modelos de programación para Big Data (título original: Entornos de programación paralela basados en modelos/paradigmas) Fernando Pérez Costoya Introducción Big Data

Más detalles

Antes de imprimir este documento piense en el medio ambiente!

Antes de imprimir este documento piense en el medio ambiente! Versión 1.0 Página 1 de 14 1. OBJETIVO: Suministrar la metodología que se aplicará para la estimación de esfuerzo para los desarrollos nuevos en el ICBF, para lo cual se detallan los aspectos a tener en

Más detalles

CAMPAÑA DIGITAL PARA LOS MIEMBROS DEL PEN GUÍA SOBRE LAS HERRAMIENTAS DE INTERNET

CAMPAÑA DIGITAL PARA LOS MIEMBROS DEL PEN GUÍA SOBRE LAS HERRAMIENTAS DE INTERNET CAMPAÑA DIGITAL PARA LOS MIEMBROS DEL PEN GUÍA SOBRE LAS HERRAMIENTAS DE INTERNET Traducido por Victoria Corbellini COMO LOS CANALES DIGITALES SON IMPRESCINDIBLES A LA HORA DE DIFUNDIR UN MENSAJE DE CAMPAÑA

Más detalles

ACTI-Desarrollo de software interactivo Curso-Taller: Desarrollo de Aplicaciones para Móviles Plataforma ios / Avanzado

ACTI-Desarrollo de software interactivo Curso-Taller: Desarrollo de Aplicaciones para Móviles Plataforma ios / Avanzado ACTI-Desarrollo de software interactivo Curso-Taller: Desarrollo de Aplicaciones para Móviles Plataforma ios / Avanzado DESCRIPCIÓN DEL CURSO-TALLER En este curso-taller, el estudiante explora los principales

Más detalles

Diplomatura en Marketing Web

Diplomatura en Marketing Web Diplomatura en Marketing Web Introducción al Marketing Web Fundamentos Qué es el marketing? Cómo marcar un target? Publicidad tradicional Vs. Publicidad online Qué es el ROI? Conocer los objetivos: respuesta

Más detalles

Introducción a la Programación

Introducción a la Programación Descripción y Contenido del Curso Introducción a la Programación Capacity Academy Educación en Tecnología de la Información Online, Efectiva y Garantizada Qué aprenderá si toma este Curso? En este curso

Más detalles

Administración de Servicios de Internet

Administración de Servicios de Internet TITULACIÓN DE FORMACIÓN CONTINUA BONIFICADA EXPEDIDA POR EL INSTITUTO EUROPEO DE ESTUDIOS EMPRESARIALES Administración de Servicios de Internet Duración: 590 horas Precio: 0 * Modalidad: A distancia *

Más detalles

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Ana María Bisbé York Servicios Profesionales sp@danysoft.com 916 638683 www.danysoft.com Abril 2015 Sala 1 SQL Server

Más detalles

INSTITUTO TECNOLÓGICO SUPERIOR FISCOMISIONAL NUESTRA SEÑORA DEL ROSARIO. UTILIZACIÓN DE LA HERRAMIENTA PRTG NETWORK MONITOR Autores:

INSTITUTO TECNOLÓGICO SUPERIOR FISCOMISIONAL NUESTRA SEÑORA DEL ROSARIO. UTILIZACIÓN DE LA HERRAMIENTA PRTG NETWORK MONITOR Autores: 1 INSTITUTO TECNOLÓGICO SUPERIOR FISCOMISIONAL NUESTRA SEÑORA DEL ROSARIO UTILIZACIÓN DE LA HERRAMIENTA PRTG NETWORK MONITOR Autores: Aguilar Jiménez, Rita Ximena Pancha Quinaluisa, Miguel Antonio Coautora

Más detalles

PROTOCOLO DE REDES SOCIALES PARA LAS CUENTAS DE PODEMOS

PROTOCOLO DE REDES SOCIALES PARA LAS CUENTAS DE PODEMOS PROTOCOLO DE REDES SOCIALES PARA LAS CUENTAS DE PODEMOS Área de Redes Sociales del Consejo Ciudadano Estatal ÍNDICE 1. Área de Redes Sociales a. Definición b. Funciones c. Herramientas d. Administración

Más detalles

Base de Datos Orientado a Columnas

Base de Datos Orientado a Columnas Base de Datos Orientado a Columnas Adrián Garcete Ingeniería Informática Matricula: 057546 Universidad Católica Nuestra Señora de la Asunción Asunción - Paraguay Abstract. Este paper presenta, como su

Más detalles

Comprender un poco más de los que es Apache Pig y Hadoop. El tutorial de cerdo muestra cómo ejecutar dos scripts de cerdo en modo local y el

Comprender un poco más de los que es Apache Pig y Hadoop. El tutorial de cerdo muestra cómo ejecutar dos scripts de cerdo en modo local y el APACHE PIG CONTENIDO 1. Introducción 3 1.1. Apache Pig 3 1.2. Propiedades 4 1.3. Requisitos para Apache Pig 4 1.4. Instalación de Hadoop 5 1.5. Instalación de java 5 1.6. Instalación de Pig 6 1.7. Ejecución

Más detalles

INTRODUCCION A LAS BASES DE DATOS ESPACIALES

INTRODUCCION A LAS BASES DE DATOS ESPACIALES INTRODUCCION A LAS BASES DE DATOS ESPACIALES Índice Introducción Qué es un SIG? Arquitectura de un SIG La información n en un SIG Uso y aplicación n de los SIG Bases de datos Introducción Antecedentes:

Más detalles

Ponente Dr. Gabriel Guerrero. 8 de Diciembre de 2014 Tecnológico de Estudios Superiores de Chalco TESCHA

Ponente Dr. Gabriel Guerrero. 8 de Diciembre de 2014 Tecnológico de Estudios Superiores de Chalco TESCHA Conferencia Magistral Paradigma por utilizar el software LIBRE respecto al software LICENCIADO en el marco de la productividad y/o riesgo de una empresa. 8 de Diciembre de 2014 Tecnológico de Estudios

Más detalles

Piensa en grande. Francisco Daniel Carretero García 07 Abril 2014

Piensa en grande. Francisco Daniel Carretero García 07 Abril 2014 Piensa en grande Francisco Daniel Carretero García 07 Abril 2014 EMPEZAMOS POR EL FINAL Soy Matemático y: Tengo Mujer Soy Papá Tengo Trabajo,..y además me gusta. PIENSA EN GRANDE A pesar de las Matemáticas,

Más detalles

EL BIG DATA EN TWITTER #TICyTwitter

EL BIG DATA EN TWITTER #TICyTwitter Informe xxxxxxxxx EL BIG DATA EN TWITTER #TICyTwitter 1 MARZO 31 MAYO 2015 1 BIENVENIDO! Twittiment es una herramienta de monitorización que permite una aproximación diferente y novedosa al análisis de

Más detalles

Minería de datos en la nube. Patricia Rayón Villela

Minería de datos en la nube. Patricia Rayón Villela Minería de datos en la nube Patricia Rayón Villela 1 Contenido Big-Data BI en la nube Analítica Texto Video Visual 2 Big data Problemas que eran difíciles o imposibles de resolver antes de ahora son manejables.

Más detalles

Curso de Internet: Navegadores, Buscadores, Correo Electrónico, Redes Sociales y Antivirus

Curso de Internet: Navegadores, Buscadores, Correo Electrónico, Redes Sociales y Antivirus Curso de Internet: Navegadores, Buscadores, Correo Electrónico, Redes Sociales y Antivirus TITULACIÓN DE FORMACIÓN CONTINUA BONIFICADA EXPEDIDA POR EL INSTITUTO EUROPEO DE ESTUDIOS EMPRESARIALES Curso

Más detalles

HADOOP, como una plataforma de procesamiento masivo de datos

HADOOP, como una plataforma de procesamiento masivo de datos HADOOP, como una plataforma de procesamiento masivo de datos Esquema de Trabajo Objetivo Alcances Limitaciones Fundamentos Teóricos Análisis Preliminar Herramientas Estructura del Cluster Resultados Desarrollo

Más detalles

TFM Comunicación, Redes y Gestión de Contenidos

TFM Comunicación, Redes y Gestión de Contenidos TFM Comunicación, Redes y Gestión de Contenidos Aplicación móvil hibrida para control de asistencia y servicio técnico a domicilio y gestión de partes de trabajo Autor: Patricia Paguay Lara Tutorizado

Más detalles