Desmitificando Big Data:

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Desmitificando Big Data:"

Transcripción

1 Desmitificando Big Data: Data Mining y Business Intelligence 2.0 Ignacio Bustillo Fecha presentación: 14 de Noviembre de 2014

2 'Hello world!' Creador & Organizador Docente universitario

3

4

5 Desmitificando Big Data: Data Mining y Business Intelligence 2.0

6

7 Big Data como persona 2014

8

9

10

11 Qué es BigData?

12 Este concepto hace referencia a la acumulación masiva de datos. Otras denominaciones son datos masivos o datos a gran escala. En la literatura escrita en lengua hispana con frecuencia se utiliza el término en inglés Big data, como aparece en el ensayo de Viktor Schönberger Big data: La revolución de los datos masivos Wikipedia.org

13

14 Barreras tecnológicas en el procesamiento de grandes problemas

15 Supercomputador ALTAMIRA

16

17 Commodity Hardware = Low Cost = Uso masivo

18 Historia de tecnologías

19 TECNOLOGÍAS Apache KAFKA

20 TECNOLOGÍAS

21

22 CRONOGRAMA BIG DATA 2004

23 Un poco de historia Las primeras implementaciones de Google necesitaban realizar operaciones de multplicación de grandes matrices para calcular el PageRank La preocupación por tratar grandes colecciones de datos, llevó a crear algoritmos y frameworks capaces de poder procesar terabytes de información Una de las primeras aplicaciones capaces de programar MapReduce fue implementado y diseñado inicialmente por Doug Cutting

24 DISTRIBUCIÓN MAP REDUCE

25 10 Y en 2004 no había datos? Y los bancos? Y las ventas de supermercados?

26

27

28 Algo raro? No. Data Mining

29 1996 Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles que se encuentran ocultos en los datos (Fayyad y otros, 1996) From Data Mining to Knowledge Discovery in Databases

30 DATA MINING La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Las técnicas de la minería de datos provienen de la inteligencia artificial y de la estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Wikipedia.org

31 En 1993, la Universidad de Waikato de Nueva Zelanda inició el desarrollo de la versión original de Weka (en TCL/TK y C) 1993 Fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993.

32

33 Problema Single node. Y la distribución de algoritmos?

34 Nuevas Propuestas en BigData: DataMining 2.0

35 Nuevas Propuestas en BigData: DataMining 2.0

36 Nuevas Propuestas en BigData: DataMining 2.0

37 Nuevas Propuestas en BigData: DataMining 2.0

38 Nuevas Propuestas en BigData: DataMining 2.0

39 Nuevas Propuestas en BigData: DataMining 2.0

40 Nuevas Propuestas en BigData: DataMining 2.0

41 DATA MINING Algo más que el presente Y LA FOTO ACTUAL? BUSINESS INTELLIGENCE

42 In 1989, Howard Dresner expanded on the popular umbrella term "Business Intelligence (BI)", originally coined by Hans Peter Luhn in Dresner defined it to mean "concepts and methods to improve business decision making by using fact-based support systems". Not long after, in response to the need for better BI, companies such as Business Objects, Actuate, Crystal Reports, and MicroStrategy began to emerge, offering to report and analyze company data. Source: A Brief History of Decision Support Systems by D.J. Power Conceptos y métodos para mejorar la toma de decisiones basadas en hechos

43 BUSINESS INTELLIGENCE

44

45 Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios Solución BI completa permite: Observar: qué está ocurriendo? Comprender: por qué ocurre? Predecir: qué ocurriría? Colaborar. qué debería hacer el equipo? Decidir: qué camino se debe conseguir? Gestión del conocimiento Qué es lo que la empresa está buscando?

46 Un conjunto de prácticas tecnológicas, herramientas informáticas y conocimientos funcionales aplicados al negocio, que permiten estructurar el acceso a la información, y la información misma, para que sea utilizada en la toma de decisiones en cualquier nivel de una organización

47 Herramientas por doquier

48 Herramientas por doquier

49 20 Vendedores de humo

50

51

52 Big Data y Business Intelligence

53

54

55 Herramientas BI buscan actualizarse Creación de nuevos conectores: Manipulación de datos Visualización de datos El primero que lo tenga es el que tiene éxito

56

57 Pentaho Data Integration

58 Talend Open Studio

59 Los retos de las tecnologías tradicionales y las propuestas Big Data para procesamiento de datos

60 RETO 1: Almacenamiento. DBs Relacionales para todo?

61 Leer datos es costoso Realmente necesitamos transacciones para todo? Cómo escalamos? Todo dominio se representa bien en un modelo relacional?

62 Not Only SQL (NoSQL) Como respuesta a estos problemas surgió el paradigma NoSQL NoSQL no es un sustituto a las bases de datos relacionales busca otras opciones para escenarios específicos Es solo una forma de decir que no todos los problemas son clavos que pueden ser atacados con un RDBMS El desarrollador cuenta con un abanico de soluciones y puede elegir la mejor para su problema en específico Existen varias formas de NoSQL, que atacan los problema del escalamiento, performance y modelado de los datos de formas distintas.

63 Tipos de BD Big Data. Not Only SQL (NoSQL) Bases de datos orientadas a documentos Almacenes Key-Value Bases de datos orientadas a objetos Bases de datos orientadas a grafos No sustituyen al modelo relacional. Escenarios específicos.

64 DBs Clave-Valor Más simples en cuanto su uso VALOR guardado se almacena como un arreglo de bytes (BLOB) El tipo de contenido no es importante para la base de datos, solo la clave y el valor que tiene asociado No necesita definir un esquema (columnas, tipos de datos) para almacenar la información. Escalabilidad: de key X a X+100 en Server 1, de X+101 a X+200 a Server2

65 DBs orientadas a documentos Un almacén key-value con la excepción de que el valor no se guarda sólo como un campo binario, sino con un formato definido de forma tal que el servidor pueda entender la diferencia es que el campo binario puede ser entendido por la base de datos

66 DBs orientadas a objetos Se basan en el paradigma orientado a objetos y no en el modelo relacional No se basan en claves primarias sino en OID Pueden representar relaciones jerárquicas Las relaciones entre tablas son a través de punteros a objetos Las bases orientadas a objetos nunca tuvieron el impacto esperado, pero tienen varios nichos específicos como algunas aplicaciones de carácter científico

67 30 DBs orientadas a grafos Almacenan los datos en forma de grafo. Da importancia no solo a los datos, sino a las relaciones entre ellos Más eficiente navegar entre relaciones que en un modelo relacional Sólo son aprovechables si tu información se puede representar fácilmente como una red

68

69 RETO 2: Procesamiento Cómo procesamos la cantidad ingente de datos?

70 Supercomputador vs Cluster con commodity hardware

71

72

73 Las primeras implementaciones de Google necesitaban realizar operaciones de multplicación de grandes matrices para calcular el PageRank La preocupación por tratar grandes colecciones de datos, llevó a crear algoritmos y frameworks capaces de poder procesar terabytes de información con commodity HW Una de las primeras aplicaciones capaces de programar MapReduce fue implementado inicialmente en Hadoop, diseñado inicialmente por Doug Cutting

74

75 Divide y vencerás

76

77 Programación Java

78

79 Operaciones en disco (HD) Y la memoria?

80

81

82 DB COLUMN El viejo que revive

83 VS

84

85 RETO 3: Real Time Antes existía?

86 Real Time: Procesamiento

87

88 Real Time: Flujos y colas

89

90

91 Nuevos modelos de negocio Fomento distribución de datos: APIficación Fomento de enriquecimiento de soluciones analíticas Impulso al Cloud

92 Puntos geoposicionados

93 Menciones de marcas

94 Infraestructura Cloud y otros servicios

95

96

97 GRAN BENEFICIADO: OPEN SOURCE

98

99 NUEVOS EQUIPOS: DATA SCIENTIST

100

101

102 Big Data, Data Mining, Business Intelligence

103 Búsquedas en la web

104 Apariciones en noticias

105 Data Analytics vs Big Data

106 Búsquedas en la web

107 Apariciones en noticias

108 En Resumen

109 El procesamiento masivo de datos no es nuevo Diferentes planteamientos en resolución de problemas Nuevas propuestas tecnológicas. Evolución creciente Actualización de herramientas Fomento del Open Source Fomento del analytics Nuevas oportunidades de negocio Nuevas demandas en el sector (Data Scientist = todoterreno) Data Mining y Business Intelligence 2.0

110 Business Analytics y Data Mining son los procedimientos. Big Data es la tecnología.

111

112

Social Big Data. Ignacio Bustillo Ignacio.Bustillo@stratebi.com Twitter: @IgnacioBustillo Fecha presentación: 13 de Noviembre de 2014

Social Big Data. Ignacio Bustillo Ignacio.Bustillo@stratebi.com Twitter: @IgnacioBustillo Fecha presentación: 13 de Noviembre de 2014 Social Big Data Ignacio Bustillo Ignacio.Bustillo@stratebi.com Twitter: @IgnacioBustillo Fecha presentación: 13 de Noviembre de 2014 'Hello world!' Creador & Organizador Docente universitario El mundo

Más detalles

Conectores Pentaho Big Data Community VS Enterprise

Conectores Pentaho Big Data Community VS Enterprise Conectores Pentaho Big Data Community VS Enterprise Agosto 2014 Stratebi Business Solutions www.stratebi.com info@stratebi.com Índice 1. Resumen... 3 2. Introducción... 4 3. Objetivo... 4 4. Pentaho Community

Más detalles

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1

ÍNDICE. Introducción... Capítulo 1. Conceptos de Big Data... 1 ÍNDICE Introducción... XIII Capítulo 1. Conceptos de Big Data... 1 Definición, necesidad y características de Big Data... 1 Aplicaciones típicas de Big Data... 4 Patrones de detección del fraude... 4 Patrones

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

Introducción a la Minería de Datos (Data Mining)

Introducción a la Minería de Datos (Data Mining) a la Minería de Datos (Data Mining) IT-Nova Facultad de Ingeniería Informática y Telecomunicaciones Iván Amón Uribe, MSc Minería de Datos Diapositivas basadas parcialmente en material de Inteligencia Analítica

Más detalles

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones

Sistemas de Información para la Gestión. UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones UNIDAD 2: RECURSOS DE TI Información y Aplicaciones 1. La Información: Propiedades de la Información. Sistemas de Información. Bases de Datos. 2. Administración

Más detalles

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS

RECURSOS DE TI Aplicaciones - Bibliografía FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS Sistemas de Información para la Gestión UNIDAD 3: RECURSOS DE TECNOLOGÍA DE INFORMACIÓN Aplicaciones UNIDAD 2: RECURSOS DE TI Aplicaciones 1. Administración de bases de datos e información: Sistemas de

Más detalles

Diplomado en Big Data

Diplomado en Big Data 160 horas Diplomado en Big Data BROCHURE, 2015 Contenido Quienes somos?... 3 Presentación del Programa... 4 Perfíl del Facilitador. 5 Objetivos.. 6 Información General.. 7 Plan de Estudio... 8-9 Plan de

Más detalles

Big Data. Rodolfo Campos http://www.smartcamp.es/~camposer/tecnocom/bigdata

Big Data. Rodolfo Campos http://www.smartcamp.es/~camposer/tecnocom/bigdata Big Data Rodolfo Campos http://www.smartcamp.es/~camposer/tecnocom/bigdata Madrid, Mayo de 2013 Agenda 1. Introducción a Big Data. 1.1. Definición / Justificación 1.2. Casos de Uso 2. NoSQL 1.1. Orientadas

Más detalles

Conceptos básicos de Big Data

Conceptos básicos de Big Data Conceptos básicos de Big Data Este documento no podrá ser reproducido, total o parcialmente, sin el permiso expreso de TRC Informática, S.L. Correos electrónicos, mensajes de textos, datos en formularios

Más detalles

Big Data y NO-SQL el futuro de la Arquitectura de Información

Big Data y NO-SQL el futuro de la Arquitectura de Información Big Data y NO-SQL el futuro de la Arquitectura de Información Jorge Mario Calvo L. EMPRENDEMICO = EMPRENdedor + academico http://jorgemariocalvo.net http://www.emprendemico.com Twitter: @Emprendemico Conocimiento

Más detalles

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

XII Encuentro Danysoft en Microsoft Abril 2015. Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código Ana María Bisbé York Servicios Profesionales sp@danysoft.com 916 638683 www.danysoft.com Abril 2015 Sala 1 SQL Server

Más detalles

BUSINESS INTELLIGENCE Y REDSHIFT

BUSINESS INTELLIGENCE Y REDSHIFT Whitepaper BUSINESS INTELLIGENCE Y REDSHIFT BEE PART OF THE CHANGE hablemos@beeva.com www.beeva.com LAS SOLUCIONES QUE TU BI NECESITA Con Amazon Web Services (AWS) es posible disponer con solo unos clics

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

CLOUD & BIG DATA. Trabajando el CLOUD, explotando BIG DATA. Cómo pueden ayudarnos estas tecnologías?. Convivimos con ellas?.

CLOUD & BIG DATA. Trabajando el CLOUD, explotando BIG DATA. Cómo pueden ayudarnos estas tecnologías?. Convivimos con ellas?. CLOUD & BIG DATA Trabajando el CLOUD, explotando BIG DATA. Cómo pueden ayudarnos estas tecnologías?. Convivimos con ellas?. Índice. (I) Introducción. Qué es CLOUD. Tipos de CLOUD. Pública. Privada. Comunitaria.

Más detalles

POSTGRADO. Ingeniería EXPERTO EN BIG DATA

POSTGRADO. Ingeniería EXPERTO EN BIG DATA POSTGRADO Ingeniería EXPERTO EN BIG DATA Data analytics Bases de datos NoSQL Hadoop Spark Map/Reduce Diseño de modelo de datos Integración con Data Warehouse Business intelligence Knowledge discovery Proceso

Más detalles

Big Data Analytics: propuesta de una arquitectura

Big Data Analytics: propuesta de una arquitectura Big Data Analytics: propuesta de una arquitectura Jonathan Solano Rodriguez y Estefany Leiva Valverde Escuela de Ingeniería, Universidad Latinoamericana de Ciencia y Tecnología, ULACIT, Urbanización Tournón,

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López

APACHE HADOOP. Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López APACHE HADOOP Daniel Portela Paz Javier Villarreal García Luis Barroso Vázquez Álvaro Guzmán López Objetivos 1. Qué es Apache Hadoop? 2. Funcionalidad 2.1. Map/Reduce 2.2. HDFS 3. Casos prácticos 4. Hadoop

Más detalles

Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público.

Esta solución de fácil uso está orientada a cualquier industria, ya sea una empresa del sector privado o del sector público. 1 En la actualidad el 80% de la información de una empresa está relacionada a un lugar. La variable de ubicación está presente en todas las áreas críticas de un negocio. Sin embargo, las organizaciones

Más detalles

Business Intelligence

Business Intelligence 2012 Business Intelligence Agenda Programas Diferencias de OLTP vs OLAP Arquitectura de una solución de BI Tecnologías Microsoft para BI Diferencias entre OLTP v/s OLAP Alineación de Datos OLTP Datos organizados

Más detalles

EL DATA SCIENTIST MAS QUE UNA MODA

EL DATA SCIENTIST MAS QUE UNA MODA EL DATA SCIENTIST MAS QUE UNA MODA JULIO 2015 AGENDA Origen y Evolución Qué conocimientos y skills deben tener? Cómo son los actuales Data Scientist? Dónde están ubicados en las empresas? SAS Data Scientist

Más detalles

SQL SERVER 2008 R2 BI 07/07/2010 BUSINESS INTELLIGENCE

SQL SERVER 2008 R2 BI 07/07/2010 BUSINESS INTELLIGENCE Todo en la vida comienza con código VII Encuentro Desarrolladores Microsoft BUSINESS INTELLIGENCE Ana María Bisbé York Servicios Profesionales VII Encuentro Desarrolladores Microsoft Todo en la vida comienza

Más detalles

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql

The H Hour: Hadoop The awakening of the BigData. Antonio Soto SolidQ COO asoto@solidq.com @antoniosql The H Hour: Hadoop The awakening of the BigData Antonio Soto SolidQ COO asoto@solidq.com @antoniosql Tendencias de la Industria El nuevo rol del operador El operador de ayer Sigue el proceso basado en

Más detalles

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,

Más detalles

Máster. en Inteligencia de Negocios

Máster. en Inteligencia de Negocios Máster en Inteligencia de Negocios Máster en Inteligencia de Negocios Este máster se presenta como un programa muy equilibrado que abarca todos los aspectos de la estrategia, la gestión, la implementación

Más detalles

Yatel - OLAP sobre redes

Yatel - OLAP sobre redes Yatel - OLAP sobre redes Integrantes - García, Mario Alejandro - Cabral, Juan Bautista - Gimenez Pecci, María de la Paz - Vera, Carlos - Liberal, Rodrigo - Laguna, Irma Graciela - Bisonard, Eduardo Matías

Más detalles

Máster. en en Business Intelligence

Máster. en en Business Intelligence Máster en en Business Intelligence Máster en Business Intelligence Este máster se presenta como un programa muy equilibrado que abarca todos los aspectos de la estrategia, la gestión, la implementación

Más detalles

Minería de datos en la nube. Patricia Rayón Villela

Minería de datos en la nube. Patricia Rayón Villela Minería de datos en la nube Patricia Rayón Villela 1 Contenido Big-Data BI en la nube Analítica Texto Video Visual 2 Big data Problemas que eran difíciles o imposibles de resolver antes de ahora son manejables.

Más detalles

Unidad 5. Conceptos y Estructuras de Archivos

Unidad 5. Conceptos y Estructuras de Archivos Unidad 5 Conceptos y Estructuras de Archivos En todos los tiempos y más aún en la era en que vivimos, el hombre tiene cada vez mas necesidad de consultar una mayor cantidad de información para poder desarrollar

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

SpagoBI Open Source Business Intelligence

SpagoBI Open Source Business Intelligence SpagoBI Open Source Business Intelligence La plataforma SpagoBI Open Source Business Intelligence Conceptos Inteligencia empresarial (Business Intelligence) es un agregado de aplicaciones y herramientas

Más detalles

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data y Supercómputo Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data 2 Hasta qué cantidad de datos podemos procesar en nuestra

Más detalles

Software Libre para Aplicaciones de Big Data

Software Libre para Aplicaciones de Big Data Software Libre para Aplicaciones de Big Data Club de Investigación Tecnológica San José, Costa Rica 2014.07.16 Theodore Hope! hope@aceptus.com Big Data: Qué es?! Conjuntos de datos de: " Alto volumen (TBs

Más detalles

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto

Más detalles

Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com

Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com Facultad Politécnica UNA Ing. Julio Paciello juliopaciello@gmail.com Contenidos Clúster de Investigación Aplicada Proyectos HPC Clúster Hadoop para tecnologías de BI Una nube privada para la Administración

Más detalles

v.1.0 Clase 1 Docente: Gustavo Valencia Zapata

v.1.0 Clase 1 Docente: Gustavo Valencia Zapata v.1.0 Clase 1 Docente: Gustavo Valencia Zapata Temas Clase 1: Introducción a la Inteligencia de Negocios Hitos y personajes Arquitectura de BI Evolución de la Información Inteligencia de Negocios (BI)

Más detalles

Qué significa Hadoop en el mundo del Big Data?

Qué significa Hadoop en el mundo del Big Data? Qué significa Hadoop en el mundo del Big Data? Un contenido para perfiles técnicos 2 ÍNDICE Qué significa Hadoop en el Universo Big Data?.... 3 El planteamiento: big data y data science.... 3 Los desafíos

Más detalles

Sistemas de Información para la Gestión

Sistemas de Información para la Gestión Sistemas de Información para la Gestión UNIDAD 3: RECURSOS DE TECNOLOGÍA DE INFORMACIÓN Aplicaciones UNIDAD 3: RECURSOS DE TI Aplicaciones 1. Administración de bases de datos e información: Sistemas de

Más detalles

curso PROYECTOS BIG DATA aplicados a la investigación y el Marketing 25 y 26 de Noviembre de 2014 de 9 a 14 h. madrid

curso PROYECTOS BIG DATA aplicados a la investigación y el Marketing 25 y 26 de Noviembre de 2014 de 9 a 14 h. madrid curso desarrollo de PROYECTOS BIG DATA aplicados a la investigación y el Marketing 25 y 26 de Noviembre de 2014 de 9 a 14 h. madrid Descripción del curso Curso-taller de formación para comprender las tecnologías

Más detalles

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos Published on Dataprix (http://www.dataprix.com) Principal > Artículos de Minería de Datos de Dataprix By Dataprix Created 26/12/2009-17:13 Artículos de Minería de Datos de Dataprix Introducción a la minería

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server

Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server Cenfotec ofrece talleres de preparación para la certificación internacional de Microsoft SQL Server Sobre el Profesor Master en Tecnologías de Bases de Datos (Administración de Bases de Datos e Inteligencia

Más detalles

IBM Power Systems con Saytel. El motor para obtener información de valor de la forma más rápida

IBM Power Systems con Saytel. El motor para obtener información de valor de la forma más rápida IBM Power Systems con Saytel El motor para obtener información de valor de la forma más rápida El motor para obtener información de valor de la forma más rápida Los nuevos requerimientos cloud, analítica,

Más detalles

Clase 1 Módulo: Data Warehouse & Datamart Docente: Gustavo Valencia Zapata

Clase 1 Módulo: Data Warehouse & Datamart  Docente: Gustavo Valencia Zapata v.1.0 Clase 1 Docente: Gustavo Valencia Zapata Temas Clase 1: El Rol de TI en BI BI Retos de TI en BI Evolución de la Información Arquitectura de BI Referencias www.gustavovalencia.com Evolución de la

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Sistemas de Información para la Gestión UNIDAD 2: Infraestructura de Tecnología de la Información Unidad 2 Infraestructura de Tecnología de la Información Estructura de TI y tecnologías emergentes. Estructura

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

Soluciones Integrales en Inteligencia de Negocios

Soluciones Integrales en Inteligencia de Negocios Soluciones Integrales en Inteligencia de Negocios QUIENES SOMOS NUESTRA MISIÓN DATAWAREHOUSE MINERÍA DE DATOS MODELOS PREDICTIVOS REPORTERÍA Y DASHBOARD DESARROLLO DE APLICACIONES MODELOS DE SIMULACIÓN

Más detalles

Fernando Gutiérrez-Cabello. Data Discovery y visualizaciones en MicroStrategy 10

Fernando Gutiérrez-Cabello. Data Discovery y visualizaciones en MicroStrategy 10 Fernando Gutiérrez-Cabello Data Discovery y visualizaciones en MicroStrategy 10 Clientes Beta de MicroStrategy 10 Por primera vez, MicroStrategy 10 ofrece una plataforma de analítica que combina una experiencia

Más detalles

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica

Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica Fundamentos Título de de Big la Data presentación utilizando MATLAB Yersinio Jiménez Campos Analista de datos Banco Nacional de Costa Rica 1 Agenda Qué es Big Data? Buenas prácticas en el manejo de memoria.

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

SAS Data Scientist. Plan de Formación

SAS Data Scientist. Plan de Formación SAS Data Scientist Plan de Formación www.sas.com/spain/formacion Juan Lorenzo, Director del Plan de Formación juan.lorenzo@sas.com formacion@sas.com Tel: +34 91 200 73 00 BIG DATA EL NUEVO RETO EN LAS

Más detalles

BIG DATA MARÍA PARRA AMAT. Almería, 5 junio 2015

BIG DATA MARÍA PARRA AMAT. Almería, 5 junio 2015 BIG DATA MARÍA PARRA AMAT Almería, 5 junio 2015 BIG DATA "Petróleo del XXI" Nuevo enfoque en el entendimiento y la toma de decisiones Conjunto de técnicas y herramientas ORIGEN Estadística Metodologías

Más detalles

Introducción a Big Data Analytics

Introducción a Big Data Analytics Introducción a Big Data Analytics Luis Zamora - Sales Manager Iberia Greenplum Pedro Algaba - EMC Greenplum Solutions Architect 1 BIG DATA: Retos y Requerimientos Big Data Analytics plantea unos requerimientos

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

Fundamentos de la Inteligencia de Negocios

Fundamentos de la Inteligencia de Negocios Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Sistemas de Información para la Gestión Fundamentos de la Inteligencia de Negocios Administración de Bases de Datos e

Más detalles

Big Data y Manejo de Datos Maestros

Big Data y Manejo de Datos Maestros Objetivos 1.- El alumno identificará el contexto, la problemática y utilizará diversas herramientas de Manejo de Datos Maestros. Esto permitirá formarse un criterio sobre cómo implementar un proyecto de

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

Hadoop. Cómo vender un cluster Hadoop?

Hadoop. Cómo vender un cluster Hadoop? Hadoop Cómo vender un cluster Hadoop? ÍNDICE Problema Big Data Qué es Hadoop? Descripción HDSF Map Reduce Componentes de Hadoop Hardware Software 3 EL PROBLEMA BIG DATA ANTES Los datos los generaban las

Más detalles

Visión general CIUDADANO SECTOR PÚBLICO. Necesidades y servicios alineados. Toma de decisiones HERRAMIENTAS. Mejora de la trazabilidad del dato

Visión general CIUDADANO SECTOR PÚBLICO. Necesidades y servicios alineados. Toma de decisiones HERRAMIENTAS. Mejora de la trazabilidad del dato Plataforma DATUNE Solución Big Open Data para las administraciones que permite relacionar los datos del ciudadano y de los servicios públicos para una administración orientada a datos. Proyecto cofinanciado

Más detalles

Jornadas INCATEC 2015

Jornadas INCATEC 2015 Jornadas INCATEC 2015 Dr. Pedro Nolasco Bonillo Ramos Ingeniero en Computación. USB Magíster en Ingeniería de Sistemas. USB Magíster en Gerencia de las Finanzas. UNY Doctor en Ciencias de la Computación.

Más detalles

Inteligencia de Negocios (Business Intelligence)

Inteligencia de Negocios (Business Intelligence) ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS Programa de Pregrado Modalidad de Experiencia Laboral Artículo El uso de la Minería de Datos en la Inteligencia de Negocios (Business Intelligence)

Más detalles

Sistema de Asignación de Riesgos Crediticios

Sistema de Asignación de Riesgos Crediticios Sistema de Asignación de Riesgos Crediticios Quienes somos Propuesta de Asignación de Riesgos Crediticios (Credit Scoring) CONTENIDO QUIENES SOMOS Matrix Data Labs es una Unidad de Negocios de Matrix CPM

Más detalles

ROL DE LA INTEROPERABILIDAD EN BIG DATA, PORQUE NO TODAS LAS FUENTES DE DATOS SON IGUALES. Marta González

ROL DE LA INTEROPERABILIDAD EN BIG DATA, PORQUE NO TODAS LAS FUENTES DE DATOS SON IGUALES. Marta González ROL DE LA INTEROPERABILIDAD EN BIG DATA, PORQUE NO TODAS LAS FUENTES DE DATOS SON IGUALES Marta González BENEFICIOS Medios de Comunicación- Redes Sociales Comercio Electrónico/Distribución Telecomunicaciones

Más detalles

Big Data con nombres propios

Big Data con nombres propios Febrero 2014 Big Data con Al hablar de tecnología Big Data se está obligado, sin duda alguna, a hablar de programación paralela y procesamiento distribuido, ya que éstas serán las características que permitirán

Más detalles

Microsoft SQL Server Conceptos.

Microsoft SQL Server Conceptos. Microsoft Conceptos. Microsoft 2005 es una plataforma de base de datos a gran escala de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP). La siguiente tabla muestra

Más detalles

Cocinando con Big Data

Cocinando con Big Data Cocinando con Big Data Javier Sánchez BDM Big Data jsanchez@flytech.es 91.300.51.09 21/11/2013 Javier Sánchez 1 Agenda Qué es Big Data? Receta Punto de Partida Para qué Big Data? Conclusiones 21/11/2013

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

INTELIGENCIA DE NEGOCIO 2014-2015

INTELIGENCIA DE NEGOCIO 2014-2015 INTELIGENCIA DE NEGOCIO 2014-2015 Tema 1. Introducción a la Inteligencia de Negocio Tema 2. Retos en Inteligencia de Negocio Tema 3. Minería de Datos. Ciencia de Datos Tema 4. Modelos de Predicción: Clasificación,

Más detalles

Habilitando la empresa ágil a través de datos unificados La travesía hacia la plataforma de datos analítico-transaccionales

Habilitando la empresa ágil a través de datos unificados La travesía hacia la plataforma de datos analítico-transaccionales Habilitando la empresa ágil a través de datos unificados Agosto de 2015 Cómo se utilizan los datos hoy Los datos analíticos se derivan y separan a partir de datos transaccionales. Requieren bases de datos

Más detalles

Bases de Datos Avanzadas Introducción Curso Maestría

Bases de Datos Avanzadas Introducción Curso Maestría Bases de Datos Avanzadas Introducción Curso Maestría Por Elizabeth León Guzmán, Ph.D. Profesora Asociada Ingeniería de Sistemas Grupo de Investigación MIDAS Agenda 1. Qué son Bases de Datos? Datos, Información,

Más detalles

Big Data y BAM con WSO2

Big Data y BAM con WSO2 Mayo 2014 Big Data y BAM con Leonardo Torres Centro Experto en SOA/BPM en atsistemas ofrece una completa suite de productos Open Source SOA y son contribuidores de muchos de los productos de Apache, como

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Módulo: Modelos de programación para Big Data

Módulo: Modelos de programación para Big Data Program. paralela/distribuida Módulo: Modelos de programación para Big Data (título original: Entornos de programación paralela basados en modelos/paradigmas) Fernando Pérez Costoya Introducción Big Data

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora

Juan Carlos Olarte B Innovation and Business Development Management. BIG DATA & ANALYTICS: El Futuro es Ahora Juan Carlos Olarte B Innovation and Business Development Management BIG DATA & ANALYTICS: El Futuro es Ahora Temas a Tratar Evolución y Tendencias Big Data & Analytics Data Mining, Data Science y Big Data

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas

Sistemas de Información para la Gestión. Unidad 3 Aplicaciones de Sistemas para la Gestión Unidad 3 Aplicaciones de Sistemas U.N.Sa. Facultad de Cs.Económicas SIG 2010 UNIDAD 3: APLICACIONES DE SISTEMAS Aplicaciones empresariales: Sistemas empresariales. Sistemas de administración

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2

INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Programa de Capacitación y Certificación. INTELIGENCIA DE NEGOCIOS CON SQL SERVER 2008 R2 Contenido PERFIL DE UN ESPECIALISTA EN BASES DE DATOS.... 3 6231. MANTENIENDO UNA BASE DE DATOS DE SQL SERVER 2008

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Petabytes de información: Repensando el modelamiento de base de datos. Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008

Petabytes de información: Repensando el modelamiento de base de datos. Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008 Petabytes de información: Repensando el modelamiento de base de datos Ernesto Quiñones Azcárate ernestoq@apesol.org Presidencia Apesol 2006 2008 Modelos de bases de datos para todos los gustos (según la

Más detalles

How organizations are influenced by Business Analytics? Octubre 2014

How organizations are influenced by Business Analytics? Octubre 2014 How organizations are influenced by Business Analytics? Octubre 2014 El boom de los datos Fuente: Gestión. Artículo: Big Data: La nueva moneda en el mundo de los negocios. Martes, 07 de octubre del 2014

Más detalles

Sistema de Asignación de Riesgos Crediticios

Sistema de Asignación de Riesgos Crediticios Sistema de Asignación de Riesgos Crediticios Quienes somos Propuesta de Asignación de Riesgos Crediticios (Credit Scoring) CONTENIDO QUIENES SOMOS Matrix Data Labs es una Unidad de Negocios de Matrix CPM

Más detalles

Roadmap para la adopción de nuevas arquitecturas de información

Roadmap para la adopción de nuevas arquitecturas de información Roadmap para la adopción de nuevas arquitecturas de información Qué es Big Data..? es el nombre que se le da a conjuntos de información que crecen de una manera tan exponencial que resulta prohibitivo

Más detalles

Viernes 17 de Octubre de 2014

Viernes 17 de Octubre de 2014 Visualización de Información & Analytics: Una escueta Introducción Viernes 17 de Octubre de 2014 Estanislao Martin Irigoyen Director Inteligentia El objetivo de esta charla es dejar a los asistentes un

Más detalles

Sybase IQ Servidor analítico con arquitectura basada en columnas

Sybase IQ Servidor analítico con arquitectura basada en columnas Sybase IQ Servidor analítico con arquitectura basada en columnas www.sybase.es Sybase IQ Descripción Tener acceso a toda la información de que dispone su organización, con el fin de analizarla no es hoy

Más detalles

Novedades en Crystal Reports XI

Novedades en Crystal Reports XI Novedades en Crystal Reports XI Introducción Introducción Esta sección proporciona información de alto nivel sobre los componentes, las funciones y las ventajas que ofrece la última versión de Crystal

Más detalles

DATA WAREHOUSE DATA WAREHOUSE

DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE DATA WAREHOUSE Autor: Roberto Abajo Alonso Asignatura: Sistemas Inteligentes, 5º Curso Profesor: José Carlos González Dep. Ing. Sistemas Telemáticos, E.T.S.I. Telecomunicación Universidad

Más detalles

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico

Alicia Iriberri Dirección de Tecnologías de Información. I.- Definición del foco estratégico Alicia Iriberri Dirección de Tecnologías de Información I.- Definición del foco estratégico II.- Establecimiento de mediciones a través del Balanced Scorecard (Tablero de Comando) III.- Despliegue del

Más detalles

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source Inteligencia Artificial y Seguridad Informática en plataformas Open Source Jornadas de Software Libre y Seguridad Informática Santa Rosa La Pampa 4 y 5 de Diciembre de 2009 AGENDA Primera Parte Definiciones

Más detalles

Google BigQuery. Luis Villalba 59191

Google BigQuery. Luis Villalba 59191 Google BigQuery Luis Villalba 59191 Universidad Católica de Asunción, Departamento de Ciencias y Tecnologías, Sede Santa Librada, Asunción, Paraguay villalba.luifer@gmail.com Abstract. En este paper estaremos

Más detalles

Convierta sus datos en conocimiento para generar utilidades.

Convierta sus datos en conocimiento para generar utilidades. Microsoft SQL Server Business Intelligence ofrece una plataforma integral fortaleciendo a las organizaciones para construir y desplegar soluciones de BI seguras, escalables y manejables. Convierta sus

Más detalles

Especialización en bases de datos, Datamining y data Warehouse

Especialización en bases de datos, Datamining y data Warehouse Especialización en bases de datos, Datamining y data Warehouse Especialización en bases de datos, El uso y la gestión de la información de la empresa y de su entorno para mejorar la toma de decisiones,

Más detalles

OLAP y Minería de Datos: Introducción

OLAP y Minería de Datos: Introducción OLAP y Minería de Datos: Introducción Carlos Hurtado L. churtado@dcc.uchile.cl Departamento de Ciencias de la Computación Universidad de Chile OLAP y Minería de Datos: Introducción, DCC, U. de Chile, 2do

Más detalles

SISTEMAS DE SOPORTE GERENCIAL

SISTEMAS DE SOPORTE GERENCIAL Logros del Curso SISTEMAS DE SOPORTE GERENCIAL Profesor: Ing. Jaime Urbina P. Ciclo : 2009-01 E-mail : pcsijurb@upc.edu.pe El alumno diseña proyectos de soporte a la toma de decisiones; además evalúa alternativas

Más detalles

Permita que sus datos le cuenten la historia con SAP Lumira. Arturo Flórez Solution Advisor / MQA Abril 10, 2014

Permita que sus datos le cuenten la historia con SAP Lumira. Arturo Flórez Solution Advisor / MQA Abril 10, 2014 Permita que sus datos le cuenten la historia con SAP Lumira Arturo Flórez Solution Advisor / MQA Abril 10, 2014 Agenda Qué es SAP Lumira? Quiénes se benefician dentro de la organización? Capacidades Versiones

Más detalles

Especialidad en Sistemas de Información

Especialidad en Sistemas de Información Grado en Ingeniería Informática Especialidad en Sistemas de Información 26-5-2014 Sistemas de Información Enlazar los ámbitos técnicos y de gestión para mejorar los procesos de las organizaciones con el

Más detalles