Sistemas de Información para la Gestión UNIDAD 3: RECURSOS DE TECNOLOGÍA DE INFORMACIÓN Aplicaciones UNIDAD 2: RECURSOS DE TI Aplicaciones 1. Administración de bases de datos e información: Sistemas de administración de bases de datos. 2. Administración del conocimiento. Sistemas de administración del conocimiento. Técnicas inteligentes. 3. Aplicaciones empresariales: Sistemas de planificación de recursos empresariales ERP. 1 2 RECURSOS DE TI Aplicaciones - Bibliografía SITUACIÓN ACTUAL: BIG DATA 3.1. Laudon y Laudon Parte II Cap6 LyL225 238 LyL245 248 P RecursosTI - Aplicaciones 3.2. Laudon y Laudon Parte II Cap8 LyL238 243 3 4
INUNDADOS POR LOS DATOS Cada vez se generan más datos: Bancos, telecom, otras transacciones comerciales... Datos científicos: astronomía, biología, Web, texto y comercio electrónico EJEMPLOS DE GRANDES CANTIDADES DE DATOS Very Long Baseline Interferometry en Europa (VLBI) 16 telescopios cada uno produce 1 Gigabit/secondde datos astronómicos durante una sesión de observación de 25 días problemas de almacenamiento y análisis AT&T gestiona billones de llamadas al día tantos datos que no pueden ser almacenados todos el análisis debe hacerse a medida que llegan los datos (datos en streaming) 5 6 LAS BDsMÁS GRANDES EN 2012 MONTONES DE DATOS EN TODAS PARTES 1. TheWorldData Centre forclimate(alemania): 220 TB + 6 PB 2. National Energy Research Scientific computing Center (EEUU): 2,8 PB 3. AT&T 4. Google: búsquedas 5. Sprint 6. Lexix Nexis: 250 TB de datos personales (incluye ADN) 7. YouTube. 8. Amazon: datos de 59 millones de clientes, 250000 libros completos 9. CIA. 10. Biblioteca del Congreso de EEUU. Enorme crecimiento en BDs comerciales y científicas debidas a avances en las tecnologías de generación y captura de datos Nuevo mantra: recoge los datos que puedas donde puedas y cuando puedas. Expectativas: los datos recogidos tendrán valor, para el propósito por el que se recogieron o para otro no evidente todavía. Seguridad nacional Datos geo espaciales Redes de sensores Negocios Simulaciones por computadora 7 http://www.siliconindia.com/news/enterpriseit/top-10-largest-databases-in-the-world-nid-118841-cid-7.html 8
Big Data El primer cuestionamiento que posiblemente llegue a su mente en este momento es Qué es Big Data y porqué se ha vuelto tan importante? Big Data Pues bien, en términos generales podríamos referirnos como a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi-estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos relacional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. 9 10 Big Data Sin embargo, Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos. Entonces Cuánto es demasiada información de manera que sea elegible para ser procesada y analizada utilizando Big Data? Analicemos primeramente en términos de bytes: Gigabyte = 10 9 = 1.000.000.000 Terabyte = 10 12 = 1.000.000.000.000 Petabyte = 10 15 = 1.000.000.000.000.000 Exabyte = 10 18 = 1.000.000.000.000.000.000 USO DE BD PARA MEJORAR EL DESEMPEÑO EMPRESARIAL 11 12
Escenario actual Contamos con un conjunto de tecnologías avanzadas que nos permiten integrar y analizar información de bancos de datos. Para obtener: sus tendencias, para segmentar la información o para encontrar la correlación en los datos. Con el objeto de generar acciones con valor agregado para el negocio. Expectativas Necesitamos: la integraciónde herramientas avanzadas con los datos, procesos de generación de conocimiento y la segmentación de la información para obtener tendencias e información oculta. 13 14 La solución? Todo esto se hace para lograr lo que denominamos: FUNDAMENTOS DE LA INTELIGENCIA DE NEGOCIOS Administración de Bases de Datos e Información Gestión del Conocimiento Business Intelligence 15 16
Business Intelligence System es Business Intelligence System un conjunto sofisticado de Herramientas y Tecnologías; que brindan soporte a todas las fases del proceso de toma de decisiones de los ejecutivos; con el objeto de mejorar las ventajas competitivasde la organización, a través de mejores decisiones y que son utilizadas por los llamados Trabajadores del Conocimiento. Howard Dresner( The Gartner Group ) Aplicaciones de computación que interpretan datos históricos, analizan tendencias y miden performance y queestánorientadasaservirdesoportealosprocesosde toma de decisiones 17 18 Business Intelligence es la Realización eficiente de todas las actividades relacionadas con la generación, extracción, organización, análisis, compartición y distribución del conocimiento de una organización. Requerimientos Capacidades y herramientas especiales para analizar extensas cantidades de datos. acceder a datos desde múltiples sistemas. 19 20
Requerimientos Requerimientos Tiempo Producto Análisis multidimensional Año, Meses, Semanas, Días,... Rubro, Artículo, Calidad,... almacenamiento de datos. herramientas de análisis predictivo y minería de datos. descubrimiento del conocimiento. Geográfica Zona, Sucursales,... 21 22 Herramientas o Procesos OLAP vs OLTP OLAP (On-Line Analytical Processing): Agilizan la consulta de grandes cantidades de datos. Permiten análisis multidimensional. Utilizado por analistas. DATA WAREHOUSE OLTP(On-Line Transactional Processing): Entrada de datos y recuperación y procesamiento de transacciones. Acceso masivo. 23 24
Almacén de Datos Data Warehouse El Data Warehousees una colección de datos orientados al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión. Using the Data Warehouse of Bill Inmon 10 Claves para el éxito en la implementación de un Data Warehouse/ Mart 1. Desarrolle la cadena patrocinante correcta. 2. Asegúrese de que su Gerente de Data Warehousing entienda las necesidades comerciales de los usuarios. 3. Trate de anticiparse a los problemas políticos que pudieran obstruir el proyecto. 4. Cargue el Data Warehouse/ Data Martsólo con los datos que necesita. 5. Entienda la diferencia entre desarrollar una BD para un DWHy desarrollarla para procesamiento de transacciones. 25 26 10 Claves para el éxito en la implementación de un Data Warehouse/ Mart Es necesario que todas las Organizaciones implementen un DWH? 6. Tienda sus redes más allá de datos orientados a registros. 7. Provea a los usuarios definiciones de datos claras y herramientas fáciles de utilizar para ayudarlos a comenzar. 8. Construya un DWH/ DM escalable y flexible. 9. Reconozca que el DWH/ DM nunca está terminado. 10.Potencie su DWH/ DM como una aplicación de soporte de decisiones comerciales. Complejidad relativa de la Organización Alto Bajo El DWHse usa para control de perfomance. El DWHes poco probable que se necesite. Bajo El DWHes mandatorio para sobrevivir (control y oportunidad). El DWHse usa para aumentar las oportunidades. Alto Número relativo de clientes 27 28
Procesamiento Analítico en Línea Herramientas o Procesos OLAP vs OLTP Herramientas OLAP Data Warehouse BD Corporativa Sistemas OLTP 29 30 Mercado de Datos Data Mart Subconjunto del Almacén de Datos, resumido o altamente enfocado. Conjunto de tecnologías avanzadas susceptibles de analizar la información de un Data Warehousepara obtener sus tendencias, segmentar la información o encontrar la correlación en los datos. Para una población específica de usuarios. Se enfoca en un área objetivo o línea del negocio. Menor costo de implementación que un almacén de datos. DATA MINING MINERÍA DE DATOS 31 32
Surge una necesidad Las herramientas OLTP responden a preguntas concretas: Cuánto se vendió el día...? Quién compró el producto? Cuál es el stock del producto? Cuál es la comisión del vendedor? Quiero saber Cuánto se vendió del producto X respecto de los objetivos por trimestre y región de ventas en los dos últimos años? Qué clientes compraron simultáneamente los productos X e Y en todas sus operaciones en los dos últimos años? El incremento/ decremento de la ventade autos 0 Km (negocio externo) en los dos últimosaños, generóalgúnhábitode compra en alguna de las regiones? Cómose puedeverafectadomi market-share porcada cambio porcentual unitario de la inflación? 33 34 Análisis Predictivo POR QUÉ LA MD? DESDE LO CIENTÍFICO Utiliza técnicas de: minería de datos, datos históricos y suposiciones sobre condiciones futuras para predecir resultados de eventos. Se recogen y guardan datos a gran velocidad Sensores remotos en satélites. Archivos de NASA EOSDIS más de 1PB de datos sobre la Tierra por año. Telescopios. Datos biológicos. Simulaciones científicas: generan TBs en solo unas horas La minería de datos ayuda a los científicos En el análisis automático de enormes conjuntos de datos En la formación de hipótesis 35 36
GRANDES OPORTUNIDADES PARA RESOLVER PROBLEMAS SOCIALES Minería de datos Mejorar la salud y reducir costos Predecir el impacto del cambio climático Comprende una serie de técnicas, algoritmos y métodos cuyo fin es la explotación de grandes volúmenes de datos con vistas al descubrimiento de información previamente desconocida y que pueda servir de ayuda en el proceso de toma de decisiones, formando parte del conjunto de tecnologías de la Inteligencia de Negocio Encontrar energías alternativas Reducir el hambre, la pobreza aumentando la producción agrícola 37 38 QUÉ ES LA MINERÍA DE DATOS? QUÉ ES LA MINERÍA DE DATOS? Minería de datos (descubrimiento de conocimiento en datos): extracción de patrones de conocimiento interesantes (no triviales, implícitos, previamente desconocidos y potencialmente útiles) de cantidades enormes de datos. Otros nombres Descubrimiento de conocimiento en bases de datos (KDD) Extracción de conocimiento Análisis de datos, análisis de patrones Arqueología de datos. Dragado de datos (datos dredging) Cosecha de información (harvest information) Inteligencia de negocios (business intelligence) Ejemplo real de la NBA Información jugada a jugada guardada por los equipos Quién está en la cancha. Quién lanza. Resultados. Los entrenadores quieren saber qué es lo que funciona Jugadas que van bien contra un rival dado. Combinaciones buenas / malas de jugadores. 39 40
DATOS, INFORMACIÓN Y CONOCIMIENTO DESCUBRIMIENTO DEL CONOCIMIENTO Conocimiento: capacidad de convertir datos e información en acciones efectivas 41 42 TIPOS DE CONOCIMIENTO Tipos de conocimiento (según su nivel de abstracción) Conocimiento evidente: fácilmente recuperable (SQL) Conocimiento multi-dimensional: considera los datos con una cierta estructura (OLAP) Conocimiento oculto: información no evidente, desconocida a priori y potencialmente útil (Data Mining) Conocimiento profundo: información que está almacenada en la base de datos, pero que resulta imposible de recuperar a menos que se disponga de alguna clave que oriente la búsqueda 43 44
PIRÁMIDE BASELINE Descubrimiento del conocimiento Jill Dyché, Federico Plancarte Jill Dyché E-data. Transformando los datos en información con Data Warehousing, Prentice Hall, 2001 45 46 EVOLUCIÓN PASO EVOLUTIVO PREGUNTA TECNOLOGÍA Recolección de datos (1960s) Acceso a los datos (1980s) Almacenes de datos, soporte a la toma de decisiones Minería de datos Cuáles fueron mis ingresos totales en los últimos cinco años? Cuáles fueron las ventas unitarias en el NOA en Marzo? Cuáles fueron las ventas unitarias en el NOA en Marzo, por producto y por edad? Hacer zoom en Salta. Qué es probable que pase respecto a las ventas de Salta el mes que viene? Por qué? computadoras, cintas, discos computadoras más rápidas, más baratas, más almacenamiento, bds relacionales computadoras más rápidas, más baratas, más almacenamiento, OLAP, bases de datos multidimensionales, almacenes de datos computadoras más rápidas, más baratas, más almacenamiento, algoritmos avanzados DESCUBRIMIENTO DEL CONOCIMIENTO (KD) Descubrimiento del Conocimiento: es la extracción no trivial de información: implícita previamente desconocida potencialmente útil a partir de los datos W. J. Frawley, G.Piatetsky-Shapiro, C. J. Matheus KnowledgeDiscovery in Databases(KDD) Nombre técnico con que se denomina al proceso global de extracción de conocimiento de bases de datos. 47 48
Verificación vs. descubrimiento Verificación 1. Elaborar una hipótesis sobre la existencia de una información de interés 2. Convertir la hipótesis en una consulta 3. Ejecutar la consulta contra un sistema de información 4. Interpretar los resultados 5. Refinar la hipótesis y repetir la ejecución Descubrimiento 1. Identificar un objetivo o problema de negocio 2. Habilitar un acceso a los datos de interés y acondicionarlos 3. Seleccionar una técnica de explotación de los datos adecuada para el problema 4. Ejecutar la técnica contra los datos 5. Interpretar los resultados Las técnicas de minería de datos son herramientas que facilitan el descubrimiento de la información 49 Tienen sentido las respuestas obtenidas? 50 Tienen sentido las respuestas obtenidas? Caso de estudio: Pérdida de clientes (attrition rate) Situación: una compañía de celulares suele perder del 25 a 30% de sus clientes al año. Con esto en mente, cuál es nuestra tarea? Suponga que tenemos información sobre clientes de los últimos N meses. 51 52
Caso de estudio: Pérdida de clientes Tarea: Predecir quién probablemente dejará el servicio en el próximo mes. Estimar el valor de ese cliente y qué oferta nos conviene hacer a ese cliente para que no se vaya Caso de estudio: Pérdida de clientes Resultados: VerizonWireless construyó un almacén de datos de clientes. Identificó posibles desertores. Desarrolló modelos múltiples, según la región. Contactó a clientes con alta probabilidad de aceptar la oferta. Redujo la pérdida de clientes de más de 2%/mes a menos de 1.5%/mes (impacto enorme, por tener >30 M clientes) (Datos de 2003) 53 54 Minería de datos y privacidad En 2006, se informó que la NSA (NationalSecurity Agency) estaba minando años de datos de llamadas para identificar redes terroristas El análisis de redes sociales puede ayudar a encontrar redes terroristas. Deportes Análisis del rendimiento de los jugadores, a partir de datos de una o más cámaras; análisis del adversario posterior al partido; fichaje de jugadores 55 56 http://www.prozonesports.com/folder/prozone/pdf/page_37.pdf
Deportes McLaren F1: 120 sensores/auto 4MB/s enviados del auto al centro de control GESTIÓN DEL CONOCIMIENTO - RESUMEN Hamilton frena una fracción de segundo más tarde que su compañero Button McLaren también hace análisis retrospectivos del rendimiento del bólido en circuitos particulares para que el conductor entienda la mejor forma de manejar. El circuito de Mónaco es el mismo desde hace 30 años, así que tenemos años de datos para saber qué pasa con la suspensión en una curva determinada (CIO Burrell) 57 http://blog.sap-tv.com/2012/09/cnn-on-mclaren-f1-racing-team-using-sap/ 58 Para tomar decisiones OLTP Data Mart BI GESTIÓN DEL CONOCIMIENTO EDUCACIÓN Transacciones Conocimientos Decisión 59 60