Warehousing: es un término utilizado para describir una forma. de integración de la información: copiar información de diversas

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Warehousing: es un término utilizado para describir una forma. de integración de la información: copiar información de diversas"

Transcripción

1 Datawarehousing Introducción DataWarehouse (almacén de datos) Warehousing: es un término utilizado para describir una forma de integración de la información: copiar información de diversas fuentes a una sola base de datos y tratar de mantenerla actualizada. Método usual: reconstrucción periódica del almacén, posiblemente durante la noche. Aspectos generales de los almacenes de datos: Momento y modo de la recogida de datos (arquitectura dirigida por las fuentes de datos, arquitectura dirigida por el destino) Selección del esquema Transformación y limpieza de los datos (purgar, evitar duplicados, transformar,..) Propagación de las actualizaciones Resúmenes de datos (uso de agregación) Los distintos pasos implicados en obtener datos a partir de una fuente de datos se denomina: ETL (Extraction, Transformation, Load).

2 OLTP La mayoría de las operaciones en las bases de datos son del tipo: procesamiento de transacciones en línea (On-line Transaction Processing OLTP-) Consultas cortas y simples, y actualizaciones frecuentes involucrando una o un número pequeño de tuplas. Ejemplos: Responder a queries provenientes de una interface Web, registro de ventas en cajas registradoras, venta de boletos de avión, etc.. Data Marts Almacenes más pequeños Expande parte de la organización e.g., mercadotecnia (clientes, productos, ventas) No requiere consenso en toda la empresa Según el diseño pudiera presentar algunos problemas a largo plazo

3 OLAP De creciente importancia es el llamado procesamiento analítico en línea (Online Analytic Processing OLAP-): Pocas consultas, pero muy consumidoras de tiempo (pueden correr por horas). Las actualizaciones son menos frecuentes, y/o la respuesta a la consulta no depende del hecho de tener actualizada la base de datos. Ejemplo: Amazon analiza las compras que le hacen sus clientes para posteriormente mostrarles pantallas con productos que pudieran ser de su interés. Ejemplo: Analistas en Wal-Mart buscan artículos cuyas ventas vayan incrementándose (o disminuyendo) en algunos almacenes en regiones específicas Arquitecturas de uso Arquitectura más común: Una base de datos local, digamos una por sucursal utilizando OLTP, mientras que un almacén de datos integra información de todas las sucursales y utiliza OLAP. Al grupo de consultas más complejas que se emiten en OLAP la mayoría de veces se les conoce como minado de datos (data mining).

4 OLTP vs. OLAP OLTP Principalmente actualizaciones Muchas transacciones pequeñas Datos en el rango de Mb-Gb Datos directo de la fuente Usuarios cotidianos de oficina Datos al día Consistencia, recuperación criticas. OLAP Principalmente lecturas Consultas largas y complejas Datos en el rango Gb-Tb Datos consolidados, resumidos Usuarios tomadores de decisiones, analistas. Técnicas de implementación de OLAP ROLAP (Relational OLAP): sistema administrador de bases de datos relacional ajustado para esquemas estrella, e.g. utilizando estructuras especiales de índices tales como: Índices Bitmap (para cada llave de una tabla de dimensiones, e.g. nombre del bar, un vector de bits diciendo cuales tuplas de la tabla de hechos tienen ese valor). Vistas materializadas = respuestas a consultas generales desde las cuales más específicas consultas pueden ser respondidas con menos trabajo que si tuvieran que ser ejecutadas desde los datos originales. MOLAP (Multidimensional OLAP): Un modelo especializado basado en una vista de cubo de los datos. Utilizan arreglos de memoria multidimensional para almacenar los cubos. HOLAP (Hybrid OLAP): Sistemas híbridos, que almacenan algunos resúmenes en la memoria y los datos básicos y otros resúmenes en bases de datos relacionales.

5 Operaciones típicas: Corte (Slice) = seleccionar un valor sobre una dimensión, e.g. un bar en particular. Dice = lo mismo sobre otra dimensión, e.g. una cerveza en particular. Pivotaje = Operación de modificación de las dimensiones utilizadas en las tabulaciones cruzadas. Abstracción: Granularidad más gruesa Concreción: Granularidad más fina. Una consulta OLAP típica: Hará todo o parte de la reunión estrella Filtrará tuplas interesantes basándose en datos de hechos y/o dimensiones. Agrupará por una o varias dimensiones. Hará una agregación del resultado. Ejemplo: Para cada bar en cd. Victoria, encontrar la venta total de cada cerveza fabricada por cervecería modelo.

6 ROLAP Las consultas típicas empiezan con una reunión estrella completa, por ejemplo: SELECT * FROM Ventas, Bares, Cervezas, Consumidores WHERE Ventas.bar = Bares.bar AND Ventas.cerveza = Cerveza. Cerveza AND Ventas.consumidor = Consumidores.consumidor; Aspectos de eficiencia Si la tabla de hechos es grande, las consultas tomarán mucho más tiempo. Vistas materializadas pudieran ser una buena opción. Ejemplo: Para la consulta acerca de bares en cd. Victoria y cervezas fabricadas por cervecería modelo, podríamos ayudarnos con la siguiente vista materializada: CREATE VIEW BDCFV(bar, direccion, cerveza, fabricante, ventas) AS SELECT bar, direccion, cerveza, fabricante, SUM(precio) AS ventas FROM Ventas NATURAL JOIN Bares NATURAL JOIN Cervezas GROUP BY bar, direccion, cerveza, fabricante; Nota: Recordar que las vistas materializadas son actualizables

7 MOLAP Basado en cubo de datos : las llaves de las tablas de dimensiones forman los ejes del cubo. Ejemplo: Para nuestro ejemplo anterior, podríamos tener 4 dimensiones: bar, cerveza, consumidor y tiempo. Atributos dependientes (precio de la venta en nuestro ejemplo) aparecen en los puntos del cubo. Pero el cubo también incluye agregaciones (típicamente sumas) a lo largo de los márgenes. Ejemplo: En nuestro cubo de 4 dimensiones, tendríamos la suma sobre cada bar, cada cerveza, cada consumidor, y cada instante de tiempo (tal vez agrupado por día). También tendríamos agregaciones para todos los subconjuntos de las dimensiones, e.g. por cada bar y cerveza, o por cada cerveza, consumidor y día. Aspectos de eficiencia Al igual que en ROLAP, las vistas materializadas pudieran ser de ayuda. Los cubos de datos invitan a las vistas materializadas que son agregaciones en una o más dimensiones. Las dimensiones no necesitan ser agregadas completamente. Mejor, es posible agrupar por atributos de la tabla de dimensiones Ejemplo: una vista materializada podría agregar completamente por consumidor, por cerveza no del todo, por tiempo acorde al día, y por bar sólo acorde a la ciudad del bar. Ejemplo: el tiempo es una dimensión realmente interesante, ya que hay agrupamientos naturales, tales como semanas y meses, que no son de la misma proporción.

8 Warehouse: Modelos y Operadores Modelos de datos relaciones estrella y copo de nieve cubos Operadores slice & dice roll-up, drill down pivoteo otros Estrella product prodid name price p1 bolt 10 p2 nut 5 store storeid city c1 nyc c2 sfo c3 la sale oderid date custid prodid storeid qty amt o100 1/7/97 53 p1 c o102 2/7/97 53 p2 c /8/ p1 c customer custid name address city 53 joe 10 main sfo 81 fred 12 main sfo 111 sally 80 willow la

9 Esquema de estrella product prodid name price sale orderid date custid prodid storeid qty amt customer custid name address city store storeid city Esquema Estrella (Star) Típicamente los datos del almacén de datos son de dos tipos: Datos de hechos: Muy grandes, una acumulación de hechos tales como las ventas. A menudo sólo inserciones ; una vez ahí, la tupla permanece. Datos dimensionales: Más pequeños, generalmente estáticos, los cuales refieren a información acerca de las entidades envueltas en los hechos.

10 Esquema Estrella (Star) ejemplo Supongamos que deseamos registrar cada venta de cerveza en todos los bares: el bar, la cerveza, el consumidor quien compró la cerveza, el día y hora, el precio que se le cargo. Los datos que refieren a los hechos pudieran estar en una relación con esquema: Ventas(bar, cerveza, consumidor, dia, hora, precio) Los datos dimensionales pudieran incluir una relación para bares, una para cervezas, y una para consumidores: Bares(bar, direccion, licencia) Cervezas(cerveza, fabricante) Consumidores (consumidor, direccion, tel) Terminología Tabla de hechos (información que es objeto del análisis) Tabla de dimensiones (dimensiones del análisis) Medidas product prodid name price sale orderid date custid prodid storeid qty amt customer custid name address city store storeid city

11 Jerarquía de dimensiones store stype city store storeid cityid tid mgr s5 sfo t1 joe s7 sfo t2 fred s9 la t1 nancy region stype tid size location t1 small downtown t2 large suburbs city cityid pop regid sfo 1M north la 5M south region regid name north cold region south warm region Cubo Vista de la tabla de hechos: sale prodid storeid amt p1 c1 12 p2 c1 11 p1 c3 50 p2 c2 8 Cubo Bi-dimensional: c1 c2 c3 p p dimensiones = 2

12 Cubo en 3-D Vista de la tabla de hechos: sale prodid storeid date amt p1 c p2 c p1 c p2 c2 1 8 p1 c p1 c2 2 4 Cubo Multi-dimensional: día 2 día 1 c1 c2 c3 p p2 c1 c2 c3 p p dimensiones = 3 Agregaciones/funciones de totales Sumar las cantidades para el día 1 En SQL: SELECT sum(amt) FROM SALE WHERE date = 1 sale prodid storeid date amt p1 c p2 c p1 c p2 c2 1 8 p1 c p1 c

13 Agregaciones/funciones de totales Sumar montos por día En SQL: SELECT date, sum(amt) FROM SALE GROUP BY date sale prodid storeid date amt p1 c p2 c p1 c p2 c2 1 8 p1 c p1 c2 2 4 ans date sum Otro ejemplo Sumar montos por día y producto En SQL: SELECT date, sum(amt) FROM SALE GROUP BY date, prodid sale prodid storeid date amt p1 c p2 c p1 c p2 c2 1 8 p1 c p1 c2 2 4 rollup drill-down sale prodid date amt p p p1 2 48

14 Agregaciones/funciones de totales Operadores: sum, count, max, min, median, avg Clausula Having Utilizando jerarquía de dimensiones Promedio por región (dentro de ciertas tiendas) Máximo por mes (dentro de ciertas fechas) Agregación en Cubo día 2 día 1 c1 c2 c3 p p2 c1 c2 c3 p p Ejemplo: procesar sumas... c1 c2 c3 p p rollup drill-down c1 c2 c3 sum sum p1 110 p

15 Drill-Down y Roll-Up Drill-down = desagregar = romper una agregación en sus partes constituyentes. Ejemplo: Habiendo determinado cuantos contratos por trimestre tenemos con nuestros clientes, desmembrar por tipo de cliente. Roll-up = agregar sobre una dimensión. Ejemplo: Queremos los totales de contratos en todo el año. Drill-down

16 Roll-Up Operadores con Cubo día 2 día 1 c1 c2 c3 p p2 c1 c2 c3 p p sale(c1,*,*) c1 c2 c3 p p sale(c2,p2,*) c1 c2 c3 sum sum p1 110 p sale(*,*,*)

17 Cubo extendido * c1 c2 c3 * p p día 2 c1* c267 c3 12 * p día 1 c1 p2 c2 c3 * p1 12* p * sale(*,p2,*) Agregaciones utilizando jerarquías día 2 día 1 c1 c2 c3 p p2 c1 c2 c3 p p cliente región país region A region B p p (Cliente c1 en Region A; Clientes c2, c3 en Region B)

18 Jerarquías de las dimensiones Año Trimestre Región País Día de la semana Mes Hora del día Fecha Estado FechaHora Ciudad Jerarquía de tiempo Jerarquía de ubicación Pivotaje Vista de la tabla de hechos: Cubo Multi-dimensional: sale prodid storeid date amt p1 c p2 c p1 c p2 c2 1 8 p1 c p1 c2 2 4 día 2 día 1 c1 c2 c3 p p2 c1 c2 c3 p p c1 c2 c3 p p2 11 8

19 Herramientas de Consulta y Análisis Constructores de consultas Reporteadores (comparaciones, crecimientos, gráficas, ) Systemas de hoja de cálculo Interfaces Web Data Mining Otras operaciones Funciones para tiempo e.g., tiempo promedio Atributos calculados e.g., comisión = ventas * índice de ganancia Consultas en textos e.g., encontrar palabras con letras X y B e.g., clasificar documentos por frecuencia de palabras X, Y, Z

20 Agregaciones extendidas en SQL99 Nuevas funciones de agregación para un sólo atributo (e.g. desviación estándar stddev-, varianza variance -) Funciones de agregación binarias (e.g. correlación, covarianzas, curvas de regresión) Generalizaciones de la estructura group by mediante estructuras cube y rollup. Ejemplo: select nombre_articulo, color, talla, sum(numero) from ventas group by cube(nombre_articulo, color, talla) Esta consulta calcula la unión de ocho agrupaciones diferentes de la relación ventas: { (nombre_articulo, color, talla), (nombre_articulo, color), (nombre_articulo, talla), (color, talla), (nombre_articulo), (color), (talla), () } Lista vacía Nombre_articulo Color Talla cantidad falda oscuro All 8 falda Pastel All 35 falda Blanco All 10 falda null All 53 vestido oscuro All 20 vestido Pastel All 10 select nombre_articulo, color, talla,sum(cantidad) from ventas vestido Blanco All 5 group by cube(nombre_articulo, color,talla) vestido null All 35 camisa oscuro All 14 camisa Pastel All 7 camisa Blanco All 28 camisa null All 49 pantalon oscuro All 20 pantalon Pastel All 2 pantalon Blanco All 5 pantalon null All 27 null oscuro All 62 null Pastel All 54 null Blanco All 48 null null All 164

21 Ejemplo utilizando rollup select nombre_articulo, color, talla, sum(cantidad) from ventas group by rollup (nombre_articulo, color, talla) En este caso sólo se generan cuatro agrupaciones diferentes de la relación ventas: { (nombre_articulo, color, talla), (nombre_articulo, color), (nombre_articulo), () } Otras funciones: Supongamos la relación estudiante_calificacion(id_estudiante, calif) : select id_estudiante, rank() over (order by (calif) desc) as clasificacion_est from estudiante_calificacion order by clasificacion_est SQL99 utiliza el valor null tanto para indicar el sentido habitual del nulo, así como el valor de all. Se puede aplicar la función de grouping a un atributo; devuelve 1 si el valor es un valor nulo que represente a all, y devuelve 0 en los demás casos. select nombre_articulo, color, talla, sum(cantidad) grouping (nombre_articulo) as indicador_nombre_articulo, grouping (color) as indicador_color grouping (talla) as indicador_talla from ventas group by cube (nombre_articulo, color, talla) función cume_dist (cumulative distribution): define la función de distribución acumulativa, para una tupla se define como p/n, donde p es el número de tuplas de la partición con valores de ordenación que preceden o son iguales al valor de ordenación de la tupla, y n es el número de tuplas de la partición. Función ntile(n): toma las tuplas de cada partición en el orden especificado y las divide en n cajones con igual número de tuplas. select tercil, sum(sueldo) from ( select sueldo, ntile(3) over (order by (sueldo)) as tercil from empleado) as s group by tercil Los valores nulos pueden complicar la definición de una clasificación, dado que no está claro si deben colocarse antes en el orden. SQL:1999 permite que el usuario especifique dónde deben aparecer mediante nulls first o nulls last: select id_estudiante, rank() over (order by calif desc nulls last ) as clasificacion_est from estudiante_calificacion

22 Consultas del tipo ventana Un ejemplo de una consulta ventana es una consulta que, dados los valores de ventas para cada fecha, calcula para cada fecha el promedio de ventas de ese día, del día anterior y del día siguiente; esas consultas de media móvil se utilizan para suavizar la variación aleatoria. SQL:1999 ofrece una característica de ventanas para soportar esas consultas. A diferencia del group by, la misma tupla puede estar en varias ventanas. Consultas del tipo ventana Ejemplo: supóngase la relación transaccion(numero_cuenta, fecha_hora, valor), donde valor es positivo para los depósitos de fondos y negativos para los retiros. Se da por supuesto que hay como máximo una transacción por cada valor fecha_hora. La consulta: select numero_cuenta, fecha_hora, sum(valor) over (partition by numero_cuenta order by fecha_hora from transaccion order by numero_cuenta, fecha_hora rows unbounded preceding) as saldo Proporciona los saldos acumulados de cada cuenta justo antes de cada transacción en esa cuenta; el saldo acumulado de una cuenta es la suma de valores de todas las transacciones anteriores de la cuenta. La cláusula partition by separa las tuplas por número_cuenta, de modo que para cada fila sólo se consideran las tuplas de su partición. Se crea una ventana para cada tupla. La palabra clave rows unbounded preceding especifican que la ventana de cada tupla consiste en todas las tuplas de la partición que la preceden en el orden especificado (en este caso, orden creciente de fecha_hora). La función sum(valor) se aplica a todas las tuplas de la ventana. Nótese que la consulta no necesita ninguna cláusula group by, ya que hay una tupla de resultado por cada tupla de la relación transaccion.

23 Consultas del tipo ventana Se pueden especificar otros tipos de ventanas. Por ejemplo, para obtener una ventana que contenga las 10 filas anteriores a cada fila, se puede especificar: rows 10 preceding Para obtener una ventana que contenga la fila actual, la anterior y la siguiente : between rows 1 preceding and 1 following Para obtener las filas siguientes y la fila actual: between rows unbounded preceding and current. Nótese que si la ordenación se realiza con un atributo que no sea clave el resultado no es determinista, ya que el orden no está definido. Se pueden especificar ventanas mediante rangos de valores, en lugar de hacerlo mediante número de filas. Ejemplo, si el valor de ordenación de una tupla es v; entonces range between 10 preceding and current row devolverá tuplas cuyo valor de ordenación se hallen entre v 10 y v (ambos incluidos). Al tratar con fechas de puede utilizar range interval 10 day preceding para obtener una ventana que contenga tuplas con los 10 días anteriores, pero sin incluir la fecha de la tupla. SQL1999 contiene muchas más funcionalidades que no son expuestas en esta presentación. DATAMINING (Mineria de Datos) Introducción

24 Data Mining Consultas a gran escala diseñadas para extraer patrones de los datos. Las aplicaciones más utilizadas son las que necesitan algún tipo de predicción. Fuertemente soportada por mecanismos de predicción: Árboles de decisión Clasificadores bayesianos Redes neuronales Regresión Reglas de asociación Agrupamiento Árboles de decisión Ejemplo: Un estudio dirigido para ver qué clientes estarían interesados en un nuevo modelo de coche. Se desea seleccionar clientes para campaña publicitaria sale custid car age city newcar c1 taurus 27 sf yes c2 van 35 la yes c3 van 40 sf yes c4 taurus 22 sf yes c5 merc 50 la no c6 taurus 25 la no Conjunto de entrenamiento

25 Una opción Y sale custid car age city newcar c1 taurus 27 sf yes c2 van 35 la yes c3 van 40 sf yes c4 taurus 22 sf yes c5 merc 50 la no age<30 c6 taurus 25 la no N Y probable city=sf N improbable car=van Y N probable improbable Otra opción sale custid car age city newcar c1 taurus 27 sf yes c2 van 35 la yes c3 van 40 sf yes c4 taurus 22 sf yes car=taurus c5 merc 50 la no Y c6 taurus 25 la no N Y city=sf N Y age<45 probable improbable probable improbable N

26 Algunas situaciones a considerar El árbol de decisión no puede ser muy profundo Se necesita seleccionar el árbol que más confiablemente predice la salidas. Encontrar las mejores particiones. Obtener mejor ganancia de información. Agrupación (Clustering) ingresos edad educación

27 Otro ejemplo: Manejo de textos Cada documento es un vector e.g., < > contiene palabras 1,4,5,... Las agrupaciones contienen documentos similares Útil para entender, documentos de búsqueda Noticias internacionales negocios deportes Algunas situaciones a considerar cuál es el número de grupos deseado? Encontrar los mejores grupos Son los grupos semánticamente significativos? e.g., el grupo yuppies? Agrupamiento aglomerativo. Agrupamiento divisivo.

28 Reglas de asociación: el ejemplo de la canasta del mercado Una fuente importante de datos para las reglas de asociación está en la canasta del mercado. Cuando un cliente pasa a través de la caja registradora, aprendemos qué artículos compra juntos, e.g. huevos y jamón. Sean datos con el esquema Canastas(can_id, articulo). Los comerciantes quisieran saber qué artículos la gente compra juntos. Ejemplo: si la gente tiende a comprar huevos y jamón juntos, porque no ponerlos cerca el uno del otro, con algún tocino en medio. Ejemplo: lanzar una gran venta de huevos y aumentar un poco el precio del jamón. El esquema básico: encontrar la pareja de artículos más frecuente Dado un umbral de soporte s, podríamos pedir: Encontrar los pares de artículos que aparecen juntos en al menos s canastas. SELECT can1.articulo, can2.articulo FROM canastas can1, canastas can2 WHERE can1.can_id = can2.can_id AND can1.articulo < can2.articulo GROUP BY can1.articulo, can2.articulo HAVING COUNT (*) >= s;

29 Haciendo un análisis a-priori La consulta anterior es prohibitivamente costosa para un monto de datos grande. Un algoritmo a-priori utiliza el hecho que un par (i, j) no puede tener soporte de s a menos que tanto i y j tengan soporte de s por sí mismos. Una implementación más eficiente utiliza una relación intermedia canastas1. INSERT INTO Canastas1 (can_id, articulo) SELECT * FROM Canastas WHERE articulo IN ( SELECT articulo FROM Canastas GROUP BY articulo HAVING COUNT (*) >= S ); Al obtener Canastas1 podemos volver a ejecutar la consulta anterior utilizando canastas1 en lugar de canastas Ejemplo: reglas de asociación registro de ventas: tran1 cust33 p2, p5, p8 tran2 cust45 p5, p8, p11 tran3 cust12 p1, p9 tran4 cust40 p5, p8, p11 tran5 cust12 p2, p9 tran6 cust12 p9 canasta Tendencia: Productos p5, p8 a menudo comprados juntos Tendencia: Cliente 12 prefiere producto p9

30 Regla de asociación Regla: {p 1, p 3, p 8 } Soporte: número de canastes donde estos productos aparecen Conjunto con soporte-alto: soporte umbral s Problema: encontrar todos los conjuntos con alto soporte Encontrar pares con soporte alto Canastas(canasta, item) SELECT I.item, J.item, COUNT(I.canasta) FROM canastas I, canastas J WHERE I.canasta = J.canasta AND I.item < J.item GROUP BY I.item, J.item Porqué? HAVING COUNT(I.canasta) >= s;

31 Ejemplo canasta item t1 p2 t1 p5 t1 p8 t2 p5 t2 p8 t2 p canasta item1 item2 t1 p2 p5 t1 p2 p8 t1 p5 p8 t2 p5 p8 t2 p5 p11 t2 p8 p verificar si cantidad s Algunos aspectos a considerar Eficiencia para reglas de tamaño 2 grande basket item t1 p2 t1 p5 t1 p8 t2 p5 t2 p8 t2 p basket item1 item2 t1 p2 p5 t1 p2 p8 t1 p5 p8 t2 p5 p8 t2 p5 p11 t2 p8 p Aún más grande! Eficiencia para reglas de tamaño k

32 Conteo eficiente Una opción: umbral = 3 canasta I.item J.item t1 p5 p8 t2 p5 p8 t2 p8 p11 t3 p2 p3 t3 p5 p8 t3 p2 p ordenar canasta I.item J.item t3 p2 p3 t3 p2 p8 t1 p5 p8 t2 p5 p8 t3 p5 p8 t2 p8 p contar y quitar contar I.item J.item 3 p5 p8 5 p12 p Conteo eficiente Otra opción: threshold = 3 canasta I.item J.item t1 p5 p8 escanear y contar t2 p5 p8 t2 p8 p11 t3 p2 p3 t3 p5 p8 t3 p2 p contar I.item J.item 1 p2 p3 2 p2 p8 3 p5 p8 5 p12 p18 1 p21 p22 2 p21 p quitar contar I.item J.item 3 p5 p8 5 p12 p Mantener el arreglo de contadores en memoria

33 Otra opción más canasta I.item J.item t1 p5 p8 t2 p5 p8 t2 p8 p11 t3 p2 p3 t3 p5 p8 t3 p2 p (2) escanear y quitar falso positivo (1) Escanear, hacer hash y contar contar bucket 1 A 5 B 2 C 1 D 8 E 1 F canasta I.item J.item t1 p5 p8 t2 p5 p8 t2 p8 p11 t3 p5 p8 t5 p12 p18 t8 p12 p tabla hash en memoria threshold = 3 contadores en memoria contar I.item J.item 3 p5 p8 1 p8 p11 5 p12 p contar I.item J.item 3 p5 p8 5 p12 p (4) quitar (3) Escanear y contar Discusión Esquema usando dispersión (hash): 2 (o 3) escaneo de datos Esquema usando ordenamiento: requiere ordenar! El esquema de dispersión trabaja bien si aparecen pocos pares con soporte alto y muchos con soporte bajo frecuencia Consultas del tipo iceberg umbral Pares de items clasificados por frecuencia

Unidad 10. Almacenes de Datos

Unidad 10. Almacenes de Datos Unidad 10 Almacenes de Datos Introducción Definición Los Almacenes de Datos (data warehouse) son colecciones de datos orientadas a la toma de decisiones Almacenes de Datos y Bases de Datos La principal

Más detalles

Procesamiento analítico en línea (OLAP) B.1 Qué es el procesamiento analítico en línea?

Procesamiento analítico en línea (OLAP) B.1 Qué es el procesamiento analítico en línea? Apéndice B Procesamiento analítico en línea (OLAP) B.1 Qué es el procesamiento analítico en línea? En un almacén de datos, a diferencia de un OLTP, se realizan operaciones de procesamiento analítico en

Más detalles

Arquitectura de un data warehouse Funcionamiento detallado de un data warehouse

Arquitectura de un data warehouse Funcionamiento detallado de un data warehouse El modelo multidimensional Data a Warehousing OLAP vs. OLTP Data Warehousing El modelo multidimensional Dimensiones, medidas y hechos Arquitectura de un data warehouse Funcionamiento detallado de un data

Más detalles

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II Carlos A. Olarte Bases de Datos II Contenido 1 Introducción 2 OLAP 3 Data Ware Housing 4 Data Mining Introducción y Motivación Cómo puede analizarse de forma eficiente volúmenes masivos de datos? La consulta,

Más detalles

BASES DE DATOS AVANZADAS. Facultad de Estadística e Informática

BASES DE DATOS AVANZADAS. Facultad de Estadística e Informática BASES DE DATOS AVANZADAS Clase 26 Agenda Integración de datos osistemas de mediación odata Warehousing Integración de datos CÓMPUTO EN LA NUBE Qué es? La integración de datos la podemos definir como el

Más detalles

Dirección General de Estudios de Postgrado Área de Ingeniería Programa: Maestría Sistemas de Información

Dirección General de Estudios de Postgrado Área de Ingeniería Programa: Maestría Sistemas de Información Dirección General de Estudios de Postgrado Área de Ingeniería Programa: Maestría Sistemas de Información Caracas, Abril 2016 Integrantes: Areiza, Elvis Pérez, Dalila Rivas, Juan Puntos a tratar: 1.- Almacén

Más detalles

1. DML. Las consultas de resumen

1. DML. Las consultas de resumen 1.1 Introducción 1. DML. Las consultas de resumen Una de las funcionalidades de la sentencia SELECT es el permitir obtener resúmenes de los datos contenidos en las columnas de las tablas. Para poder llevarlo

Más detalles

La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema (p.ej. mediante una sentencia SELECT).

La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas del sistema (p.ej. mediante una sentencia SELECT). 9. OLAP 9.1 Introducción Las herramientas de OLAP (Online Analytical Processing) presentan al usuario una visión multidimensional de los datos (esquema multidimensional) para cada actividad que es objeto

Más detalles

Modulo II Data Warehouse y OLAP

Modulo II Data Warehouse y OLAP Diplomado en Minería de Datos para la Toma de Decisiones Modulo II Data Warehouse y OLAP 2 Arquitectura Data Warehouse Objetivos 2.1 Niveles y Componentes. 2.2 Modelo de Datos Multidimensional. 2.3 Tipos

Más detalles

EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP

EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP OLAP... OLAP 1 OLAP 2 MODELO DE UN AMBIENTEOLAP LAS HERRAMIENTAS DE OLAP PRESENTAN AL USUARIO UNA VISIÓN MULTIDIMENSIONAL DE LOS DATOS O ESQUEMA MULTIDIMENSIONAL, PARA CADA ACTIVIDAD QUE ES OBJETO DE ANÁLISIS.

Más detalles

OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP. SISTEMAS ROLAP Y MOLAP. SQL AMPLIADO. OLAP 1

OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP. SISTEMAS ROLAP Y MOLAP. SQL AMPLIADO. OLAP 1 OLAP EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP. SISTEMAS ROLAP Y MOLAP. SQL AMPLIADO. OLAP 1 EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP OLAP 2 EXPLOTACIÓN DE UN DW: HERRAMIENTAS OLAP MODELO DE UN AMBIENTE OLAP

Más detalles

Procedimientos para agrupar y resumir datos

Procedimientos para agrupar y resumir datos Procedimientos para agrupar y resumir datos Introducción Presentación de los primeros n valores Uso de funciones de agregado Fundamentos de GROUP BY Generación de valores de agregado dentro de los conjuntos

Más detalles

Las empresas han comenzado a aprovechar los cada vez más numerosos datos en línea para tomar mejores decisiones sobre sus actividades.

Las empresas han comenzado a aprovechar los cada vez más numerosos datos en línea para tomar mejores decisiones sobre sus actividades. Las empresas han comenzado a aprovechar los cada vez más numerosos datos en línea para tomar mejores decisiones sobre sus actividades. Para ejecutar de manera eficiente las consultas sobre datos tan diferentes

Más detalles

Introducción 1 Recuperación de Datos mediante la Sentencia SQL SELECT

Introducción 1 Recuperación de Datos mediante la Sentencia SQL SELECT Introducción Objetivos I-2 Objetivos del Curso I-3 Oracle11g - 12cI-5 Oracle Database 11g - 12cI-6 Oracle Application Server 11g - 12cI-7 Oracle Enterprise Manager 11g - 12cGrid Control I-8 Sistema de

Más detalles

Anexo 3 COMPONENTES DE SQL SERVER. Los DDL (Data Definition Languaje) que permiten crear y definir nuevas

Anexo 3 COMPONENTES DE SQL SERVER. Los DDL (Data Definition Languaje) que permiten crear y definir nuevas Anexo 3 COMPONENTES DE SQL SERVER COMANDOS Existen tres tipos de comandos SQL [5]: Los DDL (Data Definition Languaje) que permiten crear y definir nuevas bases de datos, campos e índices. En la tabla se

Más detalles

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLOGICOS ESCUELA DE COMPUTACION

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLOGICOS ESCUELA DE COMPUTACION UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLOGICOS ESCUELA DE COMPUTACION CICLO 01-2012 GUIA DE LABORATORIO Nº 7 Nombre de la practica: Agrupación y sumarización en SQL Server 2008 Lugar de ejecución:

Más detalles

GUIA DE CURSO: ELABORADO POR: ING. LUIS TAMAYO PARA: FECHA DE PRESENTACIÓN: INTELIGENCIA DE NEGOCIOS CON PENTAHO- Versión 1.0.

GUIA DE CURSO: ELABORADO POR: ING. LUIS TAMAYO PARA: FECHA DE PRESENTACIÓN: INTELIGENCIA DE NEGOCIOS CON PENTAHO- Versión 1.0. GUIA DE CURSO: INTELIGENCIA DE NEGOCIOS CON PENTAHO- MDX Versión 1.0 ELABORADO POR: ING. LUIS TAMAYO www.relative-engine.com PARA: CEC - EPN FECHA DE PRESENTACIÓN: Quito, 17 de Junio del 2013 CONTENIDO

Más detalles

Resumen Inteligencia de Negocios

Resumen Inteligencia de Negocios Resumen Inteligencia de Negocios La inteligencia de Negocios es una tendencia dentro de la Tecnología de Información, recordemos que la Tecnología de Información ayuda a hacer eficientes muchos de los

Más detalles

Consultas. Comparación Filtros vs Consultas Tipos de Consultas Crear, reutilizar y Ejecutar Consultas. Consultas Diapositiva 1.

Consultas. Comparación Filtros vs Consultas Tipos de Consultas Crear, reutilizar y Ejecutar Consultas. Consultas Diapositiva 1. Consultas Comparación Filtros vs Consultas Tipos de Consultas Crear, reutilizar y Ejecutar Consultas Consultas Diapositiva 1 Qué son? Una consulta es un objeto de base de datos que permite extraer campos

Más detalles

CUBE, ROLLUP, GROUPING del SQL

CUBE, ROLLUP, GROUPING del SQL CUBE, ROLLUP, GROUPING del SQL Qué preguntas solucionamos con CUBE y ROLLUP? Vamos a trabajar con la siguiente tabla por no complicar los ejemplos ni el código SQL. Además una tabla como esta aunque no

Más detalles

Sistemas de ayuda a la toma de decisión

Sistemas de ayuda a la toma de decisión Sistemas de ayuda a la toma de decisión Introducción Información es todo lo que reduce la incertidumbre sobre algún aspecto de la realidad y, por lo tanto, permite tomar mejores decisiones. Los requerimientos

Más detalles

Un proyecto de IBM llamado Sistem/R construye un prototipo simple llamado SQUARE que después se transformó en SQL.

Un proyecto de IBM llamado Sistem/R construye un prototipo simple llamado SQUARE que después se transformó en SQL. CONTENIDO: 1. Lenguaje SQL 1. Componentes 2. Comandos 3. Clausulas 4. Operadores lógicos 5. Operadores de comparación 6. Funciones de agregado 2. MYSQL 1. Como entrar a MySQL 2. Comandos generales 3. Sintaxis

Más detalles

Grandes de Bases de Datos. Almacenes de Datos (DW) e Inteligencia de negocios IN (BI)

Grandes de Bases de Datos. Almacenes de Datos (DW) e Inteligencia de negocios IN (BI) Grandes de Bases de Datos Almacenes de Datos (DW) e Inteligencia de negocios IN (BI) Qué es Inteligencia de Negocios? Las TI permiten la toma de decisiones basadas en procesos de análisis sobre datos simples

Más detalles

LENGUAJE DE CONSULTA ESTRUCTURADO (SQL)

LENGUAJE DE CONSULTA ESTRUCTURADO (SQL) Qué es una base de datos? Una base de datos (cuya abreviatura es BD) es una entidad en la cual se pueden almacenar datos de manera estructurada, con la menor redundancia posible. Diferentes programas y

Más detalles

Datawarehousing: Ciclo de vida y ETL. Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela

Datawarehousing: Ciclo de vida y ETL. Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela Datawarehousing: Ciclo de vida y ETL Jose Aguilar CEMISID, Escuela de Sistemas Facultad de Ingeniería Universidad de Los Andes Mérida, Venezuela Proceso de diseño de Data Warehouse 1. Elegir un proceso

Más detalles

SQL: Lenguaje de Interrogación Estructurado

SQL: Lenguaje de Interrogación Estructurado SQL: Lenguaje de Interrogación Estructurado SQL Es el lenguaje para Bases de Datos Relacionales más usado Es un lenguaje declarativo: QUÉ no CÓMO El núcleo fundamental se basa en el Algebra Relacional,

Más detalles

UMET : UNIVERSIDAD METROPOLITANA

UMET : UNIVERSIDAD METROPOLITANA UMET : UNIVERSIDAD METROPOLITANA TRABAJO DE BASE DE DATOSA II TEMA : COMPARACION DE HARREMIENTAS OLAP PRESENTADO POR JAIME CRUZ N. MAYO 15 DE 2011 LINK : Contenido Pag: 1 Para poder determinar las diferencias

Más detalles

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4

Definición. Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición Data Warehousing: almacenamiento, transformación y distribución de datos útiles para los responsables de tomar decisiones 9/29/2006 4 Definición (cont.) Un Data Warehouse es una colección de

Más detalles

tanto, no pueden navegar por dicho modelo en busca de información.

tanto, no pueden navegar por dicho modelo en busca de información. Modelado de Datos Para comprender uno de los aspectos más relevantes de la arquitectura del Data Warehouse, como es el modelado de datos, es necesario establecer primero las diferencias sustanciales entre

Más detalles

Agrupamiento de registros. Elaboración de claúsulas avanzadas de selección. 31/12/2011. Unidad 9

Agrupamiento de registros. Elaboración de claúsulas avanzadas de selección. 31/12/2011. Unidad 9 Agrupamiento de registros Unidad 9 Elaboración de claúsulas avanzadas de selección. Un agrupamiento es el tratamiento único de varios registros que poseen un mismo valor de campo. Al realizar un agrupamiento,

Más detalles

Capítulo 3. Data Warehouse

Capítulo 3. Data Warehouse Capítulo 3. Data Warehouse Un Data Warehouse (DW) es la colección de datos, organizados, integrados, historiados y disponibles para facilitar la toma de decisiones de usuarios finales [9]. Desde el punto

Más detalles

Consultas. Consultas Diapositiva 1

Consultas. Consultas Diapositiva 1 Consultas Comparación Filtros vs Consultas Tipos de Consultas Criterios, Parámetros, Campos Calculados, Funciones de agregado Crear, reutilizar y ejecutar consultas Consultas Diapositiva 1 Consultas Cuando

Más detalles

Inteligencia de Negocios

Inteligencia de Negocios Inteligencia de Negocios Necesidades y arquitectura de la solución Clase 3 Esquema de la clase 1. OLTP vs OLAP 2. Los tres problemas del OLTP 3. La arquitectura del BI 4. Fuentes de datos. 6. Herramientas

Más detalles

Consultas SQL II. Diego Egüez. Universidad San Francisco de Quito (USFQ)

Consultas SQL II. Diego Egüez. Universidad San Francisco de Quito (USFQ) Consultas SQL II Diego Egüez Universidad San Francisco de Quito (USFQ) Abstract En este trabajo se exploran las consultas o queries en SQL. Se hace enfoque en consultas complejas y subconsultas. Los comandos

Más detalles

ÍNDICE INTRODUCCIÓN...17

ÍNDICE INTRODUCCIÓN...17 ÍNDICE INTRODUCCIÓN...17 CAPÍTULO 1. ORACLE 11g Y EL GRID COMPUTING...19 1.1 CONCEPTO DE GRID COMPUTING...19 1.2 ORACLE GRID COMPUTING...20 1.2.1 Almacenamiento eficiente de la información...21 1.2.2 Utilización

Más detalles

Computación Web (Curso 2015/2016)

Computación Web (Curso 2015/2016) Bases de Datos (I) Computación Web (Curso 2015/2016) Jesús Arias Fisteus // jaf@it.uc3m.es Bases de Datos (I) p. 1 Bases de datos relacionales Colección de datos almacenados en una o más tablas. Las tablas

Más detalles

SQL. Amparo López Gaona. México, D.F. Noviembre 2003

SQL. Amparo López Gaona. México, D.F. Noviembre 2003 Amparo López Gaona México, D.F. Noviembre 2003 Introducción El lenguaje SQL (Structured Query Language) es el lenguaje estándar para trabajo con bases de datos relacionales. Permite la definición, acceso

Más detalles

Programa de Extensión Universitaria y Vinculación (PEUVI), Departamento de Matemáticas.

Programa de Extensión Universitaria y Vinculación (PEUVI), Departamento de Matemáticas. Programa de Extensión Universitaria y Vinculación (PEUVI), Departamento de Matemáticas. DIPLOMADO EN MINERÍA DE DATOS. Coordinadora académica: Dra. Amparo López Gaona. MODULO I: INTRODUCCIÓN A LAS BASES

Más detalles

CI2355 Almacenes de datos y OLAP

CI2355 Almacenes de datos y OLAP CI2355 Almacenes de datos y OLAP Examen Lunes, 7 de mayo de 2012 2012/03/26 CI2355 - Almacenes de datos y OLAP 2 Trabajo de Investigación Presentación Artículo 40-45 minutos Fechas: Entre el 14 de mayo

Más detalles

Bases de Datos 1. Teórico: Structured Query Language

Bases de Datos 1. Teórico: Structured Query Language Bases de Datos 1 Teórico: Structured Query Language Historia Los orígenes del SQL están ligados a los orígenes de las bases de datos relacionales Estandarizado por ANSI en 1986 (SQL-86) Hubieron varias

Más detalles

INTRODUCCIÓN MDX MDX. Jortilles.com

INTRODUCCIÓN MDX MDX. Jortilles.com INTRODUCCIÓN MDX MDX info@jortilles.com Índice de contenido 1.Descripción... 2.Sintaxis....Conceptos básicos...4 4.Funciones... 4 5.Miembros calculados...5 6.Caso de uso: Creación de consultas MDX...5

Más detalles

Tutorial de MySQL Lección IV Funciones de Agregación

Tutorial de MySQL Lección IV Funciones de Agregación 1 Universidad del Quindío - Ingeniería de Sistemas - Leonardo Hernández R. leonardohernandez@telesat.com.co www.geocities.com/leoher314 Mar.3/2002, Sep.14/2002, Mar.17/2003 Tutorial de MySQL -----------------------

Más detalles

Los DLL que permiten crear y definir nuevas bases de datos, campos e índices.

Los DLL que permiten crear y definir nuevas bases de datos, campos e índices. Componentes del SQL El lenguaje SQL está compuesto por comandos, cláusulas, operadores y funciones agregadas. Estos elementos se combinan en las instrucciones para crear, actualizar y manipular las bases

Más detalles

ÍNDICE. Introducción... Capítulo 1. Características, instalación, inicio y entorno de trabajo... 1

ÍNDICE. Introducción... Capítulo 1. Características, instalación, inicio y entorno de trabajo... 1 ÍNDICE Introducción... XI Capítulo 1. Características, instalación, inicio y entorno de trabajo... 1 Características y novedades de Access 2010... 1 Comienzo rápido del trabajo y seguimiento de la información...

Más detalles

CEP GUÍA DE REFERENCIA

CEP GUÍA DE REFERENCIA CEP GUÍA DE REFERENCIA NOVIEMBRE 2014 1 INDICE 1 INDICE... 2 2 INTRODUCCIÓN... 3 2.1 OBJETIVOS Y ALCANCE DEL PRESENTE DOCUMENTO... 3 3 SINTAXIS DEL CEP DE SOFIA2... 4 3.1 CONCEPTOS PREVIOS... 4 3.2 DEFINICIÓN

Más detalles

SQL DML Select. Ges$ón y Modelación de Datos. María Constanza Pabón

SQL DML Select. Ges$ón y Modelación de Datos. María Constanza Pabón SQL DML Select Ges$ón y Modelación de Datos María Constanza Pabón mcpabon@javerianacali.edu.co SQL - DML Sentencias: INSERT UPDATE DELETE SELECT SQL - DML Query (consulta): proceso de recuperar datos de

Más detalles

Inteligencia de Negocios. Modelado Multidimensional Lógico

Inteligencia de Negocios. Modelado Multidimensional Lógico Modelado Multidimensional Lógico Esquema de la clase 1. Modelado multidimensional lógico Qué es? 2. Modelo estrella, copo de nieve y mixto 3. Construcción del DW Subjetivo - Estructura del Modelo de datos

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 5 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Data Warehouse Modelo multidimensional Diagrama

Más detalles

Introducción: Data Mining

Introducción: Data Mining Introducción: Data Mining Qué es la minería de datos? Extracción de modelos y patrones interesantes, potencialmente útiles y no triviales desde bases de datos de gran tamaño. Conceptos de Data Mining Modelo:

Más detalles

Uso de sentencias avanzadas

Uso de sentencias avanzadas Base de datos I Uso de sentencias avanzadas Objetivos: Elaborar sentencias de manejo de datos. Introducción: Después de trabajar con las sentencias de agregar, modificar, editar y visualizar datos, debemos

Más detalles

SQL SERVER Curso Teórico-Práctico

SQL SERVER Curso Teórico-Práctico SQL SERVER 2008-2012 Curso Teórico-Práctico IMPLEMENTACION DE LA BASE DE DATOS Nomenclatura Todas las tablas tendrán: - Un identificador de tipo entero auto numérico. Ésta será la clave primaria. La denominamos

Más detalles

FUNDAMENTOS ORACLE 12C

FUNDAMENTOS ORACLE 12C FUNDAMENTOS ORACLE 12C Introducción a Oracle Fundamentos 12c Aprende a programar en SQL con la base de datos más poderosa del mercado. Diseña y modela bases de datos corporativas utilizando las herramientas

Más detalles

FUNDAMENTOS DE INTELIGENCIA DE NEGOCIOS

FUNDAMENTOS DE INTELIGENCIA DE NEGOCIOS FUNDAMENTOS DE INTELIGENCIA DE NEGOCIOS Estructura de contenidos INTRODUCCIÓN... 3 1. INTELIGENCIA DE NEGOCIOS... 3 1.1. La implementación de un esquema de BI permite:... 4 1.2. Selección de Indicadores:...

Más detalles

SQL Básico. José Muñoz Jimeno Febrero 2015

SQL Básico. José Muñoz Jimeno Febrero 2015 SQL Básico José Muñoz Jimeno Febrero 2015 Control de cambios Version Fecha Comentarios 1.0 13/02/2015 Primera versión para el curso Introducción a las bases de datos con MySQL en el COITCV La última versión

Más detalles

Pero es que además, en ocasiones no hay otra forma de conseguir el resultado deseado que crear la consulta directamente en SQL.

Pero es que además, en ocasiones no hay otra forma de conseguir el resultado deseado que crear la consulta directamente en SQL. 1. INTRODUCCIÓN A unque ya hemos visto cómo realizar consultas para obtener resultados de una base de datos Access a través de la vista Diseño, debes conocer el lenguaje en el que realmente se realizan

Más detalles

Oracle Fundamentos. Programa de Estudio.

Oracle Fundamentos. Programa de Estudio. Oracle Fundamentos Programa de Estudio Oracle Fundamentos Aprende a programar en SQL con la base de datos más poderosa del mercado. Diseña y modela bases de datos corporativas utilizando las herramientas

Más detalles

Oracle Fundamentos. Programa de Estudio.

Oracle Fundamentos. Programa de Estudio. Oracle Fundamentos Programa de Estudio Oracle Fundamentos Aprende a programar en SQL con la base de datos más poderosa del mercado. Diseña y modela bases de datos corporativas utilizando las herramientas

Más detalles

TEMA 4.. CONSULTA DE DATOS I.

TEMA 4.. CONSULTA DE DATOS I. TEMA 4.. CONSULTA DE DATOS I. 4.1 El lenguaje DML (Lenguaje de manipulación de datos) Las sentencias DML(Data Manipulation Language) del lenguaje SQL (Structured Query Language o Lenguaje de peticiones

Más detalles

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data

DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER Big Data DESARROLLO APLICACIONES BUSINESS INTELLIGENCE CON MS SQL SERVER 2016 + Big Data DESCRIPCIÓN Este curso está orientado a brindar a los alumnos los fundamentos necesarios en el campo del Business Intelligence

Más detalles

Taller de Herramientas de Software : ST 213 Secc: V y W

Taller de Herramientas de Software : ST 213 Secc: V y W Universidad Nacional De Ingeniería Facultad Ingeniería Industrial y de Sistemas Taller de Herramientas de Software : ST 213 Secc: V y W SESION Nro. 9 CONSULTAS MULTITABLAS FUNCIONES RESUMEN Docente: Ing.

Más detalles

Área Académica: Sistemas Computacionales. Tema: Explotación de un Almacén de Datos: Herramientas OLAP. Profesor: Mtro Felipe de Jesus Nuñez Cardenas

Área Académica: Sistemas Computacionales. Tema: Explotación de un Almacén de Datos: Herramientas OLAP. Profesor: Mtro Felipe de Jesus Nuñez Cardenas Área Académica: Sistemas Computacionales Tema: Explotación de un Almacén de Datos: Herramientas OLAP Profesor: Mtro Felipe de Jesus Nuñez Cardenas Periodo:Agosto Noviembre 2011 Keywords Herramientas OLAP,

Más detalles

ÍNDICE. Introducción... XVII. Capítulo 1. Oracle 10g y el Grid Computing... 1

ÍNDICE. Introducción... XVII. Capítulo 1. Oracle 10g y el Grid Computing... 1 ÍNDICE Introducción... XVII Capítulo 1. Oracle 10g y el Grid Computing... 1 Necesidad del Grid Computing... 1 Concepto de Grid Computing... 4 Oracle Grid Computing... 5 Almacenamiento eficiente de información...

Más detalles

Capítulo 4. Realización de consultas

Capítulo 4. Realización de consultas Capítulo 4 Realización de consultas ÍNDICE CAPÍTULO 4 Introducción sentencia SELECT Base de datos de ejemplo Consultas básicas Cláusula ORDER BY Cláusula DISTINCT Cláusula LIMIT Expresiones Funciones propias

Más detalles

SELECT listadecampos FROM nombredetablas WHERE condicionesdebúsqueda;

SELECT listadecampos FROM nombredetablas WHERE condicionesdebúsqueda; SQL El Lenguaje de Consulta Estructurado (SQL) se usa para consultar, actualizar y administrar bases de datos relacionales, tales como las de Microsoft Access. Al crear una consulta en la ventana Consulta,

Más detalles

Consultas SQL INNER JOIN

Consultas SQL INNER JOIN Consultas SQL INNER JOIN Inner join sólo produce los registros que coinciden en las dos tablas A y B. 2. INNER JOIN TablaB Full outer join produce el conjunto de todos los registros en las tablas A y B,

Más detalles

Sistemas de Información Gerencial

Sistemas de Información Gerencial Sistemas de Información Gerencial Tema 6: Inteligencia de Negocios: Modelo Dimensional Ing. Francisco Rodríguez Novoa 1 INDICE OLTP. OLAP Modelo Estrella. Modelo Copa de Nieve Modelo Dimensional 2 Mapa

Más detalles

MANUAL BÁSICO DEL LENGUAJE SQL

MANUAL BÁSICO DEL LENGUAJE SQL MANUAL BÁSICO DEL LENGUAJE SQL INTRODUCCIÓN A continuación se presentan lo que son comandos DLL y DML, las clausulas, lo operadores (lógicos y de comparación), funciones de agregado, consultas, tipos de

Más detalles

Diseño multidimensional. Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González

Diseño multidimensional. Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González Diseño multidimensional Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González Índice Necesidades de los analistas y herramientas OLAP Multidimensionalidad Diseño lógico Necesidades de

Más detalles

RESUMEN SQL. Tipo de coincidencia Modelo Planteado Coincide No coincide. Varios caracteres 'ab*' 'abcdefg', 'abc' 'cab', 'aab'

RESUMEN SQL. Tipo de coincidencia Modelo Planteado Coincide No coincide. Varios caracteres 'ab*' 'abcdefg', 'abc' 'cab', 'aab' RESUMEN SQL Agustina Botas May COMO SE ESCRIBE UNA CONSULTA SELECT : campos WHERE : criterios que se aplican directamente a los datos (aplica a TODOS los registros) GROUP BY: agrupación de los datos seleccionados

Más detalles

LENGUAJE DE MANIPULACIÓN DE DATOS (DML) CONSULTA DE DATOS

LENGUAJE DE MANIPULACIÓN DE DATOS (DML) CONSULTA DE DATOS PREVIO 5 LENGUAJE DE MANIPULACIÓN DE DATOS (DML) CONSULTA DE DATOS INTRODUCCIÓN SQL permite realizar consultas con condiciones de búsqueda, de tal forma que los resultados son precisamente aquellos que

Más detalles

Capítulo 5. Construcción de un prototipo. Se implementó un prototipo basado en la arquitectura para análisis de información Zombi.

Capítulo 5. Construcción de un prototipo. Se implementó un prototipo basado en la arquitectura para análisis de información Zombi. Capítulo 5 Construcción de un prototipo Se implementó un prototipo basado en la arquitectura para análisis de información Zombi. Se utilizaron principalmente dos herramientas de uso gratuito: el servidor

Más detalles

Consultas en JPA-QL. Sistemas de Persistencia de Objetos

Consultas en JPA-QL. Sistemas de Persistencia de Objetos Consultas en JPA-QL Sistemas de Persistencia de Objetos Contenidos nov-08 Alberto MFA alb@uniovi.es 2 Preparación y ejecución nov-08 Alberto MFA alb@uniovi.es 3 Creación HQL y JPA QL QBC y QBE (Query By

Más detalles

Sistemas de Información 12/13 La organización de datos e información

Sistemas de Información 12/13 La organización de datos e información 12/13 La organización de datos e información Departamento Informática e Ingeniería de Sistemas Universidad de Zaragoza (raqueltl@unizar.es) " Guión Introducción: Data Warehouses Características: entornos

Más detalles

El SQL es un lenguaje estándar de programación para el acceso a bases de datos.

El SQL es un lenguaje estándar de programación para el acceso a bases de datos. El SQL es un lenguaje estándar de programación para el acceso a bases de datos. El lenguaje SQL se utiliza para acceder y manipular datos en cualquier base de datos del mercado, como por ejemplo, para

Más detalles

Vistas en InformiX Sistemas de Bases de Datos II EMT CETP A/S Leonardo Carámbula

Vistas en InformiX Sistemas de Bases de Datos II EMT CETP A/S Leonardo Carámbula Vistas en InformiX Características Una vista es una tabla virtual cuyo contenido está definido por una consulta SELECT. Al igual que una tabla real, una vista tiene: un nombre un conjunto de columnas con

Más detalles

PONTIFICIA UNIVERSIDAD CATOLICA DEL ECUADOR TEMA: AUTOR: DIRECTOR:

PONTIFICIA UNIVERSIDAD CATOLICA DEL ECUADOR TEMA: AUTOR: DIRECTOR: PONTIFICIA UNIVERSIDAD CATOLICA DEL ECUADOR FACULTAD DE INGENIERIA ESCUELA DE SISTEMAS TEMA: PRINCIPIOS Y TÉCNICAS PRÁCTICAS PARA LA IMPLEMENTACIÓN DE UN PROTOTIPO DE DATA WAREHOUSE EN SQL SERVER 2000

Más detalles

Procesamiento Analítico en Línea IBARRA MARIA DE LOS ANGELES

Procesamiento Analítico en Línea IBARRA MARIA DE LOS ANGELES IBM DB2 OLAP SERVER Procesamiento Analítico en Línea IBARRA MARIA DE LOS ANGELES 2006 Índice Introducción Data warehouse Data mart Sistemas OLTP Sistemas OLAP Operaciones analíticas básicas Vista de datos

Más detalles

20761 Querying Data with Transact-SQL

20761 Querying Data with Transact-SQL 20761 20761 Querying Data with Transact-SQL Fabricante: Microsoft Grupo: Bases de Datos Subgrupo: Microsoft SQL Server 2016 Formación: Presencial Horas: 25 Introducción Este curso está diseñado para presentar

Más detalles

Lenguaje de manipulación de datos

Lenguaje de manipulación de datos Introducción Lenguaje de manipulación de datos (Data Manipulation Language) Permite a los usuarios llevar a cabo las tareas de consulta o manipulación de la BD. El más popular es SQL. Tablas de ejemplo

Más detalles

Conceptos de Inteligencia Empresarial

Conceptos de Inteligencia Empresarial Conceptos de Inteligencia Empresarial Business Intelligence Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business intelligence), al conjunto de estrategias, aplicaciones,

Más detalles

Aux 2. Introducción a la Minería de Datos

Aux 2. Introducción a la Minería de Datos Aux 2. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial

Más detalles

SQL, Consultas. Son Importantes las Consultas? Cuál es el Resultado de SELECT? Andrés Moreno S.

SQL, Consultas. Son Importantes las Consultas? Cuál es el Resultado de SELECT? Andrés Moreno S. SQL, Consultas Andrés Moreno S. 1 Son Importantes las Consultas? Una cosa es guardar la información en forma estructurada y ordenada. Pero el utilizar la información y entender su relevancia son la clave

Más detalles

Bases de Datos Relacionales III

Bases de Datos Relacionales III Introducción a la Computación Bases de Datos Relacionales III Esteban E. Mocskos (emocskos@dc.uba.ar) Facultad de Ciencias Exactas y Naturales, UBA CONICET 11/06/2013 E. Mocskos (UBA CONICET) Clase 15:

Más detalles

CC BASES DE DATOS OTOÑO 2018

CC BASES DE DATOS OTOÑO 2018 CC3201-1 BASES DE DATOS OTOÑO 2018 Clase 6: SQL (II) Aidan Hogan aidhog@gmail.com Forma básica de una consulta de SQL Los planetas EL TEMA DE HOY MÁS SQL! Capítulo 5.4-5.6 Ramakrishnan / Gehrke El Álgebra

Más detalles

Modulo I: Introducción Gestores de Bases De Datos

Modulo I: Introducción Gestores de Bases De Datos Modulo I: Introducción Gestores de Bases De Datos El SQL El SQL (Lenguaje de Consulta Estructurado Structure Query Language), es un lenguaje de consulta estructurado establecido claramente como el lenguaje

Más detalles

CC BASES DE DATOS PRIMAVERA Clase 7: SQL (II) Aidan Hogan

CC BASES DE DATOS PRIMAVERA Clase 7: SQL (II) Aidan Hogan CC3201-1 BASES DE DATOS PRIMAVERA 2016 Clase 7: SQL (II) Aidan Hogan aidhog@gmail.com El Cálculo Relacional (de tuplas) Fórmulas atómicas: Una fórmula puede ser Una fórmula atómica o Sean (recursivamente)

Más detalles

CC BASES DE DATOS OTOÑO Clase 5: SQL (II) Aidan Hogan

CC BASES DE DATOS OTOÑO Clase 5: SQL (II) Aidan Hogan CC3201-1 BASES DE DATOS OTOÑO 2017 Clase 5: SQL (II) Aidan Hogan aidhog@gmail.com El Cálculo Relacional (de tuplas) Fórmulas atómicas: Una fórmula puede ser Una fórmula atómica o Sean (recursivamente)

Más detalles

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI NOMBRE DE LA ASIGNATURA: BASES DE DATOS III FECHA DE ELABORACIÓN: ENERO 2005 ÁREA DEL PLAN DE ESTUDIOS: AS ( ) AC ( )

Más detalles

SUBCONSULTAS SQL. Cuando se ejecuta una consulta que contiene una subconsulta, la subconsulta se ejecuta por cada fila de la consulta principal.

SUBCONSULTAS SQL. Cuando se ejecuta una consulta que contiene una subconsulta, la subconsulta se ejecuta por cada fila de la consulta principal. SUBCONSULTAS SQL DEFINICION. Una subconsulta es una sentencia SELECT que aparece dentro de otra sentencia SELECT que llamaremos consulta principal. Se puede encontrar en la lista de selección, en la cláusula

Más detalles

Organización y Acceso a Datos

Organización y Acceso a Datos Organización y Acceso a Datos Referencias: capítulos 5 y 6 de Fundamentals of Database Systems CSI-INCO Fundamentos de Bases de Datos 1 Organización física de datos leído usando BUFFER ubicados en forman

Más detalles

Oracle Database 12c SQL and PLSQL Fundamentals

Oracle Database 12c SQL and PLSQL Fundamentals Oracle Database 12c SQL and PLSQL Fundamentals DESCRIPCION MODULOS DE CAPACITACION Introducción Información general sobre 12c de base de datos Oracle y productos afines Descripción de los conceptos y la

Más detalles

Administración de las Bases de Datos

Administración de las Bases de Datos Universidad Alonso de Ojeda Facultad de Ingeniería Administración de las Bases de Datos Base de Datos II Profesora: Anaylen López Base de Datos Distribuidas Concepto "Base de datos distribuida" es en realidad

Más detalles

UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR CARRERA PROFESIONAL DE INGENIERÍA DE SISTEMAS

UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR CARRERA PROFESIONAL DE INGENIERÍA DE SISTEMAS UNIVERSIDAD NACIONAL TECNOLÓGICA DE LIMA SUR CARRERA PROFESIONAL DE INGENIERÍA DE SISTEMAS INFORME DE SUSTENTACIÓN DESARROLLO DE UNA SOLUCIÓN DE INTELIGENCIA DE NEGOCIOS COMO HERRAMIENTA DE APOYO A LA

Más detalles

Operadores. Además se pueden emplear en sentencias SET.

Operadores. Además se pueden emplear en sentencias SET. Operadores MySQL dispone de multitud de operadores diferentes para cada uno de los tipos de columna. Esos operadores se utilizan para construir expresiones que se usan en cláusulas ORDER BY y HAVING de

Más detalles

DISEÑO FÍSICO. Tema 14. Diseño Físico

DISEÑO FÍSICO. Tema 14. Diseño Físico DISEÑO FÍSICO Tema 14. Diseño Físico Introducción Las bases de datos se organizan en dos secciones: El esquema Los datos o instancias El esquema es la definición de la BD: El nombre de cada tabla El nombre

Más detalles

Práctica 2: CONSULTAS

Práctica 2: CONSULTAS Departamento de Lenguajes y Sistemas Informáticos E.T.S. Ingeniería Informática. Universidad de Sevilla Avda Reina Mercedes s/n. 41012 Sevilla Tlf/Fax 954 557 139 E-mail lsi@lsi.us.es Web www.lsi.us.es

Más detalles