Análisis de Asociaciones

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Análisis de Asociaciones"

Transcripción

1 Análisis de Asociaciones

2 Asociaciones Establecer vínculos entre los registros Asociaciones (productos que se compran juntos) Patrones secuenciales (si se compra algo en una fecha en x meses se adquiere otro producto) Secuencias similares. Detecta fenómenos con comportamientos similares

3 Análisis de la cesta de la compra Uso información de lo que compran los clientes para intentar descubrir Quien? Y Por qué? Se compran esos productos. múltiples acciones relativamente cercanas en en tiempo hay una potencial aplicación de este problema Compras con la tarjeta de crédito Servicios contratados...

4 Análisis de la cesta de la compra Reglas de asociación Dado un conjunto de registros, encontrar reglas que predicen la ocurrencia de un ítem, basándose en las ocurrencias de otros ítems en el registro

5 Análisis de la cesta de la compra Market-Basket transaction TID Items Bread, Milk Bread, Diaper, Beer, Eggs Milk, Diaper, Beer, Coke Bread, Milk, Diaper, Beer Bread, Milk, Diaper, Coke

6 Análisis de la cesta de la compra

7 Análisis de la cesta de la compra Importancia Conocer la relación entre un conjunto de datos, por ejemplo, la temperatura, el clima y la aparición de una enfermedad Tomar decisiones estratégicas en un negocio; ubicación de productos en un supermercado

8 Análisis de la cesta de la compra Estructura de las reglas P 1 P 2 P 3 P m C 1 C 2... C n P i : premisa o antecedente de la regla C j : conclusión

9 Análisis de la cesta de la compra Estructura de las reglas Para describir la compra de los usuarios en un almacén se puede tener: computer financial_management_software

10 Análisis de la cesta de la compra Estructura de las reglas Describir compra de los usuarios age(x, ) income(x, 42K 48K ) buys(x, high resolution TV)

11 Análisis de la cesta de la compra Medidas sobre reglas Personal_computer Printer Laptop_computer Digital_camera Cuál de las reglas es más significativa? Con qué certeza se puede asegurar la regla en un conjunto de datos?

12 Reglas de asociación Medidas sobre reglas Soporte(A B)=P(A B) Confianza(A B)=P(B A)

13 Data Mining

14 Data Mining

15 Reglas de asociación Medidas sobre reglas Personal_computer Printer Soporte=16% Confianza=60% Si las reglas se obtuvieron de un conjunto de 100 datos, qué indican el soporte y la confianza

16 Reglas de asociación Medidas sobre reglas Soporte(X Y)=P(X Y) Confianza(X Y)=P(Y X) X X X X X X W W Y Y Y Z Z Z X Y

17 Reglas de asociación Conversión de datos Cada ítem: un identificador Tabla de valores booleanos :representación transacción

18 Milk=I1 Eggs=I2 Coke=I3 Beer=I4 Bread=I5 Se asignan identificadores a cada ítem TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item milk, eggs, bread eggs, beer eggs, coke milk, eggs, beer milk, coke egs, coke milk, coke milk, eggs, coke, bread milk, eggs, coke

19 Milk=I1 Eggs=I2 Coke=I3 Beer=I4 Bread=I5 TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item I1, I2, I5 I2, I4 I2, I3 I1, I2, I4 I1, I3 I2, I3 I1, I3 I1, I2, I3, I5 I1, I2, I3

20 Reglas de asociación:generalidades Encontrar itemsets frecuentes: conjuntos de items superan minimum support count Generar reglas de asociación a partir itemsets frecuentes

21 Reglas de asociación Es el itemset {milk, coke} frecuente?. Considere un support count de 2 TID T100 T200 T300 T400 T500 T600 T700 List of Item milk, eggs, bread eggs, beer eggs, coke milk, eggs, beer milk, coke egs, coke milk, eggs, coke

22 Reglas de asociación:algoritmos Algoritmo Apriori: Propiedad Apriori Ejemplo: Si {milk, beer, bread} es itemset frecuente, entonces {milk, beer}, {milk, bread} y {beer, bread} también lo son.

23 Algoritmo Apriori Encuentra itemsets frecuentes usando generación de candidatos Solo se generan aquellos itemsets candidatos que cumplan la propiedad apriori Entrada: minimum support count + transacciones Salida: itemsets frecuentes del tamaño más grande posible + frecuencia para cada itemset

24 TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item I1, I2, I5 I2, I4 I2, I3 I1, I2, I4 I1, I3 I2, I3 I1, I3 I1, I2, I3, I5 I1, I2, I3 Minimum support count=2

25 C1 Scan DB for count of each candidate Itemset {I1} {I2} Sup-count Compare support {I3} {I4} {I5}

26 C1 Itemset Sup count Scan DB for count of each candidate {I1} {I2} 6 7 Compare support {I3} 6 {I4} 2 {I5} 2

27 C1 Itemset Sup count Scan DB for count of each candidate {I1} {I2} 6 7 Compare support {I3} 6 {I4} 2 {I5} 2 C1: candidatos de tamaño 1

28 C1 Itemset Sup count Scan DB for count of each candidate {I1} {I2} 6 7 Compare support {I3} 6 {I4} 2 {I5} 2 C1: candidatos de tamaño 1 Los itemset que no pasen el soporte mínimo se eliminan

29 L1 Itemset Sup count Compare support {I1} 6 Generate C2 {I2} 7 {I3} 6 {I4} 2 {I5} 2

30 C2 Itemset Generate C2 Scan DB for count of each candidate C2 : join de L1 con L1

31 Generate C2 C2 Itemset {I1,I2} {I1.I3} {I1,I4} {I1,I5} {I2,I3} {I2,I4} {I2,I5} {I3,I4} {I3,I5} {I4,I5} Scan DB for count of each candidate Para generar C2 se hace el join de L1 con L1

32 TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item I1, I2, I5 I2, I4 I2, I3 I1, I2, I4 I1, I3 I2, I3 I1, I3 I1, I2, I3, I5 I1, I2, I3

33 C2 Itemset Sup count {I1,I2} 4 Scan DB for count of each candidate {I1,I3} {I1,I4} {I1,I5} Compare support {I2,I3} 4 {I2,I4} 2 {I2,I5} 2 {I3,I4} 0 {I3,I5} 1 {I4,I5} 0

34 L2 Itemset Sup count Compare support {I1,I2} {I1,I3} 4 4 Generate C3 {I1,I5} 2 {I2,I3} 4 {I2,I4} 2 {I2,I5} 2

35 Generate C3 C3 Itemset {I1,I2, I3} {I1.I2, I5} Scan DB for count of each candidate

36 TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item I1, I2, I5 I2, I4 I2, I3 I1, I2, I4 I1, I3 I2, I3 I1, I3 I1, I2, I3, I5 I1, I2, I3

37 C3 Scan DB for count of each candidate Itemset {I1,I2, I3} Sup count 2 Compare support {I1.I2, I5} 2

38 L3 Compare support Itemset {I1,I2, I3} Sup count 2 Generate C4 {I1.I2, I5} 2

39 Itemset {I1,I2, I3, I5} El itemset {I2,I3,I5} no es frecuente

40 Algoritmo Apriori Generar reglas sobre el conjunto y calcular soporte y confianza support_count(a B)= Total transacciones contienen A y B confidence(a B)= support_count(a B) support_count(a)

41 Algoritmo Apriori Considere el itemset frecuente {I1,I2,I5}, Cuáles son las reglas que se pueden generar? I1 I2 I5 I1 I5 I2 I2 I5 I1 I1 I2 I5 I2 I1 I5 I5 I1 I2

42 Itemset {I1,I2, I3} {I1.I2, I5} Sup count 2 2

43 Itemset {I1,I2} {I1,I3} {I1,I5} {I2,I3} {I2,I4} {I2,I5} Sup count

44 Reglas Considere el itemset frecuente {I1,I2,I5}, Cuáles son las reglas que se pueden generar? I1 I2 I5, confidence=2/4=50% I1 I5 I2 I2 I5 I1 I1 I2 I5 I2 I1 I5 I5 I1 I2

45 Reglas de asociación I1 I2 I5, confidence=2/4=50% I1 I5 I2, confidence=2/2=100% I2 I5 I1, confidence=2/2=100% I1 I2 I5, confidence=2/6=33% I2 I1 I5, confidence=2/7=29% I5 I1 I2, confidence=2/2=100%

46 TID T100 T200 T300 T400 T500 T600 T700 T800 List of Item A, B, C C, D A, C A, B, D B, D B, C, D E, F D, E Minimum support count=2

47 Reglas de asociación Algoritmo FP-Growth Frequent Parent Growth: Encuentra los itemsets frecuentes sin generar candidatos Resultado igual Apriori Dos pasos: FP-tree, FP-Growth

48 FP-Growth: Arbol FP-Tree Construcción n del árbol FP-Tree Obtener frecuencias de los itemsets de tamaño 1 Ordene items descendentemente, de acuerdo las frecuencias, en una lista llamada L

49 TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item I1, I2, I5 I2, I4 I2, I3 I1, I2, I4 I1, I3 I2, I3 I1, I3 I1, I2, I3, I5 I1, I2, I3

50 Item I2 I1 I3 I5 I4 Frequency L=[I2:7 I1:6 I3=6 I4:2 I5:2 ]

51 Reglas de asociación Construcción del árbol FP-Tree Ordenar items en cada transacción en el orden dado por L

52 TID List of Item TID List of Item T100 I1, I2, I5 T100 I2, I1, I5 T200 I2, I4 T200 I2, I4 T300 I2, I3 T300 I2, I3 T400 I1, I2, I4 T400 I2, I1, I4 T500 I1, I3 T500 I1, I3 T600 I2, I3 T600 I2, I3 T700 I1, I3 T700 I1, I3 T800 I1, I2, I3, I5 T800 I2, I1, I3, I5 T900 I1, I2, I3 T900 I2, I1, I3 L=[I2:7 I1:6 I3=6 I4:2 I5:2 ]

53 FP-Growth Construcción del árbol FP-Tree Crear el nodo raíz del árbol con la etiqueta null o {} Construir el árbol con base en la lista de items ordenados

54 TID List of Item TID List of Item T100 I1, I2, I5 T100 I2, I1, I5 T200 I2, I4 T200 I2, I4 T300 I2, I3 T300 I2, I3 T400 I1, I2, I4 T400 I2, I1, I4 T500 I1, I3 T500 I1, I3 T600 I2, I3 T600 I2, I3 T700 I1, I3 T700 I1, I3 T800 I1, I2, I3, I5 T800 I2, I1, I3, I5 T900 I1, I2, I3 T900 I2, I1, I3 L=[I2:7 I1:6 I3=6 I4:2 I5:2 ]

55 null{} I2:7 I1:2 I1:4 I4:1 I3:2 I3:2 I5:1 I4:1 I3:2 I5:1

56 TID T100 T200 T300 T400 T500 T600 T700 T800 T900 List of Item I1, I2, I5 I2, I4 I2, I3 I1, I2, I4 I1, I3 I2, I3 I1, I3 I1, I2, I3, I5 I1, I2, I3

57 Itemset {I1,I2} {I1,I3} {I1,I5} {I2,I3} {I2,I4} {I2,I5} Sup count

58 Algoritmo FP-Growth Para cada item se determina su conditional pattern base Se crea un árbol FP con los elementos de cada base que cumplan con el minimum support count

59 Conditional pattern bases Item I2 I1 I3 I5 I4 Condition Pattern Base - I2:4 I2 I1:2, I2:2, I1:2 I2 I1 I3:1, I2 I1:1 I2 I1:1, I2:1

60 Conditional pattern bases Item I2 I1 I3 I5 I4 Condition Pattern Base - I2:4 I2 I1:2, I2:2, I1:2 I2 I1 I3:1, I2 I1:1 I2 I1:1, I2:1 null{} I2:4 Como I2:4 pasa el soporte mínimo, se asigna la frecuencia 4 al itemset I2 I1, esto es, I2 I1:4

61 Conditional pattern bases Item I2 I1 I3 I5 I4 Condition Pattern Base - I2:4 I2 I1:2, I2:2, I1:2 I2 I1 I3:1, I2.I1:1 I2 I1:1, I2:1 I2:4 I1:2 null{} I1:2 Genera los itemsets: I2 I3: 4 I2 I1 I3:2 I1 I3: 2

62 TID List of Item T100 A, B, C T200 C, D T300 A, C T400 A, B, D T500 B, D T600 B, C, D T700 E, F T800 D, E Minimum support count=2

63 TID T100 T200 T300 T400 T500 List of Item K,A,D,B D,A,C,E,B C,A,B,E B,A,D C,E,D Minimum support count=2

64 Ejemplo Si Leche y Pan entonces Zumo (Soporte:3/7=42.8%, Confianza: 3/3=100%)

65 Beneficios Puede ser punto de comienzo cuando no se sabe exactamente que tipos de patrones buscar. Los resultados son claros y muy útiles. Necesidad de distinguir entre las reglas Útiles Triviales: Conocidos por todos o porque podrían estar explicando resultados de campañas anteriore Inexplicables

66 Asociaciones para establecer comparativas Utilizadas comparar sucursales de una misma cadena Necesidad: enriquecer transacciones de manera que contenga productos virtuales que especifican el grupo de sucursales de donde proviene. Prestar atención a las transacciones que contienen los productos virtuales

67 Asociaciones para establecer comparativas (II) Se pueden también usar para: Comparar ventas durante promociones versus las ventas en cualquier otro momento Comparar ventas en áreas geográficas, por regiones, por zonas de marketing o por países... Comparar ventas en zonas urbanas y no urbanas Detectar diferencias en los patrones debidas a las distintas épocas del año

68 Requisitos No necesita especificar atributos de los lados derecho e izquierdo de las reglas pues se generan de manera automática Existen variedades para tratar todo tipo de datos Especificar mínimo soporte Especificar máximo número de reglas

69 Consideraciones La obtención de reglas de asociación están sujetas a las siguientes restricciones: En problemas reales el número de instancias a tratar es muy elevado (centenares de miles o más). También en casos reales el número de atributos es muy elevado (cientos o miles de atributos).

70 Consideraciones Los algoritmos de este tipo consideran que los datos de entrada están recogidos en una tabla transaccional. Para otro tipo de datos es necesario binarizar ciertos atributos.

71 Solución El problema de encontrar reglas de asociación se puede dividir en dos subproblemas: Encontrar el conjunto de productos que tienen el soporte mínimo requerido Usar los conjuntos frecuentes para generar las reglas El algoritmo Apriori es muy utilizado

72 Técnicas (I) Se pueden generar tablas de coocurrencias que van calculando las ocurrencias de pares de valores, tripletas,... Problemas: Explosión combinatoria Se necesita algún método (soportes mínimos) para evitar el crecimiento de las tablas

73 Algoritmos de Asociación Algoritmo Apriori [Agrawal 93] Objetivo: Obtener itemsets (conjuntos de valores que se repiten) de un determinado tamaño, para combinarlos en reglas.

74 Algoritmos de Asociación Algoritmo Apriori [Agrawal 93] Ventajas: Apriori y sus variantes son los más usados dentro de este tipo de análisis. Eficiencia para grandes volúmenes de datos muy elevada. Ciertos SGBD son capaces de ejecutar este algoritmo dentro del núcleo del gestor.

75 Algoritmos de Asociación Algoritmo Apriori [Agrawal 93] Limitaciones: Para ciertos datos de entrada, los resultados intermedios consumen gran cantidad de recursos (memoria).

76 Algoritmos de Asociación: Apriori I1={a 1,a 2,a 3,...} conjunto de todos los atributos. i=1 1) Se recorre la tabla de entrada y se actualiza el conjunto Li={l 1,l 2,l 3,...} donde cada l i es el par formado por un elemento de I i y por el número de veces que dicho elemento ocurre en los datos de entrada.

77 Algoritmos de Asociación 2) Se eliminan de L i los elementos cuyo contador no supere el umbral mínimo. 3) Se genera un nuevo conjunto L i+1 como el de grupos de atributos de tamaño i+1 a partir de los conjuntos de atributos de L i 4) Si L i no está vacío e i <MAX regresar a 1)

78 Ejemplo: Apriori I 1 ={A,B,C,D,E} L 1 ={(A,3);(B,8);(C,7);(D,6);(E, 6)} I 2 ={BC,BD,BE,CD,CE,DE} L 2 ={(BC,5);(BD,5);(BE,5); (CD,4);(CE,3);(DE,3)} I 3 ={BCD} L 3 ={(BCD,4)}

79 Uso de taxonomías y valores virtuales A veces es muy útil disponer de generalizaciones o agrupaciones de los productos que se están considerando Eligiendo de manera inteligente el nivel al que generalizar se pueden mejorar los resultados Para establecer hábitos de los clientes (productos bajos en calorías,...) se pueden insertar productos virtuales y analizar las asociaciones que los contengan.

80 Generación de reglas A veces las combinaciones obtenidas pueden ser de utilidad y se pueden obtener reglas que pueden ser interesantes. Las reglas de asociación toman la forma: Si condición entonces resultado donde tanto la condición como el resultado son combinaciones disjuntas de productos Hay que establecer parámetros para medir la bondad de las reglas

81 Calidad de las reglas (I) Soporte: es el porcentaje de transacciones que contienen tanto la condición como el resultado. Esto es, porcentaje de transacciones donde la regla es cierta Confianza: es el porcentaje de transacciones que conteniendo la condición también contienen el resultado. Es decir es la probabilidad de que se encuentre el resultado dada la condición

82 Reglas de disociación Es similar a una regla de asociación solo que puede tener el conector Y NO en la condición Hay que insertar los inversos lo que tiene desventajas: Se dobla el número de ítems Aumenta el tamaño de la transacción La frecuencia de los negados tiende a ser mucho mayor Interesante invertir sólo ciertos ítems.

83 Patrones secuenciales mediante asociaciones Mediante las asociaciones descubren sucesos que ocurren juntos. La siguiente pregunta considera secuencias de eventos. Las cortinas se compran antes de los muebles Cuando un cliente en un banco pide el balance de cuenta hay alta probabilidad de que lo siguiente sea el cierre de la cuenta Los patrones secuenciales requieren la identidad del cliente

84 Patrones secuenciales Para poder calcularlos se necesita unir (ordenar) a cada suceso una fecha Generalmente no se van a calcular las reglas. El interés está en las asociaciones Es una primera aproximación. Para el análisis de series temporales existen métodos más específicos (redes neuronales y regresión)

85 Asociaciones: Conclusiones Es un método simple pero robusto con resultados muy claros Tener cuidado con la calidad de las reglas Elimina combinaciones de elementos raros Se puede utilizar aunque no se tenga información de los clientes La jerarquías y los objetos virtuales pueden ayudar a obtener mejores resultados Permite una primera aproximación a los datos

86 Supermercados como brokers de información La información de qué clientes compran qué productos sería de gran interés para los suministradores de los grandes almacenes. Los dueños de la información son los supermercados, las compañías de tarjetas de crédito,... Pueden actuar de intermediarios en campañas de marketing directo enviando el mailing a los clientes objetivo.

87 Ejemplo: Uso de clustering y asociaciones Utilización de las tarjetas de cliente para introducirles productos que no han probado todavía. Mejorar la gestión de una categoría de productos

88 Ejemplo1: Los datos Se tienen los datos de cada producto que pasa por un punto de venta (POS): Fecha Almacén Hora UPC del producto Cantidad del producto Total gastado en ese producto Datos del archivo de resumen que contiene el cliente el modo de pago y resúmenes

89 Integración de los datos Se unirán ambos archivos sin utilizar los datos de resumen. Si se intenta regenerar los resúmenes se pueden encontrar importante información de los datos: Algunos UPC son cupones La cantidad a veces es el número de paquetes, otras el peso El precio total del resumen incluye impuestos

90 Los datos integrados Fecha Almacén Hora UPC del producto Cantidad del producto Total gastado en ese producto Identificación del cliente Forma de pago

91 Enriquecimiento de los datos Responder a preguntas del tipo: Quien compra qué Cuando lo compra Qué comprarán en el futuro Requiere más variables describir mejor los productos y el comportamiento del cliente.

92 Datos para enriquecer transacciones con información añadida: Almacén, cadena, línea Número de productos diferentes adquiridos Información sobre productos Descripción del tamaño Contenedor Margen del producto (alto, medio, bajo) Segmento (jerarquía) Subcategoría

93 Datos para enriquecer Sobre los clientes: Número de tarjetas Número de viajes al supermercado al día Total gastado al día Cuando compra (mañana tarde o noche) Porcentaje de productos que compra de cada margen Compras en fin de semana Compras en fiestas...

94 El problema de descubrimiento Se calculan asociaciones y no se encontraron patrones Se ejecutó un algoritmo de clustering (utilizando las variables demográficas y no las de productos comprados) y se encontraron segmentos distintos en la población Se buscaron asociaciones en los clusters más interesantes y en uno de ellos se encontró el target de la siguiente campaña.

Por Elizabeth León Guzmán, Ph.D. Profesora

Por Elizabeth León Guzmán, Ph.D. Profesora Por Elizabeth León Guzmán, Ph.D. Profesora 1 En una base de datos transaccional, transaccional cada transacción puede contener una lista de ítems (Ej: ítems comprados por un cliente) Id_transacci ón Items

Más detalles

Las reglas de asociación tienen diversas aplicaciones como:

Las reglas de asociación tienen diversas aplicaciones como: Capítulo 4 Reglas de Asociación El objetivo de las reglas de asociación es encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos transaccionales, relacionales o datawarehouses.

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Coordinación de Ciencias Computacionales INAOE. Reporte Técnico No. CCC-09-001 31 de Marzo de 2009

Coordinación de Ciencias Computacionales INAOE. Reporte Técnico No. CCC-09-001 31 de Marzo de 2009 Minería de Reglas de Asociación sobre Datos Mezclados Ansel Yoan Rodríguez González, José Francisco Martínez Trinidad, Jesús Ariel Carrasco Ochoa, José Ruiz Shulcloper Reporte Técnico No. CCC-09-001 31

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 2 - Juan Alfonso Lara Torralbo 1 Índice de contenidos (I) Introducción a Data Mining Actividad. Tipos

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Informática II Ing. Industrial. Data Warehouse. Data Mining

Informática II Ing. Industrial. Data Warehouse. Data Mining Data Warehouse Data Mining Definición de un Data Warehouses (DW) Fueron creados para dar apoyo a los niveles medios y altos de una empresa en la toma de decisiones a nivel estratégico en un corto o mediano

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

Análisis comparativo de algoritmos utilizados en la minería de secuencias frecuentes

Análisis comparativo de algoritmos utilizados en la minería de secuencias frecuentes Instituto de Cibernética, Matemática y Física Análisis comparativo de algoritmos utilizados en la minería de secuencias frecuentes TESIS EN OPCIÓN AL GRADO DE MÁSTER EN CIBERNÉTICA APLICADA, MENCIÓN MINERÍA

Más detalles

TID Artículos. 1 Pan, leche, huevos 2 Pan, pañales, cerveza 3 Leche, pañales, cerveza 4 Pan, leche, pañales, cerveza 5 Pan, leche, huevos, cerveza

TID Artículos. 1 Pan, leche, huevos 2 Pan, pañales, cerveza 3 Leche, pañales, cerveza 4 Pan, leche, pañales, cerveza 5 Pan, leche, huevos, cerveza Reglas de asociación Fernando Berzal, berzal@acm.org Reglas de asociación Introducción Definiciones Patrones frecuentes Reglas de asociación Extracción de reglas de asociación Identificación de patrones

Más detalles

Text Mining Introducción a Minería de Datos

Text Mining Introducción a Minería de Datos Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA Pablo F. Provasi 1 Lucio J. Kleisinger 1 Francisco R. Villatoro 2 1 Dpto. de Informática, Universidad

Más detalles

Integración de técnicas de Minería de datos y metaheurísticas en sitios de comercio electrónico

Integración de técnicas de Minería de datos y metaheurísticas en sitios de comercio electrónico 1 Integración de técnicas de Minería de datos y metaheurísticas en sitios de comercio electrónico Barragán Edgar, Giraldo Fabián Andrés, Londoño Isabel RESUMEN En este artículo se presenta una herramienta

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Minería de Datos. Universidad Politécnica de Victoria

Minería de Datos. Universidad Politécnica de Victoria Minería de Datos Universidad Politécnica de Victoria 1 Motivación Nuevas Necesidades del Análisis de Grandes Volúmenes de Datos El aumento del volumen y variedad de información que se encuentra informatizada

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Habilidades y Herramientas para trabajar con datos

Habilidades y Herramientas para trabajar con datos Habilidades y Herramientas para trabajar con datos Marcelo Ferreyra X Jornadas de Data Mining & Business Intelligence Universidad Austral - Agenda 2 Tipos de Datos Herramientas conceptuales Herramientas

Más detalles

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II

Apoyo a la toma de Decisiones. Carlos A. Olarte Bases de Datos II Carlos A. Olarte Bases de Datos II Contenido 1 Introducción 2 OLAP 3 Data Ware Housing 4 Data Mining Introducción y Motivación Cómo puede analizarse de forma eficiente volúmenes masivos de datos? La consulta,

Más detalles

Capítulo V Operaciones Booleanas

Capítulo V Operaciones Booleanas 85 Capítulo V Operaciones Booleanas 5.1 Introducción Es muy posible que en muchos casos sea necesario comparar dos objetos y determinar cuál es su parte común. Esto implica intersectar los dos objetos

Más detalles

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones. 2.1 Revisión sistema reconocimiento caracteres [9]: Un sistema de reconocimiento típicamente esta conformado por

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

SISTEMAS INFORMATICOS I

SISTEMAS INFORMATICOS I SISTEMAS INFORMATICOS I DATAMINING Contenidos Introducción Datamining vs otras técnicas Ejemplos del Datamining Conceptos relacionados con el Datamining Aplicaciones del datamining Modelado del datamining

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

Una metaheurística para la extracción de reglas de asociación. Aplicación a terremotos.

Una metaheurística para la extracción de reglas de asociación. Aplicación a terremotos. Escuela Técnica Superior de Ingeniería Informática Máster Oficial en Ingeniería y Tecnología del Software TRABAJO FIN DE MÁSTER Una metaheurística para la extracción de reglas de asociación. Aplicación

Más detalles

Introducción. Growing on the CRM industry during 2001. Significant. decrease 4% Ns/nc 2% Slight decrease 4% Remains 5% Significant.

Introducción. Growing on the CRM industry during 2001. Significant. decrease 4% Ns/nc 2% Slight decrease 4% Remains 5% Significant. Introducción During next decade the number of Data Mining projects will increase dramatically (more than 300%) to improve the relationship with the customer and help companies to listen to their customers

Más detalles

Control Informático de Gestión. Tema 5: Sistemas de Apoyo a la Toma de Decisiones

Control Informático de Gestión. Tema 5: Sistemas de Apoyo a la Toma de Decisiones Control Informático de Gestión Tema 5: Sistemas de Apoyo a la Toma de Decisiones Índice Revisión de los sistemas de información en la empresa La información y la toma de decisiones Sistemas transaccionales

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

Prototipo de software para la asociación de datos UDAssociate

Prototipo de software para la asociación de datos UDAssociate Prototipo de software para la asociación de datos UDAssociate Tecn. Adriana Amaya Morales 1, Tecn. Martha Lucía Rodríguez 2, Ing. Jorge Enrique Rodríguez Rodríguez 3 RESUMEN UDAssociate es una herramienta

Más detalles

WEB MINING FOR IDENTIFYING PATTERNS

WEB MINING FOR IDENTIFYING PATTERNS Minería de uso Web para la identificación de patrones Castaño P. Andres P. * Resumen La minería Web es la aplicación de técnicas de minería de datos para descubrir patrones de uso de los usuarios desde

Más detalles

ESTEREOTIPOS DE CLASES E TIDAD Y CLUSTERI G DE OBJETOS E SISTEMAS DE GESTIO

ESTEREOTIPOS DE CLASES E TIDAD Y CLUSTERI G DE OBJETOS E SISTEMAS DE GESTIO ESTEREOTIPOS DE CLASES E TIDAD Y CLUSTERI G DE OBJETOS E SISTEMAS DE GESTIO Servetto, A. 1 ; López, G. 2 ; Jeder, I. 2 ; Echeverría, A. 2 ; Grossi, M.D. 1 1. Laboratorio de Sistemas Operativos y Bases

Más detalles

Ideas innovadoras para una mejor práctica de negocios

Ideas innovadoras para una mejor práctica de negocios Ideas innovadoras para una mejor práctica de negocios ISSN 1668-5792 Volumen V, Marzo de 2007 El Portafolio de Productos en el Mercado de Consumo Masivo - Parte II Demián Siburi Pág. 3 Data Mining y Generación

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

Generación de conjuntos de ítems y reglas de asociación

Generación de conjuntos de ítems y reglas de asociación Generación de conjuntos de ítems y reglas de asociación José E. Medina Pagola, José Hernández Palancar, Raudel Hernández León, Airel Pérez Suárez, Abdel Hechavarría Díaz, Ricardo González Gazapo Dpto.

Más detalles

Introducción a los Algoritmos Genéticos

Introducción a los Algoritmos Genéticos Introducción a los Algoritmos Genéticos Francisco José Ribadas Pena INTELIGENCIA ARTIFICIAL 5 Informática ribadas@uvigo.es 17 de octubre de 2005 c FJRP 2005 ccia IA Métodos de 8 < : 1 Introducción 9 =

Más detalles

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler

Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería

Más detalles

JUAN CAMILO GIRALDO MEJÍA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE MINAS ESCUELA DE INGENIERÍAS SEDE MEDELLÍN 2009

JUAN CAMILO GIRALDO MEJÍA UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE MINAS ESCUELA DE INGENIERÍAS SEDE MEDELLÍN 2009 CARACTERIZACIÓN DE ALGUNAS TÉCNICAS ALGORITMICAS DE LA INTELIGENCIA ARTIFICIAL PARA EL DESCUBRIMIENTO DE ASOCIACIONES ENTRE VARIABLES Y SU APLICACIÓN EN UN CASO DE INVESTIGACIÓN ESPECÍFICO JUAN CAMILO

Más detalles

Qué es DataMining? Mg. Cecilia Ruz Luis Azaña Bocanegra

Qué es DataMining? Mg. Cecilia Ruz Luis Azaña Bocanegra Qué es DataMining? Mg. Cecilia Ruz Luis Azaña Bocanegra Agenda Qué es Data Mining? Cómo se integra en el proceso de Descubrimiento del conocimiento? Funcionalidades del Data Mining Técnicas Supervisadas

Más detalles

Trabajo Practico N 12

Trabajo Practico N 12 Trabajo Practico N 12 Minería de Datos CATEDRA: Actualidad Informática Ingeniería del Software III Titular: Mgter. Horacio Kuna JTP: Lic. Sergio Caballero Auxiliar: Yachesen Facundo CARRERAS: Analista

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

Diseño dimensional. Departamento de Lenguajes y Computación Universidad de Almería. Diseño dimensional. Contenidos

Diseño dimensional. Departamento de Lenguajes y Computación Universidad de Almería. Diseño dimensional. Contenidos Diseño y Construcción de Almacenes de datos Almería 2006 Diseño dimensional Manuel Torres Gil mtorres@ual.es Departamento de Lenguajes y Computación Universidad de Almería Diseño y Construcción de Almacenes

Más detalles

Data Mining o Minería de Datos

Data Mining o Minería de Datos Data Mining o Minería de Datos A quién se le ocurriría basar una de las estrategias comerciales para incrementar las ventas de una compañía de retail, en una correlación de consumo nada obvia entre pañales

Más detalles

Datamining y Aprendizaje Automatizado Dep. de Cs. e Ing. de la Computación, UNS 2do. Cuat. 2010. Prof. Carlos Iván Chesñevar

Datamining y Aprendizaje Automatizado Dep. de Cs. e Ing. de la Computación, UNS 2do. Cuat. 2010. Prof. Carlos Iván Chesñevar Datamining y Aprendizaje Automatizado 01 - Introducción. Conceptos Preliminares De qué tratará este curso Conceptos y técnicas básicas de Datamining. Conceptos y técnicas de Aprendizaje Automatizado. Análisis

Más detalles

Base de datos relacional

Base de datos relacional Base de datos relacional Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para modelar problemas reales y administrar

Más detalles

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/

Minería de Datos Web. 1 er Cuatrimestre 2015. Página Web. Prof. Dra. Daniela Godoy. http://www.exa.unicen.edu.ar/catedras/ageinweb/ Minería de Datos Web 1 er Cuatrimestre 2015 Página Web http://www.exa.unicen.edu.ar/catedras/ageinweb/ Prof. Dra. Daniela Godoy ISISTAN Research Institute UNICEN University Tandil, Bs. As., Argentina http://www.exa.unicen.edu.ar/~dgodoy

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

Registro (record): es la unidad básica de acceso y manipulación de la base de datos.

Registro (record): es la unidad básica de acceso y manipulación de la base de datos. UNIDAD II 1. Modelos de Bases de Datos. Modelo de Red. Representan las entidades en forma de nodos de un grafo y las asociaciones o interrelaciones entre estas, mediante los arcos que unen a dichos nodos.

Más detalles

Ingeniería en Informática

Ingeniería en Informática Departamento de Informática Universidad Carlos III de Madrid Ingeniería en Informática Aprendizaje Automático Junio 2007 Normas generales del examen El tiempo para realizar el examen es de 3 horas No se

Más detalles

Texto, imágenes, video Hiperenlaces Archivo log

Texto, imágenes, video Hiperenlaces Archivo log Web Mining Web Mining Aplicación técnicas data mining sobre datos que Web Descubrimiento automático información útil de documentos y servicios Web Texto, imágenes, video Hiperenlaces Archivo log Netcraft

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

UNIVERSIDAD CATÓLICA DEL NORTE FACULTAD DE INGENIERÍA Y CIENCIAS GEOLÓGICAS MAGÍSTER EN INGENIERÍA INFORMÁTICA

UNIVERSIDAD CATÓLICA DEL NORTE FACULTAD DE INGENIERÍA Y CIENCIAS GEOLÓGICAS MAGÍSTER EN INGENIERÍA INFORMÁTICA UNIVERSIDAD CATÓLICA DEL NORTE FACULTAD DE INGENIERÍA Y CIENCIAS GEOLÓGICAS MAGÍSTER EN INGENIERÍA INFORMÁTICA EVALUACIÓN EMPÍRICA DEL ACOPLAMIENTO DE ALGORITMOS DE MINERÍA DE DATOS A UN SISTEMA GESTOR

Más detalles

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP

Minería de Datos JESÚS ANTONIO GONZÁLEZ BERNAL. Universidad UPP Universidad Politécnica de Puebla UPP JESÚS ANTONIO GONZÁLEZ BERNAL 1 2 Evolución de la Tecnología BD 1960 s y antes Creación de las BD en archivos primitivos 1970 s hasta principios de los 1980 s BD Jerárquicas

Más detalles

Text mining versus redes neuronales. Dos métodos de análisis aplicados al caso de las políticas de las revistas sobre datos

Text mining versus redes neuronales. Dos métodos de análisis aplicados al caso de las políticas de las revistas sobre datos Text mining versus redes neuronales. Dos métodos de análisis aplicados al caso de las políticas de las revistas sobre datos Alicia García-García, Xavier García-Massó, Antonia Ferrer, Luis-Millán González,

Más detalles

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM?

Pero que es el Data Mining? Como esta tecnología puede resolver los problemas diarios de las organizaciones? Cuál es el ciclo de vida de un DM? Introducción En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat, sobre la posibilidad de la creación de nuevo conocimiento, he creido conveniente introducir el tema Data Mining

Más detalles

REGLAS DE ASOCIACIÓN APLICADAS A LA DETECCIÓN DE FRAUDE CON TARJETAS DE CRÉDITOS

REGLAS DE ASOCIACIÓN APLICADAS A LA DETECCIÓN DE FRAUDE CON TARJETAS DE CRÉDITOS REGLAS DE ASOCIACIÓN APLICADAS A LA DETECCIÓN DE FRAUDE CON TARJETAS DE CRÉDITOS María-Amparo Vila Miranda Daniel Sánchez Fernández Luis Cerda Leiva vila@decsai.ugr.es daniel@decsai.ugr.es lcerda@cientec.com

Más detalles

ISO 19103. Lenguaje de Esquema Conceptual

ISO 19103. Lenguaje de Esquema Conceptual ISO 19103 Lenguaje de Esquema Conceptual La ISO 19103 establece normas y guías para la adopción y uso de un Lenguaje de Esquema Conceptual (CSL) para desarrollar modelos o esquemas de información geográfica,

Más detalles

BASE DE DATOS RELACIONALES

BASE DE DATOS RELACIONALES BASE DE DATOS RELACIONALES Una base de datos relacional es una base de datos que cumple con el modelo relacional, el cual es el modelo más utilizado en la actualidad para implementar bases de datos ya

Más detalles

Sumario... 5 Prólogo... 7. Unidad didáctica 1. Introducción a la minería de datos... 9. Objetivos de la Unidad... 10

Sumario... 5 Prólogo... 7. Unidad didáctica 1. Introducción a la minería de datos... 9. Objetivos de la Unidad... 10 ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la minería de datos... 9 Objetivos de la Unidad... 10 1. Origen y motivación... 11 2. El proceso de descubrimiento

Más detalles

La inteligencia de marketing que desarrolla el conocimiento

La inteligencia de marketing que desarrolla el conocimiento La inteligencia de marketing que desarrolla el conocimiento SmartFocus facilita a los equipos de marketing y ventas la captación de consumidores con un enfoque muy relevante y centrado en el cliente. Ofrece

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Almacenamiento y Recuperación de la Información

Almacenamiento y Recuperación de la Información Almacenamiento y Recuperación de la Información Estructuras basicas de archivos Archivos Secuenciales 2do Semestre 2005 Wenceslao Palma M. www.inf.utfsm.cl/~wpalma/ari Una estructura

Más detalles

COMUNICADO Nro. 49763 08/11/2010. Ref.: Tarjetas de crédito. Tasas y costos promedio de las tarjetas de crédito a agosto de 2010. Tarjetas de Crédito

COMUNICADO Nro. 49763 08/11/2010. Ref.: Tarjetas de crédito. Tasas y costos promedio de las tarjetas de crédito a agosto de 2010. Tarjetas de Crédito "2010 - AÑO DEL BICENTENARIO DE LA REVOLUCION DE MAYO" COMUNICADO Nro. 49763 08/11/2010 Ref.: Tarjetas de crédito. Tasas y costos promedio de las tarjetas de crédito a agosto de 2010. Tarjetas de Crédito

Más detalles

Modelado Avanzado con Casos de Uso. Diseño de Software Avanzado Departamento de Informática

Modelado Avanzado con Casos de Uso. Diseño de Software Avanzado Departamento de Informática Modelado Avanzado con Casos de Uso Especificación Gráfica de Casos de Uso Una simple secuencia de acciones no puede describir adecuadamente la riqueza de situaciones que se pueden presentar en un caso

Más detalles

BASES DE DATOS MIS 308

BASES DE DATOS MIS 308 2. MODELOS DE DATOS Introducción 2.1 Entidad relación 2.2 Jerárquico 2.3 De red 2.4 Relacional Introducción Hoy en día las empresas manejan una gran cantidad de datos. Cualquier empresa que se precie debe

Más detalles

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma:

Para comenzar, abra el programa Inmediatamente aparecerá una ventana llamada editor de datos que tiene la siguiente forma: 1. Descripción Generales del Paquete Estadístico SPSS. SPSS es un paquete estadístico orientado -en principio- al ámbito de aplicación de las Ciencias Sociales y que lleva en el mercado alrededor de 25

Más detalles

INDICE Parte I. Conceptos 1. El estudio de los lenguajes de programación 2. Cuestiones de diseño de lenguajes

INDICE Parte I. Conceptos 1. El estudio de los lenguajes de programación 2. Cuestiones de diseño de lenguajes INDICE Parte I. Conceptos 1 1. El estudio de los lenguajes de programación 1.1. Por qué estudiar lenguajes de programación? 2 1.2. Breve historia de los lenguajes de programación 1.2.1. Desarrollo de los

Más detalles

Ing. Santiago C. PÉREZ Laura Noussan Lettry Carlos Campos Natalia Adaro Carolina Pennisi Andres Pozzi

Ing. Santiago C. PÉREZ Laura Noussan Lettry Carlos Campos Natalia Adaro Carolina Pennisi Andres Pozzi UNIVERSIDAD TECNOLÓGICA NACIONAL FACULTAD REGIONAL MENDOZA DEPARTAMENTO DE INGENIERÍA EN SISTEMAS DE INFORMACIÓN CÁTEDRA DE GESTIÓN DE DATOS 3º AÑO Ing. Santiago C. PÉREZ Laura Noussan Lettry Carlos Campos

Más detalles

Representación de Teorías con Reglas de Decisión. Reglas: representación potente. Inferencia de reglas via OneRule. Prof. Carlos I.

Representación de Teorías con Reglas de Decisión. Reglas: representación potente. Inferencia de reglas via OneRule. Prof. Carlos I. Datamining y Aprendizaje Automatizado 05 Aprendizaje de Conjuntos de Reglas Prof. Carlos Iván Chesñevar Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Email: cic@cs.uns.edu.ar

Más detalles

Agenda. Descripción del problema. Análisis filogenético de plantas

Agenda. Descripción del problema. Análisis filogenético de plantas Análisis filogenético de plantas Carbó Gabriela, Markel Gustavo, Poloni Pablo, Ruz Cecilia, Walitzky Liliana Agenda Objetivo del Trabajo Descripción del conjunto de datos Metodologías utilizadas Resultados

Más detalles

Carlos Daniel Quattrocchi

Carlos Daniel Quattrocchi PRESENTA Lic. Héctor Iglesias Licenciado en Informática. Profesional independiente, ha desempeñado la actividad en informática desarrollando e implementando sistemas, capacitando y asesorando a numerosas

Más detalles

Qué es DataMining? Agenda. Agenda 8/24/2007. Ing. Gustavo Markel gmarkel@gmail.com. Lic. Cecilia Ruz ruz.cecilia@gmail.com

Qué es DataMining? Agenda. Agenda 8/24/2007. Ing. Gustavo Markel gmarkel@gmail.com. Lic. Cecilia Ruz ruz.cecilia@gmail.com Qué es DataMining? Ing. Gustavo Markel gmarkel@gmail.com Lic. Cecilia Ruz ruz.cecilia@gmail.com Agenda Qué es Data Mining? Cómo se integra en el proceso de Descubrimiento del conocimiento? Funcionalidades

Más detalles

Segmentación Recursiva de Proyectos Software para la Estimación del Esfuerzo de Desarrollo Software

Segmentación Recursiva de Proyectos Software para la Estimación del Esfuerzo de Desarrollo Software Segmentación Recursiva de Proyectos Software para la Estimación del Esfuerzo de Desarrollo Software J. Cuadrado Gallego 1, Miguel Ángel Sicilia 1, Miguel Garre Rubio 1 1 Dpto de Ciencias de la Computación,

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Data Mining. Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014

Data Mining. Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014 Data Mining Hugo Alatrista-SALAS PUCP, GRPIAA Labs. halatrista@pucp.pe http://hugo.alatristasalas.free.fr/ 17 de noviembre de 2014 Outline La información y el proceso KDD 1 La información y el proceso

Más detalles

5/10/2007 PCPM PRUEBAS DE SOFTWARE. Por: Paola Constanza Peña Melo Ingeniería de Software Mayo de 2007 AGENDA GENERAL PCPM

5/10/2007 PCPM PRUEBAS DE SOFTWARE. Por: Paola Constanza Peña Melo Ingeniería de Software Mayo de 2007 AGENDA GENERAL PCPM 1 PRUEBAS DE SOFTWARE Por: Paola Constanza Peña Melo Ingeniería de Software Mayo de 2007 AGENDA GENERAL 2 1 AGENDA 3 QUE SON LAS PRUEBAS DE SOFTWARE? Proceso de análisis de un sistema. Detectar diferencias.

Más detalles

El diseño de la base de datos de un Data Warehouse. Marta Millan millan@eisc.univalle.edu.co www.eisc.univalle.edu.co/materias

El diseño de la base de datos de un Data Warehouse. Marta Millan millan@eisc.univalle.edu.co www.eisc.univalle.edu.co/materias El diseño de la base de datos de un Data Warehouse Marta Millan millan@eisc.univalle.edu.co www.eisc.univalle.edu.co/materias El modelo Multidimensional Principios básicos Marta Millan millan@eisc.univalle.edu.co

Más detalles

SEGURIDAD Y PROTECCION DE FICHEROS

SEGURIDAD Y PROTECCION DE FICHEROS SEGURIDAD Y PROTECCION DE FICHEROS INTEGRIDAD DEL SISTEMA DE ARCHIVOS ATAQUES AL SISTEMA PRINCIPIOS DE DISEÑO DE SISTEMAS SEGUROS IDENTIFICACIÓN DE USUARIOS MECANISMOS DE PROTECCIÓN Y CONTROL INTEGRIDAD

Más detalles

SOFISTICACION ANALITICA PARA EL CONOCIMIENTO DEL CLIENTE Y PERSONALIZACIÓN DE LA PROPUESTA DE VALOR

SOFISTICACION ANALITICA PARA EL CONOCIMIENTO DEL CLIENTE Y PERSONALIZACIÓN DE LA PROPUESTA DE VALOR SOFISTICACION ANALITICA PARA EL CONOCIMIENTO DEL CLIENTE Y PERSONALIZACIÓN DE LA PROPUESTA DE VALOR Carlos Mendoza Astroz SAS INSTITUTE Domain Expert carlos.mendoza@sas.com AGENDA 1. La nueva visión del

Más detalles

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006

DEFINICION. Ing. M.Sc. Fulbia Torres Asignatura: Estructuras de Datos Barquisimeto 2006 ARBOLES ESTRUCTURAS DE DATOS 2006 DEFINICION Un árbol (tree) es un conjunto finito de nodos. Es una estructura jerárquica aplicable sobre una colección de elementos u objetos llamados nodos; uno de los

Más detalles

Qué es DataMining? Mg. Cecilia Ruz Luis Azaña Bocanegra

Qué es DataMining? Mg. Cecilia Ruz Luis Azaña Bocanegra Qué es DataMining? Mg. Cecilia Ruz Luis Azaña Bocanegra Agenda Qué es Data Mining? Cómo se integra en el proceso de Descubrimiento del conocimiento? Funcionalidades del Data Mining Técnicas Supervisadas

Más detalles

Minería de reglas de asociación con programación genética gramatical

Minería de reglas de asociación con programación genética gramatical Minería de reglas de asociación con programación genética gramatical José María Luna Juan Luis Olmo José Raúl Romero Sebastián Ventura Departamento de Informática y Análisis Numérico, Universidad de Córdoba

Más detalles

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009

Tecnólogo Informático- Estructuras de Datos y Algoritmos- 2009 Árboles Ejemplos de estructuras arborescentes: con forma de árbol Regla de Alcance: los objetos visibles en un procedimiento son aquellos declarados en él mismo o en cualquier ancestro de él (cualquier

Más detalles

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo 1 Algoritmos de minería de datos incluidos en SQL Server 2008 Los algoritmos que aquí se presentan son: Árboles de decisión de Microsoft, Bayes naive de Microsoft, Clústeres de Microsoft, Serie temporal

Más detalles

E-data. Transformando datos en información con Data Warehousing

E-data. Transformando datos en información con Data Warehousing Federico Plancarte Sánchez E-data. Transformando datos en información con Data Warehousing Tema 2 El soporte a la Decisión 2-1 Evolución del soporte a la decisión Diversas categorías del análisis del DS

Más detalles

Deep Learning y Big Data

Deep Learning y Big Data y Eduardo Morales, Enrique Sucar INAOE (INAOE) 1 / 40 Contenido 1 2 (INAOE) 2 / 40 El poder tener una computadora que modele el mundo lo suficientemente bien como para exhibir inteligencia ha sido el foco

Más detalles

Optimización de consultas Resumen del capítulo 14

Optimización de consultas Resumen del capítulo 14 Optimización de consultas Resumen del capítulo 14 Libro: Fundamentos de Bases de Datos Silberschatz et al. 5ed. Dr. Víctor J. Sosa Agenda 1. Visión general 2. Estimación de las estadísticas de los resultados

Más detalles

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3.

GANTT, PERT y CPM. Figura 5.3: Carta GANTT 3. GANTT, PERT y CPM Características Conseguir una buena programación es un reto, no obstante es razonable y alcanzable. Ella debe tener el compromiso del equipo al completo, para lo cual se recomienda que

Más detalles

OLAP y Minería de Datos: Introducción

OLAP y Minería de Datos: Introducción OLAP y Minería de Datos: Introducción Carlos Hurtado L. churtado@dcc.uchile.cl Departamento de Ciencias de la Computación Universidad de Chile OLAP y Minería de Datos: Introducción, DCC, U. de Chile, 2do

Más detalles

Universidad Nacional del Sur

Universidad Nacional del Sur Universidad Nacional del Sur Tesis de Magister en Ciencias de la Computación Detección de Patrones Emergentes y su formalización utilizando Minería de Datos Incremental Walter Marcelo Grandinetti Bahía

Más detalles

TAD Lineales: Pila, Cola y Lista

TAD Lineales: Pila, Cola y Lista TAD Lineales: Pila, Cola y Lista Objetivos! Dar a conocer los TAD lineales pila, cola y lista! Presentar la especificación de cada uno de los TAD! Discutir implementaciones alternativas para cada uno de

Más detalles

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 9. IMPLEMENTACION LA ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM).

PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 9. IMPLEMENTACION LA ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM). PROGRAMA DEL DIPLOMADO DE PROCESO BENCHMARKING. TEMA 9. IMPLEMENTACION LA ADMINISTRACIÓN DE LA RELACIÓN CON EL CLIENTE (CRM). Objetivo: Al finalizar la unidad el alumno conocerá el proceso de desarrollo

Más detalles

TEMA 1. Introducción

TEMA 1. Introducción TEMA 1. Introducción Francisco José Ribadas Pena, Santiago Fernández Lanza Modelos de Razonamiento y Aprendizaje 5 o Informática ribadas@uvigo.es, sflanza@uvigo.es 28 de enero de 2013 1.1 Aprendizaje automático

Más detalles

4 o Ingeniería Informática

4 o Ingeniería Informática Esquema del tema 1. Introducción 4 o Ingeniería Informática II26 Procesadores de lenguaje Estructura de los compiladores e intérpretes 2. Etapas del proceso de traducción 3. La interpretación 4. La arquitectura

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles