REGLAS DE ASOCIACIÓN Bases de Datos Masivas. 29 de Octubre de 2015

Tamaño: px
Comenzar la demostración a partir de la página:

Download "REGLAS DE ASOCIACIÓN Bases de Datos Masivas. 29 de Octubre de 2015"

Transcripción

1 1 REGLAS DE ASOCIACIÓN Bases de Datos Masivas 29 de Octubre de 2015

2 Reglas de Asociación 2

3 3 Reglas de Asociación Dado un conjunto de transacciones encontrar reglas que puedan predecir la ocurrencia de un ítem basado en la presencia de otros. Análisis Market-Basket transactions Ejemplo de Reglas de Asociación {Diaper} {Beer}, {Milk, Bread} {Eggs,Coke}, {Beer, Bread} {Milk}, La implicancia indica co-ocurrencia no causalidad

4 4 Definiciones Itemset Una colección de 1 ó más items Ejemplo: {Milk, Bread, Diaper} k-itemset Un itemset que contiene k items Support count (σ) Cantidad de ocurrencias de un itemset Ej σ({milk, Bread, Diaper}) = 2 Customer buys both Customer buys diaper Customer buys beer

5 5 Definiciones Support (s) Fracción de transacciones que contiene a un itemset Ejemplo: σ({milk, Bread,Diaper}) / T = 2/5 Itemset frecuente s(x)= σ (x) T Un itemset cuyo support es mayor o igual al umbral establecido en minsup.

6 6 Definiciones Regla de Asociación Una expresión de la forma X Y, donde X e Y son itemsets Ejemplo: {Milk, Diaper} {Beer}

7 7 Definiciones Métricas de Evaluación de Reglas Support (s): Fracción de transacciones que contiene a X e Y Confidence (c): Mide con que frecuencia Y aparece en transacciones en las que también aparece X

8 Ejemplos de Reglas de Asociación 8 {Milk,Diaper} {Beer} (s=0.4, c=0.67) {Milk,Beer} {Diaper} (s=0.4, c=1.0) {Diaper,Beer} {Milk} (s=0.4, c=0.67) {Beer} {Milk,Diaper} (s=0.4, c=0.67) {Diaper} {Milk,Beer} (s=0.4, c=0.5) {Milk} {Diaper,Beer} (s=0.4, c=0.5) Observaciones: Todas las reglas se originaron en el itemset: {Milk, Diaper, Beer} Las reglas que se originan en el mismo itemset tienen el mismo soporte pero pueden tener distinta confianza Por qué?

9 9 Otras aplicaciones 1) Encontrar conceptos relacionados: Supongamos que las palabras son los ítems y los documentos las canastas. 2) Plagio: En este caso los ítems son las documentos y las canastas las oraciones. Donde un item/documento esta en una canasta/oración si la oración pertenece al documento. Una o dos oraciones en común en distintos documentos son un buen indicador de plagio.

10 10 Otras aplicaciones Biomarkers ( indicadores biológicos) Supongamos que los items son de 2 tipos: genes /proteínas en sangre o enfermedades. Cada canasta es el conjunto de estos datos referidos a un paciente: el genoma, los análisis de sangre y su historia clínica. Un itemset que muestra la relación entre uno o más indicadores biológicos y una enfermedad daría una pista sobre un posible análisis para detectar esa enfermedad.

11 11 Descubrimiento de reglas Dado un conjunto de transacciones T, el objetivo del descubrimiento de reglas de asociación es encontrar todas las reglas que cumplen: support minsup threshold confidence minconf threshold Aproximación de fuerza bruta: Listar todas las posibles reglas de asociación Calcular el soporte y la confianza para cada una Eliminar las que no satisfacen los umbrales predefinidos Computacionalmente Prohibitivo!

12 12 Descubrimiento de reglas Por qué es prohibitivo? Supongamos que tenemos frecuent itemset de 100 items: Vamos a tener los {a 1, a 2,..., a 100 } ( ) =100 1-itemset frecuentes Vamos a tener los ( ) = itemset frecuentes

13 13 Descubrimiento de reglas Association Rule Mining puede ser visto como un problema de 2 pasos: 1) Generación de los itemsets frecuentes Generar todos los itemsets con support minsup 2) Generación de reglas Generar a partir de la división de los itemsets frecuentes en subconjuntos las reglas que satisfacen la confianza El primer paso es computacionalmente muy caro

14 Generación de Itemsets Frecuentes 14

15 Generación de Itemsets Frecuentes 15 Aproximación de fuerza bruta: Cada itemset en el lattice es un candidato Contar el soporte de cada itemset barriendo las transacciones Comparar cada transacción contra cada itemset Complejidad ~ O(NMw) => Caro porque M = 2 d!!!

16 16 Complejidad Computacional Dados d items: Número total de itemsets = 2 d Número total de reglas:

17 Estrategias para la generación de itemsets 17 Reducir el número de candidatos (M) Búsqueda completa: M = 2 d Utilice técnicas de poda para reducir M Reducir el número de transacciones (N) Reducir el tamaño de N como el incremento del tamaño de los itemsets Esto es utilizado algoritmos como Direct Hashing and Pruning (DHP) Reducir el número de comparaciones (NM) Utilice las estructuras de datos eficientes para almacenar los candidatos o transacciones No hay necesidad de comparar cada candidato contra cada transacción

18 Reduciendo el número de candidatos 18 Principio Apriori Si un itemset es frecuente, entonces todos sus subsets deben además ser frecuentes. El Principio Apriori se sostiene debido a las siguiente propiedades de la medida de support: X, Y : ( X Y ) s ( X ) s ( Y ) El support de un itemset nunca excede el support de sus subsets Esto es conocido como la propiedad de anti-monotonía del support

19 19 Anti-Monotonía Si un itemset X no satisface el umbral de min_support entonces X no es frecuente. Es decir: S(X) < min_support Si agrego X2 al itemset X (X U X2) entonces el resultado del itemset no puede ser más frecuente que X X U X2 es no frecuente, por lo tanto: S(X U X2) < min_support Volvamos al lattice!!

20 20 El algoritmo Apriori El algoritmo Apriori fue propuesto por R. Agrawal and R. Srikant en 1994 para mining frecuent itemsets de reglas de asociación binarias (como los ejemplos de la canasta). El algoritmo maneja 2 conjuntos de itemsets: Candidatos ( C k ) Frecuentes ( L k )

21 21 El algoritmo Apriori Join Step: C k es generando uniendo L k-1 con sigo mismo. Prune Step: Un (k-1)-itemset que no es frecuente no puede ser un subset de un k-itemset frecuente. Pseudo-code: C k : Candidate itemset of size k L k : frequent itemset of size k L 1 = {frequent items}; for( k = 1; L k!= ; k ++) do begin C k+1 = candidates generated from L k for each transaction t in database do increment the count of all candidates in C k+1 that are contained in t L k+1 = candidates in C k+1 with min_support end return k L k

22 Ejemplo de Generación de Candidatos 22 L3 = { abc, abd, acd, ace, bcd } Unir: L3 * L 3 abcd de abc y abd acde de acd y ace Pruning: Como ade no está en L 3 se elimina acde C 4 ={ abcd }

23 Ejemplo de Generación de Candidatos 23

24 24 Obtención de las reglas A partir de los itemsets frecuentes vamos a generar las reglas de asociación. For each frequent itemset X, For each proper nonempty subset A of X, Let B = X - A A B is an association rule if Confidence (A where support (A confidence (A B) minconf, B) = support (AB), and B) = support (AB) / support (A) Como las reglas se construyen a partir de los itemsets frecuentes, todas satisfacen el min_support

25 Factores que afectan la complejidad 25 Elegir el umbral de min_support Bajar el umbral de support resulta en mas itemsets frecuentes Esto puede incrementar el número de candidatos y la longitud maxima de itemsets frecuentes Dimensionalidad del dataset (cantidad de items) Se necesita más espacio para almacenar el count support de cada uno de los items Si el nro de items frecuentes aumenta, tanto el costo computacional como las operaciones de I/O se incrementan Tamaño de la base de datos Dado que Apriori hace varias pasadas, el tiempo de ejecución del algoritmo puede aumentar con el número de transacciones

26 26 Tipos especiales de itemsets Maximal Frecuent Itemset: Un itemset es maximal si ninguno de su superset es frecuente Closed Frecuent Itemset: Un itemset es closed si ninguno de sus inmediatos superset tiene el mismo support que el itemset.

27 27 Medidas de Interestingnes Dada una regla X Y la información necesaria para computar medidas de Interestingness se obtiene desde una tabla de contingencia:

28 Drawback of Confidence 28

29 29 Independencia Estadística Population of 1000 students students know how to swim (S) students know how to bike (B) students know how to swim and bike (S,B) P(S B) = 420/1000 = 0.42 (Observados juntos) P(S) P(B) = = 0.42 (Indep.) - P(S B) = P(S) P(B) => Statistical independence - P(S B) > P(S) P(B) => Positively correlated - P(S B) < P(S) P(B) => Negatively correlated

30 30 Lift El Lift de una regla es X Y es la confianza de la regla dividido la confianza esperada, asumiendo que los items son independientes. Lift=P( X Y )= P (X, Y ) P (X ). P (Y ) Confidence = P(Coffee Tea) = 0.75 but P(Coffee) = 0.9 Lift = 0.75/0.9= (< 1, están asociados negativamente)

31 31 Referencias Jiawei Han,Micheline Kamber.Data Mining,Concepts and Techniques- 2 da edición- The Morgan Kaufmann Series in Data Management Systems

Por Elizabeth León Guzmán, Ph.D. Profesora

Por Elizabeth León Guzmán, Ph.D. Profesora Por Elizabeth León Guzmán, Ph.D. Profesora 1 En una base de datos transaccional, transaccional cada transacción puede contener una lista de ítems (Ej: ítems comprados por un cliente) Id_transacci ón Items

Más detalles

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES 1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;

Más detalles

Mineria de Datos. Reglas de Asociacion. Dr. Edgar Acuna Departmento de Matematicas. Universidad de Puerto Rico- Mayaguez

Mineria de Datos. Reglas de Asociacion. Dr. Edgar Acuna Departmento de Matematicas. Universidad de Puerto Rico- Mayaguez Mineria de Datos Reglas de Asociacion Dr. Edgar Acuna Departmento de Matematicas Universidad de Puerto Rico- Mayaguez math.uprrm.edu/~edgar edgar 1 Datos transaccionales Ejemplo de canasta de mercados:

Más detalles

TID Artículos. 1 Pan, leche, huevos 2 Pan, pañales, cerveza 3 Leche, pañales, cerveza 4 Pan, leche, pañales, cerveza 5 Pan, leche, huevos, cerveza

TID Artículos. 1 Pan, leche, huevos 2 Pan, pañales, cerveza 3 Leche, pañales, cerveza 4 Pan, leche, pañales, cerveza 5 Pan, leche, huevos, cerveza Reglas de asociación Fernando Berzal, berzal@acm.org Reglas de asociación Introducción Definiciones Patrones frecuentes Reglas de asociación Extracción de reglas de asociación Identificación de patrones

Más detalles

REGLAS DE ASOCIACIÓN por Claudia J iménez Jiménez R Semestre

REGLAS DE ASOCIACIÓN por Claudia J iménez Jiménez R Semestre REGLAS DE ASOCIACIÓN por Claudia Jiménez R Semestre 1-2012 1 Áreas de Aplicación Investigación de mercados Finanzas Biología Detección de fraude Medicina Sociología Y en muchas otras áreas!! ANALISIS DE

Más detalles

Reglas de Asociación en Weka

Reglas de Asociación en Weka Reglas de Asociación en Weka Este documento muestra cómo establecer reglas de asociación en Weka usando como ejemplo los datos de un banco "bank.arff". El punto de inicio consiste en discretizar los datos

Más detalles

REGLAS DE ASOCIACIÓN. Jesús González y Eduardo Morales

REGLAS DE ASOCIACIÓN. Jesús González y Eduardo Morales REGLAS DE ASOCIACIÓN Jesús González y Eduardo Morales Minería de Datos por Reglas de Asociación 2 Encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos transacccionales,

Más detalles

Las reglas de asociación tienen diversas aplicaciones como:

Las reglas de asociación tienen diversas aplicaciones como: Capítulo 4 Reglas de Asociación El objetivo de las reglas de asociación es encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos transaccionales, relacionales o datawarehouses.

Más detalles

Tareas de la minería de datos: reglas de asociación y secuencias. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: reglas de asociación y secuencias. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: reglas de asociación y secuencias CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR La parábola de la cerveza y las mantillas La parábola de la

Más detalles

Reglas de Asociación

Reglas de Asociación Reglas de Eduardo Morales, Hugo Jair Escalante INAOE (INAOE) 1 / 43 1 2 3 4 5 6 (INAOE) 2 / 43 Reglas de Objetivo: encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos

Más detalles

Análisis de desempeño de EquipAsso: Un algoritmo para el cálculo de Itemsets frecuentes basado en operadores algebraicos relacionales.

Análisis de desempeño de EquipAsso: Un algoritmo para el cálculo de Itemsets frecuentes basado en operadores algebraicos relacionales. Análisis de desempeño de : Un algoritmo para el cálculo de Itemsets frecuentes basado en operadores algebraicos relacionales. Ricardo Timarán Pereira, Ph. D.* ritimar@udenar.edu.co Andrés O. Calderón Romero.*

Más detalles

Análisis de Asociaciones

Análisis de Asociaciones Análisis de Asociaciones Asociaciones Establecer vínculos entre los registros Asociaciones (productos que se compran juntos) Patrones secuenciales (si se compra algo en una fecha en x meses se adquiere

Más detalles

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

Reglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:

Más detalles

Agenda. Introduction. Proceso de KDD. Descubrimiento de Conocimiento a partir de Datos. Introducción al KDD. Etapas. Pre-procesamiento de datos

Agenda. Introduction. Proceso de KDD. Descubrimiento de Conocimiento a partir de Datos. Introducción al KDD. Etapas. Pre-procesamiento de datos Agenda Introducción al KDD Descubrimiento de Conocimiento a partir de Datos ISISTAN sschia@exa.unicen.edu.ar Etapas Pre-procesamiento de datos Operaciones de Data Mining Reglas de Asociación Clasificación

Más detalles

Generación de conjuntos de ítems y reglas de asociación

Generación de conjuntos de ítems y reglas de asociación Generación de conjuntos de ítems y reglas de asociación José E. Medina Pagola, José Hernández Palancar, Raudel Hernández León, Airel Pérez Suárez, Abdel Hechavarría Díaz, Ricardo González Gazapo Dpto.

Más detalles

Text Mining Introducción a Minería de Datos

Text Mining Introducción a Minería de Datos Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools

Más detalles

Criptografía de clave pública Sistemas basados en el problema de la mochila

Criptografía de clave pública Sistemas basados en el problema de la mochila de la la La Criptografía de clave pública Sistemas basados de la DSIC - UPV (DSIC - UPV) de la 1 / 21 Contenidos del tema de la la La 1 Características de los sistemas de clave pública Principios para

Más detalles

Palabras Clave: Minería de datos, Reglas de asociación, Algoritmo Apriori, Confianza mínima,

Palabras Clave: Minería de datos, Reglas de asociación, Algoritmo Apriori, Confianza mínima, Reglas de Association rules in a Database of medical area. Ing. Agustín Sáenz López Ingeniero Civil Doctor en Ingeniería Civil, área: Sistemas de Planeación y Construcción. Profesor-Investigador Facultad

Más detalles

Tesis de Grado Ingeniería en Informática

Tesis de Grado Ingeniería en Informática UN MODELO DE REGLAS DE ASOCIACIÓN ESPACIO-TEMPORALES Tesis de Grado Ingeniería en Informática Departamento de Computación Mariano S. Kohan S. 78687 marianokohan@gmail.com Director: Dr. Juan M. Ale Abril,

Más detalles

Coordinación de Ciencias Computacionales INAOE. Reporte Técnico No. CCC-09-001 31 de Marzo de 2009

Coordinación de Ciencias Computacionales INAOE. Reporte Técnico No. CCC-09-001 31 de Marzo de 2009 Minería de Reglas de Asociación sobre Datos Mezclados Ansel Yoan Rodríguez González, José Francisco Martínez Trinidad, Jesús Ariel Carrasco Ochoa, José Ruiz Shulcloper Reporte Técnico No. CCC-09-001 31

Más detalles

Construcción de hipótesis candidatas

Construcción de hipótesis candidatas Capítulo 4 Construcción de hipótesis candidatas...la respuesta errónea a un ejercicio puede mostrar una ausencia real de comprensión o revelar el hecho de que el alumno ha construido su propio modelo personal.

Más detalles

Intersección de Segmentos de Recta. Geometría Computacional, MAT-125

Intersección de Segmentos de Recta. Geometría Computacional, MAT-125 Intersección de Segmentos de Recta Geometría Computacional, MAT-125 Dados dos conjuntos de segmentos de recta, calcular todas las intersecciones entre los segmentos de un conjunto y los segmentos del otro

Más detalles

Representación de Teorías con Reglas de Decisión. Reglas: representación potente. Inferencia de reglas via OneRule. Prof. Carlos I.

Representación de Teorías con Reglas de Decisión. Reglas: representación potente. Inferencia de reglas via OneRule. Prof. Carlos I. Datamining y Aprendizaje Automatizado 05 Aprendizaje de Conjuntos de Reglas Prof. Carlos Iván Chesñevar Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Email: cic@cs.uns.edu.ar

Más detalles

Universidad Nacional del Sur Departamento de Ciencias e Ingeniería de la Computación Elementos de Bases de Datos 2do. Cuatrimestre de 2004

Universidad Nacional del Sur Departamento de Ciencias e Ingeniería de la Computación Elementos de Bases de Datos 2do. Cuatrimestre de 2004 2do. Cuatrimestre de 2004 Elementos de Bases de Datos Dpto.Ciencias e Ingeniería de la Computación Universidad Nacional del Sur Lic. María Mercedes Vitturini [mvitturi@cs.uns.edu.ar] Clase 9 1er. Cuatrimestre

Más detalles

Procesamiento y Optimización de Consultas

Procesamiento y Optimización de Consultas 16/12/2011 s Procesamiento y Optimización de Consultas Grupo de Ingeniería del Software y Bases de Datos Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla diciembre 2011 s Objetivos

Más detalles

Procesamiento y Optimización de Consultas

Procesamiento y Optimización de Consultas 30/09/2016 s Procesamiento y Optimización de Consultas Grupo de Ingeniería del Software y Bases de Datos Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla septiembre 2016 s Objetivos

Más detalles

Introducción a la minería de datos y el descubrimiento del conocimiento en bases de datos

Introducción a la minería de datos y el descubrimiento del conocimiento en bases de datos Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas Introducción a la minería de datos y el descubrimiento del conocimiento en Mg. Ing. Mario José Diván Temario 1. Qué es data

Más detalles

Capítulo 8. Selección de variables Introducción

Capítulo 8. Selección de variables Introducción Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que

Más detalles

Palabras clave: Reglas de asociación, Conocimiento impreciso, Redundancia basada en conocimiento

Palabras clave: Reglas de asociación, Conocimiento impreciso, Redundancia basada en conocimiento Tipo de artículo: Artículo original Temática: Inteligencia Organizacional Recibido: 30/10/2015 Aceptado: 13/01/2016 Uso de conocimiento impreciso de usuario para reducir redundancia en reglas de asociación

Más detalles

APLICACIÓN DE REGLAS DE ASOCIACIÓN PARA LA DETECCIÓN DE PATRONES DE COMPORTAMIENTO EN SISTEMA ACADÉMICO UNIVERSITARIO

APLICACIÓN DE REGLAS DE ASOCIACIÓN PARA LA DETECCIÓN DE PATRONES DE COMPORTAMIENTO EN SISTEMA ACADÉMICO UNIVERSITARIO APLICACIÓN DE REGLAS DE ASOCIACIÓN PARA LA DETECCIÓN DE PATRONES DE COMPORTAMIENTO EN SISTEMA ACADÉMICO UNIVERSITARIO Ing. David J. Belamate, Ing. Matías A. Cassani, Ing. Carolina P. Ricci Universidad

Más detalles

Introducción a Aprendizaje no Supervisado

Introducción a Aprendizaje no Supervisado Introducción a Aprendizaje no Supervisado Felipe Suárez, Álvaro Riascos 25 de abril de 2017 2 / 33 Contenido 1. Motivación 2. k-medias Algoritmos Implementación 3. Definición 4. Motivación 5. Aproximación

Más detalles

Normalización. Carlos A. Olarte Bases de Datos I

Normalización. Carlos A. Olarte Bases de Datos I Carlos A. Olarte Bases de Datos I Outline 1 Introducción 2 Dependencias Funcionales 3 Diseño de Bases de Datos 4 Forma Normal Boyce-Codd (FNBC) 5 3FN 6 Dependneicas Funcionales Multivaluadas 7 4FN Introducción

Más detalles

WEB MINING FOR IDENTIFYING PATTERNS

WEB MINING FOR IDENTIFYING PATTERNS Minería de uso Web para la identificación de patrones Castaño P. Andres P. * Resumen La minería Web es la aplicación de técnicas de minería de datos para descubrir patrones de uso de los usuarios desde

Más detalles

Generación de números aleatorios con distribución uniforme

Generación de números aleatorios con distribución uniforme Generadores de Números Aleatorios 1 Existen en la actualidad innumerables métodos para generar números aleatorios En la literatura disponible se pueden encontrar gran cantidad de algoritmos. Generación

Más detalles

Reglas de asociación. Inteligencia Artificial Dr. Ariel Monteserin amontese@exa.unicen.edu.ar ISISTAN - UNICEN

Reglas de asociación. Inteligencia Artificial Dr. Ariel Monteserin amontese@exa.unicen.edu.ar ISISTAN - UNICEN Reglas de asociación Inteligencia Artificial Dr. Ariel Monteserin amontese@exa.unicen.edu.ar ISISTAN - UNICEN Agenda Conceptos Algoritmos de descubrimientos de reglas de asociación Post-procesamiento Actualización

Más detalles

Tipos de subárboles/ patrones en árboles

Tipos de subárboles/ patrones en árboles Patrones en árboles Fernando Berzal, berzal@acm.org Patrones en árboles Tipos de árboles Tipos de subárboles/ patrones en árboles [Partially-Ordered-Tree Miner] Algoritmos Aplicaciones 1 Tipos de árboles

Más detalles

Razón de Verosimilitud - LR

Razón de Verosimilitud - LR Razón de Verosimilitud - LR Perfil de ADN Comparación electroferogramas EXCLUIDO Muestra Sospechoso 1 Comparación electroferogramas No puede ser excluido Muestra Sospechoso 2 Qué peso debería tener la

Más detalles

Simplificación de funciones lógicas utilizando Karnaugh

Simplificación de funciones lógicas utilizando Karnaugh Simplificación de funciones lógicas utilizando Página Objetivos de la simplificación Objetivo: minimizar el costo de la función lógica Medición del costo y otras consideraciones Número de compuertas Número

Más detalles

Inducción Matemática Conjuntos Funciones. Matemática Discreta. Agustín G. Bonifacio UNSL. Repaso de Inducción, Conjuntos y Funciones

Inducción Matemática Conjuntos Funciones. Matemática Discreta. Agustín G. Bonifacio UNSL. Repaso de Inducción, Conjuntos y Funciones UNSL Repaso de Inducción, y Inducción Matemática (Sección 1.7 del libro) Supongamos que queremos demostrar enunciados del siguiente tipo: P(n) : La suma de los primeros n números naturales es n(n+1)

Más detalles

Evaluación de Reglas de Asociación en Text Mining Utilizando Métricas Semánticas y Estructurales

Evaluación de Reglas de Asociación en Text Mining Utilizando Métricas Semánticas y Estructurales UNIVERSIDAD DE CONCEPCIÓN FACULTAD DE INGENIERÍA PROGRAMA DE MAGÍSTER EN CIENCIAS DE LA COMPUTACIÓN Evaluación de Reglas de Asociación en Text Mining Utilizando Métricas Semánticas y Estructurales Profesor

Más detalles

Búsqueda en e.e. --> reglas para elegir entre las ramas que con más probabilidad lleven a la solución.

Búsqueda en e.e. --> reglas para elegir entre las ramas que con más probabilidad lleven a la solución. BÚSQUEDA HEURÍSTICA estudio de los métodos y reglas del descubrimiento y la invención. Búsqueda en e.e. --> reglas para elegir entre las ramas que con más probabilidad lleven a la solución. Situaciones

Más detalles

Optimización. Bibliografía: Fundamentos de bases de datos Korth, Silberschatz

Optimización. Bibliografía: Fundamentos de bases de datos Korth, Silberschatz Optimización Bibliografía: Fundamentos de bases de datos Korth, Silberschatz Conceptos básicos Dada una consulta, existen diferentes formas (estrategias) de calcular la respuesta. Los usuarios generalmente

Más detalles

Restricción de valor único. Indispensable para diseñar esquemas de bases de datos que eliminen al redundancia.

Restricción de valor único. Indispensable para diseñar esquemas de bases de datos que eliminen al redundancia. CC42A Auxiliar #3 Dependencias funcionales, reglas, axiomas de Armstrong, cerradura de dependencias Martes, 03 de Septiembre de 2002 Profesor: Claudio Gutiérrez Auxiliar: Tania Gallardo Consultas a tgallard@dcc.uchile.cl

Más detalles

Alonso Ramirez Manzanares Computación y Algoritmos 03.05

Alonso Ramirez Manzanares Computación y Algoritmos 03.05 Tablas de hash (2) mat-151 Alonso Ramirez Manzanares Computación y Algoritmos 03.05 Tablas de hash: resolviendo colisiones por encadenamiento cuando el número de elementos en total es proporcional al número

Más detalles

Hipótesis. Teoria del Aprendizaje Computacional

Hipótesis. Teoria del Aprendizaje Computacional Teoria del Aprendizaje Computacional CI5438 - Inteligencia Artificial 2 Clase 7 Cap 18. Russel & Norvig: Inteligencia Artificial. Un enfoque estructurado El aprendiz inductivo se puede reinterpretar como

Más detalles

1. Diseñe algoritmos que permitan resolver eficientemente el problema de la mochila 0/1 para los siguientes casos:

1. Diseñe algoritmos que permitan resolver eficientemente el problema de la mochila 0/1 para los siguientes casos: PROGRAMACIÓN DINÁMICA RELACIÓN DE EJERCICIOS Y PROBLEMAS 1. Diseñe algoritmos que permitan resolver eficientemente el problema de la mochila /1 para los siguientes casos: a. Mochila de capacidad W=15:

Más detalles

Programación Dinámica

Programación Dinámica Programación Dinámica Es aplicada típicamente a problemas de optimización, donde puede haber muchas soluciones, cada una tiene un valor asociado y prentendemos obtener la solución con valor óptimo. Al

Más detalles

Sesión 2: Teoría de Probabilidad

Sesión 2: Teoría de Probabilidad Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 2: Teoría de Probabilidad Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para

Más detalles

Algoritmos genéticos

Algoritmos genéticos Algoritmos genéticos Introducción 2 Esquema básico 3 El problema de la mochila 7 Asignación de recursos 0 El problema del viajante 3 Variantes del esquema básico 5 Por qué funciona? 9 Observaciones finales

Más detalles

Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN

Carteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN Carteras minoristas Ejemplo: Construcción de un scoring de concesión basado en un árbol de decisión Grupo de Tesorería y Modelos de Gestión de Riesgos Sergio Gavilá II Seminario sobre Basilea II Validación

Más detalles

Herramienta software para el análisis de canasta de mercado sin selección de candidatos

Herramienta software para el análisis de canasta de mercado sin selección de candidatos REVISTA INGENIERÍA E INVESTIGACIÓN VOL. 29 No. 1, ABRIL DE 2009 (60-68) Herramienta software para el análisis de canasta de mercado sin selección de candidatos Software tool for analysing the family shopping

Más detalles

HASH-MERGE vs Lookups.

HASH-MERGE vs Lookups. HASH-MERGE vs Lookups. Octubre 12, 2011 Moisés Ramírez Flores Sr. Statistical Programmer Pharmanet/i3 Agenda Introducción Hash Step. Como realizar un hash merge Preguntas Introducción Como programadores

Más detalles

Métodos Estadísticos de la Ingeniería Práctica 4: Regresión Lineal

Métodos Estadísticos de la Ingeniería Práctica 4: Regresión Lineal Métodos Estadísticos de la Ingeniería Práctica 4: Regresión Lineal Área de Estadística e Investigación Operativa Mariano Amo Salas y Licesio J. Rodríguez-Aragón Marzo 2010 Contenidos Práctica 4.......................................................

Más detalles

Rendimiento de un activo

Rendimiento de un activo Rendimiento de un activo Es la ganancia o pérdida total que experimenta el propietario de una inversión en un periodo de tiempo específico. Se obtiene como el cambio en el valor del activo más cualquier

Más detalles

Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo

Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo Caso Práctico El objetivo de este ejercicio es analizar diferentes tipos de pruebas estadísticas en las

Más detalles

Intersección de Segmentos de Recta (2) Geometría Computacional, MAT-125

Intersección de Segmentos de Recta (2) Geometría Computacional, MAT-125 Intersección de Segmentos de Recta (2) Geometría Computacional, MAT-125 Qué estructuras de datos necesitamos para implementar este algoritmo? cola de eventos Q. Operaciones: Eliminar el próximo evento

Más detalles

1.2.4 Listas enlazadas

1.2.4 Listas enlazadas 1.2.4 Listas enlazadas Las listas enlazadas son tipos de datos dinámicos que se construyen con nodos. Un nodo es un registro con al menos, dos campos, uno de ellos contiene las componentes y se le denomina

Más detalles

C U R S O : MATEMÁTICA

C U R S O : MATEMÁTICA C U R S O : MATEMÁTICA GUÍA TEÓRICO PRÁCTICA Nº 27 UNIDAD: ÁLGEBRA Y FUNCIONES ECUACIÓN DE SEGUNDO GRADO Una ecuación de segundo grado es una ecuación susceptible de llevar a la forma ax 2 + bx + c = 0,

Más detalles

EXPERIMENTO ALEATORIO

EXPERIMENTO ALEATORIO EXPERIMENTO ALEATORIO En concepto de la probabilidad, un experimento aleatorio es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, en otras palabras,

Más detalles

Base de Datos. Práctica de Normalización. 1 Base de Datos

Base de Datos. Práctica de Normalización. 1 Base de Datos Base de Datos Práctica de Normalización 1 Base de Datos 1 NORMALIZACIÓN PRIMERA PARTE 1.1 Ejercicio Son válidas las siguientes reglas de inferencias para dependencias funcionales? Si es así, dar una demostración,

Más detalles

DISEÑOS EPIDEMIOLOGICOS MONICA LUNA MG. EPIDEMIOLOGIA

DISEÑOS EPIDEMIOLOGICOS MONICA LUNA MG. EPIDEMIOLOGIA DISEÑOS EPIDEMIOLOGICOS MONICA LUNA MG. EPIDEMIOLOGIA DISEÑOS EPIDEMIOÓGICOS Estudios Observacionales Descriptivos Analíticos Estudios Experimentales Ensayos Clínicos controlados ESTUDIOS DE CASOS Y CONTROLES

Más detalles

Mi nuevo reporte de SAS no cabe en un libro de Excel, Qué hago?

Mi nuevo reporte de SAS no cabe en un libro de Excel, Qué hago? Mi nuevo reporte de SAS no cabe en un libro de Excel, Qué hago? Beatriz García Santiago 12 Oct 2011 Agenda 1) Exposición de la problemática 2) Preprocesamiento 3) Alternativas de solución 4) Qué necesitamos?

Más detalles

La distribucion de preferencias de colores es la misma tanto para personas de distinto nivel socioeconómico.

La distribucion de preferencias de colores es la misma tanto para personas de distinto nivel socioeconómico. ANEXO - PRUEBAS DE ASOCIACION A.1 Pruebas de asociacion Este tipo de pruebas testea la hipotesis nula que 2 factores (o atributos) no se encuentran asociados, respecto de la hipotesis alternativa que si

Más detalles

Minería de reglas de asociación con programación genética gramatical

Minería de reglas de asociación con programación genética gramatical Minería de reglas de asociación con programación genética gramatical José María Luna Juan Luis Olmo José Raúl Romero Sebastián Ventura Departamento de Informática y Análisis Numérico, Universidad de Córdoba

Más detalles

En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener

En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener ERRORES DE MEDICION Y SU PROPAGACION En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener la magnitud fisica de algun atributo de objetos ( proceso,

Más detalles

Tema 9: Inducción de Reglas

Tema 9: Inducción de Reglas Tema 9: Inducción de Reglas p. 1/15 Tema 9: Inducción de Reglas Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País

Más detalles

Programación Dinámica 1

Programación Dinámica 1 Programación Dinámica 1 El método de programación dinámica sirve para resolver problemas combinando las soluciones de subproblemas. Normalmente es usada para resolver problemas de optimización. Al construir

Más detalles

TEMA 3: Escalas de medida. Validación de cuestionarios.

TEMA 3: Escalas de medida. Validación de cuestionarios. 1. INTRODUCCIÓN. ESCALAS BÁSICAS. 2. ESCALAS COMPARATIVAS Y NO COMPARATIVAS. 3. ANALISIS CLÁSICO DE ÍTEMS 3.1 ANÁLISIS PRIMARIOS. 3.2 FIABILIDAD. 3.3 VALIDEZ. 4. ESCALAMIENTO MULTIDIMENSIONAL (MDS). 4.1

Más detalles

Introducción a la minería de datos. Necesidades asociadas

Introducción a la minería de datos. Necesidades asociadas Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas Introducción a la minería de datos. Necesidades asociadas Mg. Ing. Mario José Diván mjdivan@divsar.com.ar Temario 1. Qué es

Más detalles

Tema 2. Introducción a la Estadística Bayesiana

Tema 2. Introducción a la Estadística Bayesiana 2-1 Tema 2 Introducción a la Estadística Bayesiana El teorema de Bayes Ejemplo Interpretación Ejemplo: influencia de la distribución a priori Ejemplo: densidad de flujo Probabilidad bayesiana Ejemplo:

Más detalles

El momento k-ésimo para una variable aleatoria discreta respecto del origen, es. n = esperanza matemática de X

El momento k-ésimo para una variable aleatoria discreta respecto del origen, es. n = esperanza matemática de X Momentos El momento k-ésimo para una variable aleatoria discreta respecto del origen, es E(x) n = i = 1 k i ( ) x.p x El primer momento centrado en el origen (k=1) es la esperanza matemática de X También

Más detalles

AR - Marco General. Álgebra Relacional AR - SELECT. AR - SELECT - Propiedades. 19/Agosto/2016

AR - Marco General. Álgebra Relacional AR - SELECT. AR - SELECT - Propiedades. 19/Agosto/2016 AR - Marco General Marco General 19/Agosto/2016. Lenguaje formal utilizado en el modelo relacional Permite a usuarios especificar consultas sobre instancias de relaciones El resultado de una consulta es

Más detalles

Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.

Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD. Inferencia estadística: Prueba de Hipótesis Jhon Jairo Padilla A., PhD. Justificación Es una etapa de análisis de datos de un experimento comparativo: Se compara un parámetro de una v.a. con un valor dado.

Más detalles

CLASIFICACIÓN PROBLEMA SOLUCIÓN

CLASIFICACIÓN PROBLEMA SOLUCIÓN Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),

Más detalles

TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES Práctica 5 - Simplificación de gramáticas incontextuales

TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES Práctica 5 - Simplificación de gramáticas incontextuales TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES Práctica 5 - Simplificación de gramáticas incontextuales 1. Objetivos 2. Representación de los datos en Mathematica 3. Eliminación de símbolos inútiles 3.1. Símbolos

Más detalles

PSU Matemática NM-4 Guía 24: Isometrías. Transformaciones isométricas en el plano

PSU Matemática NM-4 Guía 24: Isometrías. Transformaciones isométricas en el plano Centro Educacional San Carlos de Aragón. Dpto. Matemática. Prof. Ximena Gallegos H. PSU Matemática NM-4 Guía 4: Isometrías Nombre: Curso: Fecha: - Contenido: Isometrías. Aprendizaje Esperado: Analiza diferentes

Más detalles

Programación Dinámica

Programación Dinámica Programación Dinámica Adaptado de Algorithm Design Goodrich and Tamassia Programación Dinámica 1 Calculando la serie de Fibonacci 1,1,2,3,5,8,13,21,. fib(n) = 1 si n = 0,1 fib(n 1) + fib(n 2) o.c. Programación

Más detalles

Introducción a la Probabilidad

Introducción a la Probabilidad Introducción a la Probabilidad Tema 3 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1 Ignacio Cascos Depto. Estadística, Universidad Carlos III 2 Objetivos Entender el concepto de experimento

Más detalles

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural. Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así

Más detalles

Escribir el modelo. Evaluar los efectos de los factores y la interacción entre ellos.

Escribir el modelo. Evaluar los efectos de los factores y la interacción entre ellos. Ejercicio 1: Se aplican pinturas tapaporos para aeronaves en superficies de aluminio, con dos métodos: inmersión y rociado. La finalidad del tapaporos es mejorar la adhesión de la pintura, y puede aplicarse

Más detalles

EL4005 Principios de Comunicaciones Clase No.10: Repaso de Probabilidades

EL4005 Principios de Comunicaciones Clase No.10: Repaso de Probabilidades EL4005 Principios de Comunicaciones Clase No.10: Repaso de Probabilidades Patricio Parada Departamento de Ingeniería Eléctrica Universidad de Chile 10 de Septiembre de 2010 1 of 29 Contenidos de la Clase

Más detalles

Tema 9. Inducción de Reglas

Tema 9. Inducción de Reglas Tema 9. Inducción de Reglas Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea

Más detalles

Prototipo de software para la asociación de datos UDAssociate

Prototipo de software para la asociación de datos UDAssociate Prototipo de software para la asociación de datos UDAssociate Tecn. Adriana Amaya Morales 1, Tecn. Martha Lucía Rodríguez 2, Ing. Jorge Enrique Rodríguez Rodríguez 3 RESUMEN UDAssociate es una herramienta

Más detalles

Análisis y Diseño de Algoritmos Tablas de Hash

Análisis y Diseño de Algoritmos Tablas de Hash Análisis y Diseño de Algoritmos Tablas de Hash Guillermo Morales-Luna Arturo Díaz Pérez CONTENIDO 1. Dispersión 2. Funciones de dispersión (a) Método de división (b) Método de multiplicación 3. Direccionamiento

Más detalles

2.6.2.- Aplicaciones de las vistas. 2.6.1.- Concepto de vista. 2.6.3.- Vistas en SQL. 2.6.3.- Vistas en SQL.

2.6.2.- Aplicaciones de las vistas. 2.6.1.- Concepto de vista. 2.6.3.- Vistas en SQL. 2.6.3.- Vistas en SQL. 2.6.1.- Concepto de vista. Una vista es una tabla derivada de otras tablas (básicas o virtuales). Una vista se caracteriza porque: Se considera que forma parte del esquema externo. Una vista es una tabla

Más detalles

Normalización. Carlos A. Olarte Bases de Datos I

Normalización. Carlos A. Olarte Bases de Datos I Carlos A. Olarte Bases de Datos I Outline 1 Introducción 2 Dependencias Funcionales 3 Diseño de Bases de Datos 4 Forma Normal Boyce-Codd (FNBC) 5 3FN 6 Dependneicas Funcionales Multivaluadas 7 4FN Introducción

Más detalles

Lucila Finkel Temario

Lucila Finkel Temario Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión

Más detalles

INTERSECCIÓN Y UNIÓN DE ÁREAS Y VOLÚMENES

INTERSECCIÓN Y UNIÓN DE ÁREAS Y VOLÚMENES PreUnAB INTERSECCIÓN Y UNIÓN DE ÁREAS Y VOLÚMENES Clase # 23 Octubre 2014 ÁREAS SOMBREADAS (ACHURADAS): Corresponde esta clase al cálculo de áreas de diferentes figuras relacionadas entre sí, generando

Más detalles

MEDIDAS DE ASOCIACION

MEDIDAS DE ASOCIACION MEDIDAS DE ASOCIACION OBJETIVOS DE LA LECCION Que es asociación Identificar las medidas apropiadas para un diseño de estudio Construir tablas de contingencia Calcular e interpretar las medidas de asociación

Más detalles

6-Simplificación. 6.1 Ejemplos en dos niveles 6.2 Simplificación en dos niveles 6.3 Algoritmos de simplificación. 6: Simplificación 1

6-Simplificación. 6.1 Ejemplos en dos niveles 6.2 Simplificación en dos niveles 6.3 Algoritmos de simplificación. 6: Simplificación 1 6-Simplificación 6.1 Ejemplos en dos niveles 6.2 Simplificación en dos niveles 6.3 Algoritmos de simplificación 6: Simplificación 1 Ejemplo: comparador de dos bits N1 N2 A B C D LT EQ GT A B < C D A B

Más detalles

Se espera que en el futuro se vayan añadiendo nuevos servicios que aumenten y completen el conjunto.

Se espera que en el futuro se vayan añadiendo nuevos servicios que aumenten y completen el conjunto. Introducción: Se pretende hacer un flujo de datos desde dado un genoma o varias secuencias de varios genes, poder obtener información sobre el uso de Codones en los mismos, desde calcular la frecuencia

Más detalles

Supuestos y comparaciones múltiples

Supuestos y comparaciones múltiples Supuestos y comparaciones múltiples Diseño de Experimentos Pruebas estadísticas Pruebas de bondad de ajuste Prueba de hipótesis para probar si un conjunto de datos se puede asumir bajo una distribución

Más detalles

UNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA

UNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA UNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA Marco de Descubrimiento de Conocimiento para Datos Estructuralmente Complejos con Énfasis en el Análisis de Eventos en Series Temporales Tesis

Más detalles

Administrador de Datos Por que es necesario?

Administrador de Datos Por que es necesario? Administrador de Datos Por que es necesario? Algunas cuestiones practicas A quien le pregunto cuando tengo que agregar un campo a una tabla? Cual es la dirección actualizada de los empleados? Como calculo

Más detalles

Acuerdo de aprobación de la nueva redacción del Anexo XVIII de las Normas de Ejecución y Funcionamiento del Presupuesto vigente.

Acuerdo de aprobación de la nueva redacción del Anexo XVIII de las Normas de Ejecución y Funcionamiento del Presupuesto vigente. Acuerdo de aprobación de la nueva redacción del Anexo XVIII de las Normas de Ejecución y Funcionamiento del Presupuesto vigente. Visto el Presupuesto de la Universidad Miguel Hernández de Elche para el

Más detalles

Algoritmo de Verificación para CTL IIC3800

Algoritmo de Verificación para CTL IIC3800 Algoritmo de Verificación para CTL IIC3800 Pablo Barceló P. Barceló Algoritmo de verificación para CTL 1 / 22 Qué es el model checking de CTL? Recordemos que CTL es la lógica dada por: φ,φ := a φ φ φ EXφ

Más detalles

Epidemiologia Descriptiva

Epidemiologia Descriptiva Epidemiologia Descriptiva Mexico, junio 2007 Stephen Benoit, MD, MPH International Research and Programs Branch Division of TB Elimination Temas Epidemiologia descriptiva Estadisticas descriptivas Medicion

Más detalles

Pregunta 1 Suponga que una muestra de 35 observaciones es obtenida de una población con media y varianza. Entonces la se calcula como.

Pregunta 1 Suponga que una muestra de 35 observaciones es obtenida de una población con media y varianza. Entonces la se calcula como. Universidad de Costa Rica Programa de Posgrado en Computación e Informática Doctorado en Computación e Informática Curso Estadística 18 de febrero 2013 Nombre: Segundo examen corto de Probabilidad Pregunta

Más detalles

Ms. C. Marco Vinicio Rodríguez

Ms. C. Marco Vinicio Rodríguez Ms. C. Marco Vinicio Rodríguez mvrodriguezl@yahoo.com http://mvrurural.wordpress.com/ Uno de los objetivos de la estadística es saber acerca del comportamiento de parámetros poblacionales tales como:

Más detalles