REGLAS DE ASOCIACIÓN Bases de Datos Masivas. 29 de Octubre de 2015
|
|
- Bernardo Montero Hidalgo
- hace 7 años
- Vistas:
Transcripción
1 1 REGLAS DE ASOCIACIÓN Bases de Datos Masivas 29 de Octubre de 2015
2 Reglas de Asociación 2
3 3 Reglas de Asociación Dado un conjunto de transacciones encontrar reglas que puedan predecir la ocurrencia de un ítem basado en la presencia de otros. Análisis Market-Basket transactions Ejemplo de Reglas de Asociación {Diaper} {Beer}, {Milk, Bread} {Eggs,Coke}, {Beer, Bread} {Milk}, La implicancia indica co-ocurrencia no causalidad
4 4 Definiciones Itemset Una colección de 1 ó más items Ejemplo: {Milk, Bread, Diaper} k-itemset Un itemset que contiene k items Support count (σ) Cantidad de ocurrencias de un itemset Ej σ({milk, Bread, Diaper}) = 2 Customer buys both Customer buys diaper Customer buys beer
5 5 Definiciones Support (s) Fracción de transacciones que contiene a un itemset Ejemplo: σ({milk, Bread,Diaper}) / T = 2/5 Itemset frecuente s(x)= σ (x) T Un itemset cuyo support es mayor o igual al umbral establecido en minsup.
6 6 Definiciones Regla de Asociación Una expresión de la forma X Y, donde X e Y son itemsets Ejemplo: {Milk, Diaper} {Beer}
7 7 Definiciones Métricas de Evaluación de Reglas Support (s): Fracción de transacciones que contiene a X e Y Confidence (c): Mide con que frecuencia Y aparece en transacciones en las que también aparece X
8 Ejemplos de Reglas de Asociación 8 {Milk,Diaper} {Beer} (s=0.4, c=0.67) {Milk,Beer} {Diaper} (s=0.4, c=1.0) {Diaper,Beer} {Milk} (s=0.4, c=0.67) {Beer} {Milk,Diaper} (s=0.4, c=0.67) {Diaper} {Milk,Beer} (s=0.4, c=0.5) {Milk} {Diaper,Beer} (s=0.4, c=0.5) Observaciones: Todas las reglas se originaron en el itemset: {Milk, Diaper, Beer} Las reglas que se originan en el mismo itemset tienen el mismo soporte pero pueden tener distinta confianza Por qué?
9 9 Otras aplicaciones 1) Encontrar conceptos relacionados: Supongamos que las palabras son los ítems y los documentos las canastas. 2) Plagio: En este caso los ítems son las documentos y las canastas las oraciones. Donde un item/documento esta en una canasta/oración si la oración pertenece al documento. Una o dos oraciones en común en distintos documentos son un buen indicador de plagio.
10 10 Otras aplicaciones Biomarkers ( indicadores biológicos) Supongamos que los items son de 2 tipos: genes /proteínas en sangre o enfermedades. Cada canasta es el conjunto de estos datos referidos a un paciente: el genoma, los análisis de sangre y su historia clínica. Un itemset que muestra la relación entre uno o más indicadores biológicos y una enfermedad daría una pista sobre un posible análisis para detectar esa enfermedad.
11 11 Descubrimiento de reglas Dado un conjunto de transacciones T, el objetivo del descubrimiento de reglas de asociación es encontrar todas las reglas que cumplen: support minsup threshold confidence minconf threshold Aproximación de fuerza bruta: Listar todas las posibles reglas de asociación Calcular el soporte y la confianza para cada una Eliminar las que no satisfacen los umbrales predefinidos Computacionalmente Prohibitivo!
12 12 Descubrimiento de reglas Por qué es prohibitivo? Supongamos que tenemos frecuent itemset de 100 items: Vamos a tener los {a 1, a 2,..., a 100 } ( ) =100 1-itemset frecuentes Vamos a tener los ( ) = itemset frecuentes
13 13 Descubrimiento de reglas Association Rule Mining puede ser visto como un problema de 2 pasos: 1) Generación de los itemsets frecuentes Generar todos los itemsets con support minsup 2) Generación de reglas Generar a partir de la división de los itemsets frecuentes en subconjuntos las reglas que satisfacen la confianza El primer paso es computacionalmente muy caro
14 Generación de Itemsets Frecuentes 14
15 Generación de Itemsets Frecuentes 15 Aproximación de fuerza bruta: Cada itemset en el lattice es un candidato Contar el soporte de cada itemset barriendo las transacciones Comparar cada transacción contra cada itemset Complejidad ~ O(NMw) => Caro porque M = 2 d!!!
16 16 Complejidad Computacional Dados d items: Número total de itemsets = 2 d Número total de reglas:
17 Estrategias para la generación de itemsets 17 Reducir el número de candidatos (M) Búsqueda completa: M = 2 d Utilice técnicas de poda para reducir M Reducir el número de transacciones (N) Reducir el tamaño de N como el incremento del tamaño de los itemsets Esto es utilizado algoritmos como Direct Hashing and Pruning (DHP) Reducir el número de comparaciones (NM) Utilice las estructuras de datos eficientes para almacenar los candidatos o transacciones No hay necesidad de comparar cada candidato contra cada transacción
18 Reduciendo el número de candidatos 18 Principio Apriori Si un itemset es frecuente, entonces todos sus subsets deben además ser frecuentes. El Principio Apriori se sostiene debido a las siguiente propiedades de la medida de support: X, Y : ( X Y ) s ( X ) s ( Y ) El support de un itemset nunca excede el support de sus subsets Esto es conocido como la propiedad de anti-monotonía del support
19 19 Anti-Monotonía Si un itemset X no satisface el umbral de min_support entonces X no es frecuente. Es decir: S(X) < min_support Si agrego X2 al itemset X (X U X2) entonces el resultado del itemset no puede ser más frecuente que X X U X2 es no frecuente, por lo tanto: S(X U X2) < min_support Volvamos al lattice!!
20 20 El algoritmo Apriori El algoritmo Apriori fue propuesto por R. Agrawal and R. Srikant en 1994 para mining frecuent itemsets de reglas de asociación binarias (como los ejemplos de la canasta). El algoritmo maneja 2 conjuntos de itemsets: Candidatos ( C k ) Frecuentes ( L k )
21 21 El algoritmo Apriori Join Step: C k es generando uniendo L k-1 con sigo mismo. Prune Step: Un (k-1)-itemset que no es frecuente no puede ser un subset de un k-itemset frecuente. Pseudo-code: C k : Candidate itemset of size k L k : frequent itemset of size k L 1 = {frequent items}; for( k = 1; L k!= ; k ++) do begin C k+1 = candidates generated from L k for each transaction t in database do increment the count of all candidates in C k+1 that are contained in t L k+1 = candidates in C k+1 with min_support end return k L k
22 Ejemplo de Generación de Candidatos 22 L3 = { abc, abd, acd, ace, bcd } Unir: L3 * L 3 abcd de abc y abd acde de acd y ace Pruning: Como ade no está en L 3 se elimina acde C 4 ={ abcd }
23 Ejemplo de Generación de Candidatos 23
24 24 Obtención de las reglas A partir de los itemsets frecuentes vamos a generar las reglas de asociación. For each frequent itemset X, For each proper nonempty subset A of X, Let B = X - A A B is an association rule if Confidence (A where support (A confidence (A B) minconf, B) = support (AB), and B) = support (AB) / support (A) Como las reglas se construyen a partir de los itemsets frecuentes, todas satisfacen el min_support
25 Factores que afectan la complejidad 25 Elegir el umbral de min_support Bajar el umbral de support resulta en mas itemsets frecuentes Esto puede incrementar el número de candidatos y la longitud maxima de itemsets frecuentes Dimensionalidad del dataset (cantidad de items) Se necesita más espacio para almacenar el count support de cada uno de los items Si el nro de items frecuentes aumenta, tanto el costo computacional como las operaciones de I/O se incrementan Tamaño de la base de datos Dado que Apriori hace varias pasadas, el tiempo de ejecución del algoritmo puede aumentar con el número de transacciones
26 26 Tipos especiales de itemsets Maximal Frecuent Itemset: Un itemset es maximal si ninguno de su superset es frecuente Closed Frecuent Itemset: Un itemset es closed si ninguno de sus inmediatos superset tiene el mismo support que el itemset.
27 27 Medidas de Interestingnes Dada una regla X Y la información necesaria para computar medidas de Interestingness se obtiene desde una tabla de contingencia:
28 Drawback of Confidence 28
29 29 Independencia Estadística Population of 1000 students students know how to swim (S) students know how to bike (B) students know how to swim and bike (S,B) P(S B) = 420/1000 = 0.42 (Observados juntos) P(S) P(B) = = 0.42 (Indep.) - P(S B) = P(S) P(B) => Statistical independence - P(S B) > P(S) P(B) => Positively correlated - P(S B) < P(S) P(B) => Negatively correlated
30 30 Lift El Lift de una regla es X Y es la confianza de la regla dividido la confianza esperada, asumiendo que los items son independientes. Lift=P( X Y )= P (X, Y ) P (X ). P (Y ) Confidence = P(Coffee Tea) = 0.75 but P(Coffee) = 0.9 Lift = 0.75/0.9= (< 1, están asociados negativamente)
31 31 Referencias Jiawei Han,Micheline Kamber.Data Mining,Concepts and Techniques- 2 da edición- The Morgan Kaufmann Series in Data Management Systems
Por Elizabeth León Guzmán, Ph.D. Profesora
Por Elizabeth León Guzmán, Ph.D. Profesora 1 En una base de datos transaccional, transaccional cada transacción puede contener una lista de ítems (Ej: ítems comprados por un cliente) Id_transacci ón Items
Más detallesAPRENDIZAJE PROBABILÍSTICO NAIVE BAYES
1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;
Más detallesMineria de Datos. Reglas de Asociacion. Dr. Edgar Acuna Departmento de Matematicas. Universidad de Puerto Rico- Mayaguez
Mineria de Datos Reglas de Asociacion Dr. Edgar Acuna Departmento de Matematicas Universidad de Puerto Rico- Mayaguez math.uprrm.edu/~edgar edgar 1 Datos transaccionales Ejemplo de canasta de mercados:
Más detallesTID Artículos. 1 Pan, leche, huevos 2 Pan, pañales, cerveza 3 Leche, pañales, cerveza 4 Pan, leche, pañales, cerveza 5 Pan, leche, huevos, cerveza
Reglas de asociación Fernando Berzal, berzal@acm.org Reglas de asociación Introducción Definiciones Patrones frecuentes Reglas de asociación Extracción de reglas de asociación Identificación de patrones
Más detallesREGLAS DE ASOCIACIÓN por Claudia J iménez Jiménez R Semestre
REGLAS DE ASOCIACIÓN por Claudia Jiménez R Semestre 1-2012 1 Áreas de Aplicación Investigación de mercados Finanzas Biología Detección de fraude Medicina Sociología Y en muchas otras áreas!! ANALISIS DE
Más detallesReglas de Asociación en Weka
Reglas de Asociación en Weka Este documento muestra cómo establecer reglas de asociación en Weka usando como ejemplo los datos de un banco "bank.arff". El punto de inicio consiste en discretizar los datos
Más detallesREGLAS DE ASOCIACIÓN. Jesús González y Eduardo Morales
REGLAS DE ASOCIACIÓN Jesús González y Eduardo Morales Minería de Datos por Reglas de Asociación 2 Encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos transacccionales,
Más detallesLas reglas de asociación tienen diversas aplicaciones como:
Capítulo 4 Reglas de Asociación El objetivo de las reglas de asociación es encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos transaccionales, relacionales o datawarehouses.
Más detallesTareas de la minería de datos: reglas de asociación y secuencias. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: reglas de asociación y secuencias CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR La parábola de la cerveza y las mantillas La parábola de la
Más detallesReglas de Asociación
Reglas de Eduardo Morales, Hugo Jair Escalante INAOE (INAOE) 1 / 43 1 2 3 4 5 6 (INAOE) 2 / 43 Reglas de Objetivo: encontrar asociaciones o correlaciones entre los elementos u objetos de bases de datos
Más detallesAnálisis de desempeño de EquipAsso: Un algoritmo para el cálculo de Itemsets frecuentes basado en operadores algebraicos relacionales.
Análisis de desempeño de : Un algoritmo para el cálculo de Itemsets frecuentes basado en operadores algebraicos relacionales. Ricardo Timarán Pereira, Ph. D.* ritimar@udenar.edu.co Andrés O. Calderón Romero.*
Más detallesAnálisis de Asociaciones
Análisis de Asociaciones Asociaciones Establecer vínculos entre los registros Asociaciones (productos que se compran juntos) Patrones secuenciales (si se compra algo en una fecha en x meses se adquiere
Más detallesReglas de Asociación. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid
Reglas de Asociación Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Reglas Proposicionales: Reglas de Clasificación Descripción de instancias:
Más detallesAgenda. Introduction. Proceso de KDD. Descubrimiento de Conocimiento a partir de Datos. Introducción al KDD. Etapas. Pre-procesamiento de datos
Agenda Introducción al KDD Descubrimiento de Conocimiento a partir de Datos ISISTAN sschia@exa.unicen.edu.ar Etapas Pre-procesamiento de datos Operaciones de Data Mining Reglas de Asociación Clasificación
Más detallesGeneración de conjuntos de ítems y reglas de asociación
Generación de conjuntos de ítems y reglas de asociación José E. Medina Pagola, José Hernández Palancar, Raudel Hernández León, Airel Pérez Suárez, Abdel Hechavarría Díaz, Ricardo González Gazapo Dpto.
Más detallesText Mining Introducción a Minería de Datos
Text Mining Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 12 de Marzo de 2008 qué es la minería de datos? A technique using software tools
Más detallesCriptografía de clave pública Sistemas basados en el problema de la mochila
de la la La Criptografía de clave pública Sistemas basados de la DSIC - UPV (DSIC - UPV) de la 1 / 21 Contenidos del tema de la la La 1 Características de los sistemas de clave pública Principios para
Más detallesPalabras Clave: Minería de datos, Reglas de asociación, Algoritmo Apriori, Confianza mínima,
Reglas de Association rules in a Database of medical area. Ing. Agustín Sáenz López Ingeniero Civil Doctor en Ingeniería Civil, área: Sistemas de Planeación y Construcción. Profesor-Investigador Facultad
Más detallesTesis de Grado Ingeniería en Informática
UN MODELO DE REGLAS DE ASOCIACIÓN ESPACIO-TEMPORALES Tesis de Grado Ingeniería en Informática Departamento de Computación Mariano S. Kohan S. 78687 marianokohan@gmail.com Director: Dr. Juan M. Ale Abril,
Más detallesCoordinación de Ciencias Computacionales INAOE. Reporte Técnico No. CCC-09-001 31 de Marzo de 2009
Minería de Reglas de Asociación sobre Datos Mezclados Ansel Yoan Rodríguez González, José Francisco Martínez Trinidad, Jesús Ariel Carrasco Ochoa, José Ruiz Shulcloper Reporte Técnico No. CCC-09-001 31
Más detallesConstrucción de hipótesis candidatas
Capítulo 4 Construcción de hipótesis candidatas...la respuesta errónea a un ejercicio puede mostrar una ausencia real de comprensión o revelar el hecho de que el alumno ha construido su propio modelo personal.
Más detallesIntersección de Segmentos de Recta. Geometría Computacional, MAT-125
Intersección de Segmentos de Recta Geometría Computacional, MAT-125 Dados dos conjuntos de segmentos de recta, calcular todas las intersecciones entre los segmentos de un conjunto y los segmentos del otro
Más detallesRepresentación de Teorías con Reglas de Decisión. Reglas: representación potente. Inferencia de reglas via OneRule. Prof. Carlos I.
Datamining y Aprendizaje Automatizado 05 Aprendizaje de Conjuntos de Reglas Prof. Carlos Iván Chesñevar Departamento de Cs. e Ing. de la Computación Universidad Nacional del Sur Email: cic@cs.uns.edu.ar
Más detallesUniversidad Nacional del Sur Departamento de Ciencias e Ingeniería de la Computación Elementos de Bases de Datos 2do. Cuatrimestre de 2004
2do. Cuatrimestre de 2004 Elementos de Bases de Datos Dpto.Ciencias e Ingeniería de la Computación Universidad Nacional del Sur Lic. María Mercedes Vitturini [mvitturi@cs.uns.edu.ar] Clase 9 1er. Cuatrimestre
Más detallesProcesamiento y Optimización de Consultas
16/12/2011 s Procesamiento y Optimización de Consultas Grupo de Ingeniería del Software y Bases de Datos Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla diciembre 2011 s Objetivos
Más detallesProcesamiento y Optimización de Consultas
30/09/2016 s Procesamiento y Optimización de Consultas Grupo de Ingeniería del Software y Bases de Datos Departamento de Lenguajes y Sistemas Informáticos Universidad de Sevilla septiembre 2016 s Objetivos
Más detallesIntroducción a la minería de datos y el descubrimiento del conocimiento en bases de datos
Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas Introducción a la minería de datos y el descubrimiento del conocimiento en Mg. Ing. Mario José Diván Temario 1. Qué es data
Más detallesCapítulo 8. Selección de variables Introducción
Capítulo 8 Selección de variables 8.1. Introducción En muchos problemas de regresión es posible considerar un número importante de variables predictoras. Un empresario podría estudiar los factores que
Más detallesPalabras clave: Reglas de asociación, Conocimiento impreciso, Redundancia basada en conocimiento
Tipo de artículo: Artículo original Temática: Inteligencia Organizacional Recibido: 30/10/2015 Aceptado: 13/01/2016 Uso de conocimiento impreciso de usuario para reducir redundancia en reglas de asociación
Más detallesAPLICACIÓN DE REGLAS DE ASOCIACIÓN PARA LA DETECCIÓN DE PATRONES DE COMPORTAMIENTO EN SISTEMA ACADÉMICO UNIVERSITARIO
APLICACIÓN DE REGLAS DE ASOCIACIÓN PARA LA DETECCIÓN DE PATRONES DE COMPORTAMIENTO EN SISTEMA ACADÉMICO UNIVERSITARIO Ing. David J. Belamate, Ing. Matías A. Cassani, Ing. Carolina P. Ricci Universidad
Más detallesIntroducción a Aprendizaje no Supervisado
Introducción a Aprendizaje no Supervisado Felipe Suárez, Álvaro Riascos 25 de abril de 2017 2 / 33 Contenido 1. Motivación 2. k-medias Algoritmos Implementación 3. Definición 4. Motivación 5. Aproximación
Más detallesNormalización. Carlos A. Olarte Bases de Datos I
Carlos A. Olarte Bases de Datos I Outline 1 Introducción 2 Dependencias Funcionales 3 Diseño de Bases de Datos 4 Forma Normal Boyce-Codd (FNBC) 5 3FN 6 Dependneicas Funcionales Multivaluadas 7 4FN Introducción
Más detallesWEB MINING FOR IDENTIFYING PATTERNS
Minería de uso Web para la identificación de patrones Castaño P. Andres P. * Resumen La minería Web es la aplicación de técnicas de minería de datos para descubrir patrones de uso de los usuarios desde
Más detallesGeneración de números aleatorios con distribución uniforme
Generadores de Números Aleatorios 1 Existen en la actualidad innumerables métodos para generar números aleatorios En la literatura disponible se pueden encontrar gran cantidad de algoritmos. Generación
Más detallesReglas de asociación. Inteligencia Artificial Dr. Ariel Monteserin amontese@exa.unicen.edu.ar ISISTAN - UNICEN
Reglas de asociación Inteligencia Artificial Dr. Ariel Monteserin amontese@exa.unicen.edu.ar ISISTAN - UNICEN Agenda Conceptos Algoritmos de descubrimientos de reglas de asociación Post-procesamiento Actualización
Más detallesTipos de subárboles/ patrones en árboles
Patrones en árboles Fernando Berzal, berzal@acm.org Patrones en árboles Tipos de árboles Tipos de subárboles/ patrones en árboles [Partially-Ordered-Tree Miner] Algoritmos Aplicaciones 1 Tipos de árboles
Más detallesRazón de Verosimilitud - LR
Razón de Verosimilitud - LR Perfil de ADN Comparación electroferogramas EXCLUIDO Muestra Sospechoso 1 Comparación electroferogramas No puede ser excluido Muestra Sospechoso 2 Qué peso debería tener la
Más detallesSimplificación de funciones lógicas utilizando Karnaugh
Simplificación de funciones lógicas utilizando Página Objetivos de la simplificación Objetivo: minimizar el costo de la función lógica Medición del costo y otras consideraciones Número de compuertas Número
Más detallesInducción Matemática Conjuntos Funciones. Matemática Discreta. Agustín G. Bonifacio UNSL. Repaso de Inducción, Conjuntos y Funciones
UNSL Repaso de Inducción, y Inducción Matemática (Sección 1.7 del libro) Supongamos que queremos demostrar enunciados del siguiente tipo: P(n) : La suma de los primeros n números naturales es n(n+1)
Más detallesEvaluación de Reglas de Asociación en Text Mining Utilizando Métricas Semánticas y Estructurales
UNIVERSIDAD DE CONCEPCIÓN FACULTAD DE INGENIERÍA PROGRAMA DE MAGÍSTER EN CIENCIAS DE LA COMPUTACIÓN Evaluación de Reglas de Asociación en Text Mining Utilizando Métricas Semánticas y Estructurales Profesor
Más detallesBúsqueda en e.e. --> reglas para elegir entre las ramas que con más probabilidad lleven a la solución.
BÚSQUEDA HEURÍSTICA estudio de los métodos y reglas del descubrimiento y la invención. Búsqueda en e.e. --> reglas para elegir entre las ramas que con más probabilidad lleven a la solución. Situaciones
Más detallesOptimización. Bibliografía: Fundamentos de bases de datos Korth, Silberschatz
Optimización Bibliografía: Fundamentos de bases de datos Korth, Silberschatz Conceptos básicos Dada una consulta, existen diferentes formas (estrategias) de calcular la respuesta. Los usuarios generalmente
Más detallesRestricción de valor único. Indispensable para diseñar esquemas de bases de datos que eliminen al redundancia.
CC42A Auxiliar #3 Dependencias funcionales, reglas, axiomas de Armstrong, cerradura de dependencias Martes, 03 de Septiembre de 2002 Profesor: Claudio Gutiérrez Auxiliar: Tania Gallardo Consultas a tgallard@dcc.uchile.cl
Más detallesAlonso Ramirez Manzanares Computación y Algoritmos 03.05
Tablas de hash (2) mat-151 Alonso Ramirez Manzanares Computación y Algoritmos 03.05 Tablas de hash: resolviendo colisiones por encadenamiento cuando el número de elementos en total es proporcional al número
Más detallesHipótesis. Teoria del Aprendizaje Computacional
Teoria del Aprendizaje Computacional CI5438 - Inteligencia Artificial 2 Clase 7 Cap 18. Russel & Norvig: Inteligencia Artificial. Un enfoque estructurado El aprendiz inductivo se puede reinterpretar como
Más detalles1. Diseñe algoritmos que permitan resolver eficientemente el problema de la mochila 0/1 para los siguientes casos:
PROGRAMACIÓN DINÁMICA RELACIÓN DE EJERCICIOS Y PROBLEMAS 1. Diseñe algoritmos que permitan resolver eficientemente el problema de la mochila /1 para los siguientes casos: a. Mochila de capacidad W=15:
Más detallesProgramación Dinámica
Programación Dinámica Es aplicada típicamente a problemas de optimización, donde puede haber muchas soluciones, cada una tiene un valor asociado y prentendemos obtener la solución con valor óptimo. Al
Más detallesSesión 2: Teoría de Probabilidad
Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 2: Teoría de Probabilidad Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para
Más detallesAlgoritmos genéticos
Algoritmos genéticos Introducción 2 Esquema básico 3 El problema de la mochila 7 Asignación de recursos 0 El problema del viajante 3 Variantes del esquema básico 5 Por qué funciona? 9 Observaciones finales
Más detallesCarteras minoristas. árbol de decisión. Ejemplo: Construcción de un scoring de concesión basado en un DIRECCIÓN GENERAL DE SUPERVISIÓN
Carteras minoristas Ejemplo: Construcción de un scoring de concesión basado en un árbol de decisión Grupo de Tesorería y Modelos de Gestión de Riesgos Sergio Gavilá II Seminario sobre Basilea II Validación
Más detallesHerramienta software para el análisis de canasta de mercado sin selección de candidatos
REVISTA INGENIERÍA E INVESTIGACIÓN VOL. 29 No. 1, ABRIL DE 2009 (60-68) Herramienta software para el análisis de canasta de mercado sin selección de candidatos Software tool for analysing the family shopping
Más detallesHASH-MERGE vs Lookups.
HASH-MERGE vs Lookups. Octubre 12, 2011 Moisés Ramírez Flores Sr. Statistical Programmer Pharmanet/i3 Agenda Introducción Hash Step. Como realizar un hash merge Preguntas Introducción Como programadores
Más detallesMétodos Estadísticos de la Ingeniería Práctica 4: Regresión Lineal
Métodos Estadísticos de la Ingeniería Práctica 4: Regresión Lineal Área de Estadística e Investigación Operativa Mariano Amo Salas y Licesio J. Rodríguez-Aragón Marzo 2010 Contenidos Práctica 4.......................................................
Más detallesRendimiento de un activo
Rendimiento de un activo Es la ganancia o pérdida total que experimenta el propietario de una inversión en un periodo de tiempo específico. Se obtiene como el cambio en el valor del activo más cualquier
Más detallesCaso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo
Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo Caso Práctico El objetivo de este ejercicio es analizar diferentes tipos de pruebas estadísticas en las
Más detallesIntersección de Segmentos de Recta (2) Geometría Computacional, MAT-125
Intersección de Segmentos de Recta (2) Geometría Computacional, MAT-125 Qué estructuras de datos necesitamos para implementar este algoritmo? cola de eventos Q. Operaciones: Eliminar el próximo evento
Más detalles1.2.4 Listas enlazadas
1.2.4 Listas enlazadas Las listas enlazadas son tipos de datos dinámicos que se construyen con nodos. Un nodo es un registro con al menos, dos campos, uno de ellos contiene las componentes y se le denomina
Más detallesC U R S O : MATEMÁTICA
C U R S O : MATEMÁTICA GUÍA TEÓRICO PRÁCTICA Nº 27 UNIDAD: ÁLGEBRA Y FUNCIONES ECUACIÓN DE SEGUNDO GRADO Una ecuación de segundo grado es una ecuación susceptible de llevar a la forma ax 2 + bx + c = 0,
Más detallesEXPERIMENTO ALEATORIO
EXPERIMENTO ALEATORIO En concepto de la probabilidad, un experimento aleatorio es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, en otras palabras,
Más detallesBase de Datos. Práctica de Normalización. 1 Base de Datos
Base de Datos Práctica de Normalización 1 Base de Datos 1 NORMALIZACIÓN PRIMERA PARTE 1.1 Ejercicio Son válidas las siguientes reglas de inferencias para dependencias funcionales? Si es así, dar una demostración,
Más detallesDISEÑOS EPIDEMIOLOGICOS MONICA LUNA MG. EPIDEMIOLOGIA
DISEÑOS EPIDEMIOLOGICOS MONICA LUNA MG. EPIDEMIOLOGIA DISEÑOS EPIDEMIOÓGICOS Estudios Observacionales Descriptivos Analíticos Estudios Experimentales Ensayos Clínicos controlados ESTUDIOS DE CASOS Y CONTROLES
Más detallesMi nuevo reporte de SAS no cabe en un libro de Excel, Qué hago?
Mi nuevo reporte de SAS no cabe en un libro de Excel, Qué hago? Beatriz García Santiago 12 Oct 2011 Agenda 1) Exposición de la problemática 2) Preprocesamiento 3) Alternativas de solución 4) Qué necesitamos?
Más detallesLa distribucion de preferencias de colores es la misma tanto para personas de distinto nivel socioeconómico.
ANEXO - PRUEBAS DE ASOCIACION A.1 Pruebas de asociacion Este tipo de pruebas testea la hipotesis nula que 2 factores (o atributos) no se encuentran asociados, respecto de la hipotesis alternativa que si
Más detallesMinería de reglas de asociación con programación genética gramatical
Minería de reglas de asociación con programación genética gramatical José María Luna Juan Luis Olmo José Raúl Romero Sebastián Ventura Departamento de Informática y Análisis Numérico, Universidad de Córdoba
Más detallesEn ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener
ERRORES DE MEDICION Y SU PROPAGACION En ciencias e ingeniería (experimentales) es imprescindible realizar mediciones, que consisten en obtener la magnitud fisica de algun atributo de objetos ( proceso,
Más detallesTema 9: Inducción de Reglas
Tema 9: Inducción de Reglas p. 1/15 Tema 9: Inducción de Reglas Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País
Más detallesProgramación Dinámica 1
Programación Dinámica 1 El método de programación dinámica sirve para resolver problemas combinando las soluciones de subproblemas. Normalmente es usada para resolver problemas de optimización. Al construir
Más detallesTEMA 3: Escalas de medida. Validación de cuestionarios.
1. INTRODUCCIÓN. ESCALAS BÁSICAS. 2. ESCALAS COMPARATIVAS Y NO COMPARATIVAS. 3. ANALISIS CLÁSICO DE ÍTEMS 3.1 ANÁLISIS PRIMARIOS. 3.2 FIABILIDAD. 3.3 VALIDEZ. 4. ESCALAMIENTO MULTIDIMENSIONAL (MDS). 4.1
Más detallesIntroducción a la minería de datos. Necesidades asociadas
Universidad Nacional de La Pampa Facultad de Ciencias Económicas y Jurídicas Introducción a la minería de datos. Necesidades asociadas Mg. Ing. Mario José Diván mjdivan@divsar.com.ar Temario 1. Qué es
Más detallesTema 2. Introducción a la Estadística Bayesiana
2-1 Tema 2 Introducción a la Estadística Bayesiana El teorema de Bayes Ejemplo Interpretación Ejemplo: influencia de la distribución a priori Ejemplo: densidad de flujo Probabilidad bayesiana Ejemplo:
Más detallesEl momento k-ésimo para una variable aleatoria discreta respecto del origen, es. n = esperanza matemática de X
Momentos El momento k-ésimo para una variable aleatoria discreta respecto del origen, es E(x) n = i = 1 k i ( ) x.p x El primer momento centrado en el origen (k=1) es la esperanza matemática de X También
Más detallesAR - Marco General. Álgebra Relacional AR - SELECT. AR - SELECT - Propiedades. 19/Agosto/2016
AR - Marco General Marco General 19/Agosto/2016. Lenguaje formal utilizado en el modelo relacional Permite a usuarios especificar consultas sobre instancias de relaciones El resultado de una consulta es
Más detallesInferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.
Inferencia estadística: Prueba de Hipótesis Jhon Jairo Padilla A., PhD. Justificación Es una etapa de análisis de datos de un experimento comparativo: Se compara un parámetro de una v.a. con un valor dado.
Más detallesCLASIFICACIÓN PROBLEMA SOLUCIÓN
Capítulo 7 Análisis Cluster CLASIFICACIÓN Asignar objetos en su lugar correspondiente dentro de un conjunto de categorías establecidas o no. PROBLEMA Dado un conjunto de m objetos (animales, plantas, minerales...),
Más detallesTEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES Práctica 5 - Simplificación de gramáticas incontextuales
TEORÍA DE AUTÓMATAS Y LENGUAJES FORMALES Práctica 5 - Simplificación de gramáticas incontextuales 1. Objetivos 2. Representación de los datos en Mathematica 3. Eliminación de símbolos inútiles 3.1. Símbolos
Más detallesPSU Matemática NM-4 Guía 24: Isometrías. Transformaciones isométricas en el plano
Centro Educacional San Carlos de Aragón. Dpto. Matemática. Prof. Ximena Gallegos H. PSU Matemática NM-4 Guía 4: Isometrías Nombre: Curso: Fecha: - Contenido: Isometrías. Aprendizaje Esperado: Analiza diferentes
Más detallesProgramación Dinámica
Programación Dinámica Adaptado de Algorithm Design Goodrich and Tamassia Programación Dinámica 1 Calculando la serie de Fibonacci 1,1,2,3,5,8,13,21,. fib(n) = 1 si n = 0,1 fib(n 1) + fib(n 2) o.c. Programación
Más detallesIntroducción a la Probabilidad
Introducción a la Probabilidad Tema 3 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1 Ignacio Cascos Depto. Estadística, Universidad Carlos III 2 Objetivos Entender el concepto de experimento
Más detallesAplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.
Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así
Más detallesEscribir el modelo. Evaluar los efectos de los factores y la interacción entre ellos.
Ejercicio 1: Se aplican pinturas tapaporos para aeronaves en superficies de aluminio, con dos métodos: inmersión y rociado. La finalidad del tapaporos es mejorar la adhesión de la pintura, y puede aplicarse
Más detallesEL4005 Principios de Comunicaciones Clase No.10: Repaso de Probabilidades
EL4005 Principios de Comunicaciones Clase No.10: Repaso de Probabilidades Patricio Parada Departamento de Ingeniería Eléctrica Universidad de Chile 10 de Septiembre de 2010 1 of 29 Contenidos de la Clase
Más detallesTema 9. Inducción de Reglas
Tema 9. Inducción de Reglas Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Euskal Herriko Unibertsitatea
Más detallesPrototipo de software para la asociación de datos UDAssociate
Prototipo de software para la asociación de datos UDAssociate Tecn. Adriana Amaya Morales 1, Tecn. Martha Lucía Rodríguez 2, Ing. Jorge Enrique Rodríguez Rodríguez 3 RESUMEN UDAssociate es una herramienta
Más detallesAnálisis y Diseño de Algoritmos Tablas de Hash
Análisis y Diseño de Algoritmos Tablas de Hash Guillermo Morales-Luna Arturo Díaz Pérez CONTENIDO 1. Dispersión 2. Funciones de dispersión (a) Método de división (b) Método de multiplicación 3. Direccionamiento
Más detalles2.6.2.- Aplicaciones de las vistas. 2.6.1.- Concepto de vista. 2.6.3.- Vistas en SQL. 2.6.3.- Vistas en SQL.
2.6.1.- Concepto de vista. Una vista es una tabla derivada de otras tablas (básicas o virtuales). Una vista se caracteriza porque: Se considera que forma parte del esquema externo. Una vista es una tabla
Más detallesNormalización. Carlos A. Olarte Bases de Datos I
Carlos A. Olarte Bases de Datos I Outline 1 Introducción 2 Dependencias Funcionales 3 Diseño de Bases de Datos 4 Forma Normal Boyce-Codd (FNBC) 5 3FN 6 Dependneicas Funcionales Multivaluadas 7 4FN Introducción
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesINTERSECCIÓN Y UNIÓN DE ÁREAS Y VOLÚMENES
PreUnAB INTERSECCIÓN Y UNIÓN DE ÁREAS Y VOLÚMENES Clase # 23 Octubre 2014 ÁREAS SOMBREADAS (ACHURADAS): Corresponde esta clase al cálculo de áreas de diferentes figuras relacionadas entre sí, generando
Más detallesMEDIDAS DE ASOCIACION
MEDIDAS DE ASOCIACION OBJETIVOS DE LA LECCION Que es asociación Identificar las medidas apropiadas para un diseño de estudio Construir tablas de contingencia Calcular e interpretar las medidas de asociación
Más detalles6-Simplificación. 6.1 Ejemplos en dos niveles 6.2 Simplificación en dos niveles 6.3 Algoritmos de simplificación. 6: Simplificación 1
6-Simplificación 6.1 Ejemplos en dos niveles 6.2 Simplificación en dos niveles 6.3 Algoritmos de simplificación 6: Simplificación 1 Ejemplo: comparador de dos bits N1 N2 A B C D LT EQ GT A B < C D A B
Más detallesSe espera que en el futuro se vayan añadiendo nuevos servicios que aumenten y completen el conjunto.
Introducción: Se pretende hacer un flujo de datos desde dado un genoma o varias secuencias de varios genes, poder obtener información sobre el uso de Codones en los mismos, desde calcular la frecuencia
Más detallesSupuestos y comparaciones múltiples
Supuestos y comparaciones múltiples Diseño de Experimentos Pruebas estadísticas Pruebas de bondad de ajuste Prueba de hipótesis para probar si un conjunto de datos se puede asumir bajo una distribución
Más detallesUNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA
UNIVERSIDAD POLITÉCNICA DE MADRID FACULTAD DE INFORMÁTICA Marco de Descubrimiento de Conocimiento para Datos Estructuralmente Complejos con Énfasis en el Análisis de Eventos en Series Temporales Tesis
Más detallesAdministrador de Datos Por que es necesario?
Administrador de Datos Por que es necesario? Algunas cuestiones practicas A quien le pregunto cuando tengo que agregar un campo a una tabla? Cual es la dirección actualizada de los empleados? Como calculo
Más detallesAcuerdo de aprobación de la nueva redacción del Anexo XVIII de las Normas de Ejecución y Funcionamiento del Presupuesto vigente.
Acuerdo de aprobación de la nueva redacción del Anexo XVIII de las Normas de Ejecución y Funcionamiento del Presupuesto vigente. Visto el Presupuesto de la Universidad Miguel Hernández de Elche para el
Más detallesAlgoritmo de Verificación para CTL IIC3800
Algoritmo de Verificación para CTL IIC3800 Pablo Barceló P. Barceló Algoritmo de verificación para CTL 1 / 22 Qué es el model checking de CTL? Recordemos que CTL es la lógica dada por: φ,φ := a φ φ φ EXφ
Más detallesEpidemiologia Descriptiva
Epidemiologia Descriptiva Mexico, junio 2007 Stephen Benoit, MD, MPH International Research and Programs Branch Division of TB Elimination Temas Epidemiologia descriptiva Estadisticas descriptivas Medicion
Más detallesPregunta 1 Suponga que una muestra de 35 observaciones es obtenida de una población con media y varianza. Entonces la se calcula como.
Universidad de Costa Rica Programa de Posgrado en Computación e Informática Doctorado en Computación e Informática Curso Estadística 18 de febrero 2013 Nombre: Segundo examen corto de Probabilidad Pregunta
Más detallesMs. C. Marco Vinicio Rodríguez
Ms. C. Marco Vinicio Rodríguez mvrodriguezl@yahoo.com http://mvrurural.wordpress.com/ Uno de los objetivos de la estadística es saber acerca del comportamiento de parámetros poblacionales tales como:
Más detalles