Minería de Datos. Fundamentos, Técnicas y Aplicaciones. Ramiro Aguilar Quispe

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Minería de Datos. Fundamentos, Técnicas y Aplicaciones. Ramiro Aguilar Quispe"

Transcripción

1 Minería de Datos Fundamentos, Técnicas y Aplicaciones Ramiro Aguilar Quispe

2 c Ramiro Aguilar Quispe, Carrera de Informática Facultad de Ciencias Puras y Naturales Universidad Mayor de San Andrés, Bolivia Departamento de Informática y Automática Facultad de Ciencias Universidad de Salamanca, España Imprime: Reprografía Signo C/ Serranos, Salamanca, España. I.S.B.N.: X Está permitida la reproducción parcial o total de esta obra siempre que sea con fines educativos no comerciales y se citen a la fuente y al autor. ii

3 iii A Jelena

4 iv

5 Tabla de Contenidos Tabla de Contenidos Lista de Tablas Lista de Figuras Resumen Agradecimientos v xv xvii xxv xxvii I FUNDAMENTOS DE MINERÍA DE DATOS 1 1 Contexto de la Minería de Datos Aprendizaje Automático Necesidad de la Minería de Datos Qué es la Minería de Datos? Minería de Datos como Proceso Dual Minería de Datos como Núcleo Concepto de Minería de Datos Qué no es la Minería de Datos? Sistemas de Ayuda a la Dirección Sistemas de Procesamiento Analítico en Línea Consulta e Informe Qué puede hacer la Minería de Datos? Predicción v

6 1.5.2 Clasificación Estimación Agrupamiento Análisis de Asociación Descripción y Visualización El Contexto de Negocio de la Minería de Datos Minería de Datos como Herramienta de Investigación Minería de Datos para Procesos Minería de Datos para Mercadeo Minería de Datos para Administración de Relaciones de Consumo El Contexto Técnico de la Minería de Datos Minería de Datos y Aprendizaje Automático Minería de Datos y Estadística Minería de Datos y Toma de Decisiones Minería de Datos y Tecnología de Cómputo El Contexto Social de la Minería de Datos Aplicaciones y Tendencias Minería de Datos Distribuida Minería de Datos Multimedia Minería de Datos Web Minería de Datos: Seguridad y Confidencialidad Descubrimiento de Conocimiento en Bases de Datos Inteligencia de Negocio Conceptos Alcance de la Inteligencia de Negocio Niveles de Manejo de Información Del Análisis Multidimensional al Descubrimiento de Conocimiento Operaciones Básicas del Análisis Multidimensional Proceso de Descubrimiento de Conocimiento Determinación de Objetivos Preparación de Datos Transformación de Datos vi

7 2.2.4 Minería de Datos Análisis de Resultados Asimilamiento de Conocimiento Vista Previa de las Técnicas de Minería de Datos Métodos Estadísticos Árboles de Inducción Redes Neuronales Artificiales Agrupamiento o Segmentación Análisis de Asociación Algoritmos Genéticos Lógica Borrosa Series Temporales II DE LA ESTADÍSTICA AL APRENDIZAJE AUTOMÁ- TICO 47 3 Regresión y Estimación Conceptos El Problema de Regresión Coeficiente de Determinación de la Regresión Regresión Lineal Proceso de Regresión Lineal Regresión de Y sobre X Regresión de X sobre Y Ejemplo inicial Propiedades de la Regresión Lineal Otro ejemplo Regresión Lineal Múltiple Determinación de los Coeficientes Regresión Logística Asociación entre variables binomiales Modelo de Regresión Logística Simple vii

8 4 Aprendizaje Bayesiano Introducción Teorema de Bayes Variables Continuas y Ruido Aprendizaje Probabilístico Principio de Longitud de Descripción Mínima Clasificador Bayesiano Óptimo Clasificador Bayesiano Naive Estimación de Probabilidades Redes Bayesianas Propagación de Probabilidades Propagación en Árboles Propagación en Poliárboles Propagación en Redes Multiconectadas Redes Bayesianas en Minería de Datos Aprendizaje Paramétrico Funcionamiento Variables no Observadas Aprendizaje Estructural Árboles Poliárboles Redes Multiconectadas Mejora Estructural III TÉCNICAS DE MINERÍA DE DATOS 83 5 Árboles de Decisión Qué esunárbol de Decisión? Representación Gráfica de un Árbol de Decisión Expresividad de un Árbol de Decisión Inducción de Árboles de Decisión a partir de Ejemplos Tarea recomendada para la Inducción Selección del tipo de clasificador y aplicaciones comunes Bucle básico Entropía viii

9 5.3.2 Ganancia de información Reducción de incertidumbre Arboles de Decisión dentro del Aprendizaje Automático Algoritmo ID Algoritmo ID3 Normalizado Algoritmos Incrementales Algoritmos ID5 e ID5R Otros Temas de Estudio Sobreajuste ( overfitting ) Poda ( prunning ) Atributos de valores continuos Medidas alternativas en la selección de atributos Atributos con valores perdidos Atributos con pesos diferentes Algoritmo C Otros Algoritmos Desarrollados Algoritmo C4.5 Oblicuo Algoritmo C Redes Neuronales equivalentes a Árboles de Decisión Redes Neuronales Artificiales Introducción Componentes de las Redes Neuronales Artificiales Funciones de Activación Arquitecturas de RNAs Paradigmas de Aprendizaje Entrenamiento de una Unidad Procesadora Geometría del funcionamiento de una UPU Método del gradiente descendente Procedimiento de Widrow-Hoff Procedimiento delta generalizado Redes Neuronales Multicapa Método de retropropagación Cambio de Pesos en las Capas de la Red Inicialización y criterio de parada ix

10 6.4.4 Algoritmo de Aprendizaje Generalización, precisión y sobreajuste Agrupamiento Qué es el agrupamiento? Reconocimiento Estadístico de Patrones y Redes Neuronales Mapas Auto-organizados Arquitectura de la red Aprendizaje con la Ecuación Trivial Aprendizaje con la Ecuación Simple Modelos de Vecindarios Neuronales Inicialización y Condición de Parada Algoritmo de Agrupamiento Cuantificación Vectorial Representantes de Clase Diversas Actualizaciones Algunos Resultados Red Neuronal de Topología Flexible Categorización Adaptativa Plasticidad Neuronal en el cerebro Red Neuronal de Topología Flexible Funcionamiento Análisis de Asociación Reglas de Asociación Forma de las Regla Coherencia de una Regla Primera Aproximación Descubrimiento de Asociaciones Descubrimiento de Patrones Secuenciales Funcionamiento De las Reglas de Asociación a las Correlaciones Implicaciones Negativas Reglas de Correlación x

11 IV TÉCNICAS HÍBRIDAS Sistemas de Lógica Borrosa Conjuntos Borrosos Grado de Pertenencia Propiedades de los Conjuntos Borrosos Sistemas Borrosos Variables Linguísticas Enborronamiento Motor de Inferencia Modificadores Linguísticos Operadores T-Norma y S-Norma Base de Reglas Desemborronado Entrenamiento de Sistemas de Lógica Borrosa Caracterización del Conjunto de Entrenamiento Entrenamiento con Universos Fijos Entrenamiento con Universos Variables Algoritmos Evolutivos Computación Evolutiva Algoritmos Genéticos Metáfora Natural Algoritmo Genético Simple Implementación de un Algoritmo Genético Proceso de Selección Proceso de Cruzamiento Proceso de Mutación Proceso de Selección de Sobrevivientes Estrategias Evolutivas Representación Estrategias Evolutivas Simples Estrategias Evolutivas Compuestas Estrategias Evolutivas Avanzadas Sistemas Clasificadores Programación Genética xi

12 10.6 Hardware Evolutivo Algoritmos Genéticos en el aprendizaje de Redes Neuronales Artificiales Redes Neuronales Artificiales en el Reconocimiento de Patrones Algoritmos Genéticos para el Aprendizaje: Cromosoma y Función Objetivo Proceso de Evolución Algunas Conclusiones y Recomendaciones V APLICACIONES Gestión de Proyectos Software Pautas para la Simbiosis entre la Minería de Datos y la Lógica Borrosa Descripción de la Base de Datos Minería de Datos Agrupamiento Reglas de Asociación Árboles de Decisión Sistema Clasificador Borroso Variables de Entrada Variable de Salida Reglas Borrosas Funciones de Transferencia Resultados del Sistema Clasificador Borroso Conclusiones Proyectos Biológicos de Gran Escala Genoma Humano Genoma Humano Descifrado Coincidencia de Resultados Secuenciación del Genoma Humano Qué es el Genoma? Genes xii

13 Polimorfismos Nucleótidos Simples Desafíos Futuros Bioinformática Secuenciación del Cromosoma Minería de Datos Descubrimiento de Patrones Secuenciales Reglas de Asociación Trabajos Futuros Bibliografía 259 A Teminología del Aprendizaje Automático 267 xiii

14 xiv

15 Lista de Tablas 2.1 Jerarquía de elementos de dependencia Ejemplos con atributos multivariados Ejemplos con atributos binarios Conjunto de datos Conjunto de reglas de asociación de mayor confianza Conjunto de datos etiquetado mediante la reglas de correlación generadas Transacciones de compra de artículos Porcentajes de compra de los artículos té (t) y café (c) Grados de pertenencia de las edades de personas respecto de los conjuntos borrosos: bebés, jóvenes, adultos y viejos Conjunto de entrenamiento donde cada fila representa una instancia, caso o ejemplo para el accionar de un sistema de lógica borrosa Parámetros o atributos de la Base de Datos Valores de los representantes de clase para los proyectos buenos, regulares y malos usando la distancia Euclideana xv

16 11.3 Valores de los representantes de clase para los proyectos buenos, regulares y malos usando la distancia de Manhattan Conjunto de reglas de asociación entre los atributos ASIMDY y TIEMPO Reglas borrosas de clasificación Aminoácidos que representan el código genético Número de millones de bp s (Mbp), genes etiquetados y componentes no localizados por cromosoma Conteo de tripletas localizadas por el árbol de secuencias para las cien mil bp s Reglas de asociación para las tripletas válidas por el árbol de secuencias (θ >1500) xvi

17 Lista de Figuras 1.1 Ingeniería del Aprendizaje de Datos Un sistema de Inteligencia Artificial La minería de datos como proceso dual entre análisis y síntesis sobre los datos El proceso de minería de datos como núcleo para adquirir conocimiento Posicionamiento de las Técnicas de la Inteligencia Corporativa Estratos de la Inteligencia de Negocio Niveles del manejo de la información Estructura organizacional de una comercial descrita jerárquicamente en la Tabla Visualización Multidimensional de los datos Etapas del Proceso de Descubrimiento de Conocimiento en Bases de Datos Visualización del histograma de datos Visualización del diagrama de sectores Ejemplo de visualización de las medidas estadísticas usando MineSet para IRIX de Silicon Graphics xvii

18 2.9 Visualización de dispersión o scatterplots usando MineSet para IRIX de Silicon Graphics Estimación del error de clasificación con la técnica Holdout Validación cruzada del aprendizaje para estimar el error en el clasificador Curva de esfuerzo al clasificar correctamente una cantidad de registros Curva promedio del error aprendizaje en función del número de registros Representación de la confusión provocada por los errores de clasificación Curva ROI que representa la precisión en función de la pérdida Aproximación de la curva a los puntos de observación Aproximación de la superficie f a los puntos de observación Regresión de Y sobre X Regresión de X sobre Y Función Sigmoidal Logística Red Bayesiana de tres variables binarias Grafo acíclico donde el evento E en independiente del conjunto de eventos {A, C, D, F, G} Un árbol de decisión con tres niveles, seis nodos y nueve hojas Definición de la función clasificadora para un árbol de decisión binario Árbol de decisión con atributos (nodos) de valores multivaluados Gráfico de la función Entropía de rango p(x), x [0, 1] Árbol de decisión generado para los ejemplos de la tabla xviii

19 5.6 Representación multidimensional de los ejemplos de la tabla Arbol de decisión generado para los ejemplos de la tabla Determinando cuándo empieza el sobreajuste [70] Árbol de decisión de nodos con valores binarios y Red Neuronal equivalente Árbol de decisión multivariado y Red Neuronal equivalente Red Neuronal de ocho nodos y cinco unidades procesadoras Esquema de una neurona o unidad procesadora Taxonomía de las redes neuronales [9] Geometría de una UPU Red neuronal de una capa de entrada y L capas de unidades procesadoras Distribución de patrones (puntos) no etiquetados Jerarquía de grupos en un conjunto de elementos (puntos) Partición jerárquica de grupos en forma de árbol Agrupamiento por distancia Euclidea, a) pequeña distancia entre grupos y pequeña distancia dentro de los grupos, b) mucha distancia dentro de los grupos y pequeña distancia entre los grupos; y, c) mucha distancia entre los grupos y pequeña distancia dentro de los grupos Arquitectura de la red neuronal de Kohonen Función de energía tipo sombrero mejicano : variación de los pesos en función de la distancia entre las neuronas de salida Función de retroalimentación lateral simple Función de retroalimentación lateral exponencial xix

20 7.9 Interpretación geométrica de la variante LVQ2.1. El punto X se proyecta en la línea conectada m = y m Aplicaciones de LVQ en la compresión de imágenes. a) Imagen original de 865 Kb; b) Imagen comprimida con LVQ a 74 Kb; c) Imagen comprimida con GVQ a 56 Kb Agrupamiento de dígitos escritos a mano (distribución aleatoria de ejemplos) Agrupamiento de dígitos escritos a mano (agrupaciones por similitudes) Esquema del cambio de sinapsis entre las neuronas Arquitectura de la red neuronal de topología flexible Visualización de reglas de asociación en los datos de la tabla Identificación de reglas de asociación de mayor confianza para los datos de la tabla Identificación de transacciones y conteo de apariciones Combinación de transacciones en cantidad mayor a 2 y combinación de transacciones de cuatro atributos Base de datos con transacciones de compras ordenados por cliente Combinación de transacciones y descubrimiento de patrones secuenciales Representación de las funciones de pertenencia de los conjuntos borrosos bebé, jóven, adulto y viejo para la variable linguística edad Representación de las funciones de pertenencia de la intersección de los conjuntos borrosos jóvenes y viejos xx

21 9.3 Representación de las funciones de pertenencia de la unión de los conjuntos borrosos jóvenes y viejos Sistema de Lógica Borrosa Representación de las funciones de pertenencia de la variable linguística temperatura Enborronamiento del valor de las entradas reales o concretas Extracción de salidas por el Motor de Inferencia Borroso Desemborronado de las variables de salida borrosa Técnicas de la Computación Evolutiva Diagrama de flujo de procesos del algoritmo genético Selección por ruleta de 2 individuos progenitores a partir de una población de 4 individuos Selección por muestreo estocástico universal de 2 individuos a partir de una población de 4 individuos Proceso de cruzamiento de cromosomas de 8 genes en un punto c = Proceso de cruzamiento de cromosomas de 8 genes en dos puntos c 1 =2yc 2 = Proceso de cruzamiento uniforme formando un descendiente a partir de 2 progenitores que obedecen el criterio de copia según una máscara de cruce Proceso de mutación del gen número 4 de un cromosoma de 8 genes Proceso de mutación estructural de un cromosoma de 8 genes Estructura general de un Sistema Clasificador Esquema de robot insecto de hardware evolutivo xxi

22 10.12 Dinámica de optimización cuando la solución converge y se halla el óptimo global Presencia de óptimos locales en superficies heterogneas Esquema de la aplicación de RNAs en el aprendizaje de coberturas de terreno en imágenes satelitales Comportamiento del error promedio utilizando Backpropagation en el problema de aprendizaje de coberturas de terreno en imágenes satelitales Esquema de cruzamiento de los individuos Wij uw jk u y Wv ij W jk v que soportan el problema de aprendizaje de coberturas de terreno en imágenes satelitales Comportamiento del error promedio utilizando Algoritmos Genéticos en el problema de aprendizaje de coberturas de terreno en imágenes satelitales Distribución de proyectos El proyecto número 267 se desarrolló con mucho tiempo y aunque no representó mucho esfuerzo logró alta calidad Otros puntos de vista de la distribución de proyectos Agrupamiento o generación de valores representantes de clase con el criterio de la distancia Euclideana (proyecto BUENO=1, REGULAR=2 y MALO=3) Generación de valores representantes de clase (proyecto BUENO=2, REGULAR=1 y MALO=3) usando el criterio de la distancia de Manhattan Reglas de asociación generadas de la BDs inicial Esquema de clasificación con las reglas de asociación Árbol de decisión para clasificar a los proyectos en tres grupos xxii

23 11.9 Curva de aprendizaje del árbol de decisión Curva de esfuerzo para los proyectos buenos Curva de retorno acumulado de coste para la clasificación de los proyectos buenos Árbol de opciones para clasificar a los proyectos en tres grupos Representación de las funciones de pertenencia µ Eb, µ Em y µ Ea para la variable linguística esfuerzo Representación de las funciones de pertenencia µ M, µ R y µ B para la variable linguística tipo de proyecto Función de transferencia Proyecto vs. Esfuerzo, (a) tiempo corto y calidad baja; (b) tiempo corto y calidad media; y, (c) tiempo corto y calidad alta Función de transferencia Proyecto vs. Esfuerzo, (a) tiempo medio y calidad baja; (b) tiempo medio y calidad media; y, (c) tiempo medio y calidad alta Función de transferencia Proyecto vs. Esfuerzo Estableciendo constante tiempo largo y (a) calidad baja, (b) calidad media y, (c) calidad alta Visualización de proyectos clasificados con el sistema borroso Los cromosomas de la especie humana Bases nucleótidas que forman pares por enlaces de hidrógeno Interpretación de los componentes de la doble hélice de la cadena de ADN Aminoácidos conformantes del Código Genético Modelamiento de los cromosomas en función del número de bp s. Evaluación de la secuenciación por el Consorcio Público hasta diciembre de xxiii

24 12.6 Mapeo de SNPs y genes en la porción de 20.0 Mbp Mbp del cromosoma humano 22 [66] Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (NCBI) Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (EBI). Debe apreciar la cantidad de genes y marcas detectadas en 1 Mbp Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (NCBI). En 1 Mbp, se han detectado cuatro genes APOL3, APOL4, APOL2 y APOL Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (EBI). En el anterior intervalo (1 Mbp) se detecta y confirma el gen APOL3, pero no se detectan otros genes lo cual demuestra el carácter diferenciador de los dos visualizadores (en estas visualizaciones Ensembl maneja más bp s que Entrez lo que amplia el rango de búsqueda de genes, de modo que para Ensembl los genes APOL4, APOL2 y APOL1 estarán en el siguiente intervalo) Generación del árbol de secuencias. i) CC T ycc G; ii) CCT G y CCG G Generación y conteo de secuencias de longitud Árbol de secuencias generado Generación y conteo de secuencias de longitud Reglas de asociación de los codones del árbol de secuencias xxiv

25 Resumen En este trabajo se realiza el análisis y la descripción de las técnicas de la minería de datos y se detallan las aplicaciones realizadas para problemas reales. La obra está dividida en doce capítulos estructurados en cinco partes. La primera parte compuesta de dos capítulos, expresa el entorno o contexto de la minería de datos donde se resalta la diferencia de su implantación como proceso o como visión dentro del paradigma de investigación en el área del aprendizaje automático. La segunda parte marca el inicio de la explicación de las técnicas y se hace énfasis en los principios estadísticos elementales con la intensión de mostrar que el camino empieza en la matemática y la estadística y continúa hacia el enfoque del aprendizaje automático; esta parte tiene dos capítulos. La tercera parte compuesta de cuatro capítulos, especifica los fundamentos, propiedades y puntualizaciones de las técnicas clásicas de la minería de datos; se describen las técnicas supervisadas plasmadas en la Inducción de Árboles y las Redes Neuronales Artificiales y, las técnicas de descubrimiento de conocimiento: Agrupamiento y Análisis de Asociación. La cuarta parte, compuesta de dos capítulos, engloba otras técnicas denominadas híbridas, que amplían la disponibilidad de opciones para el minero de datos. La quinta parte de la obra se orienta a mostrar la aplicación de las técnicas a problemas reales; en dos capítulos se propone el modo de uso e implementación del método tratando de generar espectativas por la eficacia y eficiencia de los algoritmos, sin embargo, se concluye que la aplicación de las técnicas de minería de datos pueden brindar buenas soluciones así como algunas incógnitas. xxv

26 xxvi

27 Agradecimientos No hay algo más penoso en la vida que la impotencia de sólo dar gracias por el bien recibido (Anónimo) Deseo expresar mis agradecimientos a todas las personas que de alguna manera han colaborado para la realización de este trabajo. En particular, agradezco a María Moreno por sus observaciones y por la iniciativa para aplicar el método dentro del contexto de la minería de datos. Agradezco a las personas e instituciones que brindaron datos reales sobre los cuales se desarrollaron las aplicaciones, en particular, a Isabel Ramos de la Universidad de Sevilla por los datos sobre los proyectos de software. Gracias a Juan Manuel Corchado por la colaboración en la gestión de este libro, a los profesores del Departamento de Informática y Automática de la Universidad de Salamanca por sus observaciones y opiniones y a los compañeros de trabajo del doctorado. Ramiro Aguilar Quispe Salamanca, España Noviembre, 2002 xxvii

28 Notación H: Conjunto de hipótesis h: Hipótesis Ξ: Conjunto de ejemplos de entrenamiento X: Ejemplo, instancia (x 1,x 2,..., x N ) X (K) : x 1,x 2,..., x K E: Entropía G() Ganancia de Información R: Reducción de incertidumbre T : Árbol de decisión : Producto de matrices ˆ1: Vector columna unitario W n m : Matriz de pesos de n filas por m columnas. xxviii

29 Parte I FUNDAMENTOS DE MINERÍA DE DATOS 1

30

31 Capítulo 1 Contexto de la Minería de Datos 1.1 Aprendizaje Automático Los zoólogos, psicólogos y otros estudian el aprendizaje en animales y el hombre. El aprendizaje automático (AA) estudia el aprendizaje en las máquinas. Ciertamente, las técnicas del aprendizaje automático derivan de los esfuerzos de los psicólogos que tratan de precisar sus teorías trazando la ruta del aprendizaje animal y humano hacia los modelos computacionales. Así pues, el AA se considera como un marco de trabajo que integra los métodos y técnicas para lograr conocimiento: a partir de un conjunto de datos, se realiza el proceso de aprendizaje automático el cual adquiere el conocimiento que luego puede expresar (ver Fig. 1.1). Datos Aprendizaje Automático Conocimiento Figura 1.1: Ingeniería del Aprendizaje de Datos. 3

32 Aprendizaje Automático Usualmente, el AA provoca cambios en los sistemas que realizan tareas asociadas con Inteligencia Artificial (IA). Algunas tareas involucran, reconocimiento, clasificación, planificación, control robótico y predicción. Aquellos sistemas en los que se quiere observar mayor autonomía deben producir esos cambios en tiempo real. Estos sistemas llamados agentes perciben y modelan su entorno y calculan acciones apropiadas quizás anticipando sus efectos. Los cambios que ocurren tienen que ver con la estructuración de la base subyacente de su conocimiento. En la Fig. 1.2 se puede apreciar la arquitectura de un agente típico en IA. Señales de sensores Objetivos Percepción Modelo Planificación y Razonamiento Cálculo de la Acción Acciones Figura 1.2: Un sistema de Inteligencia Artificial. Pero, por qué y para qué lograr el aprendizaje en las máquinas? Algunas razones ingenieriles son: Algunas tareas no pueden ser definidas excepto por ejemplos; esto es, se pueden disponer de pares entrada y salida pero no se puede explicar una relación concisa entre ellas. Entonces, sería interesante disponer de Minería de Datos. Fundamentos, Técnicas y Aplicaciones

33 1. Contexto de la Minería de Datos 5 máquinas que ajusten sus estructuras internas aprendiendo enormes cantidades de ejemplos y posteriormente emitan una salida coherente a la vez que generen una función aproximada con la relación implícita de los ejemplos. Es posible la existencia de enormes cantidades de estructuras de datos con importantes relaciones y correlaciones. Los métodos de AA se usan para extraer esas relaciones (minería de datos). Típicamente, el diseñador humano produce máquinas que deben trabajar en los entornos en los cuales son usados. Sería interesante que la mejora de estas máquinas se haga de forma automática en base a la experiencia. Generalmente, la cantidad disponible de conocimiento sobre ciertas tareas es dificil de codificar explícitamente por los humanos. Las máquinas pueden aprender gradualmente ese conocimiento. Los entornos cambian en el tiempo. Las máquinas pueden adaptarse a estos cambios reduciendo la constante necesidad de rediseño. 1.2 Necesidad de la Minería de Datos Aunque en la década de los sesenta la mayoría de las técnicas de Inteligencia Artificial (IA) fue imposible demostrarlas por el rendimiento de los computadores, hoy se puede observar que el poder operacional de las mismas mejoró tanto, que resolver problemas o demostrar teoremas o conceptos son sólo algunas de las tareas habituales que se realizan. En la década de los ochenta, a partir de la invención del computador de escritorio, hemos visto que la mejora en rendimiento de estas máquinas se produce muy aceleráramente: se decía que la velocidad de los procesadores se duplicaba cada dos años. No cabe duda, que la evolución se acelera. La historia demuestra que en 1906, Stanley, Francis y Freelan a bordo de su aeroplano Stanley Steamer lograron romper el record mundial de velocidad en el aire volando a 122 millas/hora (superando la antigua marca de 15 millas/hora), sin embargo, a finales de 1969 los astronautas del programa de la NASA Apollo, volaron a una velocidad cercana a millas/h, es decir 223 veces más rápido. También, la historia nos dice que a principios del siglo XX, muchas empresas, en promedio, podían almacenar su información en 10 Minería de Datos. Fundamentos, Técnicas y Aplicaciones

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda

Inteligencia en Redes de Comunicaciones. Tema 7 Minería de Datos. Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda Inteligencia en Redes de Comunicaciones Tema 7 Minería de Datos Julio Villena Román, Raquel M. Crespo García, José Jesús García Rueda {jvillena, rcrespo, rueda}@it.uc3m.es Índice Definición y conceptos

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA Escuela Académico Profesional de Ingeniería de Sistemas 1. ESPECIFICACIONES

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Módulo Titulación TÉCNICAS DE APRENDIZAJE AUTOMÁTICO COMPUTACIÓN TECNOLOGÍAS ESPECÍFICAS GRADO EN INGENIERÍA INFORMÁTICA Plan 545 Código 46932 Periodo de

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Introducción a la Minería de Datos

Introducción a la Minería de Datos Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

Tareas 20% Primer Examen Parcial 20% Segundo Examen Parcial 20% Proyecto Final 25% Examen Final 15%

Tareas 20% Primer Examen Parcial 20% Segundo Examen Parcial 20% Proyecto Final 25% Examen Final 15% Introducción a la Computación Evolutiva Dr. Carlos Artemio Coello Coello CINVESTAV-IPN Departamento de Computación Av. Instituto Politécnico Nacional No. 2508 Col. San Pedro Zacatenco México, D.F. 07360

Más detalles

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software

Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Extracción Automática de Conocimiento en Bases de Datos e Ingeniería del Software Mª. José Ramírez Quintana José Hernández Orallo Programa: Programación Declarativa e Ingeniería de la Programación Objetivos

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas 1. DEFINICIONES, UBICACIÓN CONCEPTUAL E HISTORIA DE LA I.A. 2. COMPLEJIDAD COMPUTACIONAL, EXPLOSIÓN COMBINATORIA, DOMINIOS NO

Más detalles

Minería de datos (Introducción a la minería de datos)

Minería de datos (Introducción a la minería de datos) Minería de datos (Introducción a la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 14-I. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 24

Más detalles

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013

VivaMéxico sin PRI. Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres. Otoño 2013 VivaMéxico sin PRI Quiero que mi país sea de todos. Dr. Ivo H. Pineda Torres Facultad de Ciencias de la Computación Benemérita Universidad Autónoma de Puebla Otoño 2013 IMAGENESpemexmorena Adquisición

Más detalles

Cómo se usa Data Mining hoy?

Cómo se usa Data Mining hoy? Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta

Más detalles

CURSO MINERÍA DE DATOS AVANZADO

CURSO MINERÍA DE DATOS AVANZADO CURSO MINERÍA DE DATOS AVANZADO La minería de datos (en inglés, Data Mining) se define como la extracción de información implícita, previamente desconocida y potencialmente útil, a partir de datos. En

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD

KDD y MD. Dr. Juan Pedro Febles Rodríguez BIOINFO CITMA 2005. Juan Pedro Febles KDD y MD KDD y MD Dr. Juan Pedro Febles Rodríguez BIOINFO febles@bioinfo.cu http://www.bioinfo.cu CITMA 2005 Temas a tratar Algunos antecedentes académicos. El proceso de descubrimiento de conocimientos en Datos

Más detalles

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY)

MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) MINERÍA DE DATOS Y DESCUBRIMIENTO DE CONOCIMIENTO (DATA MINING AND KNOWLEDGE DISCOVERY) Autor: Lic. Manuel Ernesto Acosta Aguilera Entidad: Facultad de Economía, Universidad de La Habana Dirección: Edificio

Más detalles

LA GESTIÓN DEL CONOCIMIENTO

LA GESTIÓN DEL CONOCIMIENTO Plan de Formación 2006 ESTRATEGIAS Y HABILIDADES DE GESTIÓN DIRECTIVA MÓDULO 9: 9 LA ADMINISTRACIÓN ELECTRÓNICA EN LA SOCIEDAD DE LA INFORMACIÓN LA GESTIÓN DEL CONOCIMIENTO José Ramón Pereda Negrete Jefe

Más detalles

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico

Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Aplicación de herramientas de inteligencia de negocios en modelamiento geometalúrgico Verónica Escobar González, Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Dirección de Modelamiento Geometalúrgico

Más detalles

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net

Proyecto técnico MINERÍA DE DATOS. Febrero 2014. www.osona-respon.net info@osona-respon.net Proyecto técnico MINERÍA DE DATOS Febrero 2014 www.osona-respon.net info@osona-respon.net 0. Índice 0. ÍNDICE 1. INTRODUCCIÓN... 2 2. LOS DATOS OCULTOS... 3 2.1. Origen de la información... 3 2.2. Data

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

Métodos Exploratorios en Minería de Datos

Métodos Exploratorios en Minería de Datos Métodos Exploratorios en Minería de Datos Tutor: El curso será impartido por Dr. Oldemar Rodríguez graduado de la Universidad de París IX y con un postdoctorado de la Universidad de Stanford. Duración:

Más detalles

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales

Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Algoritmos genéticos como métodos de aproximación analítica y búsqueda de óptimos locales Jorge Salas Chacón A03804 Rubén Jiménez Goñi A93212 Juan Camilo Carrillo Casas A91369 Marco Vinicio Artavia Quesada

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo

Algoritmos de minería de datos incluidos en SQL Server 2008 1. Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo 1 Algoritmos de minería de datos incluidos en SQL Server 2008 Los algoritmos que aquí se presentan son: Árboles de decisión de Microsoft, Bayes naive de Microsoft, Clústeres de Microsoft, Serie temporal

Más detalles

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas

Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Aproximación evolutiva a la inducción constructiva basada en expresiones algebraicas Manuel Baena García, Rafael Morales Bueno y Carlos Cotta Porras Workshop MOISES Septiembre 2004 1/15 Contenido Inducción

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Contenido Introducción: Inteligencia de negocios (Business Intelligence). Componentes Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica. Fases

Más detalles

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés

Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Aplicación de Vectores Estadísticos de Características y Ensambles para el Reconocimiento Automático del Llanto de Bebés Amaro Camargo Erika, Reyes García Carlos A. Instituto Nacional de Astrofísica, Óptica

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

Aplicación de Redes bayesianas usando Weka.

Aplicación de Redes bayesianas usando Weka. Aplicación de Redes bayesianas usando Weka. Cynthia Lorena Corso 1, Fabian Gibellini 1 1 Universidad Tecnológica Nacional, Facultad Regional Córdoba Laboratorio de Sistemas de Información Maestro M. López

Más detalles

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1

ÍNDICE. Introducción... Capítulo 1. El concepto de Data Mining... 1 ÍNDICE Introducción... XV Capítulo 1. El concepto de Data Mining... 1 Introducción... 1 Una definición de Data Mining... 3 El proceso de Data Mining... 6 Selección de objetivos... 8 La preparación de los

Más detalles

Diseño de redes viales urbanas usando algoritmos genéticos. M. Angélica Pinninghoff J.* Eduardo Matthews D. * Héctor Díaz C.

Diseño de redes viales urbanas usando algoritmos genéticos. M. Angélica Pinninghoff J.* Eduardo Matthews D. * Héctor Díaz C. Diseño de redes viales urbanas usando algoritmos genéticos M. Angélica Pinninghoff J.* Eduardo Matthews D. * Héctor Díaz C. e-mail: mapinnin@inf.udec.cl * Departamento de Ingeniería Informática y Ciencias

Más detalles

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos

Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos MT 6 Desarrollo de un sistema capaz de optimizar rutas de entrega utilizando algoritmos genéticos Rosario Baltazar 1 Judith Esquivel Vázquez 2 Andrea Rada 3 Claudia Díaz 4 Resumen Durante los últimos 15

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SVM: Máquinas de Vectores Soporte. Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid SVM: Máquinas de Vectores Soporte Carlos Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid Contenido 1. Clasificación lineal con modelos lineales 2. Regresión

Más detalles

Desarrollo de un nuevo algoritmo para resolver programas lineales enteros y su aplicación práctica en el desarrollo económico.

Desarrollo de un nuevo algoritmo para resolver programas lineales enteros y su aplicación práctica en el desarrollo económico. Desarrollo de un nuevo algoritmo para resolver programas lineales enteros y su aplicación práctica en el desarrollo económico. 7071 Febrero, 2014 Resumen Es importante señalar que en un entorno social

Más detalles

Las Matemáticas En Ingeniería

Las Matemáticas En Ingeniería Las Matemáticas En Ingeniería 1.1. Referentes Nacionales A nivel nacional se considera que el conocimiento matemático y de ciencias naturales, sus conceptos y estructuras, constituyen una herramienta para

Más detalles

Minería de datos para la determinación del grado de exclusión social

Minería de datos para la determinación del grado de exclusión social Minería de datos para la determinación del grado de exclusión social Data mining to determine the degree of social exclusion * Jorge Enrique Rodríguez Rodríguez Fecha de recepción: 23 de agosto de 2008

Más detalles

Predicción de índices de futuros financieros mediante redes neuronales

Predicción de índices de futuros financieros mediante redes neuronales Predicción de índices de futuros financieros mediante redes neuronales Joan Bosch 1,Lluís Garrido 1,SergioGómez 2 1) Dept. d Estructura i Constituents de la Matèria, Facultat de Física, Universitat de

Más detalles

Inteligencia Artificial para desarrolladores Conceptos e implementación en C#

Inteligencia Artificial para desarrolladores Conceptos e implementación en C# Introducción 1. Estructura del capítulo 19 2. Definir la inteligencia 19 3. La inteligencia de los seres vivos 22 4. La inteligencia artificial 24 5. Dominios de aplicación 26 6. Resumen 28 Sistemas expertos

Más detalles

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información

Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Impacto de la Complejidad del Dominio en las Variaciones del Comportamiento de Procesos de Explotación de Información Marcelo López Nocera Programa de Maestría en Ingeniería de Sistemas de Información.

Más detalles

PLAN DE ESTUDIOS Y CONTENIDOS MÍNIMOS

PLAN DE ESTUDIOS Y CONTENIDOS MÍNIMOS CARRERAS DE DOS AÑOS TECNICATURA EN PROGRAMACIÓN DE COMPUTADORAS PLAN DE ESTUDIOS Y CONTENIDOS MÍNIMOS Resolución UB 004/14 ANEXO Tabla general de asignaturas del Plan de Estudios y Obligaciones Académicas

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

Capítulo 1. Introducción

Capítulo 1. Introducción Capítulo 1. Introducción El WWW es la mayor fuente de imágenes que día a día se va incrementando. Según una encuesta realizada por el Centro de Bibliotecas de Cómputo en Línea (OCLC) en Enero de 2005,

Más detalles

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos

CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos CARTOGRAFIADO DE TEXTOS Métodos Iconográficos de Observación, Exploración y Comunicación Aplicados a la Minería de Textos Anteproyecto de Tesis de Magíster en Ingeniería del Software Tesista: Lic. Matilde

Más detalles

APLICABILIDAD DE MÉTODOS DE INTELIGENCIA ARTIFICIAL A LA CALIBRACIÓN DE REDES DE ACUEDUCTO

APLICABILIDAD DE MÉTODOS DE INTELIGENCIA ARTIFICIAL A LA CALIBRACIÓN DE REDES DE ACUEDUCTO APLICABILIDAD DE MÉTODOS DE INTELIGENCIA ARTIFICIAL A LA CALIBRACIÓN DE REDES DE ACUEDUCTO Juan Guillermo Saldarriga Valderrama * Profesor Titular del Departamento de Ingeniería Civil y Ambiental de la

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO ROBOTS MÓVILES Y AGENTES INTELIGENTES 0756 8º, 9 o 06 Asignatura Clave Semestre Créditos Ingeniería Eléctrica Ingeniería

Más detalles

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/ laura SADIO 12, 13 y 14 de Marzo de 2008 grupo de PLN en FaMAF http://www.cs.famaf.unc.edu.ar/ pln/

Más detalles

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA Pablo F. Provasi 1 Lucio J. Kleisinger 1 Francisco R. Villatoro 2 1 Dpto. de Informática, Universidad

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

PROMETEO: Un Sistema Experto para el Pronóstico Meteorológico Local basado en Redes Neuronales y. cálculo de analogías.

PROMETEO: Un Sistema Experto para el Pronóstico Meteorológico Local basado en Redes Neuronales y. cálculo de analogías. PROMETEO: Un Sistema Experto para el Pronóstico Meteorológico Local basado en Redes Neuronales y Cálculo de Analogías José M. Gutiérrez Rafael Cano Antonio S. Cofiño Miguel A. Rodríguez Instituto Nacional

Más detalles

SÍNTESIS DE SISTEMAS DE CONTROL DIFUSOS MEDIANTE HERRAMIENTAS DE DISEÑO DSP SOBRE FPGAS 1

SÍNTESIS DE SISTEMAS DE CONTROL DIFUSOS MEDIANTE HERRAMIENTAS DE DISEÑO DSP SOBRE FPGAS 1 SÍNTESIS DE SISTEMAS DE CONTROL DIFUSOS MEDIANTE HERRAMIENTAS DE DISEÑO DSP SOBRE FPGAS 1 S. Sánchez-Solano 1, M. Brox 2, A. Cabrera 3 1 Instituto de Microelectrónica de Sevilla (CNM-CSIC). Sevilla, España.

Más detalles

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES José Alejandro Chiri Aguirre RESUMEN La predicción de recidiva en pacientes que han sido

Más detalles

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia

GUÍA DOCENTE. Curso Académico 2015/16. Técnicas de Análisis Estadístico basado en Inteligencia GUÍA DOCENTE Curso Académico 2015/16 1. Técnicas de Análisis Estadístico basado en Inteligencia Artificial 1.1. Datos de la asignatura Tipo de estudios Titulación Nombre de la asignatura Carácter de la

Más detalles

Deep Learning y Big Data

Deep Learning y Big Data y Eduardo Morales, Enrique Sucar INAOE (INAOE) 1 / 40 Contenido 1 2 (INAOE) 2 / 40 El poder tener una computadora que modele el mundo lo suficientemente bien como para exhibir inteligencia ha sido el foco

Más detalles

PLANIFICACIÓN DE LA DOCENCIA UNIVERSITARIA GUÍA DOCENTE. Datamining y Aprendizaje Automático

PLANIFICACIÓN DE LA DOCENCIA UNIVERSITARIA GUÍA DOCENTE. Datamining y Aprendizaje Automático CENTRO UNIVERSITARIO DE TECNOLOGÍA Y ARTE DIGITAL PLANIFICACIÓN DE LA DOCENCIA UNIVERSITARIA GUÍA DOCENTE Datamining y Automático 1. DATOS DE IDENTIFICACIÓN DE LA ASIGNATURA. Título: Facultad: Grado en

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín.

Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica. Grupo de Política y Gestión Tecnológica. Universidad Pontificia Bolivariana Medellín. Bogotá 15 y 16 de Agosto de 2008 EXTRACCIÓN DE PATRONES DE LA ENCUESTA ANUAL MANUFACTURERA COLOMBIANA EMPLEANDO INTELIGENCIA ARTIFICIAL Luis Felipe Duque Álvarez. Estudiante de Ingeniería Electrónica.

Más detalles

Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil

Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil Aplicación de técnicas de minería de datos para la evaluación del rendimiento académico y la deserción estudiantil Osvaldo M. Spositto spositto@unlam.edu.ar Martín E. Etcheverry metcheverry@unlam.edu.ar

Más detalles

Weka como herramienta de data mining

Weka como herramienta de data mining Weka como herramienta de data mining Lic. Aldave Rojas Isaac Alberto Instituto Tecnológico Superior de Ciudad Serdán Abstract El presente trabajo muestra un ejemplo introductorio a la herramienta de Data

Más detalles

Con el fin de obtener los datos, se procede con las siguientes instrucciones:

Con el fin de obtener los datos, se procede con las siguientes instrucciones: Capitulo 3. La predicción de beneficios del mercado bursátil Este segundo caso de estudio va más allá en el uso de técnicas de minería de datos. El dominio específico utilizado para ilustrar estos problemas

Más detalles

ENSIA 605 Inteligencia de Negocios y Minería de Datos

ENSIA 605 Inteligencia de Negocios y Minería de Datos ENSIA 605 Inteligencia de Negocios y Minería de Datos Profesor: Jaime Miranda P. E mail profesor: jmirandap@fen.uchile.cl OBJETIVOS DEL CURSO OBJETIVO GENERAL Estudiar, analizar, diseñar y aplicar tecnologías

Más detalles

Estudio comparativo de los currículos de probabilidad y estadística español y americano

Estudio comparativo de los currículos de probabilidad y estadística español y americano Estudio comparativo de los currículos de probabilidad y estadística español y americano Jaldo Ruiz, Pilar Universidad de Granada Resumen Adquiere las mismas capacidades en Probabilidad y Estadística un

Más detalles

Capítulo 1. Introducción. 1.1. Antecedentes

Capítulo 1. Introducción. 1.1. Antecedentes Capítulo 1. Introducción En este capítulo se presenta una descripción general del problema a investigar y el enfoque con el que se aborda. Se establece la necesidad de incorporar técnicas de análisis novedosas

Más detalles

Conjuntos y Sistemas Difusos (Lógica Difusa y Aplicaciones)

Conjuntos y Sistemas Difusos (Lógica Difusa y Aplicaciones) Departamento de enguajes y Ciencias de la Computación Universidad de Málaga Conjuntos y Sistemas Difusos (ógica Difusa y Aplicaciones) 5. Variables ingüísticas E.T.S.I. Informática J. Galindo Gómez VARIABES

Más detalles

18:15 19:15 13.5. Reunión de la red HEUR. Sala Andalucía 3. 19:30 21:00 Acto de Inauguración y Conferencia Invitada CEDI2005. Miércoles, 14 Septiembre

18:15 19:15 13.5. Reunión de la red HEUR. Sala Andalucía 3. 19:30 21:00 Acto de Inauguración y Conferencia Invitada CEDI2005. Miércoles, 14 Septiembre IVCongresoEspañolde Metaheurísticas,Algoritmos EvolutivosyBioinspirados MAEB 05 18:15 19:15 13.5.ReunióndelaredHEUR SalaAndalucía3 19:30 21:00 ActodeInauguraciónyConferencia InvitadaCEDI2005 Miércoles,14Septiembre

Más detalles

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA

SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA SISTEMAS DE INFORMACION GERENCIAL LIC.PATRICIA PALACIOS ZULETA Qué es inteligencia de negocios? (BI) Business Intelligence es la habilidad para transformar los datos en información, y la información en

Más detalles

Clasificación de Áreas y Subáreas para las inscripciones al Doctorado en Ciencias Informáticas

Clasificación de Áreas y Subáreas para las inscripciones al Doctorado en Ciencias Informáticas Área Algoritmos y Estructuras de Datos Arquitectura de computadoras Subárea - Algoritmos - Análisis de algoritmos - Estructuras de Datos - Verificación y certificación de programas - Lógicas para el desarrollo

Más detalles

Introducción. Qué es machine learning? Algunos Tipos de Machine Learning. Generalización & Exploración. Ejemplos de aplicaciones en Machine Learning

Introducción. Qué es machine learning? Algunos Tipos de Machine Learning. Generalización & Exploración. Ejemplos de aplicaciones en Machine Learning Introducción Qué es aprendizaje automatizado e inferencia inductiva"? Para qué sirve? (ejemplos/aplicaciones) Tareas de aprendizaje Representación de datos Enfoques usados Concept learning: algoritmos

Más detalles

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA 5504. Horas / Crédito: 3 horas semanales / 3 Créditos

Prontuario. I. Titulo del curso: Minería de Datos. II. Codificación: ESTA 5504. Horas / Crédito: 3 horas semanales / 3 Créditos Universidad de Puerto Rico Recinto de Rio Piedras Facultad de Administración de Empresas 1 2 I. Titulo del curso: Minería de Datos Prontuario II. Codificación: ESTA 5504 III. Horas / Crédito: 3 horas semanales

Más detalles

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes:

Data & Text Mining. III Reunión de la RedDES(GT de Tecnología de la BVS6) Exponentes: Data & Text Mining Exponentes: - Dr. Jorge Bacallao Guerra - Ing. Ramón Martinez - Ing. José Villanueva Agosto del 2012 Introducción o Porqué es necesario utilizar data mining o Que ésdata miningy qué

Más detalles

Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México

Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México Gómez Ramírez, Eduardo Maestría en ciencias en el área de cibernética. Un logro

Más detalles

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez Curso de Análisis de investigaciones con programas Informáticos 1 UNIVERSIDAD DE JAÉN Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos

Más detalles

Por qué DW y DM? Data Warehouse and Data Mining. Información en las empresas. Data Warehouse

Por qué DW y DM? Data Warehouse and Data Mining. Información en las empresas. Data Warehouse Data Warehouse and Data Mining José A. Royo http://www.cps.unizar.es/~jaroyo email: joalroyo@unizar.es Departamento de Informática e Ingeniería de Sistemas Por qué DW y DM? Mayor poder de procesamiento

Más detalles

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales Elkin García, Germán Mancera, Jorge Pacheco Presentación Los autores han desarrollado un método de clasificación de música a

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

ALGUNOS RESULTADOS EXPERIMENTALES DE LA INTEGRACIÓN DE AGRUPAMIENTO E INDUCCIÓN COMO MÉTODO DE DESCUBRIMIENTO DE CONOCIMIENTO

ALGUNOS RESULTADOS EXPERIMENTALES DE LA INTEGRACIÓN DE AGRUPAMIENTO E INDUCCIÓN COMO MÉTODO DE DESCUBRIMIENTO DE CONOCIMIENTO ALGUNOS RESULTADOS EXPERIMENTALES DE LA INTEGRACIÓN DE AGRUPAMIENTO E INDUCCIÓN COMO MÉTODO DE DESCUBRIMIENTO DE CONOCIMIENTO Kogan, A. 1, Rancan, C. 2,3, Britos, P. 3,1, Pesado, P. 2,4, García-Martínez,

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Anexo 1: MATRIZ DE CONGRUENCIA. Objetivo. Problema. Problema. Objetivos. Hipótesis General. Teórico. General. Especifico. Específicos.

Anexo 1: MATRIZ DE CONGRUENCIA. Objetivo. Problema. Problema. Objetivos. Hipótesis General. Teórico. General. Especifico. Específicos. 170 Anexo 1: MATRIZ DE CONGRUENCIA Problema Problema Objetivo Objetivos Hipótesis Variables Hipótesis Variables Marco General Especifico General Específicos General Especificas Teórico En qué medida el

Más detalles

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES

MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES MINERÍA DE DATOS: ÁREA DE OPORTUNIDADES Actualmente se vive una época donde se tiene una enorme cantidad de datos que se generan diariamente (del orden de Terabytes, Petabytes 1 (Han, Kamber, & Pei, 2012))

Más detalles

Grupo de investigación en Minería de Datos http://mida.usal.es

Grupo de investigación en Minería de Datos http://mida.usal.es Departamento de Informática y Automática Postgrado en Informática y Automática MÁSTER EN SISTEMAS INTELIGENTES ASIGNATURAS Introducción a la Minería de Datos Minería Web María N. Moreno García http://avellano.usal.es/~mmoreno

Más detalles

Introducción Qué es Minería de Datos?

Introducción Qué es Minería de Datos? Conceptos Básicos Introducción Qué es Minería de Datos? Extracción de información o de patrones (no trivial, implícita, previamente desconocida y potencialmente útil) de grandes bases de datos. Introducción

Más detalles

Finanzas e Investigación de Mercados"

Finanzas e Investigación de Mercados DIPLOMATURA: "Análisis de Datos para Negocios, Finanzas e Investigación de Mercados" Seminario: Introducción a Data Mining y Estadística Dictado: Sábado 13, 20,27 de Abril, 04 de Mayo en el horario de

Más detalles

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático? Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento

Más detalles

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase

Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Construcción de un árbol balanceado de subclasificadores para SVM multi-clase Waldo Hasperué 1,2, Laura Lanzarini 1, 1 III-LIDI, Facultad de Informática, UNLP 2 Becario CONICET {whasperue, laural}@lidi.info.unlp.edu.ar

Más detalles

TÓPICOS AVANZADOS DE BASES DE DATOS

TÓPICOS AVANZADOS DE BASES DE DATOS TÓPICOS AVANZADOS DE BASES DE DATOS 1. DATOS DE LA ASIGNATURA. Nombre de la asignatura: TÓPICOS AVANZADOS DE BASES DE DATOS Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: Modulo

Más detalles

Uso de algoritmos genéticos para resolver el modelo determinista y estocástico para el diseño de una red de recogida de residuos

Uso de algoritmos genéticos para resolver el modelo determinista y estocástico para el diseño de una red de recogida de residuos International Conference on Industrial Engineering & Industrial Management - CIO 2007 1443 Uso de algoritmos genéticos para resolver el modelo determinista y estocástico para el diseño de una red de recogida

Más detalles

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.

Text Mining. Laura Alonso i Alemany. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu. Facultad de Matemática, Astronomía y Física UNC, Córdoba (Argentina) http://www.cs.famaf.unc.edu.ar/~laura SADIO 26 de Marzo, 9 y 23 de Abril y 7 de mayo de 2010 grupo de PLN en FaMAF http://www.cs.famaf.unc.edu.ar/~pln/

Más detalles

Diploma en Business Analytics

Diploma en Business Analytics Diploma en Business Analytics JULIO 2010 FACULTAD DE INGENIERÍA Y CIENCIAS www.uai.cl Por qué un Diploma en Business Analytics? El análisis metódico e inteligente de datos es una actividad estratégica

Más detalles

Propuesta de una arquitectura para la generación de mutantes de orden superior en WS-BPEL

Propuesta de una arquitectura para la generación de mutantes de orden superior en WS-BPEL Propuesta de una arquitectura para la generación de mutantes de orden superior en WS-BPEL Emma Blanco Muñoz, Antonio García Domínguez, Juan José Domínguez Jiménez, Inmaculada Medina Bulo Escuela Superior

Más detalles

Propuesta de un modelo basado en redes neuronales para la detección de riesgo crediticio

Propuesta de un modelo basado en redes neuronales para la detección de riesgo crediticio Revista de Investigación ULASALLE, Rev Inv ULASALLE, Número 1, 2012 (55-64) Universidad La Salle Arequipa, Perú Propuesta de un modelo basado en redes neuronales para la detección de riesgo crediticio

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles