Minería de Datos. Fundamentos, Técnicas y Aplicaciones. Ramiro Aguilar Quispe

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Minería de Datos. Fundamentos, Técnicas y Aplicaciones. Ramiro Aguilar Quispe"

Transcripción

1 Minería de Datos Fundamentos, Técnicas y Aplicaciones Ramiro Aguilar Quispe

2 c Ramiro Aguilar Quispe, Carrera de Informática Facultad de Ciencias Puras y Naturales Universidad Mayor de San Andrés, Bolivia Departamento de Informática y Automática Facultad de Ciencias Universidad de Salamanca, España Imprime: Reprografía Signo C/ Serranos, Salamanca, España. I.S.B.N.: X Está permitida la reproducción parcial o total de esta obra siempre que sea con fines educativos no comerciales y se citen a la fuente y al autor. ii

3 iii A Jelena

4 iv

5 Tabla de Contenidos Tabla de Contenidos Lista de Tablas Lista de Figuras Resumen Agradecimientos v xv xvii xxv xxvii I FUNDAMENTOS DE MINERÍA DE DATOS 1 1 Contexto de la Minería de Datos Aprendizaje Automático Necesidad de la Minería de Datos Qué es la Minería de Datos? Minería de Datos como Proceso Dual Minería de Datos como Núcleo Concepto de Minería de Datos Qué no es la Minería de Datos? Sistemas de Ayuda a la Dirección Sistemas de Procesamiento Analítico en Línea Consulta e Informe Qué puede hacer la Minería de Datos? Predicción v

6 1.5.2 Clasificación Estimación Agrupamiento Análisis de Asociación Descripción y Visualización El Contexto de Negocio de la Minería de Datos Minería de Datos como Herramienta de Investigación Minería de Datos para Procesos Minería de Datos para Mercadeo Minería de Datos para Administración de Relaciones de Consumo El Contexto Técnico de la Minería de Datos Minería de Datos y Aprendizaje Automático Minería de Datos y Estadística Minería de Datos y Toma de Decisiones Minería de Datos y Tecnología de Cómputo El Contexto Social de la Minería de Datos Aplicaciones y Tendencias Minería de Datos Distribuida Minería de Datos Multimedia Minería de Datos Web Minería de Datos: Seguridad y Confidencialidad Descubrimiento de Conocimiento en Bases de Datos Inteligencia de Negocio Conceptos Alcance de la Inteligencia de Negocio Niveles de Manejo de Información Del Análisis Multidimensional al Descubrimiento de Conocimiento Operaciones Básicas del Análisis Multidimensional Proceso de Descubrimiento de Conocimiento Determinación de Objetivos Preparación de Datos Transformación de Datos vi

7 2.2.4 Minería de Datos Análisis de Resultados Asimilamiento de Conocimiento Vista Previa de las Técnicas de Minería de Datos Métodos Estadísticos Árboles de Inducción Redes Neuronales Artificiales Agrupamiento o Segmentación Análisis de Asociación Algoritmos Genéticos Lógica Borrosa Series Temporales II DE LA ESTADÍSTICA AL APRENDIZAJE AUTOMÁ- TICO 47 3 Regresión y Estimación Conceptos El Problema de Regresión Coeficiente de Determinación de la Regresión Regresión Lineal Proceso de Regresión Lineal Regresión de Y sobre X Regresión de X sobre Y Ejemplo inicial Propiedades de la Regresión Lineal Otro ejemplo Regresión Lineal Múltiple Determinación de los Coeficientes Regresión Logística Asociación entre variables binomiales Modelo de Regresión Logística Simple vii

8 4 Aprendizaje Bayesiano Introducción Teorema de Bayes Variables Continuas y Ruido Aprendizaje Probabilístico Principio de Longitud de Descripción Mínima Clasificador Bayesiano Óptimo Clasificador Bayesiano Naive Estimación de Probabilidades Redes Bayesianas Propagación de Probabilidades Propagación en Árboles Propagación en Poliárboles Propagación en Redes Multiconectadas Redes Bayesianas en Minería de Datos Aprendizaje Paramétrico Funcionamiento Variables no Observadas Aprendizaje Estructural Árboles Poliárboles Redes Multiconectadas Mejora Estructural III TÉCNICAS DE MINERÍA DE DATOS 83 5 Árboles de Decisión Qué esunárbol de Decisión? Representación Gráfica de un Árbol de Decisión Expresividad de un Árbol de Decisión Inducción de Árboles de Decisión a partir de Ejemplos Tarea recomendada para la Inducción Selección del tipo de clasificador y aplicaciones comunes Bucle básico Entropía viii

9 5.3.2 Ganancia de información Reducción de incertidumbre Arboles de Decisión dentro del Aprendizaje Automático Algoritmo ID Algoritmo ID3 Normalizado Algoritmos Incrementales Algoritmos ID5 e ID5R Otros Temas de Estudio Sobreajuste ( overfitting ) Poda ( prunning ) Atributos de valores continuos Medidas alternativas en la selección de atributos Atributos con valores perdidos Atributos con pesos diferentes Algoritmo C Otros Algoritmos Desarrollados Algoritmo C4.5 Oblicuo Algoritmo C Redes Neuronales equivalentes a Árboles de Decisión Redes Neuronales Artificiales Introducción Componentes de las Redes Neuronales Artificiales Funciones de Activación Arquitecturas de RNAs Paradigmas de Aprendizaje Entrenamiento de una Unidad Procesadora Geometría del funcionamiento de una UPU Método del gradiente descendente Procedimiento de Widrow-Hoff Procedimiento delta generalizado Redes Neuronales Multicapa Método de retropropagación Cambio de Pesos en las Capas de la Red Inicialización y criterio de parada ix

10 6.4.4 Algoritmo de Aprendizaje Generalización, precisión y sobreajuste Agrupamiento Qué es el agrupamiento? Reconocimiento Estadístico de Patrones y Redes Neuronales Mapas Auto-organizados Arquitectura de la red Aprendizaje con la Ecuación Trivial Aprendizaje con la Ecuación Simple Modelos de Vecindarios Neuronales Inicialización y Condición de Parada Algoritmo de Agrupamiento Cuantificación Vectorial Representantes de Clase Diversas Actualizaciones Algunos Resultados Red Neuronal de Topología Flexible Categorización Adaptativa Plasticidad Neuronal en el cerebro Red Neuronal de Topología Flexible Funcionamiento Análisis de Asociación Reglas de Asociación Forma de las Regla Coherencia de una Regla Primera Aproximación Descubrimiento de Asociaciones Descubrimiento de Patrones Secuenciales Funcionamiento De las Reglas de Asociación a las Correlaciones Implicaciones Negativas Reglas de Correlación x

11 IV TÉCNICAS HÍBRIDAS Sistemas de Lógica Borrosa Conjuntos Borrosos Grado de Pertenencia Propiedades de los Conjuntos Borrosos Sistemas Borrosos Variables Linguísticas Enborronamiento Motor de Inferencia Modificadores Linguísticos Operadores T-Norma y S-Norma Base de Reglas Desemborronado Entrenamiento de Sistemas de Lógica Borrosa Caracterización del Conjunto de Entrenamiento Entrenamiento con Universos Fijos Entrenamiento con Universos Variables Algoritmos Evolutivos Computación Evolutiva Algoritmos Genéticos Metáfora Natural Algoritmo Genético Simple Implementación de un Algoritmo Genético Proceso de Selección Proceso de Cruzamiento Proceso de Mutación Proceso de Selección de Sobrevivientes Estrategias Evolutivas Representación Estrategias Evolutivas Simples Estrategias Evolutivas Compuestas Estrategias Evolutivas Avanzadas Sistemas Clasificadores Programación Genética xi

12 10.6 Hardware Evolutivo Algoritmos Genéticos en el aprendizaje de Redes Neuronales Artificiales Redes Neuronales Artificiales en el Reconocimiento de Patrones Algoritmos Genéticos para el Aprendizaje: Cromosoma y Función Objetivo Proceso de Evolución Algunas Conclusiones y Recomendaciones V APLICACIONES Gestión de Proyectos Software Pautas para la Simbiosis entre la Minería de Datos y la Lógica Borrosa Descripción de la Base de Datos Minería de Datos Agrupamiento Reglas de Asociación Árboles de Decisión Sistema Clasificador Borroso Variables de Entrada Variable de Salida Reglas Borrosas Funciones de Transferencia Resultados del Sistema Clasificador Borroso Conclusiones Proyectos Biológicos de Gran Escala Genoma Humano Genoma Humano Descifrado Coincidencia de Resultados Secuenciación del Genoma Humano Qué es el Genoma? Genes xii

13 Polimorfismos Nucleótidos Simples Desafíos Futuros Bioinformática Secuenciación del Cromosoma Minería de Datos Descubrimiento de Patrones Secuenciales Reglas de Asociación Trabajos Futuros Bibliografía 259 A Teminología del Aprendizaje Automático 267 xiii

14 xiv

15 Lista de Tablas 2.1 Jerarquía de elementos de dependencia Ejemplos con atributos multivariados Ejemplos con atributos binarios Conjunto de datos Conjunto de reglas de asociación de mayor confianza Conjunto de datos etiquetado mediante la reglas de correlación generadas Transacciones de compra de artículos Porcentajes de compra de los artículos té (t) y café (c) Grados de pertenencia de las edades de personas respecto de los conjuntos borrosos: bebés, jóvenes, adultos y viejos Conjunto de entrenamiento donde cada fila representa una instancia, caso o ejemplo para el accionar de un sistema de lógica borrosa Parámetros o atributos de la Base de Datos Valores de los representantes de clase para los proyectos buenos, regulares y malos usando la distancia Euclideana xv

16 11.3 Valores de los representantes de clase para los proyectos buenos, regulares y malos usando la distancia de Manhattan Conjunto de reglas de asociación entre los atributos ASIMDY y TIEMPO Reglas borrosas de clasificación Aminoácidos que representan el código genético Número de millones de bp s (Mbp), genes etiquetados y componentes no localizados por cromosoma Conteo de tripletas localizadas por el árbol de secuencias para las cien mil bp s Reglas de asociación para las tripletas válidas por el árbol de secuencias (θ >1500) xvi

17 Lista de Figuras 1.1 Ingeniería del Aprendizaje de Datos Un sistema de Inteligencia Artificial La minería de datos como proceso dual entre análisis y síntesis sobre los datos El proceso de minería de datos como núcleo para adquirir conocimiento Posicionamiento de las Técnicas de la Inteligencia Corporativa Estratos de la Inteligencia de Negocio Niveles del manejo de la información Estructura organizacional de una comercial descrita jerárquicamente en la Tabla Visualización Multidimensional de los datos Etapas del Proceso de Descubrimiento de Conocimiento en Bases de Datos Visualización del histograma de datos Visualización del diagrama de sectores Ejemplo de visualización de las medidas estadísticas usando MineSet para IRIX de Silicon Graphics xvii

18 2.9 Visualización de dispersión o scatterplots usando MineSet para IRIX de Silicon Graphics Estimación del error de clasificación con la técnica Holdout Validación cruzada del aprendizaje para estimar el error en el clasificador Curva de esfuerzo al clasificar correctamente una cantidad de registros Curva promedio del error aprendizaje en función del número de registros Representación de la confusión provocada por los errores de clasificación Curva ROI que representa la precisión en función de la pérdida Aproximación de la curva a los puntos de observación Aproximación de la superficie f a los puntos de observación Regresión de Y sobre X Regresión de X sobre Y Función Sigmoidal Logística Red Bayesiana de tres variables binarias Grafo acíclico donde el evento E en independiente del conjunto de eventos {A, C, D, F, G} Un árbol de decisión con tres niveles, seis nodos y nueve hojas Definición de la función clasificadora para un árbol de decisión binario Árbol de decisión con atributos (nodos) de valores multivaluados Gráfico de la función Entropía de rango p(x), x [0, 1] Árbol de decisión generado para los ejemplos de la tabla xviii

19 5.6 Representación multidimensional de los ejemplos de la tabla Arbol de decisión generado para los ejemplos de la tabla Determinando cuándo empieza el sobreajuste [70] Árbol de decisión de nodos con valores binarios y Red Neuronal equivalente Árbol de decisión multivariado y Red Neuronal equivalente Red Neuronal de ocho nodos y cinco unidades procesadoras Esquema de una neurona o unidad procesadora Taxonomía de las redes neuronales [9] Geometría de una UPU Red neuronal de una capa de entrada y L capas de unidades procesadoras Distribución de patrones (puntos) no etiquetados Jerarquía de grupos en un conjunto de elementos (puntos) Partición jerárquica de grupos en forma de árbol Agrupamiento por distancia Euclidea, a) pequeña distancia entre grupos y pequeña distancia dentro de los grupos, b) mucha distancia dentro de los grupos y pequeña distancia entre los grupos; y, c) mucha distancia entre los grupos y pequeña distancia dentro de los grupos Arquitectura de la red neuronal de Kohonen Función de energía tipo sombrero mejicano : variación de los pesos en función de la distancia entre las neuronas de salida Función de retroalimentación lateral simple Función de retroalimentación lateral exponencial xix

20 7.9 Interpretación geométrica de la variante LVQ2.1. El punto X se proyecta en la línea conectada m = y m Aplicaciones de LVQ en la compresión de imágenes. a) Imagen original de 865 Kb; b) Imagen comprimida con LVQ a 74 Kb; c) Imagen comprimida con GVQ a 56 Kb Agrupamiento de dígitos escritos a mano (distribución aleatoria de ejemplos) Agrupamiento de dígitos escritos a mano (agrupaciones por similitudes) Esquema del cambio de sinapsis entre las neuronas Arquitectura de la red neuronal de topología flexible Visualización de reglas de asociación en los datos de la tabla Identificación de reglas de asociación de mayor confianza para los datos de la tabla Identificación de transacciones y conteo de apariciones Combinación de transacciones en cantidad mayor a 2 y combinación de transacciones de cuatro atributos Base de datos con transacciones de compras ordenados por cliente Combinación de transacciones y descubrimiento de patrones secuenciales Representación de las funciones de pertenencia de los conjuntos borrosos bebé, jóven, adulto y viejo para la variable linguística edad Representación de las funciones de pertenencia de la intersección de los conjuntos borrosos jóvenes y viejos xx

21 9.3 Representación de las funciones de pertenencia de la unión de los conjuntos borrosos jóvenes y viejos Sistema de Lógica Borrosa Representación de las funciones de pertenencia de la variable linguística temperatura Enborronamiento del valor de las entradas reales o concretas Extracción de salidas por el Motor de Inferencia Borroso Desemborronado de las variables de salida borrosa Técnicas de la Computación Evolutiva Diagrama de flujo de procesos del algoritmo genético Selección por ruleta de 2 individuos progenitores a partir de una población de 4 individuos Selección por muestreo estocástico universal de 2 individuos a partir de una población de 4 individuos Proceso de cruzamiento de cromosomas de 8 genes en un punto c = Proceso de cruzamiento de cromosomas de 8 genes en dos puntos c 1 =2yc 2 = Proceso de cruzamiento uniforme formando un descendiente a partir de 2 progenitores que obedecen el criterio de copia según una máscara de cruce Proceso de mutación del gen número 4 de un cromosoma de 8 genes Proceso de mutación estructural de un cromosoma de 8 genes Estructura general de un Sistema Clasificador Esquema de robot insecto de hardware evolutivo xxi

22 10.12 Dinámica de optimización cuando la solución converge y se halla el óptimo global Presencia de óptimos locales en superficies heterogneas Esquema de la aplicación de RNAs en el aprendizaje de coberturas de terreno en imágenes satelitales Comportamiento del error promedio utilizando Backpropagation en el problema de aprendizaje de coberturas de terreno en imágenes satelitales Esquema de cruzamiento de los individuos Wij uw jk u y Wv ij W jk v que soportan el problema de aprendizaje de coberturas de terreno en imágenes satelitales Comportamiento del error promedio utilizando Algoritmos Genéticos en el problema de aprendizaje de coberturas de terreno en imágenes satelitales Distribución de proyectos El proyecto número 267 se desarrolló con mucho tiempo y aunque no representó mucho esfuerzo logró alta calidad Otros puntos de vista de la distribución de proyectos Agrupamiento o generación de valores representantes de clase con el criterio de la distancia Euclideana (proyecto BUENO=1, REGULAR=2 y MALO=3) Generación de valores representantes de clase (proyecto BUENO=2, REGULAR=1 y MALO=3) usando el criterio de la distancia de Manhattan Reglas de asociación generadas de la BDs inicial Esquema de clasificación con las reglas de asociación Árbol de decisión para clasificar a los proyectos en tres grupos xxii

23 11.9 Curva de aprendizaje del árbol de decisión Curva de esfuerzo para los proyectos buenos Curva de retorno acumulado de coste para la clasificación de los proyectos buenos Árbol de opciones para clasificar a los proyectos en tres grupos Representación de las funciones de pertenencia µ Eb, µ Em y µ Ea para la variable linguística esfuerzo Representación de las funciones de pertenencia µ M, µ R y µ B para la variable linguística tipo de proyecto Función de transferencia Proyecto vs. Esfuerzo, (a) tiempo corto y calidad baja; (b) tiempo corto y calidad media; y, (c) tiempo corto y calidad alta Función de transferencia Proyecto vs. Esfuerzo, (a) tiempo medio y calidad baja; (b) tiempo medio y calidad media; y, (c) tiempo medio y calidad alta Función de transferencia Proyecto vs. Esfuerzo Estableciendo constante tiempo largo y (a) calidad baja, (b) calidad media y, (c) calidad alta Visualización de proyectos clasificados con el sistema borroso Los cromosomas de la especie humana Bases nucleótidas que forman pares por enlaces de hidrógeno Interpretación de los componentes de la doble hélice de la cadena de ADN Aminoácidos conformantes del Código Genético Modelamiento de los cromosomas en función del número de bp s. Evaluación de la secuenciación por el Consorcio Público hasta diciembre de xxiii

24 12.6 Mapeo de SNPs y genes en la porción de 20.0 Mbp Mbp del cromosoma humano 22 [66] Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (NCBI) Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (EBI). Debe apreciar la cantidad de genes y marcas detectadas en 1 Mbp Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (NCBI). En 1 Mbp, se han detectado cuatro genes APOL3, APOL4, APOL2 y APOL Mapeo de la secuencia de genes del cromosoma 22, porción 33.2 Mbp Mbp (EBI). En el anterior intervalo (1 Mbp) se detecta y confirma el gen APOL3, pero no se detectan otros genes lo cual demuestra el carácter diferenciador de los dos visualizadores (en estas visualizaciones Ensembl maneja más bp s que Entrez lo que amplia el rango de búsqueda de genes, de modo que para Ensembl los genes APOL4, APOL2 y APOL1 estarán en el siguiente intervalo) Generación del árbol de secuencias. i) CC T ycc G; ii) CCT G y CCG G Generación y conteo de secuencias de longitud Árbol de secuencias generado Generación y conteo de secuencias de longitud Reglas de asociación de los codones del árbol de secuencias xxiv

25 Resumen En este trabajo se realiza el análisis y la descripción de las técnicas de la minería de datos y se detallan las aplicaciones realizadas para problemas reales. La obra está dividida en doce capítulos estructurados en cinco partes. La primera parte compuesta de dos capítulos, expresa el entorno o contexto de la minería de datos donde se resalta la diferencia de su implantación como proceso o como visión dentro del paradigma de investigación en el área del aprendizaje automático. La segunda parte marca el inicio de la explicación de las técnicas y se hace énfasis en los principios estadísticos elementales con la intensión de mostrar que el camino empieza en la matemática y la estadística y continúa hacia el enfoque del aprendizaje automático; esta parte tiene dos capítulos. La tercera parte compuesta de cuatro capítulos, especifica los fundamentos, propiedades y puntualizaciones de las técnicas clásicas de la minería de datos; se describen las técnicas supervisadas plasmadas en la Inducción de Árboles y las Redes Neuronales Artificiales y, las técnicas de descubrimiento de conocimiento: Agrupamiento y Análisis de Asociación. La cuarta parte, compuesta de dos capítulos, engloba otras técnicas denominadas híbridas, que amplían la disponibilidad de opciones para el minero de datos. La quinta parte de la obra se orienta a mostrar la aplicación de las técnicas a problemas reales; en dos capítulos se propone el modo de uso e implementación del método tratando de generar espectativas por la eficacia y eficiencia de los algoritmos, sin embargo, se concluye que la aplicación de las técnicas de minería de datos pueden brindar buenas soluciones así como algunas incógnitas. xxv

26 xxvi

27 Agradecimientos No hay algo más penoso en la vida que la impotencia de sólo dar gracias por el bien recibido (Anónimo) Deseo expresar mis agradecimientos a todas las personas que de alguna manera han colaborado para la realización de este trabajo. En particular, agradezco a María Moreno por sus observaciones y por la iniciativa para aplicar el método dentro del contexto de la minería de datos. Agradezco a las personas e instituciones que brindaron datos reales sobre los cuales se desarrollaron las aplicaciones, en particular, a Isabel Ramos de la Universidad de Sevilla por los datos sobre los proyectos de software. Gracias a Juan Manuel Corchado por la colaboración en la gestión de este libro, a los profesores del Departamento de Informática y Automática de la Universidad de Salamanca por sus observaciones y opiniones y a los compañeros de trabajo del doctorado. Ramiro Aguilar Quispe Salamanca, España Noviembre, 2002 xxvii

28 Notación H: Conjunto de hipótesis h: Hipótesis Ξ: Conjunto de ejemplos de entrenamiento X: Ejemplo, instancia (x 1,x 2,..., x N ) X (K) : x 1,x 2,..., x K E: Entropía G() Ganancia de Información R: Reducción de incertidumbre T : Árbol de decisión : Producto de matrices ˆ1: Vector columna unitario W n m : Matriz de pesos de n filas por m columnas. xxviii

29 Parte I FUNDAMENTOS DE MINERÍA DE DATOS 1

30

31 Capítulo 1 Contexto de la Minería de Datos 1.1 Aprendizaje Automático Los zoólogos, psicólogos y otros estudian el aprendizaje en animales y el hombre. El aprendizaje automático (AA) estudia el aprendizaje en las máquinas. Ciertamente, las técnicas del aprendizaje automático derivan de los esfuerzos de los psicólogos que tratan de precisar sus teorías trazando la ruta del aprendizaje animal y humano hacia los modelos computacionales. Así pues, el AA se considera como un marco de trabajo que integra los métodos y técnicas para lograr conocimiento: a partir de un conjunto de datos, se realiza el proceso de aprendizaje automático el cual adquiere el conocimiento que luego puede expresar (ver Fig. 1.1). Datos Aprendizaje Automático Conocimiento Figura 1.1: Ingeniería del Aprendizaje de Datos. 3

32 Aprendizaje Automático Usualmente, el AA provoca cambios en los sistemas que realizan tareas asociadas con Inteligencia Artificial (IA). Algunas tareas involucran, reconocimiento, clasificación, planificación, control robótico y predicción. Aquellos sistemas en los que se quiere observar mayor autonomía deben producir esos cambios en tiempo real. Estos sistemas llamados agentes perciben y modelan su entorno y calculan acciones apropiadas quizás anticipando sus efectos. Los cambios que ocurren tienen que ver con la estructuración de la base subyacente de su conocimiento. En la Fig. 1.2 se puede apreciar la arquitectura de un agente típico en IA. Señales de sensores Objetivos Percepción Modelo Planificación y Razonamiento Cálculo de la Acción Acciones Figura 1.2: Un sistema de Inteligencia Artificial. Pero, por qué y para qué lograr el aprendizaje en las máquinas? Algunas razones ingenieriles son: Algunas tareas no pueden ser definidas excepto por ejemplos; esto es, se pueden disponer de pares entrada y salida pero no se puede explicar una relación concisa entre ellas. Entonces, sería interesante disponer de Minería de Datos. Fundamentos, Técnicas y Aplicaciones

33 1. Contexto de la Minería de Datos 5 máquinas que ajusten sus estructuras internas aprendiendo enormes cantidades de ejemplos y posteriormente emitan una salida coherente a la vez que generen una función aproximada con la relación implícita de los ejemplos. Es posible la existencia de enormes cantidades de estructuras de datos con importantes relaciones y correlaciones. Los métodos de AA se usan para extraer esas relaciones (minería de datos). Típicamente, el diseñador humano produce máquinas que deben trabajar en los entornos en los cuales son usados. Sería interesante que la mejora de estas máquinas se haga de forma automática en base a la experiencia. Generalmente, la cantidad disponible de conocimiento sobre ciertas tareas es dificil de codificar explícitamente por los humanos. Las máquinas pueden aprender gradualmente ese conocimiento. Los entornos cambian en el tiempo. Las máquinas pueden adaptarse a estos cambios reduciendo la constante necesidad de rediseño. 1.2 Necesidad de la Minería de Datos Aunque en la década de los sesenta la mayoría de las técnicas de Inteligencia Artificial (IA) fue imposible demostrarlas por el rendimiento de los computadores, hoy se puede observar que el poder operacional de las mismas mejoró tanto, que resolver problemas o demostrar teoremas o conceptos son sólo algunas de las tareas habituales que se realizan. En la década de los ochenta, a partir de la invención del computador de escritorio, hemos visto que la mejora en rendimiento de estas máquinas se produce muy aceleráramente: se decía que la velocidad de los procesadores se duplicaba cada dos años. No cabe duda, que la evolución se acelera. La historia demuestra que en 1906, Stanley, Francis y Freelan a bordo de su aeroplano Stanley Steamer lograron romper el record mundial de velocidad en el aire volando a 122 millas/hora (superando la antigua marca de 15 millas/hora), sin embargo, a finales de 1969 los astronautas del programa de la NASA Apollo, volaron a una velocidad cercana a millas/h, es decir 223 veces más rápido. También, la historia nos dice que a principios del siglo XX, muchas empresas, en promedio, podían almacenar su información en 10 Minería de Datos. Fundamentos, Técnicas y Aplicaciones

"Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios

Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios "Diseño, construcción e implementación de modelos matemáticos para el control automatizado de inventarios Miguel Alfonso Flores Sánchez 1, Fernando Sandoya Sanchez 2 Resumen En el presente artículo se

Más detalles

Aprendizaje Computacional. Eduardo Morales y Jesús González

Aprendizaje Computacional. Eduardo Morales y Jesús González Aprendizaje Computacional Eduardo Morales y Jesús González Objetivo General La capacidad de aprender se considera como una de los atributos distintivos del ser humano y ha sido una de las principales áreas

Más detalles

MINERIA DE DATOS Y Descubrimiento del Conocimiento

MINERIA DE DATOS Y Descubrimiento del Conocimiento MINERIA DE DATOS Y Descubrimiento del Conocimiento UNA APLICACIÓN EN DATOS AGROPECUARIOS INTA EEA Corrientes Maximiliano Silva La información Herramienta estratégica para el desarrollo de: Sociedad de

Más detalles

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos

UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos 2.1. Principios básicos del Modelado de Objetos UNIDAD 2: Abstracción del Mundo real Al Paradigma Orientado a Objetos Hoy en día muchos de los procesos que intervienen en un negocio o empresa y que resuelven

Más detalles

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 - Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es

Más detalles

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre:

DES: Programa(s) Educativo(s): Tipo de materia: Clave de la materia: Semestre: : : lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. lemas propios de la. 12 6 lemas propios de la. 12 6 lemas propios de la.

Más detalles

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática

Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática Universidad acional Experimental Del Táchira Decanato de Docencia Departamento de Ingeniería en Informática Metodología Evolutiva Incremental Mediante Prototipo y Técnicas Orientada a Objeto (MEI/P-OO)

Más detalles

forma de entrenar a la nuerona en su aprendizaje.

forma de entrenar a la nuerona en su aprendizaje. Sistemas expertos e Inteligencia Artificial,Guía5 1 Facultad : Ingeniería Escuela : Computación Asignatura: Sistemas expertos e Inteligencia Artificial Tema: SISTEMAS BASADOS EN CONOCIMIENTO. Objetivo

Más detalles

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. SISTEMA EDUCATIVO inmoley.com DE FORMACIÓN CONTINUA PARA PROFESIONALES INMOBILIARIOS. CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN. Business Intelligence. Data Mining. PARTE PRIMERA Qué es

Más detalles

PREPROCESADO DE DATOS PARA MINERIA DE DATOS

PREPROCESADO DE DATOS PARA MINERIA DE DATOS Ó 10.1007/978-3-319-02738-8-2. PREPROCESADO DE DATOS PARA MINERIA DE DATOS Miguel Cárdenas-Montes Frecuentemente las actividades de minería de datos suelen prestar poca atención a las actividades de procesado

Más detalles

OPTATIVA I: MINERIA DE DATOS

OPTATIVA I: MINERIA DE DATOS UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: OPTATIVA I: MINERIA DE DATOS DES: Programa(s) Educativo(s): Tipo de materia: Clave de la

Más detalles

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre.

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre. Tema: Sistemas Subtema: Base de Datos. Materia: Manejo de aplicaciones

Más detalles

1.1. Introducción y conceptos básicos

1.1. Introducción y conceptos básicos Tema 1 Variables estadísticas Contenido 1.1. Introducción y conceptos básicos.................. 1 1.2. Tipos de variables estadísticas................... 2 1.3. Distribuciones de frecuencias....................

Más detalles

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Introducción a selección de atributos usando WEKA Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012 Contenido 1 Introducción a WEKA El origen Interfaces

Más detalles

Elementos requeridos para crearlos (ejemplo: el compilador)

Elementos requeridos para crearlos (ejemplo: el compilador) Generalidades A lo largo del ciclo de vida del proceso de software, los productos de software evolucionan. Desde la concepción del producto y la captura de requisitos inicial hasta la puesta en producción

Más detalles

Un filtro general de respuesta al impulso finita con n etapas, cada una con un retardo independiente d i y ganancia a i.

Un filtro general de respuesta al impulso finita con n etapas, cada una con un retardo independiente d i y ganancia a i. Filtros Digitales Un filtro general de respuesta al impulso finita con n etapas, cada una con un retardo independiente d i y ganancia a i. En electrónica, ciencias computacionales y matemáticas, un filtro

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) SYLLABO UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMÉRICA) FACULTAD DE INGENIERIA DE SISTEMAS E INFORMATICA Escuela Académico Profesional de Ingeniería de Sistemas 1. ESPECIFICACIONES

Más detalles

ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS

ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS EtsiIngenio Inteligencia Artificial 1 Raposo López Alejandro Sánchez Palacios Manuel Resumen dibujo de grafos mediante algoritmos genéticos

Más detalles

CAPITULO 6 SISTEMA DE DETECCION DE INTRUSOS

CAPITULO 6 SISTEMA DE DETECCION DE INTRUSOS Capitulo 6. Sistema de Detección de Intrusos con Redes Neuronales. 69 CAPITULO 6 SISTEMA DE DETECCION DE INTRUSOS USANDO REDES NEURONALES. En este capítulo se realiza la preparación adecuada de toda la

Más detalles

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.

Los futuros desafíos de la Inteligencia de Negocios. Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile. Los futuros desafíos de la Inteligencia de Negocios Richard Weber Departamento de Ingeniería Industrial Universidad de Chile rweber@dii.uchile.cl El Vértigo de la Inteligencia de Negocios CRM: Customer

Más detalles

Visión global del KDD

Visión global del KDD Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento

Más detalles

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. 1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS

Más detalles

Parte I: Introducción

Parte I: Introducción Parte I: Introducción Introducción al Data Mining: su Aplicación a la Empresa Cursada 2007 POR QUÉ? Las empresas de todos los tamaños necesitan aprender de sus datos para crear una relación one-to-one

Más detalles

Unidad 1. Fundamentos en Gestión de Riesgos

Unidad 1. Fundamentos en Gestión de Riesgos 1.1 Gestión de Proyectos Unidad 1. Fundamentos en Gestión de Riesgos La gestión de proyectos es una disciplina con la cual se integran los procesos propios de la gerencia o administración de proyectos.

Más detalles

Objetivos Generales. Objetivos específicos. Que el estudiante:

Objetivos Generales. Objetivos específicos. Que el estudiante: ASIGNATURA: MÉTODOS NUMPERICOS I (ANÁLISIS Y PROCESAMIENTO DE LOS DATOS EXPERIMENTALES CON INTRODUCCIÓN A LA COMPUTACIÓN) Objetivos Generales Comprender y manejar los conceptos relacionados con el manejo,

Más detalles

Data Mining Técnicas y herramientas

Data Mining Técnicas y herramientas Data Mining Técnicas y herramientas Introducción POR QUÉ? Empresas necesitan aprender de sus datos para crear una relación one-toone con sus clientes. Recogen datos de todos lo procesos. Datos recogidos

Más detalles

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales Elkin García, Germán Mancera, Jorge Pacheco Presentación Los autores han desarrollado un método de clasificación de música a

Más detalles

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322 Nicole García Gómez 2830047-6 Diego Riquelme Adriasola 2621044-5 RESUMEN.- La minería de datos corresponde a la extracción

Más detalles

INTELIGENCIA DE NEGOCIO (MASTER UNIVERSITARIO EN INGENIERÍA INFORMÁTICA)

INTELIGENCIA DE NEGOCIO (MASTER UNIVERSITARIO EN INGENIERÍA INFORMÁTICA) INTELIGENCIA DE NEGOCIO (MASTER UNIVERSITARIO EN INGENIERÍA INFORMÁTICA) 1.- Datos de la Asignatura Código 302436 Plan 2014 ECTS 3 Carácter OPCIONAL Curso 1º Periodicidad 2er SEMESTRE Área Departamento

Más detalles

SISTEMAS INTELIGENTES

SISTEMAS INTELIGENTES SISTEMAS INTELIGENTES T11: Métodos Kernel: Máquinas de vectores soporte {jdiez, juanjo} @ aic.uniovi.es Índice Funciones y métodos kernel Concepto: representación de datos Características y ventajas Funciones

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) CLASIFICACIÓN NO SUPERVISADA CLUSTERING Y MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN) info@clustering.50webs.com Indice INTRODUCCIÓN 3 RESUMEN DEL CONTENIDO 3 APRENDIZAJE

Más detalles

Base de datos II Facultad de Ingeniería. Escuela de computación.

Base de datos II Facultad de Ingeniería. Escuela de computación. Base de datos II Facultad de Ingeniería. Escuela de computación. Introducción Este manual ha sido elaborado para orientar al estudiante de Bases de datos II en el desarrollo de sus prácticas de laboratorios,

Más detalles

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático?

Ingeniería del conocimiento. Sesión 1 Por qué estudiar aprendizaje automático? Ingeniería del conocimiento Sesión 1 Por qué estudiar aprendizaje automático? 1 Agenda Qué vamos a ver en la asignatura? Para qué sirve todo esto? Cómo aprobar la asignatura? 2 Extracción del conocimiento

Más detalles

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas

Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas Taxonomía de los principales temas de I A Por: Luis Guillermo Restrepo Rivas 1. DEFINICIONES, UBICACIÓN CONCEPTUAL E HISTORIA DE LA I.A. 2. COMPLEJIDAD COMPUTACIONAL, EXPLOSIÓN COMBINATORIA, DOMINIOS NO

Más detalles

Algoritmos Genéticos. Introduccion a la Robótica Inteligente

Algoritmos Genéticos. Introduccion a la Robótica Inteligente Algoritmos Genéticos Introduccion a la Robótica Inteligente 7 Marzo 2014 (IRIN) AGs 7/03/2014 1 / 43 Índice 1 Introducción 2 Algoritmos Genéticos 3 Algunos Fundamentos Matemáticos 4 Conclusiones (IRIN)

Más detalles

MATEMÁTICAS ESO EVALUACIÓN: CRITERIOS E INSTRUMENTOS CURSO 2014-2015 Colegio B. V. María (Irlandesas) Castilleja de la Cuesta (Sevilla) Página 1 de 7

MATEMÁTICAS ESO EVALUACIÓN: CRITERIOS E INSTRUMENTOS CURSO 2014-2015 Colegio B. V. María (Irlandesas) Castilleja de la Cuesta (Sevilla) Página 1 de 7 Página 1 de 7 1 CRITERIOS DE EVALUACIÓN 1.1 SECUENCIA POR CURSOS DE LOS CRITERIOS DE EVALUACION PRIMER CURSO 1. Utilizar números naturales y enteros y fracciones y decimales sencillos, sus operaciones

Más detalles

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación

BASE DE DATOS UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II. Comenzar presentación UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA T.S.U. EN ESTADISTICA DE SALUD CATEDRA DE COMPUTACIÓN II BASE DE DATOS Comenzar presentación Base de datos Una base de datos (BD) o banco de datos es un conjunto

Más detalles

I SEMANA ELECTRONICA REDES NEURONALES

I SEMANA ELECTRONICA REDES NEURONALES UNIVERSIDAD NACIONAL SAN ANTONIO ABAD A DEL CUSCO CARRERA PROFESIONAL DE INGENIERIA ELECTRONICA I SEMANA ELECTRONICA REDES NEURONALES Ing. Avid idromán González Se trata de una nueva forma de computación

Más detalles

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión.

9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de decisión. TEMA 9 TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA EL ANÁLISIS DE LA INFORMACIÓN CONTABLE 9.1.Los sistemas expertos. 9.2.Las redes neuronales artificiales. 9.3.Sistemas de inducción de reglas y árboles de

Más detalles

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión...

8.1. Introducción... 1. 8.2. Dependencia/independencia estadística... 2. 8.3. Representación gráfica: diagrama de dispersión... 3. 8.4. Regresión... Tema 8 Análisis de dos variables: dependencia estadística y regresión Contenido 8.1. Introducción............................. 1 8.2. Dependencia/independencia estadística.............. 2 8.3. Representación

Más detalles

CAPÍTUL07 SISTEMAS DE FILOSOFÍA HÍBRIDA EN BIOMEDICINA. Alejandro Pazos, Nieves Pedreira, Ana B. Porto, María D. López-Seijo

CAPÍTUL07 SISTEMAS DE FILOSOFÍA HÍBRIDA EN BIOMEDICINA. Alejandro Pazos, Nieves Pedreira, Ana B. Porto, María D. López-Seijo CAPÍTUL07 SISTEMAS DE FILOSOFÍA HÍBRIDA EN BIOMEDICINA Alejandro Pazos, Nieves Pedreira, Ana B. Porto, María D. López-Seijo Laboratorio de Redes de Neuronas Artificiales y Sistemas Adaptativos Universidade

Más detalles

Fundamentos del diseño 3ª edición (2002)

Fundamentos del diseño 3ª edición (2002) Unidades temáticas de Ingeniería del Software Fundamentos del diseño 3ª edición (2002) Facultad de Informática necesidad del diseño Las actividades de diseño afectan al éxito de la realización del software

Más detalles

Redes de Kohonen y la Determinación Genética de las Clases

Redes de Kohonen y la Determinación Genética de las Clases Redes de Kohonen y la Determinación Genética de las Clases Angel Kuri Instituto Tecnológico Autónomo de México Octubre de 2001 Redes Neuronales de Kohonen Las Redes de Kohonen, también llamadas Mapas Auto-Organizados

Más detalles

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA CLASIFICACIÓN NO SUPERVISADA CLASIFICACION IMPORTANCIA PROPÓSITO METODOLOGÍAS EXTRACTORES DE CARACTERÍSTICAS TIPOS DE CLASIFICACIÓN IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL

Más detalles

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,

Más detalles

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial

Evaluación, limpieza y construcción de los datos: un enfoque desde la inteligencia artificial Universidad del Cauca Facultad de Ingeniería Electrónica y Telecomunicaciones Programas de Maestría y Doctorado en Ingeniería Telemática Seminario de Investigación Evaluación, limpieza y construcción de

Más detalles

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Sistemas de Sensación Segmentación, Reconocimiento y Clasificación de Objetos CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides Introducción La visión artificial, también conocida como visión por computador

Más detalles

RESUMEN CUADRO DE MANDO

RESUMEN CUADRO DE MANDO 1. Objetivo Los objetivos que pueden alcanzarse, son: RESUMEN CUADRO DE MANDO Disponer eficientemente de la información indispensable y significativa, de modo sintético, conectada con los objetivos. Facilitar

Más detalles

EL MODELO DE DATOS RASTER

EL MODELO DE DATOS RASTER EL MODELO DE DATOS RASTER El modelo de datos raster, como señala Bosque (1992), es el modelo de datos complementario al modelo vectorial presentado anteriormente. Tiene como principal característica el

Más detalles

1. DATOS DE LA ASIGNATURA

1. DATOS DE LA ASIGNATURA 1. DATOS DE LA ASIGNATURA Nombre de la asignatura: Curso Avanzado de Estadística Titulación: Máster en Matemáticas y aplicaciones Código Breve Descripción: El curso está centrado en dos temas relativamente

Más detalles

UN ENTORNO A MEDIDA PARA EL DISEÑO Y LA SIMULACIÓN DE MAQUINARIA POR COMPUTADOR

UN ENTORNO A MEDIDA PARA EL DISEÑO Y LA SIMULACIÓN DE MAQUINARIA POR COMPUTADOR UN ENTORNO A MEDIDA PARA EL DISEÑO Y LA SIMULACIÓN DE MAQUINARIA POR COMPUTADOR Manuel González y Javier Cuadrado Departamento de Ingeniería Industrial II, Campus de Esteiro, 15403 Ferrol Universidad de

Más detalles

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA.

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA. MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA. AUTORES: MSC. MIREYA LÓPEZ DELGADO LIC. ESPINOSA. CUIDAD HABANA PROGRAMA

Más detalles

Finanzas e Investigación de Mercados"

Finanzas e Investigación de Mercados DIPLOMATURA: "Análisis de Datos para Negocios, Finanzas e Investigación de Mercados" Seminario: Introducción a Data Mining y Estadística Dictado: Sábado 13, 20,27 de Abril, 04 de Mayo en el horario de

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Portafolio de Servicios y Productos

Portafolio de Servicios y Productos Portafolio de Servicios y Productos Introducción Somos una empresa que se dedica a generar ventajas competitivas para nuestros clientes a través de desarrollos y consultoría en inteligencia de negocios

Más detalles

Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI.

Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI. Procesos de Negocio Objetivos Describir una metodología sistemática de análisis de los procesos organizacionales y cómo estos pueden ser apoyados por las TI. Identificar y analizar los procesos de negocios,

Más detalles

El Proceso Unificado de Desarrollo de Software

El Proceso Unificado de Desarrollo de Software El Proceso de Desarrollo de Software Ciclos de vida Métodos de desarrollo de software El Proceso Unificado de Desarrollo de Software 1 Fases principales del desarrollo de software Captura de requisitos:

Más detalles

Academia de la carrera de Licenciatura Informática del Instituto Tecnológico Aguascalientes

Academia de la carrera de Licenciatura Informática del Instituto Tecnológico Aguascalientes 1. DATOS DE LA ASIGNATURA Nombre de la Asignatura: Sistemas de Soporte a la Decisión Carrera: Licenciatura en Informática Clave de la asignatura: IFS-0406 Horas teoría - horas práctica - créditos: 4-2-10

Más detalles

Tópicos Avanzados de Análisis y Diseño INGENIERIA DE SOFTWARE ING. MA. MARGARITA LABASTIDA ROLDÁN

Tópicos Avanzados de Análisis y Diseño INGENIERIA DE SOFTWARE ING. MA. MARGARITA LABASTIDA ROLDÁN Tópicos Avanzados de Análisis y Diseño INGENIERIA DE SOFTWARE ING. MA. MARGARITA LABASTIDA ROLDÁN Proceso de Negocio (Business Process) Conjunto estructurado, medible de actividades para producir un producto.

Más detalles

Redes Neuronales Artificiales y sus Aplicaciones

Redes Neuronales Artificiales y sus Aplicaciones Redes Neuronales Artificiales y sus Aplicaciones Profesorado Departamento Programa de Doctorado Créditos 3 Nº de Plazas 2. La asignatura 2. Objetivos de la asignatura 3. Contenidos 4. Metodología de trabajo

Más detalles

http://www.informatizate.net

http://www.informatizate.net http://www.informatizate.net Metodologías De Desarrollo De Software María A. Mendoza Sanchez Ing. Informático - UNT Microsoft Certified Professional - MCP Analísta y Desarrolladora - TeamSoft Perú S.A.C.

Más detalles

Analizar, desarrollar y programar modelos matemáticos, estadísticos y de simulación.

Analizar, desarrollar y programar modelos matemáticos, estadísticos y de simulación. PERFIL PROFESIONAL Analizar, desarrollar y programar modelos matemáticos, estadísticos y de simulación. Reconocer y guiarse por los aspectos sociales, profesionales y éticos en su entorno. Dirigir y coordinar

Más detalles

Sistemas de Información Geográficos (SIG o GIS)

Sistemas de Información Geográficos (SIG o GIS) Sistemas de Información Geográficos (SIG o GIS) 1) Qué es un SIG GIS? 2) Para qué sirven? 3) Tipos de datos 4) Cómo trabaja? 5) Modelos de datos, Diseño Conceptual 6) GeoDataase (GD) 7) Cómo evaluamos

Más detalles

TOMA DE DECISIONES II

TOMA DE DECISIONES II TOMA DE DECISIONES II Tema Nº 04 1. LAS HERRAMIENTAS TECNOLÓGICAS PARA LAS TOMA DE DECISIONES GERENCIALES 1.1 Importancia de los ERP. 1.2 Aadministración del desempeño corporativo CPM 1. HERRAMIENTAS TECNOLÓGICAS

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

Tema 2. Espacios Vectoriales. 2.1. Introducción

Tema 2. Espacios Vectoriales. 2.1. Introducción Tema 2 Espacios Vectoriales 2.1. Introducción Estamos habituados en diferentes cursos a trabajar con el concepto de vector. Concretamente sabemos que un vector es un segmento orientado caracterizado por

Más detalles

DE VIDA PARA EL DESARROLLO DE SISTEMAS

DE VIDA PARA EL DESARROLLO DE SISTEMAS MÉTODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS 1. METODO DEL CICLO DE VIDA PARA EL DESARROLLO DE SISTEMAS CICLO DE VIDA CLÁSICO DEL DESARROLLO DE SISTEMAS. El desarrollo de Sistemas, un proceso

Más detalles

Minería de Datos. Vallejos, Sofia

Minería de Datos. Vallejos, Sofia Minería de Datos Vallejos, Sofia Contenido Introducción: Inteligencia de negocios (Business Intelligence). Descubrimiento de conocimiento en bases de datos (KDD). Minería de Datos: Perspectiva histórica.

Más detalles

VISION ARTIFICIAL APOYADA EN SISTEMAS HÍBRIDOS NEURO-SIMBÓLICOS

VISION ARTIFICIAL APOYADA EN SISTEMAS HÍBRIDOS NEURO-SIMBÓLICOS VISION ARTIFICIAL APOYADA EN SISTEMAS HÍBRIDOS NEURO-SIMBÓLICOS Dr. Gerardo Reyes Salgado Profesor-Investigador / Instituto Tecnológico de Cuautla gerardo.reyes@itcuautla.edu.mx www.itcuautla.edu.mx 1

Más detalles

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata

v.1.0 Clase 5 Docente: Gustavo Valencia Zapata v.1.0 Clase 5 Docente: Gustavo Valencia Zapata Temas Clase 5: Conceptos de Minería de Datos Herramientas de DM Referencias Minería de datos Proceso de DM www.gustavovalencia.com Minería de datos La minería

Más detalles

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE Capítulo 4 Algoritmos de Aprendizaje 26 CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE En este capítulo se proporcionan las descripciones matemáticas de los principales algoritmos de aprendizaje para redes neuronales:

Más detalles

INGENIERIA EN INGENIERÍA EN SISTEMAS COMPUTACIONALES CLAVE MATERIA OBJETIVO

INGENIERIA EN INGENIERÍA EN SISTEMAS COMPUTACIONALES CLAVE MATERIA OBJETIVO INGENIERIA EN INGENIERÍA EN SISTEMAS COMPUTACIONALES CLAVE MATERIA OBJETIVO SCE - 0418 SCM - 0414 SCC-0428 ACM - 0403 SCB - 0421 SCV - 0407 ACU-0402 Introducción a la ingeniería en sistemas computacionales

Más detalles

by Tim Tran: https://picasaweb.google.com/lh/photo/sdo00o8wa-czfov3nd0eoa?full-exif=true

by Tim Tran: https://picasaweb.google.com/lh/photo/sdo00o8wa-czfov3nd0eoa?full-exif=true by Tim Tran: https://picasaweb.google.com/lh/photo/sdo00o8wa-czfov3nd0eoa?full-exif=true I. FUNDAMENTOS 3. Representación de la información Introducción a la Informática Curso de Acceso a la Universidad

Más detalles

ANÁLISIS DE DATOS NO NUMERICOS

ANÁLISIS DE DATOS NO NUMERICOS ANÁLISIS DE DATOS NO NUMERICOS ESCALAS DE MEDIDA CATEGORICAS Jorge Galbiati Riesco Los datos categóricos son datos que provienen de resultados de experimentos en que sus resultados se miden en escalas

Más detalles

TEMA 1 Sistemas de información

TEMA 1 Sistemas de información TEMA 1 Sistemas de información María N. Moreno García Departamento de Informática y Automática Universidad de Salamanca Contenidos 1. Conceptos básicos 2. Elementos de un sistema de información 3. Estructura

Más detalles

SIMULACIÓN DE SISTEMAS (I. ELÉCTRICA/I. ELECTRÓNICA)

SIMULACIÓN DE SISTEMAS (I. ELÉCTRICA/I. ELECTRÓNICA) ASIGNATURA DE GRADO: SIMULACIÓN DE SISTEMAS (I. ELÉCTRICA/I. ELECTRÓNICA) Curso 2014/2015 (Código:68903050) 1.PRESENTACIÓN DE LA ASIGNATURA En esta asignatura se estudian las técnicas de simulación, comenzando

Más detalles

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre - 2003 MINERÍA DE DATOS Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE Octubre - 2003 CONTENIDO Qué es Data Warehousing Data Warehouse Objetivos del Data Warehouse

Más detalles

3.1 JUSTIFICACION E IMPORTANCIA DEL PRESENTE TRABAJO DE

3.1 JUSTIFICACION E IMPORTANCIA DEL PRESENTE TRABAJO DE III INTRODUCCION 3.1 JUSTIFICACION E IMPORTANCIA DEL PRESENTE TRABAJO DE INVESTIGACION Hoy en día la computadora es tan importante para el ingeniero Como lo fue en su momento la regla de cálculo. Mediante

Más detalles

Tema 7. Introducción al reconocimiento de objetos

Tema 7. Introducción al reconocimiento de objetos Tema 7. Introducción al reconocimiento de objetos En resumen, un sistema de reconocimiento de patrones completo consiste en: Un sensor que recoge las observaciones a clasificar. Un sistema de extracción

Más detalles

Tecnologías de Información y Comunicación II CLASE 10

Tecnologías de Información y Comunicación II CLASE 10 Tecnologías de Información y Comunicación II CLASE 10 Medidas Una medida es un tipo de dato cuya información es usada por los analistas (usuarios) en sus consultas para medir la perfomance del comportamiento

Más detalles

ORIENTACIONES SIMCE TIC

ORIENTACIONES SIMCE TIC ORIENTACIONES SIMCE TIC Sistema Nacional de Medición de Competencias TIC en Estudiantes ORIENTACIONES SIMCE TIC Sistema Nacional de Medición de Competencias TIC en Estudiantes INDICE Introducción 7 Prueba

Más detalles

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA

TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA TÉCNICAS DE MINERÍA DE DATOS Y TEXTO APLICADAS A LA SEGURIDAD AEROPORTUARIA MSC ZOILA RUIZ VERA Empresa Cubana de Aeropuertos y Servicios Aeronáuticos Abril 2010 ANTECEDENTES El proyecto Seguridad es una

Más detalles

CONSULTA EN BASES DE DATOS

CONSULTA EN BASES DE DATOS CONSULTA EN BASES DE DATOS Tutorial para el Usuario 2 Introducción La Universidad Autónoma de Aguascalientes a través del Departamento de Información Bibliográfica pone a disposición de la comunidad universitaria

Más detalles

PRIMAVERA RISK ANALYSIS

PRIMAVERA RISK ANALYSIS PRIMAVERA RISK ANALYSIS CARACTERÍSTICAS PRINCIPALES Guía de análisis de riesgo Revisión del programa Plantilla de riesgo instantáneo Asistente para registro de riesgo Registro de riesgo Análisis de riesgo

Más detalles

IDENTIFICACIÓN DE SISTEMAS ASPECTOS PRÁCTICOS EN IDENTIFICACIÓN

IDENTIFICACIÓN DE SISTEMAS ASPECTOS PRÁCTICOS EN IDENTIFICACIÓN IDENTIFICACIÓN DE SISTEMAS ASPECTOS PRÁCTICOS EN IDENTIFICACIÓN Ing. Fredy Ruiz Ph.D. ruizf@javeriana.edu.co Maestría en Ingeniería Electrónica Pontificia Universidad Javeriana 2013 CONSIDERACIONES PRÁCTICAS

Más detalles

MÁQUINA DE VECTORES DE SOPORTE

MÁQUINA DE VECTORES DE SOPORTE MÁQUINA DE VECTORES DE SOPORTE La teoría de las (SVM por su nombre en inglés Support Vector Machine) fue desarrollada por Vapnik basado en la idea de minimización del riesgo estructural (SRM). Algunas

Más detalles

SÍNTESIS Y PERSPECTIVAS

SÍNTESIS Y PERSPECTIVAS SÍNTESIS Y PERSPECTIVAS Los invitamos a observar, a identificar problemas, pero al mismo tiempo a buscar oportunidades de mejoras en sus empresas. REVISIÓN DE CONCEPTOS. Esta es la última clase del curso.

Más detalles

Las Matemáticas En Ingeniería

Las Matemáticas En Ingeniería Las Matemáticas En Ingeniería 1.1. Referentes Nacionales A nivel nacional se considera que el conocimiento matemático y de ciencias naturales, sus conceptos y estructuras, constituyen una herramienta para

Más detalles

INGENIERÍA DEL SOFTWARE

INGENIERÍA DEL SOFTWARE INGENIERÍA DEL SOFTWARE Sesión No. 2 Nombre: Procesos de ingeniería del software INGENIERÍA DEL SOFTWARE 1 Contextualización La ingeniería de software actualmente es muy importante, pues con los avances

Más detalles

Unidades temáticas de Ingeniería del Software. Fases del proceso de desarrollo 4ª edición (2008)

Unidades temáticas de Ingeniería del Software. Fases del proceso de desarrollo 4ª edición (2008) Unidades temáticas de Ingeniería del Software Fases del proceso de desarrollo 4ª edición (2008) Facultad de Informática organización del desarrollo El ciclo de vida del software abarca el proceso de desarrollo,

Más detalles

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA

IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA V REUNIÓN DE AUDITORES INTERNOS DE BANCA CENTRAL 8 AL 11 DE NOVIEMBRE DE 1999 LIMA - PERÚ IMPACTO DEL DESARROLLO TECNOLOGICO EN LA AUDITORIA Claudio Urrutia Cea Jefe de Auditoría BANCO CENTRAL DE CHILE

Más detalles

UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS UNIDAD ACADÉMICA MULTIDISCIPLINARIA REYNOSA-RODHE SIMULACIÓN DE SISTEMAS

UNIVERSIDAD AUTÓNOMA DE TAMAULIPAS UNIDAD ACADÉMICA MULTIDISCIPLINARIA REYNOSA-RODHE SIMULACIÓN DE SISTEMAS UNIDAD MÉTODOS DE MONTECARLO II 2.1 Definición Los métodos de Montecarlo abarcan una colección de técnicas que permiten obtener soluciones de problemas matemáticos o físicos por medio de pruebas aleatorias

Más detalles

TÓPICOS AVANZADOS DE BASES DE DATOS

TÓPICOS AVANZADOS DE BASES DE DATOS TÓPICOS AVANZADOS DE BASES DE DATOS 1. DATOS DE LA ASIGNATURA. Nombre de la asignatura: TÓPICOS AVANZADOS DE BASES DE DATOS Carrera: Ingeniería en Sistemas Computacionales Clave de la asignatura: Modulo

Más detalles

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos

Artículos de Minería de Datos de Dataprix Introducción a la minería de datos Published on Dataprix (http://www.dataprix.com) Principal > Artículos de Minería de Datos de Dataprix By Dataprix Created 26/12/2009-17:13 Artículos de Minería de Datos de Dataprix Introducción a la minería

Más detalles

Probabilidades y Estadística (Computación) Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Ana M. Bianco y Elena J.

Probabilidades y Estadística (Computación) Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires Ana M. Bianco y Elena J. Generación de Números Aleatorios Números elegidos al azar son útiles en diversas aplicaciones, entre las cuáles podemos mencionar: Simulación o métodos de Monte Carlo: se simula un proceso natural en forma

Más detalles

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas. El primer paso en el diseño de una base de datos es la producción del esquema conceptual. Normalmente, se construyen varios esquemas conceptuales, cada uno para representar las distintas visiones que los

Más detalles