Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
|
|
- Esther Espinoza Flores
- hace 7 años
- Vistas:
Transcripción
1 Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
2 Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos a grupos predefinidos (aprendizaje supervisado). Encuentra modelos (funciones) que describen y distinguen clases o conceptos para futuras predicciones. Probablemente la tarea más familiar y más popular de la minería de datos. 2 de 33
3 Tareas de la minería de datos: clasificación Ejemplos de aplicación: Calificación de crédito (credit scoring), reconocimiento de imágenes y patrones, diagnóstico médico, detección de fallos en aplicaciones industriales, clasificar tendencias de mercados financieros,... Métodos: Análisis discriminante, árboles de decisión, reglas de clasificación, redes neuronales.
4 Tareas de la minería de datos: clasificación Ejemplo simple: En EE.UU. los maestros clasifican a los estudiantes en A, B, C, D o F según sus notas. Utilizando simplemente límites (60, 70, 80, 90), las siguientes clasificaciones son posibles: 90 <= nota A 80 <= nota <= 90 B 70 <= nota <= 80 C 60 <= nota < 70 D Nota < 60 F
5 Clasificación contra predicción En alguna literatura de minería de datos se considera a la clasificación como el emparejamiento contra clases (etiquetas de valores), mientras que la predicción está asociada a valores continuos. Es decir, en el conjunto de entrenamiento la variable objetivo es una variable continua. Finalmente, clasificación y predicción vienen siendo lo mismo, aunque se pueden hacer la diferenciación según el tipo de variable.
6 Clasificación: aprendizaje 6 de 33
7 Clasificación: pruebas 7 de 33
8 Preparación de los datos para clasificación y predicción Limpieza de los datos Tratamiento del ruido y de valores faltantes. Análisis de relevancia Algunos atributos en los datos pueden ser irrelevantes o redundantes. Eliminar dichos atributos mejora la eficiencia y la eficacia. Transformación de datos Se pueden hacer generalizaciones de los datos a conceptos de mayor nivel. También se pueden normalizar los datos. 8 de 33
9 Evaluación de métodos de clasificación Precisión en la predicción Capacidad de predecir correctamente. Eficiencia Costos computacionales. Robustez Habilidad para funcionar con ruido y ausencia de ciertos valores. Escalabilidad Habilidad para trabajar con grandes cantidades de datos. Interpretabilidad Entendimiento y comprensión que brinda. 9 de 33
10 Clasificación: definición formal Dada una base de datos D = {t 1, t 2,, t n } de tuplas (elementos, registros) y un conjunto de clases C = {C 1,, C m }, el problema de clasificación trata de definir un mapeo f : D C donde cada t i se asigna a una clase. Una clase C j contiene precisamente aquellas tuplas mapeadas a ella; esto es, C j = { t i f(t i ) = C j, 1<=i<=n y t i ϵ D }. 10 de 33
11 Clasificación: algoritmos Estadísticos Regresión simple, regresión múltiple, bayes,... Distancia k vecinos más cercanos,... Árboles de decisión ID3, C4.5, CART,... Redes neuronales Retropropagación,... Reglas Reglas de asociación, de 33
12 Clasificación por inducción de árboles de decisión El aprendizaje por árboles de decisión es un método comúnmente utilizado en minería de datos. El objetivo es crear un modelo que prediga el valor de una variable objetivo basándose en varias variables de entrada. Se muestra un ejemplo en las dos filminas siguientes. Cada nodo interior corresponde a a una de las variables de entrada. Hay aristas hacia un hijo para cada uno de los posibles valores de dicha variable de entrada. Cada hoja representa un valor de la variable objetivo dados los valores de las variables entrada representadas por el camino de la raíz a la hoja. 12 de 33
13 Clasificación por inducción de árboles de decisión edad ingreso estudiante calificación_crédito clase:compra_computador <=30 alto no suficiente no <=30 alto no excelente no alto no suficiente sí >40 medio no suficiente sí >40 bajo sí suficiente sí >40 bajo sí excelente no bajo sí excelente sí <=30 medio no suficiente no <=30 bajo sí suficiente sí >40 medio sí suficiente sí <=30 medio sí excelente sí medio no excelente sí alto sí suficiente sí >40 medio no excelente no 13 de 33
14 Clasificación por inducción de árboles de decisión 14 de 33
15 Clasificación por inducción de árboles de decisión Un árbol puede ser aprendido separando el conjunto fuente en subconjuntos basados en una prueba de valor de atributo. Este proceso es repetido en cada subconjunto derivado de una manera recursiva llamada particionamiento recursivo. La recursión termina cuando el subconjunto en un nodo tiene para todos sus miembros el mismo valor de la variable objetivo o cuando separar ya no agrega valor a la predicción. 15 de 33
16 Clasificación por inducción de árboles de decisión Los datos vienen en registros de la forma: (x,y) = (x 1, x 2, x 3,..., x k, Y) La variable dependiente Y es la variable objetivo que se está tratando de explicar, clasificar o generalizar. El vector x está compuesto de las variables de entrada The vector x is composed of the input variables x 1, x 2, x 3, etc., que son usadas para la tarea de minería. 16 de 33
17 Clasificación por inducción de árboles de decisión 17 de 33
18 Clasificación por los k vecinos más cercanos (KNN) Esquema de clasificación común, basado en el uso de medidas de distancia. Es un tipo de aprendizaje por analogía. La técnica asume que el conjunto completo de entrenamiento incluye no sólo los datos sino también la clasificación deseada. Los datos de entrenamiento son entonces el modelo. 18 de 33
19 Clasificación por los k vecinos más cercanos (KNN) Cuando se va a clasificar un nuevo elemento (t) se determina su distancia contra todos los elementos en el conjunto de entrenamiento. Luego sólo se consideran los K elementos más cercanos al nuevo elemento (t). El nuevo elemento (t) es entonces clasificado en la clase mayoritaria de los vecinos cercanos. 19 de 33
20 Clasificación por los k vecinos más cercanos (KNN) De manera más formal: El conjunto de entrenamiento es descrito por atributos numéricos n-dimensionales. Cada individuo representa un punto en un espacio n-dimensional. Así, el conjunto de entrenamiento es almacenado en un espacio patrón n-dimensional. Cuando se clasifica un individuo nuevo se busca en el espacio patrón los k individuos más cercanos al nuevo individuo. 20 de 33
21 Clasificación por los k vecinos más cercanos (KNN) La cercanía es usualmente definida en términos de la distancia euclidiana, donde la distancia entre dos puntos, X=(x 1, x 2,, x n ) y Y=(y 1, y 2,, y n ) es d ( X,Y )= i=1 n (x i y i ) 2 El nuevo individuo es asignado a la clase más común o mayoritaria entre sus k vecinos más cercanos. Cuando k=1 se asigna la clase del elemento más cercano. 21 de 33
22 Clasificación por los k vecinos más cercanos (KNN): ejemplo 22 de 33
23 Clasificación por los k vecinos más cercanos (KNN): algoritmo 23 de 33
24 Clasificación por los k vecinos más cercanos (KNN) La técnica KNN es muy sensible a la escogencia de k. Una regla práctica es k menor o igual a la raíz del número de elementos de entrenamiento. Los clasificadores de vecinos más cercanos son aprendizaje basados en instancia o aprendizaje flojo (lazy learning). Tienen mayor eficiencia en el entrenamiento. Sin embargo, los costos computacionales pueden ser caros en la clasificación si los individuos de entrenamiento (el modelo) son muchos. 24 de 33
25 Regresión lineal simple 25 de 33
26 Regresión lineal simple 26 de 33
27 Regresión lineal simple 27 de 33
28 Regresión lineal simple 28 de 33
29 Regresión lineal simple 29 de 33
30 Clasificación bayesiana ingenua Sea X un conjunto de datos cuya clase es desconocida. Sea H alguna hipótesis tal que el conjunto de datos pertenece a una clase C. Se desea entonces determinar P(H X), la probabilidad de que la hipótesis H sea válida dados los datos observados en X. P(H X) es la probabilidad posterior, o la probabilidad a posteriori, de H condicionada en X. 30 de 33
31 Clasificación bayesiana ingenua El teorema de Bayes es útil en el hecho de que provee una manera de calcular la probabilidad posterior, P(H X), de P(H), P(X) y P(X H). El teorema de Bayes adaptado a la clasificación es: P(H X )= P ( X H ) P(H ) P( X ) 31 de 33
32 Clasificación bayesiana ingenua: ejemplo edad ingreso estudiante calificación_crédito clase:compra_computador <=30 alto no suficiente no <=30 alto no excelente no alto no suficiente sí >40 medio no suficiente sí >40 bajo sí suficiente sí >40 bajo sí excelente no bajo sí excelente sí <=30 medio no suficiente no <=30 bajo sí suficiente sí medio sí suficiente sí <=30 medio sí excelente sí >40 medio no excelente sí >40 alto sí suficiente sí medio no excelente no 32 de 33
33 Gracias por su atención! Preguntas?
APRENDIZAJE PROBABILÍSTICO NAIVE BAYES
1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;
Más detallesTécnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO
Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO 2 Objetivo El objetivo principal de las técnicas de clasificación supervisada es obtener un modelo clasificatorio válido para permitir tratar
Más detallesCRITERIOS DE SELECCIÓN DE MODELOS
Inteligencia artificial y reconocimiento de patrones CRITERIOS DE SELECCIÓN DE MODELOS 1 Criterios para elegir un modelo Dos decisiones fundamentales: El tipo de modelo (árboles de decisión, redes neuronales,
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesProyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.
Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial. Funcionamiento: Se realiza un test en cada nodo interno del árbol, a medida que
Más detallesCómo se usa Data Mining hoy?
Cómo se usa Data Mining hoy? 1 Conocer a los clientes Detectar segmentos Calcular perfiles Cross-selling Detectar buenos clientes Evitar el churning, attrition Detección de morosidad Mejora de respuesta
Más detallesTécnicas de Minería de Datos
Técnicas de Minería de Datos Act. Humberto Ramos S. 1 Qué es Minería de datos? El desarrollo de dispositivos tecnológicos para acumular datos a bajo costo. Acumulación o registro de gran cantidad de datos.
Más detallesMinería de datos (Fases de la minería de datos)
Minería de datos (Fases de la minería de datos) M. en C. Sergio Luis Pérez Pérez UAM CUAJIMALPA, MÉXICO, D. F. Trimestre 12-O. Sergio Luis Pérez (UAM CUAJIMALPA) Curso de minería de datos 1 / 23 Fase de
Más detallesCÁLCULO DE PROBABILIDADES
CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.
Más detallesClasificador Jerárquico de Imágenes utilizando Naive Bayes
Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}
Más detallesAprendizaje Automatizado. Árboles de Clasificación
Aprendizaje Automatizado Árboles de Clasificación Árboles de Clasificación Estudiaremos un algoritmo para la creación del árbol. Selección de atributos comenzando en el nodo raíz. Proceso recursivo. Árboles
Más detallesTema AA-4: Sesgo inductivo
Razonamiento Automático Curso 2002 2003 Tema AA-4: Sesgo inductivo Miguel A. Gutiérrez Naranjo José A. Alonso Jiménez Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla
Más detallesAprendizaje Supervisado K - Vecinos más cercanos Knn-Method
Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No
Más detallesRicardo Aler Mur CLASIFICADORES KNN-I
Ricardo Aler Mur CLASIFICADORES KNN-I En esta clase se habla del aprendizaje de modelos de clasificación y regresión basados en instancias o ejemplares. En concreto: Se define la clasificación y regresión
Más detallesMinería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria
Minería de Datos Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria 1 Que es un conjunto de datos? Es una colección de objetos con sus respectivo atributos. Un atributo es una propiedad
Más detallesUnidad 5: MODELO DE COMPORTAMIENTO - ESQUEMA DE DATOS CARACTERÍSTICAS DEL ESQUEMA DE DATOS DIAGRAMA ENTIDAD RELACIÓN (D.E.R.)
Unidad 5: MODELO DE COMPORTAMIENTO - ESQUEMA DE DATOS OBJETIVO DEL ESQUEMA DE DATOS Describir los datos que el sistema debe conocer para poder responder a los estímulos. CARACTERÍSTICAS DEL ESQUEMA DE
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detallesMinería de Datos. Árboles de Decisión. Fac. Ciencias Ing. Informática Otoño de Dept. Matesco, Universidad de Cantabria
Minería de Datos Árboles de Decisión Cristina Tîrnăucă Dept. Matesco, Universidad de Cantabria Fac. Ciencias Ing. Informática Otoño de 2012 Twenty questions Intuición sobre los árboles de decisión Juego
Más detallesInteligencia Artificial Técnicas de clasificación
Inteligencia Artificial Técnicas de clasificación ISISTAN - CONICET Clasificación: Agenda Concepto Clasificación Predicción Evaluación Árboles de Decisión Construcción Uso Poda Clasificador Bayesiano Ejemplos
Más detalles3. Árboles de decisión
3.1 Introducción Método para aproximación de funciones objetivo que tengan valores discretos (clasificación) Uno de los métodos mas extensamente usados para inferencia inductiva Capaz de aprender hipótesis
Más detallesMASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión.
MASTER DE INGENIERÍA BIOMÉDICA. Métodos de ayuda al diagnóstico clínico. Tema 6: Árboles de decisión. 1 Objetivos del tema Conocer en qué consiste un árbol de decisión. Aprender los problemas que pueden
Más detallesInteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani
Inteligencia Artificial Aprendizaje neuronal Ing. Sup. en Informática, 4º Curso académico: 20/202 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3. Introducción
Más detallesTema 7: Aprendizaje de árboles de decisión
Inteligencia Artificial 2 Curso 2002 03 Tema 7: Aprendizaje de árboles de decisión José A. Alonso Jiménez Miguel A. Gutiérrez Naranjo Francisco J. Martín Mateos José L. Ruiz Reina Dpto. de Ciencias de
Más detallesTaller Minería de datos aplicados a la educación
Taller Minería de datos aplicados a la educación 2ª parte Presentación del software PASW Modeler 27 de junio de 2011 Mercedes Torrado Departamento Métodos de Investigación y Diagnóstico en Educación (MIDE)
Más detallesAplicaciones empresariales
KDD y Data Minig Descubrimiento de Conocimiento en Bases de Datos Se define como la extracción no trivial de información implícita, desconocida, y potencialmente útil de los datos. La palabra descubrimiento
Más detallesCapítulo 3. Polinomios
Capítulo 3 Polinomios 29 30 Polinomios de variable real 31 Polinomios de variable real 311 Evaluación de polinomios Para el cálculo eficiente de los valores de un polinomio se utiliza el algoritmo de Horner,
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur TIPOS DE TAREAS, MODELOS Y ALGORITMOS ? Datos Entrenamiento Algoritmo Modelo Galaxia espiral TAREAS / MODELOS
Más detalles1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.
1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2. GENERALIDADES SOBRE LAS TÉCNICAS DE INVESTIGACIÓN SOCIAL Y DE MERCADOS
Más detallesSISTEMAS INTELIGENTES
SISTEMAS INTELIGENTES T8: Aprendizaje basado en instancias www.aic.uniovi.es/ssii Índice Aprendizaje basado en instancias Métricas NN Vecino más próximo: Regiones de Voronoi El parámetro K Problemas de
Más detallesItinerario: Inteligencia Computacional
Máster Universitario en Investigación e Innovación en Tecnologías de la Información y las Comunicaciones Itinerario: Inteligencia Computacional Escuela Politécnica Superior Universidad Autónoma de Madrid
Más detallesFacultad de Ingeniería Civil y Ambiental Análisis Espacial.
Análisis Espacial. Contenido. - Introducción. - Revisión de estadística básica. - Precisión y exactitud. - Interpolación. - Métodos. - Aplicaciones. - Modelación y SIG. Interpoladores Locales: - Polígonos
Más detallesAnálisis de imágenes digitales
Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en texturas INTRODUCCIÓN La textura provee información sobre la distribución espacio-local del color o niveles de intensidades
Más detallesIntroducción a la Minería de Datos
Introducción a la Minería de Datos Abdelmalik Moujahid, Iñaki Inza y Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial Universidad del País Vasco Índice 1 Minería de
Más detallesNivel I: Pensamiento Memorístico (demuestra conocimiento en forma igual o casi igual a como lo aprendido).
Niveles de Pensamiento de Norman Webb El Dr. Norman Webb, especialista en el área de evaluación, junto con otros profesionales describió cuatro niveles de profundidad de conocimiento (DOK, por sus siglas
Más detalles2 OBJETIVOS TERMINALES Como resultado de aprender adecuadamente los contenidos del curso el estudiante estará en capacidad de:
MATERIA: Matemáticas para el diseño CÓDIGO: 08287 REQUISITOS: Algebra y funciones (08272) PROGRAMAS: Diseño Industrial, Diseño de Medios Interactivos. PERÍODO ACADÉMICO: 2016-2 INTENSIDAD SEMANAL: 4 Horas
Más detallesSISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS.
SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS. MTIE. Erik Guerrero Bravo. Universidad Tecnológica Tula - Tepeji. Introducción Sistemas Transaccionales
Más detallesPROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO INGENIERÌA EN SISTEMAS ASIGNATURA
PROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO INGENIERÌA EN SISTEMAS SEMESTRE ASIGNATURA 8vo TEORÍA DE DECISIONES CÓDIGO HORAS MAT-31314
Más detallesPRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Más detallesGeneración de Variables Aleatorias. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Generación de Variables Aleatorias UCR ECCI CI-453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción Las variables aleatorias se representan por medio de distribuciones
Más detallesVecinos próximos (IB1/IBk) Vecinos próximos
Clasificación de patrones: Métodos supervisados Máxima verosimilitud (ZeroR) Jordi Porta Zamorano es el método más simple Escuela Politécnica Superior Universidad Autónoma de Madrid jordi.porta@uam.es
Más detallesReconocimiento Automático de Voz
Reconocimiento Automático de Voz Presentación basada en las siguientes Referencias: [1] Rabiner, L. & Juang, B-H.. Fundamentals of Speech Recognition, Prentice Hall, N.J., 1993. [2] Rabiner, L. & Juang,
Más detallesFundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 9 - Juan Alfonso Lara Torralbo 1 Índice de contenidos Actividad. Qué es un modelo de Data Mining Qué es
Más detallesGUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)
GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC) Curso Académico: 2015-2016 Programa: Centro: Universidad: Máster Universitario en Ingeniería Informática Escuela Politécnica Superior
Más detallesEVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.
EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO 2013-2014. Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. UNIDAD 3: POLINOMIOS Y FRACCIONES ALGEBRAICAS Operaciones
Más detallesAprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Más detallesINDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica
INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables
Más detallesAprendizaje Supervisado Árboles de Decisión
Aprendizaje Supervisado Árboles de Decisión 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No
Más detallesMÉTODOS DE APRENDIZAJE INDUCTIVO
Aprendizaje Automático y Data Mining Bloque III MÉTODOS DE ARENDIZAJE INDUCTIVO 1 Índice Clasificación de métodos: Lazy Eager Árboles de decisión. Listas de reglas. Aprendizaje Bayesiano. Redes neuronales
Más detallesFACULTAD DE INGENIERÍA
FACULTAD DE INGENIERÍA II JORNADAS DE DATA MINING CONFERENCIA 7.- " CASO SNOOP CONSULTING-ORACLE Fernando Das Neves Gerente de I+D de Snoop Consulting-Oracle Data Mining Technologies IAE - Pilar, 7 y 8
Más detallesConceptos básicos útiles. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Conceptos básicos útiles PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Grafos Grafo Un grafo (o bien, un grafo no dirigido) G consiste en un conjunto E de lados (o ramas, aristas, arcos)
Más detallesPrimera aproximación al aprendizaje automático.
APRENDIZAJE Introducción al aprendizaje algorítmico José M. Sempere Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia Aprender: Tomar algo en la memoria [...] Adquirir
Más detallesProbabilidad y Estadística
Probabilidad y Estadística Tema 4 Variables aleatorias Objetivo de aprendizaje del tema Al finalizar el tema serás capaz de: Describir las características de las variables aleatorias discretas y continuas.
Más detallesAprendizaje basado en ejemplos.
Aprendizaje basado en ejemplos. In whitch we describe agents that can improve their behavior through diligent study of their own experiences. Porqué queremos que un agente aprenda? Si es posible un mejor
Más detallesMASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: ANÁLISIS DEL RIESGO ACTUARIAL Y FINANCIERO
MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN 2009 Nombre de asignatura: ESTADÍSTICA ACTUARIAL III: ANÁLISIS MULTIVARIANTE DE DATOS Código: 603377 Materia: ESTADÍSTICA ACTUARIAL Módulo: ANÁLISIS DEL
Más detallesModelo Predictivo del Crimen para la Región Metropolitana
Análisis Espacial de la Criminalidad basado en Georeferenciación de Denuncias José Miguel Benavente PhD Departamento de Economía. Departamento de Ingeniería Industrial. Universidad de Chile. Carabineros
Más detallesBIOESTADISTICA ( ) Evaluación de pruebas diagnósticas. 1) Características del diseño en un estudio para evaluar pruebas diagnósticas.
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55-10536) Evaluación de pruebas diagnósticas CONCEPTOS CLAVE 1) Características del diseño en un estudio para evaluar pruebas
Más detallesINDICADORES DE GESTION
Página 1 de 10 INDICADORES DE GESTION AÑO 2011 ELABORO: REVISO: APROBO: MARIA DEL PILAR OQUENDO LILIAM P. ZAPATA MARTINEZ RAMIRO ANTONIO NAVIA DIAZ Página 2 de 10 CONTENIDO 1. ALCANCE... 3 2. DEFINICIÓN...
Más detallesComplejidad de los Algoritmos
Que es un Algoritmo? Complejidad de los Algoritmos Webster: cualquier método especial para resolver cierta clase de problemas. Horowitz: método preciso utilizable en una computadora para la solución de
Más detallesReconocimiento automático de rostros
Reconocimiento automático de rostros Ponente: Dr. Wilfrido Gómez Flores Investigador CINVESTAV wgomez@tamps.cinvestav.mx Ciudad Victoria,, 15 de junio de 2016 1 Introducción 2 Reconocimiento de rostros
Más detallesAux 6. Introducción a la Minería de Datos
Aux 6. Introducción a la Minería de Datos Gastón L Huillier 1,2, Richard Weber 2 glhuilli@dcc.uchile.cl 1 Departamento de Ciencias de la Computación Universidad de Chile 2 Departamento de Ingeniería Industrial
Más detallesTema 2 Primeros Modelos Computacionales
Universidad Carlos III de Madrid OpenCourseWare Redes de Neuronas Artificiales Inés M. Galván - José Mª Valls Tema 2 Primeros Modelos Computacionales 1 Primeros Modelos Computacionales Perceptron simple
Más detallesCNCA. Colaboratorio Nacional de Computación Avanzada Centro Nacional de Alta Tecnología. Proyectos de uso de la e-infraestructura en RedCLARA
CNCA Colaboratorio Nacional de Computación Avanzada Centro Nacional de Alta Tecnología Proyectos de uso de la e-infraestructura en RedCLARA 1er Día Virtual de la e-infraestructura San José, Costa Rica,
Más detallesGeometría de las superficies
Geometría de las superficies Klette, schluns, koschan Computer vision: three dimensional data from images Cap 3 1 Representaciones funcionales Representación mediante una ecuación condicional para X e
Más detallesCONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con
319 CONCLUSIONES La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con respecto a otros modelos típicos de solución de problemas de Ingeniería, una de ellas es su inspiración en modelos
Más detallesAprendizaje de conceptos. El aprendizaje como generalización
Aprendizaje de conceptos. El aprendizaje como generalización 1 Aprendizaje de conceptos Consideraremos el problema de inferir automáticamente la definición general de un concepto o clase a partir de un
Más detalles4º E.S.O. Matemáticas A
4º E.S.O. Matemáticas A Objetivos 1. Incorporar, al lenguaje y formas habituales de argumentación, las distintas formas de expresión matemática (numérica, algebraica, de funciones, geométrica...), con
Más detallesDES: Materia requisito:
UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU007H Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: DES: Ingeniería Programa(s) Educativo(s): Ingeniería Aeroespacial Tipo de materia: Básica
Más detallesDr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental
Universidad de Puerto Rico Recinto de Aguadilla Programa CeCiMat Elemental Definición de conceptos fundamentales de la Estadística y la Probabilidad y su aportación al mundo moderno Dr. Richard Mercado
Más detallesConsumir Servicios Web SOAP. CI-2454 Servicios Web Prof. Braulio José Solano Rojas ECCI, UCR
Consumir Servicios Web SOAP CI-2454 Servicios Web Prof. Braulio José Solano Rojas ECCI, UCR Tener un buen IDE es ideal La forma más productiva de consumir un Servicio Web SOAP es por medio de un Entorno
Más detallesProbabilidad. 1. Conceptos previos. Teoría de conjuntos. Conceptos básicos
. Conceptos previos Teoría de conjuntos. Conceptos básicos Dado un conjunto M, se llama conjunto de partes de M, y se denota por P(M), al conjunto de todos los subconjuntos de M (incluido el conjunto vacio,,
Más detallesAprendizaje Automático y Data Mining. Bloque IV DATA MINING
Aprendizaje Automático y Data Mining Bloque IV DATA MINING 1 Índice Definición y aplicaciones. Grupos de técnicas: Visualización. Verificación. Descubrimiento. Eficiencia computacional. Búsqueda de patrones
Más detallesMATEMÁTICAS APLICADAS A LAS CCSS II. 1. Resolver sistemas de ecuaciones lineales mediante el método de Gauss.
MATEMÁTICAS APLICADAS A LAS CCSS II Criterios de evaluación. 1. Resolver sistemas de ecuaciones lineales mediante el método de Gauss. 2. Operar correctamente con matrices y utilizar el lenguaje matricial
Más detallesVisión global del KDD
Visión global del KDD Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Introducción Desarrollo tecnológico Almacenamiento masivo de información Aprovechamiento
Más detallesGuía docente 2007/2008
Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación
Más detallesTEMARIOS EXAMEN DE ADMISIÓN 2017 EDUCACIÓN BÁSICA Y MEDIA: MATEMÁTICA. Contenido
TEMARIOS EXAMEN DE ADMISIÓN 2017 1 Básico 1.- Reconocimiento izquierda derecha 2.- Figuras geométricas 3.- Cuerpos geométricos 4.- Establecer patrones 5.- Secuencias temporales 6.- ordinales 7.- Reconocimiento
Más detallesINGENIERÍA EN TECNOLOGÍAS DE LA INFORMACIÓN
INGENIERÍA HOJA DE ASIGNATURA CON DESGLOSE DE UNIDADES TEMÁTICAS 1. Nombre de la asignatura Estadística Aplicada 2. Competencias Dirigir proyectos de tecnologías de información (T.I.) para contribuir a
Más detallesMATEMÁTICAS APLICADAS A LAS CCSS II (2º BACHILLERATO)
MATEMÁTICAS APLICADAS A LAS CCSS II (2º BACHILLERATO) 1.1.1 Contenidos y temporalización. Matemáticas Aplicadas a las Ciencias Sociales II 1.1.1.1 Bloque 1. Álgebra (Total : 40 sesiones) Matrices y determinantes
Más detallesModelos Gráficos Probabilistas L. Enrique Sucar INAOE. Sesión 10: Redes Bayesianas Inferencia. 1era parte. [Neapolitan 90]
Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 10: Redes Bayesianas Inferencia 1era parte [Neapolitan 90] Inferencia en Redes Bayesianas Introducción Clases de algoritmos 1era Parte Propagación
Más detallesMatemáticas I Grado de Administración y Dirección de Empresas Examen de Febrero Curso 2011/ ?
Matemáticas I Grado de Administración y Dirección de Empresas Examen de Febrero Curso 011/1 1) (1 punto) Dado el subespacio vectorial,,,,,,,,,,, a) Obtener la dimensión, unas ecuaciones implícitas, unas
Más detallesTEMARIO: CONTENIDOS, OBJETIVOS MÍNIMOS Y TIEMPO.
TEMARIO: CONTENIDOS, OBJETIVOS MÍNIMOS Y TIEMPO. Los contenidos seleccionados tienen la intención de aportar una formación matemática suficiente para abordar problemas del mundo social y del entorno, así
Más detallesTema 15: Combinación de clasificadores
Tema 15: Combinación de clasificadores p. 1/21 Tema 15: Combinación de clasificadores Abdelmalik Moujahid, Iñaki Inza, Pedro Larrañaga Departamento de Ciencias de la Computación e Inteligencia Artificial
Más detallesBases Formales de la Computación: Redes de Bayes (segunda parte)
Bases Formales de la Computación: Redes de Bayes (segunda parte) Departamento de Ciencias e Ingeniería de la Computación Pontificia Universidad Javeriana Cali Periodo 2008-2 Razonamiento en Redes de Bayes
Más detallesMetodología de la Investigación: Validez y Confiabilidad. Prof. Reinaldo Mayol Arnao
Metodología de la Investigación: Validez y Confiabilidad Prof. Reinaldo Mayol Arnao Validez en varios momentos En esta presentación hablaremos sobre la medición de la validez en dos pasos críticos de la
Más detallesmatemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4
PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesVariables aleatorias bidimensionales discretas
Universidad de San Carlos de Guatemala Facultad de Ingeniería Área de Estadística VARIABLES ALEATORIAS BIDIMENSIONALES Concepto: Sean X e Y variables aleatorias. Una variable aleatoria bidimensional (X,
Más detallesMétodos basados en instancias. K-vecinos, variantes
Métodos basados en instancias K-vecinos, variantes Contenido 1. Caracterización 2. K-vecinos más próximos 3. Mejoras al algoritmo básico 4. Bibliografía 2 1. Caracterización Forma más sencilla de aprendizaje:
Más detallesAsignaturas antecedentes y subsecuentes
PROGRAMA DE ESTUDIOS PROBABILIDAD Área a la que pertenece: Área Sustantiva Profesional Horas teóricas: 3 Horas prácticas: 2 Créditos: 8 Clave: F0056 Asignaturas antecedentes y subsecuentes PRESENTACIÓN
Más detallesAplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.
Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así
Más detallesEjercicio 1 (20 puntos)
ESTADISTICA Y SUS APLICACIONES EN CIENCIAS SOCIALES. Examen Montevideo, 15 de diciembre de 2015. Nombre: C.I.: EXAMEN Libre Reglamentado El examen consta de dos partes. La primera parte debe ser realizada
Más detallesCLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres
CLASIFICACIÓN DE LA IMAGEN TÉCNICA QUE PERMITE LA IDENTIFICACIÓN DE LOS DIFERENTES OBJETOS O GRUPOS PRESENTES EN UNA IMAGEN MULTI-ESPECTRAL. MÉTODO NO SUPERVISADO MÉTODO SUPERVISADO El Desarrollo De Las
Más detallesBloque 1. Contenidos comunes. (Total: 3 sesiones)
4º E.S.O. OPCIÓN A 1.1.1 Contenidos 1.1.1.1 Bloque 1. Contenidos comunes. (Total: 3 sesiones) Planificación y utilización de procesos de razonamiento y estrategias de resolución de problemas, tales como
Más detallesAplicaciones prácticas de Minería de Datos con IBM SPSS Modeler
Álvaro J. Méndez Services Engagement Manager IBM SPSS / Profesor Econometría UAM Jecas, 22 Oct 2010 Aplicaciones prácticas de Minería de Datos con IBM SPSS Modeler Business Analytics software Agenda Minería
Más detallesCONTENIDO OBJETIVOS TEMÁTICOS HABILIDADES ESPECIFICAS
UNIDAD: REGIONAL CENTRO EJE BÁSICO, DIVISIÓN DE INGENIERÍA DEPARTAMENTO: MATEMATICAS ACADEMIA: (SERVICIO) HORAS DE CATEDRA CARACTER: OBLIGATORIA CREDITOS: 08 TEORICA:03 TALLER: 02 80 REQUISITO: Cálculo
Más detallesEsta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )
Tema 3 Formas cuadráticas. 3.1. Definición y expresión matricial Definición 3.1.1. Una forma cuadrática sobre R es una aplicación q : R n R que a cada vector x = (x 1, x 2,, x n ) R n le hace corresponder
Más detallesANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos
Más detallesIntensificación en "Lenguajes e Inteligencia Artificial"
Ingeniería Informática - ETS Informática Métodos y Técnicas Informáticas específicas. Comportamientos humanos que se quieren simular/emular: IA: Vertiente "cognitiva" : Razonamiento, Intelecto,. RF: Vertiente
Más detallesInteligencia en Redes de Comunicaciones - 06 Aprendizaje
El objetivo de este tema es realizar una introducción a los conceptos, fundamentos y técnicas básicas de aprendizaje computacional. En primer lugar se formalizará el concepto de aprendizaje y se describirán
Más detallesObservación: El método de Euler, es el método de Taylor de orden 1.
METODO DE TAYLOR TEOREMA DE TAYLOR DE ORDEN N Sea y(t) una función tal que sea n veces continuamente diferenciable en el intervalo [a,b] y existe y (N+1) existe en [a, b] Para todo t k + [a, b] abrá un
Más detalles