Aprendizaje Supervisado Análisis Discriminante (Lineal y Cuadrático)



Documentos relacionados
Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes)

EPB 603 Sistemas del Conocimiento

Aprendizaje Supervisado Máquinas Vectoriales de Soporte

Aprendizaje Supervisado K - Vecinos más cercanos Knn-Method

Aprendizaje Supervisado Árboles de Decisión

Tema 7. Introducción al reconocimiento de objetos

Análisis Exploratorio de Datos

MÁQUINA DE VECTORES DE SOPORTE

Método k-medias. [ U n a i n t r o d u c c i ó n ]

Los mapas auto-organizados de Kohonen (SOM )

Redes de Kohonen y la Determinación Genética de las Clases

Práctica 11 SVM. Máquinas de Vectores Soporte

MINERIA DE DATOS Y Descubrimiento del Conocimiento

Programación Genética

Conciliación bancaria en CheqPAQ Cargado de estado de cuenta

MÁQUINAS DE VECTORES DE SOPORTE

TEMA 5 Variables ficticias

Matrices equivalentes. El método de Gauss

Cómo se usa Data Mining hoy?

Universidad Diego Portales Facultad de Economía y Empresa

Si se encontraron no conformidades en la auditoría de fase I, deben ser corregidas por el cliente antes de la auditoría de fase 2.

Principios de Bases de Datos Relacionales, Normalización. Unidad 4

MLM Matemática Discreta

3.- DETERMINANTES. a 11 a 22 a 12 a 21

f(x)=a n x n +a n-1 x n-1 +a n-2 x n a 2 x 2 +a 1 x 1 +a 0

RELACIONES DE RECURRENCIA

UTILIZACIÓN DE RELOJES

La ventana de Microsoft Excel

Enfoque propuesto para la detección del humo de señales de video.

Iniciándose en la Programación con la ClassPad

COMBINAR CORRESPONDENCIA EN MICROSOFT WORD

Álgebra Lineal Ma1010

ESTRUCTURA DE DATOS: ARREGLOS

Clasificación de Música por Genero Utilizando Redes Neuronales Artificiales. Elkin García, Germán Mancera, Jorge Pacheco

Tecnologías en la Educación Matemática. Expresiones. Datos. Expresiones Aritméticas. Expresiones Aritméticas 19/08/2014

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

3. Selección y Extracción de características. Selección: Extracción: -PCA -NMF

Tablas. Estas serán las tablas que usaremos en la mayoría de ejemplos. Empleado

José Ignacio Latorre Universidad de Barcelona

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Tema 8: Análisis Discriminante. Clasificación. Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid. Análisis discriminante

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos

Anexo 1: Demostraciones

Construyendo gráficos estadísticos con ayuda de Microsoft Excel

Funciones polinomiales de grados 3 y 4

ARREGLOS DEFINICION GENERAL DE ARREGLO

Procesos Críticos en el Desarrollo de Software

ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL Y GRAPH

4. Programación Paralela

SIIGO Pyme. Análisis de Rentabilidad y Participación. Cartilla I

Clasificación de métricas.

AVISO IMPORTANTE: Si cumples con los requisitos previamente mencionados, encontrarás en la siguiente página los pasos de tu trámite Campus France

La estrategia básica para jugar blackjack.

Lista de comprobación

EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO

ANÁLISIS DE DATOS NO NUMERICOS

Métodos de la Minería de Datos

Espacios generados, dependencia lineal y bases

Sistemas Operativos. Sesión 5: Protocolos de enrutamiento vector distancia

Ecuaciones de segundo grado

MATEMÁTICAS BÁSICAS. Autora: Jeanneth Galeano Peñaloza Edición: Oscar Guillermo Riaño

Optimización de Procesos

UNIVERSIDAD SAN FRANCISCO DE QUITO. Minería de Datos Aplicada a Credit Scoring. Mauricio Figueroa

UNIDAD 6. Programación no lineal

Métodos Iterativos para Resolver Sistemas Lineales

Fundamentos de Biología Aplicada I Estadística Curso Práctica 6: Regresión Logística I

Material del curso Análisis de datos procedentes de investigaciones mediante programas informáticos Manuel Miguel Ramos Álvarez

Área Académica: ICBI, Sistemas Computacionales. Profesor: M.C.C Víctor Tomás Tomás Mariano

Profr. Efraín Soto Apolinar. Función Inversa

Introducción a la Computación TFA

INSTRUCTIVO PARA INSCRIPCIÓN DE INGLÉS. 2. Ingresar el usuario de Timonel para que se dé acceso a la plataforma de inscripción.

DISEÑO WEB ADOBE DREAMWEAVER CS3

Pruebas de acceso a enseñanzas universitarias oficiales de grado Castilla y León

CLASIFICACIÓN NO SUPERVISADA

Valores y vectores propios de una matriz. Juan-Miguel Gracia

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Minería de Datos. Abstract. Existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística Potencia de computo

Funciones Reales en una Variable

CAPÍTULO 3 RED NEURONAL PARA EL RECONOCIMIENTO DE ROSTROS

Tablas de Datos. HL Mata 1

Problemas resueltos de combinatoria

Métodos de agregación de modelos y aplicaciones

Decidir cuándo autenticar en dispositivos móviles a partir de modelos de machine learning 1

Ciencias de la Computación I

28 = =

Guía de Modelo Relacional y Conversión de Entidad-Relación a Relacional

Matemáticas 1204, 2013 Semestre II Tarea 5 Soluciones

Si piensa que no hay forma de prevenir el cáncer

En Evaluaciones y Análisis Financiero, La TASA DE INTERES recibe diferentes

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

MANUAL DE LA CONFIGURACIÓN Y USO DEL MÓDULO DE ASM PARA PRESTASHOP

MANUAL DE LA CONFIGURACIÓN Y USO DEL MÓDULO DE ASM PARA JOOMLA-VIRTUEMART

Aprendizaje por refuerzo

Qué son los protocolos de enrutamiento Dinámico?

DATOS EN SERVIDOR DE RED PROCEDIMIENTO PARA INSTALACIÓN Y CONFIGURACIÓN DE BASES DE DATOS EN SERVIDORES DE RED

Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones

Técnicas De Conteo. En este caso si k es grande, no es tan sencillo hacer un conteo exhaustivo de los puntos o resultados de S.

Resolución de Problemas

Transcripción:

Aprendizaje Supervisado Análisis Discriminante (Lineal y Cuadrático)

10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No 2 No Casado 100K No 3 No Soltero 70K No 4 Sí Casado 120K No 5 No Divorcia do 95K Fraude Sí 6 No Casado 60K No Tabla de Aprendizaje Id Reembolso Estado Civil Ingresos Anuales 7 No Soltero 80K No 8 Si Casado 100K No 9 No Soltero 70K No Tabla de Testing Fraude Evaluar Generar el Modelo Aplicar el Modelo Algoritmo de Aprendizaje Modelo Nuevos Individuos

Definición de Clasificación Dada una base de datos D = {t 1, t 2,, t n } de tuplas o registros (individuos) y un conjunto de clases C = {C 1, C 2,, C m }, el problema de la clasificación es encontrar una función f: D C tal que cada t i es asignada una clase C j. f: D C podría ser una Red Neuronal, un Árbol de Decisión, un modelo basado en Análisis Discriminante, o una Red Beyesiana.

Ejemplo: Créditos en un Banco Tabla de Aprendizaje Variable Discriminante Con la Tabla de Aprendizaje se entrena (aprende) el modelo matemático de predicción, es decir, a partir de esta tabla se calcula la función f de la definición anterior.

Ejemplo: Créditos en un Banco Tabla de Testing Variable Discriminante Con la Tabla de Testing se valida el modelo matemático de predicción, es decir, se verifica que los resultados en individuos que no participaron en la construcción del modelo es bueno o aceptable. Algunas veces, sobre todo cuando hay pocos datos, se utiliza la Tabla de Aprendizaje también como de Tabla Testing.

Ejemplo: Créditos en un Banco Nuevos Individuos Variable Discriminante Con la Tabla de Nuevos Individuos se predice si estos serán o no buenos pagadores.

Idea: Se proyecta el nuevo individuo en suplementario y se asigna a la clase más cercana, pero qué significa clase más cercana? Supongamos que la matriz de datos (tabla de aprendizaje) está etiquetada separando por bloques las k distintas clases que se quieren clasificar con (X j ) 1 j k y el tamaño de cada clase es el número de filas de dicha clase, en R, nrow(x j ) = n j. La regla de Clasificación: Asigne cada nuevo individuo con valores en las variables x como sigue:

Idea: Se proyecta el nuevo individuo en suplementario y se asigna a la clase más cercana v3 v5 v8 v1 v2 v4 v6

Qué significa la distancia en este contexto? Definimos el Centro de Gravedad de la Clase o Centroide como sigue: Entonces la distancia al clase significa la distancia al Centro de Gravedad de la Clase o Centroide como sigue:

Escogiendo la Fórmula para distancia Fisher propuso usar lo siguiente, primero se descompone la tabla de aprendizaje como sigue: Luego calcular: Luego el Centro de Gravedad es el centro de gravedad de la proyección:

Análisis Discriminante Lineal Consiste en asignar el nuevo individuo x a la clase con centro de gravedad proyectado más cercano: Centroide más cercano Línea de separación dada por el ADL

El paquete MASS contiene la función lda para realizar Análisis Discriminante Lineal Instalando y usando el paquete MASS : install.packages( MASS,dependencies=TRUE) library(mass)

Ejemplo con IRIS.CSV Ejemplo con la tabla de datos IRIS IRIS Información de variables: 1.sepal largo en cm 2.sepal ancho en cm 3.petal largo en cm 4.petal ancho en cm 5.clase: Iris Setosa Iris Versicolor Iris Virginica

> library(scatterplot3d) > scatterplot3d(datos$p.ancho,datos$s.largo,datos$s.ancho)

Ejemplo 1: iris.csv

Ejemplo 2: Credit-Scoring MuestraAprendizajeCredito2500.csv MuestraTestCredito2500.csv

Descripción de Variables MontoCredito MontoCuota 1= Muy Bajo 1 =Muy Bajo 2= Bajo 2 =Bajo 3= Medio 3 =Medio 4= Alto 4 =Alto IngresoNeto GradoAcademico 1= Muy Bajo 1 =Bachiller 2= Bajo 2 =Licenciatura 3= Medio 3 =Maestría 4= Alto 4 =Doctorado CoeficienteCreditoAvaluo BuenPagador 1= Muy Bajo 1 =NO 2= Bajo 2 =Si 3= Medio 4= Alto

Análisis Discriminante Cuadrático ADC ADL

Análisis Discriminante Cuadrático

Datos IRIS con separación Lineal y Cuadrática Lineal Cuadrática

Ejemplo con IRIS.CSV Ejemplo con la tabla de datos IRIS IRIS Información de variables: 1.sepal largo en cm 2.sepal ancho en cm 3.petal largo en cm 4.petal ancho en cm 5.clase: Iris Setosa Iris Versicolor Iris Virginica

Ejemplo 2: Credit-Scoring MuestraAprendizajeCredito2500.csv MuestraTestCredito2500.csv

Gracias.