Mineria de Datos. Clasificacion supervisada: clasificadores k-nn. Dr. Edgar Acuna Departmento de Matematicas
|
|
- Sara Fuentes Sánchez
- hace 5 años
- Vistas:
Transcripción
1 Mineria de Datos Clasificacion suervisada: clasificadores k-nn Dr. Edgar Acuna Deartmento de Matematicas Universidad de Puerto Rico- Mayaguez academic.urm.edu/eacuna 1
2 En el método de los k vecinos mas cercanos ( knn: k nearest neighbors") (Fix y Hodges, 1951) se estima la función de densidad de donde rovienen un conjunto de datos. Alicado a clasificacion suervisada el metodo k-nn se usa ara estimar la función de densidad condicional f(x/c j ), de las redictoras x or cada clase C j. Es un método de clasificación noaramétrico, ya que no se hace ninguna suosición distribucional acerca de las variables redictoras. 2
3 Estimacion de densidad univariada or knn Sea x 1, x 2,..x n una muestra con una función densidad desconocida f(x) que se desea estimar y sea t un número real. Recordar que la robabilidad de que x caiga en el intervalo (t-h,t+h), uede ser aroximada or 2hf(t), donde f es la función de densidad y h es una constante cercana a cero. Por otro lado dicha robabilidad tambien uede ser estimada or k/n, donde k es el número de observaciones que caen en el intervalo (t-h,t+h). O sea f(t) k/2hn. En estimacion k-nn, k es refijado y h se determina de acuerdo a el. Más formalmente, sea d(x,y)= x-y la distancia usual entre los untos x e y de la linea recta. 3
4 Suongamos que hemos calculados todas las distancias d(x i,t)= x i -t y que estas son ordenadas de menor a mayor, tal como d 1 (t) d 2 (t). d n (t) Entonces el estimador de la funcion de densidad f en el unto t segun sus k vecinos mas cercanos esta dado or ˆ k f ( t) = 2nd ( t) k 4
5 Ejemlo Estimar usando k-nn la función de densidad corresondiente al siguiente conjunto de datos El histograma (normalizado ara que el area sea 1) de los datos se muestra en el siguiente slide. El estimador de la funcion de densidad usando un vecino mas cercano se muestra abajo. Se hace uso de la funcion fdknn en R. >y=c( , , , , , , , , , ) > fdknn(y,10,1) [1] [7]
6 6
7 Estimador k-nn de la funcion de densidad ara k=1,3,5,7 7
8 Estimacion de densidad multivariada El estimado de la función de densidad en el unto d-dimensional x tiene la forma ˆ k f (x) = nv k (x) donde v k (x) es el volumen de un elisoide centrado en x de radio r k (x), que a su vez es la distancia de x al k-ésimo unto más cercano. 8
9 El clasificador k-nn Desde el unto de vista de clasificacion suervisada el método k-nn es bien simle de alicar. En efecto, si las funciones de densidades condicionales f(x/c i ) de la clase C i que aarecen en la ecuación P( C i / x) = f (x / Ci ) π f (x) i son estimadas or k-nn. Entonces, ara clasificar un objeto, con mediciones dadas or el vector x, en la clase Ci se debe cumlir que k k iπ jπ i j > n v ( x) n v ( x) i k ara j i. Donde k i y k j son los k vecinos de x en las clase C i y C j resectivamente. j k 9
10 Asumiendo riors roorcionales a los tamaños de las clases (n i /n y n j /n resectivamente) lo anterior es equivalente a: k i >k j ara j i Luego, el rocedimiento de clasificación sería así: 1) Hallar los k objetos que están a una distancia más cercana al objeto x, k usualmente es un número imar. 2) Si la mayoría de esos k objetos ertenecen a la clase C i entonces el objeto x es asignado a ella. En caso de emate se clasifica al azar. 10
11 Hay dos roblemas en el método k-nn, la elección de la distancia o métrica y la elección de k. La métrica más elemental que se uede elegir es la euclideana d(x,y)=(x-y)'(x-y). Esta métrica sin embargo, uede causar roblemas si las variables redictoras han sido medidas en unidades muy distintas entre sí. Algunos refieren rescalar los datos antes de alicar el método. Otra distancia bien usada es la distancia Manhatan definida or d(x,y)= x-y. Si hay redictoras de distnto tio, esto es continuas, nominales y ordinales, entonces el uso de la distancia euclideana nos es un aroiado. Se ueden usar distancia ara variables mixtas (Wilson y Martinez, Gower). Algunas veces, las redictoras discretas son continuizadas, ero esto es muy comlejo de hacer. 11
12 La distancia Gower (I) La distancia Gower (Gower, 1971) entre las instancias d- dimensionales x i y x j esta definida or dist. Gow( x, x i Si la k-esima variable es nominal entonces d ijk =0 si x ik =x jk y 1 en caso contrario. Los w ijk= 1 Si la k-esima variable es logica o binaria asimetrica entonces d ijk =0 si x ik =x jk =TRUE, y 1 en caso contrario. Los w ijk seran 1 en todos los casos exceto cuando x ik =x jk =FALSE en cuyo caso valen 0. Si la k-esima variable es continua u ordinal entonces d ijk= x ik - x jk /rango(x k ). Los w ijk =1. Tambien si x ik o x ik o ambos estan missing entonces w ijk vale 0. j ) d k = 1 = d w k = 1 ijk w d ijk ijk 12
13 La Distancia Gower La funcion gower.dist del aquete StatMatch de R calcula la distancia gower Gower.dist(ejearbol) Otra manera de lidiar con variables nominales es usar variables binarias ara reresentarlas. Asi si una varibale nominal asume k valores distintos se ueden usar k-1 variables binarias raa reresentarlas. 13
14 Enas y Choi (1996) usando simulación hicieron un estudio ara determinar el k ótimo cuando solo hay dos clases resentes y determinaron que si los tamaños muestrales de las dos clases son comarables entonces k=n 3/8 si habia oca diferencia entre las matrices de covarianzas de los gruos y k=n 2/8 si habia bastante diferencia entre las matrices de covarianzas. El sesgo del error de classificación aumenta a medida que k aumenta, en tanto que la varianza disminuye. Se ha demostrado (Cover y Hart, 1967) que la tasa de error del clasificador k-nn es a lo más dos veces la tasa de error ótimo (error del clasificador Bayesiano donde las osteriores son conocidas). 14
15 Ejemlo: Datos de notas eje1dis=read.table( htt://math.urm.edu/~edgar/eje1disc.dat,header=t) > knn(eje1dis[,1:2],eje1dis[,1:2],eje1dis[,4],k=1) [1] f fffffff Levels: f ># errror de clasificacion con k=1 vecinos > exak1=knn(eje1dis[,1:2],eje1dis[,1:2],eje1dis[,4],k=1) > mean(exak1!=eje1dis[,4]) [1] 0 > knn(eje1dis[,1:2],eje1dis[,1:2],eje1dis[,4],k=5) [1] f f f f f ffff Levels: f ># error de clasificacion con k=5 vecinos >exak5=knn(eje1dis[,1:2],eje1dis[,1:2],eje1dis[,4],k=5) > mean(exak5!=eje1dis[,4]) [1]
16 Ejemlo: Frontera de decision EX1 EX2 f f f f f f f f Grafica de las fronteras de knn-1 16
17 Ejemlo de knn: Bua > knn(bua[,1:6],bua[,1:6],bua[,7],k=3) [1] [38] [75] [112] [149] [186] [223] [260] [297] [334] Levels: 1 2 Error de mala clasification or resustitucion > mean(knn(bua[,1:6],bua[,1:6],bua[,7],k=3)!=bua[,7]) [1]
18 Ejemlo (cont) > buak1=knn(bua[,-7],bua[,-7],as.factor(bua[,7]),k=1) > table(buak1,bua[,7]) buak error=0% > buak5=knn(bua[,-7],bua[,-7],as.factor(bua[,7]),k=5) > table(buak5,bua[,7]) buak error=21.44% 18
19 Ejemlo (cont.) ># estimacion del error or el metodo de dejar uno afuera > mean(knn.cv(bua[,1:6],bua[,7],k=5)!=bua[,7]) [1] > mean(knn.cv(bua[,1:6],bua[,7],k=7)!=bua[,7]) [1] > mean(knn.cv(bua[,1:6],bua[,7],k=9)!=bua[,7]) [1] > mean(knn.cv(bua[,1:6],bua[,7],k=11)!=bua[,7]) [1] ># estimacion del error or validacion cruzada > crossval(bua,method="knn",kvec=7,reet=10) [1] > crossval(bua,method="knn",kvec=9,reet=10) [1] > crossval(bua,method="knn",kvec=11,reet=10) [1]
20 Ejemlo de knn: diabetes > diabk3=knn(diabetes[,-9],diabetes[,-9],as.factor(diabetes[,9]),k=3) > table(diabk3,diabetes[,9]) diabk error=14.06% > diabk5=knn(diabetes[,-9],diabetes[,-9],as.factor(diabetes[,9]),k=5) > error=mean(diabk5!=diabetes[,9]) >error #estimacion del error or validacion cruzada crossval(diabetes,method="knn",kvec=3,reet=10) Loading required ackage: class [1] > crossval(diabetes,method="knn",kvec=5,reet=10) [1]
21 Otro clasificador noarametrico Estimacion de densidad or kernel. Pero su mayor desventaja es que es esado comutacionalmente. El mas usado es el kernel gaussiano. Los metodos noarametricos or lo general afrontan el roblema de la maldicion de la dimensionalidad. El numero de datos debe crecer casi exonencialmente al numero de la dimension ara que la estimacion sea buena. 21
Mineria de Datos. Clasificacion Supervisada: Regresion Logistica. Dr. Edgar Acuna Departmento de Matematicas
Mineria de Datos Clasiicacion Suervisada: Regresion Logistica Dr. Edgar Acuna Deartmento de Matematicas Universidad de Puerto Rico- Mayaguez math.urrm.edu/~edgar Consideraremos or ahora que solo tenemos
Más detallesMinería de Datos. Clasificación Supervisada. Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez
Minería de Datos Clasificación Suervisada Dr. Edgar Acuña Deartamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: edgar@math.urm.edu, eacunaf@gmail.com Website: math.urm.edu/~edgar
Más detallesMineria de Datos. Arboles de Decision. Dr. Edgar Acuna Departmento de Matematicas. Universidad de Puerto Rico- Mayaguez academic.uprm.
Mineria de Datos Arboles de Decision Dr. Edgar Acuna Deartmento de Matematicas Universidad de Puerto Rico- Mayaguez academic.urm.edu/eacuna El uso de árboles de decisión tuvo su origen en las ciencias
Más detallesMinería de Datos. Clasificación Supervisada. Dr. Edgar Acuña Departamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez
Minería de Datos Clasificación Suervisada Dr. Edgar Acuña Deartamento de Ciencias Matemáticas Universidad de Puerto Rico-Mayaguez E-mail: edgar@math.urm.edu, eacunaf@gmail.com Website: math.urm.edu/~edgar
Más detallesESTADISTICA ELEMENTAL
ESTADISTICA ELEMENTAL Dr. Edgar Acuna http://academic.uprm.edu/eacuna UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ INTRODUCCIÓN En este capítulo, primero se introducirán algunos conceptos
Más detallesEjemplos: 1) De una urna que contiene 6 bolillas blancas y 4 negras se extraen sin reposición 3 bolillas. Se definen
Probabilidades Estadística Comutación Facultad de Ciencias Eactas Naturales. Universidad de Buenos Aires Ana M. Bianco Elena J. Martínez Vectores aleatorios Hasta ahora hemos estudiado modelos de robabilidad
Más detallesEjemplos: 1) De una urna que contiene 6 bolillas blancas y 4 negras se extraen sin reposición 3 bolillas. Se definen
Probabilidades Estadística Comutación Facultad de Ciencias Eactas Naturales Universidad de Buenos Aires Ana M. Bianco Elena J. Martínez Vectores aleatorios Hasta ahora hemos estudiado modelos de robabilidad
Más detallesAnálisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,
Más detallesAnálisis de Componentes principales -PCA-
Análisis de Comonentes rinciales -PCA- PCA en Teledetección... 1 La idea general... 1 El método...2 La interretación...5 Que es? El PCA constituye un rocedimiento matemático que ermite transformar un número
Más detallesANALISIS DISCRIMINANTE, ESTADISTICA GERENCIAL
UNIVERSIDAD DE PUERTO RICO Recinto de Río Piedras Facultad de Administración de Empresas Instituto de Estadística ANALISIS DISCRIMINANTE, HERRAMIENTA EN ESTADISTICA GERENCIAL José C. Vega Vilca, PhD Presentación
Más detallesEstimación de densidades basada en núcleos: algunos elementos. Isabel Cañette
Estimación de densidades basada en núcleos: algunos elementos básicos. Isabel Cañette Seminario de Reconocimiento de Patrones. Seminario de Probabilidad y Estadística. Diciembre, 2002 Introducción. Decimos
Más detallesAnálisis Matemático Ingenierías en Informática Soluciones del examen de febrero de 2009
Análisis Matemático Ingenierías en Informática Soluciones del examen de febrero de 9. a) Prueba, usando el teorema de Bolzano, que la función f.x/ D e x Cx x se anula en al menos tres untos del intervalo
Más detallesCAPÍTULO 2. En este capítulo se introducirá el marco teórico que se utilizó en la
CAPÍTULO MARCO TEÓRICO En este caítulo se introducirá el marco teórico que se utilizó en la investigación de la incidencia que tiene la Prueba de Atitud Académica (PAA) en el rendimiento académico Es decir,
Más detallesAnálisis de Datos. Clasificación Bayesiana para distribuciones normales. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Clasificación Bayesiana para distribuciones normales Profesor: Dr. Wilfrido Gómez Flores 1 Funciones discriminantes Una forma útil de representar clasificadores de patrones es a través
Más detallesTécnicas Supervisadas Aproximación no paramétrica
Técnicas Supervisadas Aproximación no paramétrica 2016 Notas basadas en el curso Reconocimiento de Formas de F.Cortijo, Univ. de Granada Pattern Classification de Duda, Hart y Storck The Elements of Statistical
Más detallesEL MÉTODO KERNEL DE EQUATING Y SU CONTRAPARTE BAYESIANA NO PARAMÉTRICA: UN ESTUDIO DE COMPARACIÓN BAJO EL DISEÑO DE GRUPOS EQUIVALENTES
EL MÉTODO KERNEL DE EQUATING Y SU CONTRAPARTE BAYESIANA NO PARAMÉTRICA: UN ESTUDIO DE COMPARACIÓN BAJO EL DISEÑO DE GRUPOS EQUIVALENTES Constanza Rojo Alfaro 1, Jorge González Burgos 2 1 Dto de Estadística,
Más detallesAN ALISIS MATEM ATICO B ASICO. N = f0; 1; 2; :::; 8; 9; 10; ::::; 87; 88; :::::; n; n + 1; (n + 1) + 1; ::::g: Figura 1. Los numeros naturales.
AN ALISIS MATEM ATICO B ASICO. DE LOS NATURALES A LOS REALES. Los numeros Naturales N: Los numeros naturales los escribimos con diez dgitos: N = f0; ; ; :::; 8; 9; 0; ::::; 87; 88; :::::; n; n + ; (n +
Más detallesALTERNATIVAS AL GRÁFICO DE PROBABILIDAD NORMAL COMO TEST DE VALIDACIÓN
ISSN 007-197 ALTERNATIVAS AL GRÁICO DE PROBABILIDAD NORMAL COMO TEST DE VALIDACIÓN Ana María Islas Cortes Instituto Politécnico Nacional, ESIT amislas@in.mx Gabriel Guillén Buendia Instituto Politécnico
Más detallesTema 4: VARIABLE ALEATORIA N-DIMENSIONAL
Tema 4: VARIABLE ALEATORIA N-DIMENSIONAL Carlos Alberola López Lab. Procesado de Imagen, ETSI Telecomunicación Despacho D04 caralb@tel.uva.es, jcasasec@tel.uva.es, http://www.lpi.tel.uva.es/sar Concepto
Más detallesSistemas de Reconocimiento de Patrones
Sistemas de Reconocimiento de Patrones p. 1/33 Sistemas de Reconocimiento de Patrones Luis Vázquez GTI - IIE Facultad de Ingeniería Universidad de la República Sistemas de Reconocimiento de Patrones p.
Más detalles- Nombre del documento: Apellido_1_Apellido_2_Nombre_PEC2.pdf.
Sistemas de Comunicaciones I T207-PEC2 Consultor: Francesc Tarrés Fecha entrega: 27 de noviembre de 208 Normas de entrega - Entregar referiblemente un documento en PDF y comrobar que todas las ecuaciones
Más detallesMÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur KNN: VECINO(S) MAS CERCANO(S) K NEAREST NEIGHBORS (KNN) Altura Niño Adulto Mayor Se guardan todos los ejemplos
Más detallesExamen Parcial. Attr1: A, B Attr2: A, B, C Attr3 1, 2, 3 Attr4; a, b Attr5: 1, 2, 3, 4
Aprenentatge 0-03 Q Examen Parcial Nombre: (Examen ) Instrucciones. (0 puntos) Este examen dura horas. Responded todas las preguntas en estas hojas. Para las preguntas test poned un circulo alrededor de
Más detallesProcesamiento Digital de Imágenes
Visión or Comutadora Unidad III Procesamiento Digital de Imágenes Rogelio Ferreira Escutia Contenido 1) Oeraciones Individuales a) Transformaciones Punto a Punto b) Transformaciones de 2 Imágenes Punto
Más detallesANÁLISIS DE COMPONENTES PRINCIPALES
ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta
Más detallesMÉTODOS ESTADÍSTICOS AVANZADOS USADOS EN LOS Sistemas de Información Geográfica. Esperanza Ayuga (2008)
Imagen cortesía de la NASA MÉTODOS ESTADÍSTICOS AVANZADOS USADOS EN LOS Sistemas de Información Geográfica (I. Métodos no paramétricos) Esperanza Ayuga (2008) Índice Introducción Métodos no paramétricos
Más detallesSobre una acotación de Burgess para sumas parciales de Gauss
Sobre una acotación de Burgess ara sumas arciales de Gauss Universidad Autónoma de Madrid htt://www.uam.es/fernando.chamizo Salamanca, 29 de julio de 2009 Índice 1 Sumas generales 2 Sumas mixtas 3 Prueba
Más detallesEstadística Inferencial
Estadística Inferencial 1 Sesión No. 11 Nombre: Regresión y correlación múltile Contextualización En la sesión anterior se resentó la regresión lineal simle y se mostró su uso en la obtención de una ecuación
Más detallesCálculo II 8 de junio de 2016
Cálculo II 8 de junio de 6 Publicación de notas: 3-6-6. Revisión del examen: 6-6-6. Problema (3 untos). Se de ne la siguiente función en R : f (x; y) x 4 + y 4 4xy: (a) Calcula la derivada de f en el unto
Más detallesProceso Selectivo para la XXIII IMC, Bulgaria
Proceso Selectivo ara la XXIII IMC, Bulgaria Facultad de Ciencias UNAM Instituto de Matemáticas UNAM SUMEM Indicaciones Esera la indicación ara voltear esta hoja. Mientras tanto, lee estas instrucciones
Más detallesIntroducción. Existen dos aproximaciones para resolver el problema de clasificación: Aproximación Generativa (vista en el Tema 3) Basada en:
Introducción Eisten dos aproimaciones para resolver el problema de clasificación: Aproimación Generativa (vista en el Tema 3) Basada en: Modelar p(,w)=p( w)p(w) p( w) es la distribución condicional de
Más detallesUNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Fracciones continuas, ecuación de Pell y unidades en el anillo de enteros de los cuerpos cuadráticos
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS EAP DE MATEMÁTICA PURA Fracciones continuas, ecuación de Pell y unidades en el anillo de enteros de los cueros cuadráticos Caítulo
Más detallesI.- Análisis Gráfico Multivariado
I.- Análisis Gráfico Multivariado El análisis multivariado está basado en los rinciios de la Estadística multivariada, la cuál considera la observación y el análisis de más de una variable al mismo tiemo.
Más detallesJuan Carlos Colonia INFERENCIA ESTADÍSTICA
Juan Carlos Colonia INFERENCIA ESTADÍSTICA PARÁMETROS Y ESTADÍSTICAS Es fundamental entender la diferencia entre parámetros y estadísticos. Los parámetros se refieren a la distribución de la población
Más detallesDistribuciones multivariadas
Distribuciones multivariadas Si X 1,X 2,...,X p son variables aleatorias discretas, definiremos la función de probabilidad conjunta de X como p(x) =p(x 1,x 2,...,x k )=P (X 1 = x 1,X 2 = x 2,...,X p =
Más detallesUNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ DEPARTAMENTO DE MATEMATICAS PRIMER EXAMEN DE ESMA EDGAR ACUNA Stre. 97-I NOMBRE...
1 UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ DEPARTAMENTO DE MATEMATICAS PRIMER EXAMEN DE ESMA 3101 EDGAR ACUNA Stre. 97-I NOMBRE... I. (16 pts) ELEGIR LA MEJOR CONTESTACION EN CADA UNA
Más detallesSOLUCIONES AL EXAMEN DE SEPTIEMBRE DE ESTADÍSTICA EXAMEN DE MATEMÁTICAS II
SOLUCIONES AL EXAMEN DE SEPTIEMBRE DE 4. ESTADÍSTICA EXAMEN DE MATEMÁTICAS II Estadística (primer parcial). Septiembre de 4.- El coeficiente de determinación R nos determina a) el % de la varianza de Y
Más detallesy k k=1 k=1 n k=1 l=1 = 1 2
Muestreo. Tarea. Semestre 205-2. Profesora: Guillermina Eslava Gómez. Ayudante: Graciela Martínez Sánchez Fecha de entrega: viernes 27 de febrero en clase Resolver en equipos de a 6 alumnos. Las tareas
Más detallesPredicción basada en vecinos
Predicción basada en vecinos Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Introducción Esquema de predicción directa Predicción basada
Más detallesMATEMATICA CPU Práctica 5 FUNCIONES POLINÓMICAS Y EXPRESIONES RACIONALES. r iv. ( p )( ) v. ( )( )
MATEMATICA CPU FUNCIONES POLINÓMICAS Y EXPRESIONES RACIONALES Sean los olinomios ( 5, q (, r ( y s ( a) Hallar los olinomios: i ( q( ii r( q( s( iii r ( s( iv r ( ( q( b) Calcular: i () ii q ( ) iii (
Más detallesAnálisis de Datos. Estimación de distribuciones desconocidas: métodos no paramétricos. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Estimación de distribuciones desconocidas: métodos no paramétricos Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La estimación de densidad con modelos paramétricos asumen que las
Más detallesAnálisis de Capacidad Multivariada
Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos
Más detallesMATEMÁTICAS ESPECIALES II PRÁCTICA 9 Parte 1 - Series de Fourier
MATEMÁTICAS ESPECIALES II - 18 PRÁCTICA 9 Parte 1 - Series de Fourier Definición. Una función f(x se dice eriódica si existe un número L (llamado eríodo tal que f(x + L = f(x ara todo x (,. Proiedades.
Más detalles286. Microeconomía II Cátedra Prof. Enrique Bour Facultad de Ciencias Económicas Universidad de Buenos Aires Guía de Trabajos Prácticos
II. Teoría del Consumidor EJERCICIO Considere a un individuo que maximiza la siguiente función de utilidad: ux (, x) x a - = x a, 0< a 0. a. Derive
Más detallesUPR Departamento de Ciencias Matemáticas RUM MATE 3171 Primer Examen Parcial 21 de octubre de 2010
UPR Deartamento de Ciencias Matemáticas RUM MATE 37 Primer Eamen Parcial de octubre de 00 Nombre: # Estudiante: Profesor: Sección: Instrucciones: Lea cada regunta minuciosamente. No se ermite el uso de
Más detallesVALUACIÓN DE BONOS. 3. Tasa de rendimiento al vencimiento. las que diversos inversionistas descuentan los flujos futuros de un mismo bono y de esa
1 VALUACIÓN DE BONOS 3. Tasa de rendimiento al vencimiento El recio de mercado de un bono, como cualquier otro activo, se determina or oferta y demanda de numerosos inversionistas. Las tasas de rendimiento
Más detallesPRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Más detallesMATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN ECUACIONES Y GRAFICA DE LA CIRCUNFERENCIA
MATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN ECUACIONES Y GRAFICA DE LA CIRCUNFERENCIA Ecuaciones Una ecuación es la a rmación de que dos exresiones algebraicas son iguales. Los
Más detallesMATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASE # 12
MATEMÁTICAS BÁSICAS UNIVERSIDAD NACIONAL DE COLOMBIA - SEDE MEDELLÍN CLASE # Ecuaciones Una ecuación es la a rmación de que dos exresiones algebraicas son iguales. Los siguientes son ejemlos de ecuaciones:
Más detallesTEMA 11 : ESPACIO AFÍN
TEMA : ESPACIO AFÍN. Ecuaciones de la recta en el esacio Al igual ue en el lano ( R ), en el esacio ( R ), una recta ueda determinada or un unto P(x,y,z ) y un ector director V = (,, ) no nulo. Para ue
Más detallesSistemas de Percepción Visión por Computador
Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión
Más detallesExámen de Teoría de Números
Exámen de Teoría de Número de enero de 06 Hacer 5 de lo 6 roblema La untuación e obre 0 unto Problema a) 0,5 unto) Hallar d06) y φ06) b) 0,5 unto) Se uede ecribir 06 como uma de do cuadrado erfecto? Y
Más detallesGermán Bassi. 9 de septiembre de X(i) = 1 N 1T X. i=1
. Estimación de la Media Germán Bassi 9 de septiembre de 00 Dada la variable aleatoria X, podemos estimar el valor esperado de la misma mediante la siguiente fórmula: µ X = X(i) = T X. Ambas representaciones
Más detallesGraficación. Clipping 2D. Clipping 2D: en un punto. Clipping 2D: en una línea. Clipping - Algoritmos de corte
Cliing 2D Graficación Cliing - Algoritmos de corte Dada una figura, or lo general sólo una arte de ella es visualizada a arte visualizada es esecificada mediante la window cliing Cliing seara los elementos
Más detallesIdentificación n de SIStemas
Identificación n de SIStemas Métodos de Estimación n Recursivos ISIS J. C. Gómez Métodos de Identificación n Recursivos Mínimos Cuadrados Recursivos ara una estructura de modelo de regresión lineal y n
Más detallesAprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur Aprendizaje de distancias Kilian Q. Weinberger, Lawrence K. Saul: Distance Metric Learning for Large Margin
Más detallesMATERIA: MATEMÁTICAS APLICADAS A LAS CC. SOCIALES
UNIVERSIDDES PÚLICS DE L COMUNIDD DE MDRID PRUE DE CCESO ESTUDIOS UNIVERSITRIOS (LOGSE) 00 008 (Setiembre) MTERI: MTEMÁTICS PLICDS LS CC. SOCILES INSTRUCCIONES GENERLES Y VLORCIÓN INSTRUCCIONES: El alumno
Más detallesSoluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II
Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Alicadas a las iencias Sociales II Antonio Francisco Roldán Lóez de Hierro * onvocatoria de 2006 Las siguientes áginas contienen
Más detallesMecánica Teórica Curso Boletín 7
Mecánica Teórica Curso 017-18 Boletín 7 Física Teórica, Universidad de Sevilla 7 de diciembre de 017 1.- Para una artícula libre con Hamiltoniano: H = H(q, ) = m, donde m es la masa de la artícula, obtener
Más detallesTema 2: Análisis Discriminante
Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación
Más detallesEjercicio 1. Ejercicio 2
Guía de Ejercicios Ejercicio. Calcular los momentos de primer y segundo orden (media y varianza) de una variable aleatoria continua con distribución uniforme entre los límites a y b.. Sabiendo que la función
Más detallesGráfico de Control T-Cuadrada Multivariada
Gráfico de Control T-Cuadrada Multivariada STATGRAPHICS Rev. 25/04/2007 Resumen El procedimiento Gráfico de Control T-Cuadrada Multivariada crea diagramas de control para dos o más variables numéricas.
Más detallesGEOESTADÍSTICA APLICADA
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO GEOESTADÍSTICA APLICADA Tema: Análisis Exploratorio de Datos Instructores: Dr. Martín A. Díaz Viera (mdiazv@imp.mx) Dr. Ricardo Casar González (rcasar@imp.mx) 2009
Más detallesTema 1. Cinemática de partícula
Tema 1. Cinemática de artícula Cinemática de artícula Tema 1 1. Introducción. Vectores osición, velocidad y aceleración 3. 4. Método gráfico en movimiento rectilíneo 5. de varias artículas Mecánica II
Más detallesSintaxis LÓGICA COMPUTACIONAL CÁLCULO DE PROPOSICIONES. Funciones boolenas. Semántica
Proosiciones atómicas y comuestas Sintaxis LÓGICA COMPUTACIONAL CÁLCULO DE PROPOSICIONES Francisco Hernández Quiroz Deartamento de Matemáticas Facultad de Ciencias, UNAM E-mail: fh@cienciasunammx Página
Más detallesSEGUNDA PRUEBA. 26 de febrero de 2010 INSTRUCCIONES. Esta prueba consiste en la resolución de un problema de tipo experimental
SEGUNDA PRUEBA 6 de febrero de 010 : INSTRUCCIONES Esta rueba consiste en la resolución de un roblema de tio exerimental Razona siemre tus lanteamientos No olvides oner tus aellidos, nombre y datos del
Más detallesTabla 7: Ejemplo matriz CaractE
8 RESULTADOS EXPERIMENTALES 8.1 MATRICES DE CARACTERÍSTICAS Con el fin de dar una idea más precisa de cómo se conforman las matrices de características usadas en el reconocimiento de patrones y qué valores
Más detallesTransformaciones y esperanza
Capítulo 3 Transformaciones y esperanza 3.1. Introducción Por lo general estamos en condiciones de modelar un fenómeno en términos de una variable aleatoria X cuya función de distribución acumulada es
Más detallesHoja 4 Variables aleatorias multidimensionales
Hoja 4 Variables aleatorias multidimensionales 1.- Estudiar si F (x, y) = 1, si x + 2y 1, 0, si x + 2y < 1, es una función de distribución en IR 2. 2.- Dada la variable aleatoria 2-dimensional (X, Y )
Más detalles(x) = 1 si P (Y = 1 X = x) P (Y = 0 X = x) P (Y = 0 X = x) > P (Y = 1 X = x) P (X = x Y = 0)P (Y = 0) > P (X = x Y = 1)P (Y = 1)
1 1. Conceptos generales de clasificación 2. Clasificador k-vecino más cercano 3. Clasificador Bayesiano óptimo 4. Análisis discriminante lineal (LDA) 5. Clasificadores lineales y el Modelo perceptrón
Más detallesIdentificación de Sistemas
Identificación de Sistemas Estimación de Mínimos Cadrados Ator: Dr. Jan Carlos Gómez Estimación n de Mínimos M Cadrados ara Estrctra de Regresor ineal Se asme qe la relación entrada-salida ede ser descrita
Más detalles5.2. Selección Adversa parte II el modelo de Rothschild y Stiglitz (1976)
5.. Selección Adversa arte II el modelo de Rothschild y Stiglitz (1976) Matilde P. Machado matilde.machado@uc3m.es Resumen: Muestra el imacto de la información imerfecta en el resultado de equilibrio de
Más detallesÍndice general. Prefacio...5
Índice general Prefacio...5 Capítulo 1 Introducción...13 1.1 Introducción...13 1.2 Los datos...19 1.3 Etapas en los procesos de big data...20 1.4 Minería de datos...21 1.5 Estructura de un proyecto de
Más detallesProbabilidad Condicional
Probabilidad Condicional Ejemplo: Se tiene que dos bolas son seleccionadas aleatoriamente (sin reemplazo) de un caja que contiene r bolas rojas y b bolas azules. Cuál es la probabilidad de que la primera
Más detallesAprendizaje inductivo no basado en el error Métodos competitivos supervisados.
Aprendizaje inductivo no basado en el error Métodos competitivos supervisados. Aprendizaje basado en instancias Carlos J. Alonso González Departamento de Informática Universidad de Valladolid Contenido
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesANALISIS DE FRECUENCIA EN HIDROLOGIA
ANALISIS DE FRECUENCIA EN HIDROLOGIA Luis F. Carvajal Julián D. Rojo Universidad Nacional de Colombia Facultad de Minas Escuela de Geociencias y Medio Ambiente Introducción 1. Los eventos hidrológicos
Más detallesConceptos de Probabilidad y estadística. Jhon Jairo Padilla A., PhD
Conceptos de Probabilidad y estadística Jhon Jairo Padilla A., PhD Introducción La ingeniería de tráfico está soportada sobre conceptos de probabilidad y estadística como: Probabilidad Variable aleatoria
Más detallesDISEÑO Y CÁLCULO DE TAMAÑO DE MUESTRA PARA SU APLICACIÓN A LOS ESTUDIOS DE INVESTIGACIÓN. FACILITADOR: JOSÉ CRISTO NOVA
DISEÑO Y CÁLCULO DE TAMAÑO DE MUESTRA PARA SU APLICACIÓN A LOS ESTUDIOS DE INVESTIGACIÓN. FACILITADOR: JOSÉ CRISTO NOVA INTRODUCCIÓN Los profesionales y docentes del área de la metodología de investigación
Más detallesUNIVERSIDAD NACIONAL DE CORDOBA TITULO
UNIVERSIDAD NACIONAL DE CORDOBA TITULO METODOS NO PARAMETRICOS DE CLASIFICACION CON VARIABLES CONTINUAS. CASO DE APLICACIÓN EN UNA MUESTRA DE EMPRESAS QUE OPERAN BAJO LA FORMA DE SOCIEDADES ANÓNIMAS EN
Más detallesAnálisis de Señales en Geofísica
Análisis de Señales en Geofísica 4 Clase Facultad de Ciencias Astronómicas y Geofísicas, Universidad Nacional de La Plata, Argentina 1 kz cula o diolo 1 1 kz inversa de un diolo 1+kz cociente de diolos
Más detallesAcerca de las matrices elementales y sus inversas
Acerca de las matrices elementales y sus inversas Matriz ermutación: Se denomina matriz ermutación a una matriz cuadrada en la que en cada fila y columna hay un único elemento distinto de cero e igual
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detallesPart VII. Estadística I. Mario Francisco. Introducción a la inferencia. Estimación puntual. Propiedades deseables de los estimadores
Part VII La inferencia puede definirse como el conjunto de métodos mediante cuales podemos extraer información sobre distintas características de interés de cierta distribución de probabilidad de la cual
Más detallesBloque 33 Guía: Ecuación de la recta en el plano cartesiano SGUICEG055EM33-A17V1
SGUICEG055EM-A7V Bloque Guía: Ecuación de la recta en el lano cartesiano TABLA DE CORRECCIÓN ECUACIÓN DE LA RECTA EN EL PLANO CARTESIANO N Clave Dificultad estimada B Alicación Media A Alicación Media
Más detallesEscuela Universitaria Politécnica Examen de Cálculo - Febrero - Curso 01/02
Escuela Universitaria Politécnica Examen de Cálculo - Febrero - Curso 0/02 x 2 + y 4. (a) Comprueba que el siguiente límite no existe lim (x,y) (0,0) x 2 + y. 2 (b) Busca una trayectoria a través de la
Más detallesAlgunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda
Más detallesEjercicios Tema 7. que tenga los mismos datos que la Pila original pero. Diséñese un método que invierta recursivamente una Cola dada.
Ejercicios Tema 7 Ejercicios Adatados de Auntes y Exámenes de EDA Germán Moltó gmolto@dsic.uv.es Estructuras de Datos y Algoritmos Escuela Técnica Suerior de Ingeniería Informática Universidad Politécnica
Más detalles7. DISTRIBUCIOES DISCRETAS DE PROBABILIDAD
7. DISTRIBUCIOES DISCRETAS DE PROBABILIDAD La Distribución Binomial Esta distribución fue elaborada or Jacobo Bernoulli y es alicable a un gran número de roblemas de carácter económico y en numerosas alicaciones
Más detallesConceptos de Probabilidad y estadística. Jhon Jairo Padilla A., PhD
Conceptos de Probabilidad y estadística Jhon Jairo Padilla A., PhD Introducción La ingeniería de tráfico está soportada sobre conceptos de probabilidad y estadística como: Probabilidad Variable aleatoria
Más detallesDepartamento de Ingeniería Matemática- Universidad de Chile
Ingeniería Matemática FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS UNIVERSIDAD DE CHILE Álgebra Lineal 08-4 Matrices elementales SEMANA 2: MATRICES Como veremos la resolución de sistemas de ecuaciones via
Más detallesInferencia Estadística
Inferencia Estadística 2do C. 2018 Mg. Stella Figueroa Clase Nº10 Población y Muestra- Parámetro y Estimación puntual Población: Es el conjunto de todos los elementos o unidades elementales con características
Más detallesANÁLISIS DE COMPONENTES PRINCIPALES
ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta
Más detallesCI 41C HIDROLOGÍA HIDROLOGÍA PROBABILÍSTICA
CI 41C HIDROLOGÍA HIDROLOGÍA PROBABILÍSTICA alcantarilla Puente? Badén http://www.disasternews.net/multimedia/files/drought5_9412.jpg Fenómenos en Ingeniería (según certeza de ocurrencia) determinísticos
Más detallesAnálisis de Datos. Análisis lineal discriminante. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Análisis lineal discriminante Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Para reducir el error de clasificación algunas veces es necesario identificar el subconjunto de características
Más detallesXAX > i 0. i 4 2i. 2 i i 8
Álgebra Lineal Caítulo. Tóicos Eseciales y Alicaciones.. Matrices y formas ositivas En esta sección estudiamos matrices ositivas, formas sesquilineales ositivas, y formas cuadráticas ositivas. a. Matrices
Más detallesCOMP 6315 Mineria de Datos
COMP 6315 Mineria de Datos CLASE 2: TIPO de Datos (basada en notas del Prof V. Kumar) Dr. Edgar Acuna Departmento de Matematicas Universidad de Puerto Rico- Mayaguez academic.uprm.edu/eacuna/comp3015.html
Más detallesAprendizaje Automático
Regresión Lineal: Descenso de Gradiente Árboles de Regresión: M5 Ingeniería Informática Fernando Fernández Rebollo y Daniel Borrajo Millán Grupo de Planificación y Aprendizaje (PLG) Departamento de Informática
Más detalles