ANÁLISIS DISCRIMINANTE (AD)
|
|
- Elena Lagos Blanco
- hace 7 años
- Vistas:
Transcripción
1 discrim_predictivo.doc 30//05 vgg ANÁLISIS DISCRIMINANTE (AD) Regresión con respuesta categórica Y Cómo depende Y de las variables X, X,... X p? cualitativa cuantitativas Planteamiento Predictivo del AD: Cómo predecir Y a partir de los valores observados X, X,... X p? Planteamiento Descriptivo del AD: Y determina k grupos, a caracterizar en términos de X, X,... X p Qué variables cambian más a través de los grupos? Qué características tiene cada grupo? INTRODUCCIÓN Ejemplo: Caracterización de especies. Mediante la longitud y anchura de pétalos y sépalos vables cuantitativas X, X, X 3 y X 4 -. Cómo distinguir (discriminar) tres especies de Iris (Setosa, Versicolor y Virginica) -vble Y-? Ejemplo: Diagnóstico automático. Por los resultados de diferentes pruebas diagnósticas -vables cuantitativas X X p - Cómo reconocer una enfermedad distinguiéndola de otras similares -vble Y-? Ejemplo3: Reconocimiento de formas o textos. A partir de diferentes medidas - vables cuantitativas X X p - de una imagen capturada Cómo identificar una pieza (reconocimiento de formas) o una letra (rec. de textos) -vble Y-? Cómo identifica google a una persona (reconocimiento de imagen) en una fotografía? Ejemplo 4: Valoración de riesgos. Una entidad financiera desea valorar el riesgo de una posible operación crediticia personal catalogándola como muy segura, segura, normal, algo insegura o muy insegura -vble Y-. Para ello dispone de información sobre el cliente, relativa a otras operaciones realizadas con la entidad, declaraciones de renta y patrimonio, etc -vables X Xp- Ejemplo 5: Control de fraude fiscal. La Agencia Tributaria va a revisar declaciones de renta sospechosas de fraude. Para seleccionarlas utiliza las declaraciones de los últimos años - vables X Xp- y los resultados de las inspecciones realizadas en ejercicios anteriores correcta, fraude leve, fraude grave, fraude muy grave-.
2 discrim_predictivo.doc 30//05 vgg. Análisis Discriminante / Plantemiento Predictivo Objetivo: Asignar grupo a nuevos individuos. Observamos las variables X i o en varios individuos de cada grupo (observaciones de calibración) o y en otros individuos sin catalogar (observaciones a asignar). Un nuevo individuo del cual sólo conocemos los valores X i debe asignarse a un grupo. o desconocemos a qué grupo pertenece o tomamos una decisión basándonos en la información que proporcionan las denominadas observaciones de calibración o aprendizaje (individuos para los que conocemos tanto los valores X i como el grupo al que pertenecen).. Análisis Discriminante / Plantemiento Descriptivo Objetivo: Caracterizar los grupos En qué difieren? Variables originales: detectamos las variables X i de más poder discriminante, aquellas que mejor diferencian los grupos. Variables artificiales (Análisis Discriminante Factorial): Buscamos aquellas combinaciones lineales de las X i que mejor recogen las diferencias entre grupos. Las interpretamos y las utilizamos para representar gráficamente los grupos, detectando características más complejas que los diferencian..3 Datos en AD:.4 Análisis Discriminante y Clasificación En AD los grupos están definidos y se conocen para las observaciones de calibración; se estudian sus características y se asigna grupo a nuevos individuos. En Clasificación Automática, por el contrario, los posibles grupos no se conocen y es la propia estructura de los datos quien los determina.
3 discrim_predictivo.doc 30//05 vgg 3 Un primer paso: MANOVA previo al AD La longitud y anchura media de los pétalos cambian de una variedad a otra? Los valores medios de las pruebas analíticas difieren según la enfermedad? Las medias de las características que observo sobre cada imagen captada, varían al cambiar de objeto? Observadas p variables conjuntamente para individuos dentro de cada grupo, podemos analizar mediante un MANOVA si las media p-dimensional (de las variables X, X,... X p ) es cambiante através de los k grupos, o por el contrario, no se aprecia efecto grupo. MANOVA de factor Y (grupo), con variables explicativas X, X,... X p (cuantitativas) Cada nivel del factor Y define un grupo. H 0 : NO EFECTO. La media p-dim se mantienen a través de los k grupos: = = = k Nota recordatoria: El Manova requiere normalidad y homocedasticidad. Obviamente, tiene sentido realizar un Análisis Discriminante que estudie las diferencias entre grupos sólo cuando se rechaza H 0 Cuando el MANOVA rechaza la igualdad de medias a través de los grupos, el ADD caracteriza las diferencias entre grupos (Planteamiento Descriptivo) ADP predice el grupo de individuos sin catalogar (Planteamiento Predictivo) 3 ADP ANÁLISIS DISCRIMINANTE / planteamiento PREDICTIVO Indice de la Sección 3 3. DOS poblaciones N p ( i, i ) 's iguales: Función Lineal Discriminante de Fisher i y conocidas enfoque poblacional i desconocidas; conocida enfoque muestral i y desconocidas asumimos enfoque muestral 3. DOS poblaciones N p ( i, i) 's diferentes: Función Discriminante Cuadrática i y i conocidas enfoque poblacional i ó i desconocidas SIN asumir enfoque muestral 3.3 k poblaciones N p ( i, i) 3. DOS poblaciones N p ( i, i ) 's iguales Función Lineal Discriminante de Fisher p= p= Enfoque Poblacional (densidades conocidas)
4 discrim_predictivo.doc 30//05 vgg 4 i y conocidas (caso - enfoque poblacional - Población : x ~ N p (, ) Población : x ~ N p (, ) diferencia entre las dos medias p-dim = - distancia de Mahalanobis entre ellas t - - ) t - - ) Nuevo elemento, de población desconocida: x 0 0 x 0 ~ N p ( 0, ) Problema: 0 ó 0? Idea: Discriminar mediante una combinación lineal L(x) a t x Optimo: qué dirección a separa mejor los grupos? x / a t x > k x / a t x < k Búsqueda de la dirección a óptima a efectos de discriminación: Para cada a, a t x 0 es una c.l. de sus componentes: a t x 0 ~ N (a t 0, a t a) Busco la dirección a que mejor discrimina entre los dos grupos, es decir, que maximiza la separación (homogeneizada) entre las medias transformadas: a t, a t f.objetivo: (a μ - a μ ) (a δ ) (a Σ Σ δ ) a Σa. δσ δ = δ Σδ= a Σa a Σa a Σa a Σa t t t t / -/ t - () - a t t t t () resulta de aplicar la desigualdad de Cauchy Schwarz a los dos vectores / -/ u Σ a y v Σ δ la igualdad () sólo se alcanza cuando los vectores u y v son colineales, es decir, / -/ Σ a = λ Σ δ, de donde obtenemos la solución a, única salvo factor escala () Solución: a = - - ( - ) (ó a, puesto que Valor máximo de = Δ 0 ) a : t - =, dist de Mahalanobis entre y. Datos proyectados, a t x, sobre esta dirección a óptima: Para esta a, a a t x = ( - ) t - x L(x) La función L recibe el nombre de Función Lineal Discriminante de Fisher (que se utiliza para construir diferentes reglas de clasificación) λa
5 discrim_predictivo.doc 30//05 vgg 5 Regla de clasificación A partir de L(x 0 ) (valor que toma la función lineal discriminante L para la nueva observación x 0 ), decido a qué población se asigna la nueva observación x 0 : t x 0 si a x 0 > k para ello utilizo una Regla de clasificación : [] t x 0 si a x 0 < k Errores al aplicar una regla de clasificación []: Error tipo : Error tipo : t - t - k - δσ μ Probabilidades: e = ( - k + δσ μ ) e = ( ) Qué k elijo? La k que dé alguna propiedad deseable; por ejemplo e = e : ) Igual probabilidad de clasificación errónea: e = e = ( ) k 0 = ½ t - ( + ) = ½ ( t - - t - ) punto medio Regla de discriminación lineal de Fisher: x 0 si a t x 0 > k 0, es decir x 0 si ( - ) t - x 0 - ( t - - t - ) > 0 [] equivalentemente, x 0 si t - x 0 - t - > t - x 0 - t - Otros criterios ) Mínima Distancia: asigno a la población de cuya media diste menos. Regla MD: x 0 si (x 0, ) < (x 0, ): (x 0 - ) t - (x 0 - ) < (x 0 - ) t - (x 0 - ) Es fácil ver que coincide con la regla de discriminación lineal. 3) Razón de verosimilitud: asigno a la población con función de densidad mayor Regla RV: en este caso también coincide con la regla de discriminación lineal 4) Bayes. Modifico la regla incorporando información a priori y costes. Probabilidades a priori: q q Costes de clasificación errónea: c c Regla de Bayes: coincide con la de Fisher para k= k 0 + d con d= c q / c q - - Nota: esta regla produce e e e = ( d Δ ) e = ( d Δ )
6 discrim_predictivo.doc 30//05 vgg 6 i desconocidas; conocida (caso - enfoque muestral - Enfoque Muestral (densidades con parámetros desconocidos) Observo n individuos en la población ; media muestral x n individuos en la población ; media muestral x Sustituyo en [] las i, ahora desconocidas por sus estimaciones por x i y tengo una nueva versión de la regla de discriminación lineal de Fisher: x 0 si ( x - x ) t - x 0 - ( x t - x - x t - x ) > 0 [3] Nota: Sigue coincidiendo con la regla DM, pero con la RV sólo si n = n. Aproximaciones asintóticas (Okamoto) para e y e (valores teóricos) e ( ) + a / n + a / n e ( ) + a / n + a / n Δ +(p-) Δ - 4 (p-) siendo a = Φ (Δ), a = Φ (Δ) 6Δ 6Δ Estimación de errores: e y e se pueden estimar por dos procedimientos a) sustituyendo, desconocido, por ˆΔ en las aproximaciones de Okamoto: t - ˆΔ= (x- x ) Σ (x- x ) b) jacknife: Se toma una observación de y se le aplica la regla de discriminación lineal como si desconociéramos a qué grupo pertenece. Calculo la media muestral omitiendo esta observación x i y se utiliza esta media muestral x (i) en [3] para asignar grupo a la observación omitida. Vemos si la asignación es correcta. Se aplica la regla una tras otra a todas las observaciones de cada grupo. Utilizamos la proporción de asignaciones erróneas para estimar e y e : m m ê= ê= donde m i representa el nº de individuos de i mal asignados. n n
7 discrim_predictivo.doc 30//05 vgg 7 i y desconocidas (caso -enfoque Muestral- Estimador pooled de a partir de las desviaciones a la media muestral de cada grupo: S p = n n [ (xt t i x)(x- i x)+ (x n + i - x)(x n + i - x)] f, con f= n +n - i= i= Esta versión [4] de la regla de discriminación lineal de Fisher utiliza S p en lugar de que ahora se desconoce: x 0 si ( x - x ) t S - p x 0 - ( x t - S p x - x t - S p x ) > 0 [4] Nota: coincide con la regla DM, pero con la RV sólo si n = n : x 0 si d - (x 0, x ) < d - (x S 0, x ) (regla RV) p Sp + + n n Aproximaciones asintóticas (Okamoto) para e y e e ( ) + a / n + a / n + a 3 / f e ( ) + a / n + a / n + a 3 / f siendo a y a las expresiones de 3.. y a 3 = Δ (p-) Φ (Δ) 4 Estimación de errores: e y e se estiman por los mismos procedimientos que en 3..: a) sustituyendo en las aproximaciones de Okamoto, desconocido, por ˆΔ f-p- t - ˆΔ = (x- x)s(x- p x) f b) jacknife: Como en 3.. pero utilizando S p en lugar de desconocida). Nota: a) es mejor que b) bajo normalidad, pero b) es mejor que a) cuando utilizo esta regla de discriminación lineal sobre datos que NO son normales.
8 discrim_predictivo.doc 30//05 vgg 8 3. DOS poblaciones N p ( i, i ) 's diferentes Función Discriminante Cuadrática i y i conocidas ( ) - enfoque poblacional - Criterio de Mínima Distancia (MD): asigno a la población de cuya media diste menos. Regla MD: x 0 si (x 0, ) < (x 0, ): (x 0 - ) t - (x 0 - ) < (x 0 - ) t - (x 0 - ) x / (x, ) < (x, ) x / (x, ) < (x, ) i ó i desconocidas (SIN asumir - enfoque muestral Cuando se desconocen los parámetros, los sustituimos por estimadores: Regla MD x 0 si ˆΔ (x 0, ) < ˆΔ (x 0, ): (x 0 - x ) t - S (x 0 - x ) < (x 0 - x ) t S - (x 0 - x ) Las probabilidades de clasificación errónea, e y e, se estiman por jacknife.
9 discrim_predictivo.doc 30//05 vgg k poblaciones N p ( i, i) 3.3. Asumiendo k (desconocida) - enfoque muestral x i : vector media muestral basado en n i observaciones de la población i. k S p matriz de covarianzas muestral pooled con f= n- k i= i g.de l. Nuevo elemento: x 0 ~ N p ( 0, ) Regla MD de Mínima Distancia (también RV): x 0 i si d (x, x ) - d (x, x ) j - S p 0 i S 0 j p Regla de Discriminación lineal: (es lineal en x o ) x 0 i si xsx- xsx sup xsx- xsx t - t - t - t - i p 0 i p i j... k j p 0 j p j [5] Carecemos de expresiones para las probabilidades de clasificación errónea; se estiman por métodos jacknife Sin asumir k (desconocidas) - enfoque muestral Asignamos de forma similar que en 3.3., pero utilizando en la regla [5] cada S i en lugar del estimador común pooled S p : x 0 i si xsx- xsx sup xsx- xsx t - t - t - t - i i 0 i i i j... k j j 0 j j j [6] Población y muestra Densidades conocidas muestras Muestras de densidades desconocidas Si conocemos las distribuciones teóricas, podemos utilizar las correspondientes versiones poblacionales, con las covarianzas teóricas i en lugar de las estimadas S i.
10 discrim_predictivo.doc 30//05 vgg Métodos no paramétricos Existen métodos alternativos para situaciones en que las variables discriminantes no son Np dentro de cada grupo. Los más conocidos son los métodos de vecinos próximos y los basados en estimación no paramétrica de la densidad Vecinos próximos El criterio se basa en medir proximidad a base de acumular las distancias del individuo con grupo desconocido a los t individuos más próximos de cada grupo y asignarlo finalmente al grupo más cercano. Para asignar un individuo x i a un grupo, el método de t vecinos localiza dentro de cada grupo los t individuos más próximos al aspirante x i. Son los llamados vecinos más próximos. La suma de estas t distancias se utiliza como indicador de la separación entre el aspirante y el grupo. El individuo se asigna al grupo más próximo. SAS/Discrim permite computar distancias de Mahalanobis con la matriz de covarianzas específica de cada grupo o bien con la pooled S p Estimación de densidades Como primer paso, aplicamos métodos no paramétricos de estimación de la densidad y a partir de las observaciones de calibración obtenemos un estimador dentro de cada grupo. Después construyo reglas de asignación similares a las del apartado 3, sólo que en lugar de utilizar densidades normales multivariantes, empleamos estas estimaciones obtenidas por métodos no paramétricos. Así, obtengo nuevas reglas de discriminación por el método de máxima verosimilitud o por el de Bayes cuando incorporamos información a priori sobre la probabilidad de pertenencia a cada grupo: Grupo k probs a priori p() p() p(k) densidades f(x/) f(x/) f(x/k) (conocidas o estimadas) p(i) f(x/i) probs a posteriori p(/x) p(/x) p(k/x) con p(i/x)= k p(j) f(x/j) SAS/Discrim ofrece el método Núcleo con núcleo uniforme, normal, epanechnikov y parámetro de suavizado común para todos los grupos o específico para cada grupo. j=
Clasificación. Aurea Grané. Análisis Discriminante
Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis discriminante Análisis Discriminante y Clasificación Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Supongamos
Más detallesTema 2: Análisis Discriminante
Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación
Más detallesCapítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Más detallesMÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
Más detallesSistemas de Reconocimiento de Patrones
Sistemas de Reconocimiento de Patrones p. 1/33 Sistemas de Reconocimiento de Patrones Luis Vázquez GTI - IIE Facultad de Ingeniería Universidad de la República Sistemas de Reconocimiento de Patrones p.
Más detallesANÁLISIS DISCRIMINANTE
DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis
Más detallesTema 8. Fundamentos de Análisis discriminante
Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. Tema 8. Fundamentos de Análisis discriminante 8.1. Introducción. Empezamos deniendo el problema discriminante.
Más detallesClasificación y regresión logística
Clasificación y regresión logística José R. Berrendero Universidad Autónoma de Madrid Contenidos Planteamiento del problema de clasificación supervisada Regla lineal de Fisher Regresión logística Optimalidad:
Más detallesECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
Más detallesTema 6: Introducción a la Inferencia Bayesiana
Tema 6: Introducción a la Inferencia Bayesiana Conchi Ausín Departamento de Estadística Universidad Carlos III de Madrid concepcion.ausin@uc3m.es CESGA, Noviembre 2012 Contenidos 1. Elementos básicos de
Más detallesRECONOCIMIENTO DE PAUTAS
RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes
Más detallesTema 3: Estimación estadística de modelos probabilistas. (primera parte)
Tema 3: Estimación estadística de modelos probabilistas. (primera parte) Estructura de este tema: 1. 2 Estimación por intervalos de confianza. 3 Contrastes de hipótesis. Planteamiento del problema Inconveniente:
Más detallesFormulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico
Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más
Más detallesPRÁCTICA I. Ejercicios Teóricos
PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las
Más detallesCONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN
CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN Antonio Morillas A. Morillas: C. no paramétricos (II) 1 1. Contrastes de aleatoriedad. Contraste de rachas. 2. Contrastes de localización 2.1 Contraste
Más detallesCONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región
Más detallesUNIVERSIDAD DE MANAGUA Al más alto nivel
UNIVERSIDAD DE MANAGUA Al más alto nivel Estadística Inferencial Encuentro #9 Tema: Estimación puntual y por Intervalo de confianza Prof.: MSc. Julio Rito Vargas A. Grupos: CCEE y ADMVA /2016 Objetivos:
Más detallesTema 3 Normalidad multivariante
Aurea Grané Máster en Estadística Universidade Pedagógica Aurea Grané Máster en Estadística Universidade Pedagógica Tema 3 Normalidad multivariante 3 Normalidad multivariante Distribuciones de probabilidad
Más detallesJuan Carlos Colonia INFERENCIA ESTADÍSTICA
Juan Carlos Colonia INFERENCIA ESTADÍSTICA PARÁMETROS Y ESTADÍSTICAS Es fundamental entender la diferencia entre parámetros y estadísticos. Los parámetros se refieren a la distribución de la población
Más detallesCONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región
Más detallesEstadística Diplomado
Diplomado HRB UNAM 1 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 / 25 1 Estimación Puntual Momentos Máxima Verosimiltud Propiedades 2 Estimación por Intervalos Cantidades Pivotales
Más detallesUNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:
Más detallesT2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
Más detallesEXAMEN DE ESTADÍSTICA Septiembre 2011
EXAMEN DE ESTADÍSTICA Septiembre 2011 Apellidos: Nombre: DNI: GRUPO: 1. De una clase de N alumnos se tiene la siguiente información sobre las calificaciones obtenidas del 1 al 8 en una cierta asignatura
Más detalles7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño
7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL Jorge Eduardo Ortiz Triviño jeortizt@unal.edu.co http:/www.docentes.unal.edu.co/jeortizt/ Introducción Los datos frecuentemente son dados para valores
Más detallesConceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.
Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Tema 1 (III) Estadística 2 Curso 08/09 Tema 1 (III) (Estadística 2) Contrastes de bondad de
Más detallesTema 4: Estimación por intervalo (Intervalos de Confianza)
Tema 4: Estimación por intervalo (Intervalos de Confianza (a partir del material de A. Jach (http://www.est.uc3m.es/ajach/ y A. Alonso (http://www.est.uc3m.es/amalonso/ 1 Planteamiento del problema: IC
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesDiplomado en Estadística Aplicada
Diplomado en Estadística Aplicada Con el propósito de mejorar las habilidades para la toma de decisiones, la División de Estudios de Posgrado de la Facultad de Economía ha conjuntado a profesores con especialidad
Más detallesDISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO
TEMA II ESQUEMA GENERAL Diseño experimental de dos grupos: definición y clasificación Formatos del diseño y prueba de hipótesis Diseño experimental multigrupo: definición Formato del diseño multigrupo
Más detallesEjercicio Heterocedasticidad_2
Ejercicio heterocedasticidad 2. 1 Ejercicio Heterocedasticidad_2 Tengamos los siguientes datos de los beneficios (B i ) y ventas (V i ) de 20 empresas: obs B V 1 13,2 61 2 15 78 3 22,2 158 4 15,2 110 5
Más detallesRepaso de Probabilidad y Estadística
Repaso de Probabilidad y Estadística Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Febrero 2011 Probabilidad 2 Definición.............................................................
Más detallesTema 4. Análisis multivariante de la varianza
Máster en Técnicas Estadísticas Análisis Multivariante Año 2008 2009 Profesor: César Sánchez Sellero Tema 4 Análisis multivariante de la varianza 4 Presentación del modelo Se trata de comparar las medias
Más detallesEstimación de densidades basada en núcleos: algunos elementos. Isabel Cañette
Estimación de densidades basada en núcleos: algunos elementos básicos. Isabel Cañette Seminario de Reconocimiento de Patrones. Seminario de Probabilidad y Estadística. Diciembre, 2002 Introducción. Decimos
Más detallesEjercicio 1. Ejercicio 2
Guía de Ejercicios Ejercicio. Calcular los momentos de primer y segundo orden (media y varianza) de una variable aleatoria continua con distribución uniforme entre los límites a y b.. Sabiendo que la función
Más detallesPrácticas Tema 5. Ampliaciones del Modelo lineal básico
Prácticas Tema 5. Ampliaciones del Modelo lineal básico Ana J. López y Rigoberto Pérez Dpto. Economía Aplicada, Universidad de Oviedo PRÁCTICA 5.1. Se ha examinado la evolución reciente de las ventas de
Más detallesEconometría II. Hoja de Problemas 1
Econometría II. Hoja de Problemas 1 Nota: En todos los contrastes tome como nivel de significación 0.05. 1. SeanZ 1,...,Z T variables aleatorias independientes, cada una de ellas con distribución de Bernouilli
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesTécnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste
Técnicas de Inferencia Estadística II Tema 3. Contrastes de bondad de ajuste M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 3. Contrastes de bondad
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detalles1. Muestreo e Inferencia Estadística
Tema 6: Introducción a la Inferencia Estadística Objetivos Introducir los conceptos elementales en esta parte de la asignatura. Tratar con muestras aleatorias y su distribución muestral en ejemplos de
Más detallesAplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.
Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así
Más detallesMétodos estadísticos de clasificación
Métodos estadísticos de clasificación Preparado por Luis M. Molinero (Alce Ingeniería) CorreoE: bioestadistica alceingenieria.net Artículo en formato PDF Diciembre 2002 www.seh lelha.org/stat1.htm El problema
Más detallesESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 22 - Diciembre - 2.006 Primera Parte - Test Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Más detallesESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio
ESTADÍSTICA I Tema 2: Algunas ideas básicas sobre inferencia estadística. Muestreo aleatorio Muestra aleatoria Conceptos probabiĺısticos básicos El problema de inferencia Estadísticos. Media y varianza
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación Facultad de Ciencias Sociales, UdelaR Índice 1. Repaso: estimadores y estimaciones. Propiedades de los estimadores. 2. Estimación puntual.
Más detallesMuestreo de variables aleatorias
Estadística II Universidad de Salamanca Curso 2011/2012 Outline 1 Introducción 2 Distribución de la muestra 3 4 5 Distribuciones de la media y la varianza en poblaciones normales Introducción Tiene como
Más detallesINDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos
INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos
Más detallesNúmeros reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos.
MATEMÁTICAS I Contenidos. Aritmética y álgebra: Números reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos. Resolución e interpretación gráfica de ecuaciones e
Más detallesSelección de distribuciones de probabilidad
Selección de distribuciones de probabilidad Patricia Kisbye FaMAF 6 de mayo, 2010 Análisis estadístico de datos simulados Los sistemas reales tienen fuentes de aleatoriedad: Tipo de sistema Fabricación
Más detallesTema 8: Análisis Discriminante. Clasificación. Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid. Análisis discriminante
Aurea Grané. Máster en Estadística. Universidade Pedagógica. 1 Aurea Grané. Máster en Estadística. Universidade Pedagógica. 2 Análisis discriminante Tema 8: Análisis Discriminante y Clasificación Aurea
Más detallesEstadística I para futuros ingenieros Unidad 4. Segunda parte
Estadística I para futuros ingenieros Unidad 4 Segunda parte ITSS L.A. Jorge VC 2 Estimación: puntual y por intervalos A partir de los estadísticos que hemos obtenido en la/s muestra/s queremos obtener
Más detallesEL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)
EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesINTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)
INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que
Más detallesENUNCIADO y SOLUCIONES. Problema 1
Ingeniería Industrial Métodos estadísticos de la Ingeniería Examen Junio 007. ENUNCIADO y SOLUCIONES Problema La memoria RAM para un ordenador se puede recibir de dos fabricantes A y B con igual probabilidad.
Más detallesEstadística Descriptiva y Probabilidad FORMULARIO
Estadística Descriptiva y Probabilidad FORMULARIO Departament d Estadística i Investigació Operativa Universitat de València Angel Corberán Francisco Montes 2 3 Capítulo 1 Estadística Descriptiva 1.1.
Más detalles> plot(salmon[,- 1],col=as.factor(salmon[,1]))
ANÁLISIS DISCRIMINANTE El análisis discriminante, se utiliza para identificar las características que permiten diferenciar a dos o más grupos de sujetos; además para clasificar nuevos casos como pertenecientes
Más detallesGuía docente 2007/2008
Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación
Más detallesTema 6. Multicolinealidad. Contenido Multicolinealidad perfecta Multicolinealidad de grado alto
Tema 6 Multicolinealidad Contenido 6.1. Multicolinealidad perfecta...................... 108 6.. Multicolinealidad de grado alto................... 110 108 Tema 6. Multicolinealidad A la hora de estimar
Más detallesAPRENDIZAJE PROBABILÍSTICO NAIVE BAYES
1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto;
Más detallesTema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
Más detallesRegresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
Más detallesBloque 3 Tema 14 ANÁLISIS DE LA VARIANZA. PRUEBA F
Bloque 3 Tema 4 AÁLISIS DE LA VARIAZA. PRUEBA F El objetivo fundamental de la experimentación es estudiar la posible relación de causalidad existente entre dos o más variables. Este estudio representa
Más detallesEl modelo de azar proporcional: la regresión de Cox
El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten
Más detallesTEMA 5: Especificación y Predicción en el MRL
EMA 5: Especificación y Predicción en el MRL Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) ema 5: Especificación y Predicción Curso
Más detallesREGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
Más detallesEstimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas
Estimación MC2E, MVIL en Modelos de Ecuaciones Simultáneas Economía Aplicada III (UPV/EHU) OCW 2013 Contents 1 Mínimos Cuadrados en 2 Etapas 2 Mínimos Cuadrados en 2 Etapas El método de Mínimos Cuadrados
Más detallesMETODOS ESTADÍSTICOS
METODOS ESTADÍSTICOS Introducción. Uno de los objetivos de la asignatura de Hidrología, es mostrar a los alumnos, las herramientas de cálculo utilizadas en Hidrología Aplicada para diseño de Obras Hidráulicas.
Más detallesEstadística para la Economía y la Gestión IN 3401 Clase 5
Estadística para la Economía y la Gestión IN 3401 Clase 5 Problemas con los Datos 9 de junio de 2010 1 Multicolinealidad Multicolinealidad Exacta y Multicolinealidad Aproximada Detección de Multicolinealidad
Más detallesESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M. En este capítulo, vamos a abordar la Estimación Puntual, que es uno de los tres grandes conjuntos de técnicas que
Más detallesNotas de clase Estadística R. Urbán R.
Inferencia estadística Sabemos que una población puede ser caracterizada por los valores de algunos parámetros poblacionales, por ello es lógico que en muchos problemas estadísticos se centre la atención
Más detallesy x Estimar por MCO un modelo lineal entre la variable explicada (y) y las
Ejercicio MLG Disponemos de los siguientes datos y x x3 7 6 0 4 3 7 8 6 3 6 6 5 8 9 8 Se pide. Estimar por MCO un modelo lineal entre la variable explicada (y) y las explicativas (x).. Comprobar que el
Más detallesTEMA 4 Modelo de regresión múltiple
TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.
Más detallesJulio Deride Silva. 4 de junio de 2010
Curvas ROC y Regresión Lineal Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 4 de junio de 2010 Tabla de Contenidos Curvas ROC y Regresión Lineal
Más detallesANALISIS DISCRIMINANTE, ESTADISTICA GERENCIAL
UNIVERSIDAD DE PUERTO RICO Recinto de Río Piedras Facultad de Administración de Empresas Instituto de Estadística ANALISIS DISCRIMINANTE, HERRAMIENTA EN ESTADISTICA GERENCIAL José C. Vega Vilca, PhD Presentación
Más detallesCurso de Estadística no-paramétrica
Curso de Estadística no-paramétrica Sesión 3: Regresión no paramétrica y Contrastes de Aleatoriedad y bondad de ajuste Facundo Muñoz Grup d Estadística espacial i Temporal Departament d Estadística en
Más detalles1. Ejercicios. 2 a parte
1. Ejercicios. 2 a parte Ejercicio 1 Calcule 1. P (χ 2 9 3 33) 2. P (χ 2 15 7 26). 3. P (15 51 χ 2 8 22). 4. P (χ 2 70 82). Ejercicio 2 Si X χ 2 26, obtenga un intervalo [a, b] que contenga un 95 % de
Más detallesTécnicas Cuantitativas para el Management y los Negocios I
Técnicas Cuantitativas para el Management y los Negocios I Licenciado en Administración Módulo II: ESTADÍSTICA INFERENCIAL Contenidos Módulo II Unidad 4. Probabilidad Conceptos básicos de probabilidad:
Más detallesProbabilidad y Estadística Segundo del grado en Telecomunicaciones, UAM, Examen de la convocatoria extraordinaria,
Probabilidad y Estadística Segundo del grado en Telecomunicaciones, UAM, 2014-2015 Examen de la convocatoria extraordinaria, 22-6-2015 Nombre y apellidos.......................................................................
Más detallesQué hacemos cuando la distribución no es normal? Qué significa ser normal? Qué significa ser normal? 1er. Simposio Metodología Seis Sigma
er. imposio Metodología eis igma Resumen Qué hacemos cuando la distribución no es normal? Qué significa ser normal? Ejemplos de situaciones normales Ejemplos de situaciones no normales Resumen Implicaciones
Más detalles6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid
6. Inferencia con muestras grandes 1 Tema 6: Inferencia con muestras grandes 1. Intervalos de confianza para μ con muestras grandes 2. Determinación del tamaño muestral 3. Introducción al contraste de
Más detalles2.3. Análisis bayesiano para datos normales
2.3. Análisis bayesiano para datos normales 87 2.3. Análisis bayesiano para datos normales Otra de las situaciones más frecuentes en la práctica estadística es aquella en la que nos encontramos con datos
Más detallesEstas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías
ANOVA I 19-8-2014 Estas dos clases ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA II - ANOVA factorial - ANCOVA (análisis
Más detallesVariables aleatorias
Variables aleatorias Ignacio Cascos Fernández Departamento de Estadística Universidad Carlos III de Madrid Estadística I curso 2008 2009 Una variable aleatoria es un valor numérico que se corresponde con
Más detallesBases estadísticas del reconocimiento de patrones
Bases estadísticas del reconocimiento de patrones César Martínez cmartinez _AT_ fich.unl.edu.ar Inteligencia Computacional FICH-UNL Percepción humana Tarea muuuuy simple: Cuántas llaves hay? Inteligencia
Más detallesTécnicas de Muestreo Métodos
Muestreo aleatorio: Técnicas de Muestreo Métodos a) unidad muestral elemental: a.1) muestreo aleatorio simple a.2) muestreo (seudo)aleatorio sistemático a.3) muestreo aleatorio estratificado b) unidad
Más detallesEconometría Aplicada
Econometría Aplicada Inferencia estadística, bondad de ajuste y predicción Víctor Medina Intervalos de confianza Intervalos de confianza Intervalos de confianza Intervalos de confianza La pregunta que
Más detallesEstadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1)
Estadística Multivariada Computacional Introducción al Aprendizaje Automático (parte 1) Mathias Bourel IMERL - Facultad de Ingeniería, Universidad de la República, Uruguay 24 de octubre de 2016 M.Bourel
Más detallesTEMA 3.- EL ANALISIS ESTADISTICO DE LA INFORMACION (MODELIZACION) DIFERENTES TIPOS DE PROCEDIMIENTOS ESTADISTICOS
TEMA 3.- EL ANALISIS ESTADISTICO DE LA INFORMACION (MODELIZACION) PROCEDIMIENTOS ESTADISTICOS CONSTRUCCION DE MODELOS DIFERENTES TIPOS DE PROCEDIMIENTOS ESTADISTICOS Cada procedimiento es aplicable a un
Más detallesIDENTIFICACIÓN DE SISTEMAS ESTIMACIÓN ESTOCÁSTICA
IDENTIFICACIÓN DE SISTEMAS ESTIMACIÓN ESTOCÁSTICA Ing. Fredy Ruiz Ph.D. ruizf@javeriana.edu.co Maestría en Ingeniería Electrónica Pontificia Universidad Javeriana 2013 Problema de la estima θ(t): magnitud
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesTeoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Más detallesÍndice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
Más detallesCONTRASTES DE HIPÓTESES
CONTRASTES DE IPÓTESES 1. Contraste de hipótesis 2. Contrastes de tipo paramétrico 2.1 Contraste T para una muestra 2.2 Contraste T para dos muestras independientes 2.3 Análisis de la varianza 3. Contrastes
Más detallesTema 5. Muestreo y distribuciones muestrales
1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución
Más detallesT1. Distribuciones de probabilidad discretas
Estadística T1. Distribuciones de probabilidad discretas Departamento de Ciencias del Mar y Biología Aplicada Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir de
Más detalles5.3. Análisis discriminante Cuándo tenemos que utilizar el análisis discriminante
FUOC P01/71039/00748 119 Investigación descriptiva: análisis de información 5.3. Análisis discriminante 5.3.1. Cuándo tenemos que utilizar el análisis discriminante Para resolver muchos problemas de marketing,
Más detallesEstadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Más detalles