Análisis discriminante.
|
|
|
- Luis Miguel Casado Benítez
- hace 7 años
- Vistas:
Transcripción
1 Análisis discriminante. INTRODUCCIÓN Las técnicas de análisis discriminante se proponen la determinación de un criterio que nos permita decidir a qué grupo pertenece un cierto individuo, a partir de la información disponible sobre él cifrada en términos de los valores que toman ciertas variables consideradas. A diferencia del análisis cluster, no pretendemos clasificar a los individuos en grupos, procediendo nosotros mismos a su agrupación, sino que, aquí, los grupos ya están constituidos y lo que buscamos es descubrir qué tiene de específico cada grupo para ser capaces de asignar de manera correcta los individuos a los grupos. Se trata, en definitiva, de discriminar a qué grupo pertenece, o debería pertenecer cada individuo. Se dispone, por tanto, de un conjunto de datos relativos a unos elementos o individuos, pertenecientes a dos o más grupos definidos " a priori", de manera precisa. El objetivo inicial es encontrar si ciertas variables, de entre las que se dispone, nos pueden permitir asignar correctamente a los individuos a las clases a las que pertenecen. El fin último es ser capaces de asignar un "individuo anónimo " (del que se desconoce su afiliación) a la clase o grupo al que pertenece. En consecuencia, podemos considerar que la discriminación se plantea dos objetivos distintos aunque íntimamente relacionados; y, en ese sentido, cabe decir que admite dos enfoques: Una discriminación entendida como decisión de adscripción a un grupo de un individuo ; y una discriminación entendida como una descripción de la estructura diferenciadora de los grupos. Cuando se habla de discriminación suele hacerse referencia al problema de la identificación y se la considera como una técnica de toma de decisiones. Éste fue, de hecho, el principal enfoque que se dio a los primeros trabajos de Fisher, Wald, Anderson, Welch, von Mises etc. En estas páginas dedicaremos un breve espacio al problema de la identificación (discriminación como decisión) y nos centraremos luego en el enfoque descriptivo, haciendo especial hincapié en el análisis factorial discriminante. I.M.Lejarza,
2 I.M.Lejarza,
3 DISCRIMINACIÓN COMO DECISIÓN DISCRIMINACIÓN COMO IDENTIFICACIÓN (PERSPECTIVA DECISIONAL) En esta perspectiva la discriminación se plantea como el problema de identificar (adscribir) un individuo anónimo. La situación de nuestro problema de decisión es la siguiente: Tenemos un individuo, w, que puede pertenecer a una de varias posibles poblaciones H 1,H 2,...,H r. Pero no sabemos a cuál de ellas pertenece de hecho. Disponemos de un conjunto de n variables X 1,X 2,..X n. Nuestro individuo nos viene caracterizado por los valores que toman para él las n variables. En consecuencia, podemos caracterizarlo por el vector de observaciones: x( 1 w) x( 2 w) X(w)=.. x n ( w) Nos planteamos la obtención de una regla de decisión que nos permita asignar al individuo w a una de las r poblaciones o grupos. La ejecución de esta regla de decisión es lo que constituye la identificación o discriminación. La solución del problema suele acometerse construyendo ciertas funciones (funciones = f (X)), llamadas discriminantes, con la esperanza de que estas funciones nos definan sobre R n una partición { R 1,R 2..,R r },de modo que podamos adoptar el criterio de decisión de que si X(w)R i, entonces w H i. Básicamente hay tres posiciones, (que bajo ciertas condiciones, presentan resultados similares) de afrontar el problema de la discriminación y la determinación de las funciones discriminantes : A. Apoyarse para la construcción de las funciones discriminantes en la distancia entre el individuo w y los distintos grupos. B. Apoyarse en el criterio de minimizar la probabilidad de error de clasificación (con o sin información inicial) o maximizar la verosimilitud de pertenencia al grupo. C. Plantear la identificación como un típico problema de decisión cuya solución pasa por la minimización de la función de pérdida asociada a la "mala clasificación " ( o misclassification). Utilizando un criterio de discriminación geométrico, resulta razonable asignar el individuo anónimo a aquel grupo del que se encuentre más cercano. Lo habitual es considerar la distancia al centro de gravedad del grupo y utilizar una medida de la distancia que no esté sujeta ni a la escala de medida de las variables ni a su covariación o correlación, y, en este sentido, la distancia de Mahalanobis es la más adecuada. I.M.Lejarza,
4 Así pues si consideramos la distancia entre el individuo w (representado por el vector de observaciones X) y el grupo H i, como la distancia de Mahalanobis entre X y el centro de gravedad del grupo i simo M i : D (X,H i ) = (X M i )' V 1 (X M i ) El criterio de discriminación será asignar w al grupo H i si: D (X,H i ) = min s{d (X,H s )} Es fácil obtener una función discriminante que discrimine entre los grupos H i y H j : W ij (X) = (M i M j )'V 1 X 1/2 (M i M j)' V 1 (M i + M j ) que es una función lineal debida a Fisher y, posteriormente desarrollada, para el caso de disponer únicamente de información muestral,por Wald y Anderson De esta forma, si para un cierto i se cumple que : W ij (X) > 0 i j asignaremos el individuo anónimo al grupo H i. Otro criterio de discriminación basado en la distribución de las variables en los distintos grupos será el que asigne el individuo anónimo a aquel grupo en el que se maximice la función de verosimilitud. Según este criterio asignaremos el individuo w al grupo H i si : L i(x)= max s { L s(x)} (donde L es la función de verosimilitud). En este caso la función discriminante para cada par de grupos H i y H j sería : V ij (X) = log L i (X) log L j (X) De forma que si para cierto i se cumple que: V ij (X) > 0 i j asignaremos el individuo anónimo al grupo H i. Si las poblaciones son normales multivariantes y las matrices de varianzas coinciden, el criterio máximo verosímil y el geométrico coinciden y el discriminador máximo verosímil asume la misma expresión que el discriminador lineal de Wald Anderson. Sin embargo, en el caso en el que cada población tenga una matriz de varianzas propia el discriminador adopta una expresión cuadrática. De forma que para cada dos grupos la función discriminante queda como: Q X X V V X X V M V M X MV M MV M V V ij ( ) ( j i ) ( j i i j ) j j j i i i log j log i I.M.Lejarza,
5 Welch fue el primero en proponer la discriminación siguiendo un criterio de minimizar la probabilidad de error de calsificación o bien, maximizar la verosimilitud de pertenencia a un grupo. Estudió también, la posibilidad de disponer de conocimiento a priori acerca de la pertenencia de un individuo a cada grupo y el modo de utilizarlo en la discriminación a través del uso del Teorema de Bayes. Con información inicial el discriminador asociado era, entonces: B ij (X) = log L i (X) log L j (X) + log (q i /q j ) donde q i y q j son las probabilidades iniciales de que w pertenezca a H i y H j, respectivamente. Otros muchos autores han hecho hincapié en las distintas consecuencias que pueden tener distintos errores de clasificación. En muchas situaciones prácticas distintos errores de clasificación pueden tener asociados costes muy distintos. En ese caso, no es el error de clasificación lo que se debe minimizar sino el coste esperado o decantarse por aquella alternativa que nos minimice el máximo coste u optar por algún otro criterio decisional adecuado. DISCRIMINACIÓN COMO DESCRIPCIÓN-ANÁLISIS FACTORIAL-DISCRIMINANTE- OBJETIVOS DEL ANÁLISIS FACTORIAL DISCRIMINANTE Así pues, los objetivos que perseguimos con el análisis factorial discriminante son básicamente: 1. Seleccionar qué variables resultan más discriminantes de entre las disponibles. 2. Obtener los llamados factores o funciones discriminantes, que no son otra cosa que nuevas variables que serán combinaciones lineales de las variables discriminantes originales con un poder de discriminación óptimo. 3. Interpretar los factores discriminantes; lo que podrá hacerse a partir de las correlaciones de éstos con las variables originales, análogamente a como interpretábamos la estructura factorial en el Análisis Factorial. Aquí se trata, obviamente, de interpretar la estructura de diferenciación o estructura discriminante. 4. Ser capaces, por último, de clasificar a los individuos en base a los factores discriminantes obtenidos. ANÁLISIS MULTIVARIANTE DE LA VARIANZA (MANOVA) Si el análisis de la varianza univariante pretende contrastar hipótesis lineales sobre la influencia de los distintos niveles de uno o varios factores en el comportamiento de una variable (unidimensional), el análisis multivariante de la varianza (MANOVA) tiene la misma pretensión, pero considerando un vector (multidimensional) de variables. La aplicación paradigmática del análisis de la varianza es determinar si existen diferencias significativas entre los distintos niveles o grupos de un factor (categórico), a I.M.Lejarza,
6 través del contraste de igualdad de medias. Porque es, fundamentalmente, ésta la aplicación que nos interesa, aquí nos detendremos un poco en ella, para el caso multivariante del MANOVA, para luego poder extender sus resultados y consideraciones al análisis factorial discriminante. Los supuestos del análisis serán los mismos en el caso del MANOVA que en el del análisis factorial discriminante y, en consecuencia, los mantendremos ya desde aquí: a. Consideramos un vector aleatorio Y de dimensión n sobre el cuál obtenemos g muestras correspondientes a los g niveles, categorías o grupos considerados. b. Suponemos que Y sigue, en cada una de las poblaciones de los g grupos una distribución Normal n-variante con vector de medias M (i= 1,2,...g),eventualmente distinto para cada grupo y matriz de covarianzas V, la misma para todas las poblaciones. Bajo estos supuestos, consideraremos, también, que cada observación n-dimensional para cada grupo, i, puede expresarse de acuerdo con el siguiente modelo: Y i = M + A i + E i Donde: M es el vector de medias general. A i es un vector n-dimensional que nos indica el efecto propio del nivel o grupo i-simo. E i es un vector aleatorio que nos indica la desviación errática de las observaciones y se supone que sigue una distribución normal n-dimensional con vector de medias el vector nulo y matriz de varianzas V, la misma para todos los grupos (i=1,2,...g) En estas circunstancias es fácil comprobar cómo el vector Y i tendrá, en cada grupo, i, una distribución: Y i N [ (M + A i ); V ] Sobre este modelo nos plantemos contrastar la hipótesis nula de que todos los vectores A sean nulos: H 0 : A 1 = A 2 =...= A g =0 Esta hipótesis equivale a considerar que no hay diferencias en los vectores de medias de Y en cada uno de los grupos o que las medias en cada grupo son las mismas y coinciden el vector M. Para la realización del contraste, partimos, como en el caso univariante, de la descomposición de la varianza total; en este caso de la matriz de varianzas y covarianzas total. La matriz de varianzas muestrales T puede verse como la suma de otras dos matrices de varianzas: T = B + W Donde B es la matriz de varianzas "entre-grupos" (Between-groups) y W es la matriz de varianza "intra- grupos" (Within-groups). I.M.Lejarza,
7 B expresa las varianzas y covarianzas, considerando los centroides de los grupos como observaciones. W, en cambio, expresa la suma para todos los grupos de las varianzas y covarianzas de las observaciones de cada grupo. Pues bien, la matriz NB, donde N es el número total de observaciones muestrales, puede probarse que sigue una distribución de Wishart con parámetros n, g-1, V (lo que se expresa como W n (g-1, V ) ). La distribución puede considerarse como una generalización de la distribución 2 de Pearson, que puede definirse de acuerdo con el siguiente esquema general: Si tenemos una matriz de n columnas y m filas, Z; donde cada columna está formada por un vector aleatorio m-dimensional que tiene una distribución normal m-variante con vector de medias el vector nulo y matriz de varianzas V, la misma para todas las columnas de la matriz; entonces la matriz A = Z'Z sigue una distribución de Wishart de parámetros n, m y V [lo que puede expresarse como: W n (m,v) ] Una propiedad importante de esta distribución es que si realizamos un muestreo aleatorio de tamaño N sobre una población normal multivariante N [M,V],la matriz formada por el producto del escalar N y la matriz de varianzas muestral,s, sigue una distribución de Wishart de parámetros n, N-1, V: NS W n (N-1, V ) Es, precisamente, a partir de esta propiedad como puede probarse el resultado de que : NB W n (g-1,v) Igualmente puede probarse también que si la hipótesis nula: H 0 : A 1 = A 2 =...= A g =0 es cierta, entonces la matriz NW seguirá, también una distribución de Wishart de parámetros n, N-g, V y será independiente de la distribución de NB. Obviamente también, considerando esa misma propiedad, NS (siendo S la matriz de varianzas totales muestral ) seguirá también una distribución W n (N-1,V) Teniendo en cuenta ésto, el contraste de la hipótesis nula: H 0 : A 1 = A 2 =...= A g =0 se lleva a cabo evaluando el valor del estadístico (lambda de Wilks): = W / T Estadístico que sigue una distribución de Wilks de parámetros n, N-g,g-1. Es, precisamente este estadístico el que nos conducirá a determinar si los vectores de medias de los grupos son significativamente diferentes o no; es decir, si la hipótesis nula es rechazable o no: Para un nivel de significación : Aceptaremos la hipótesis nula si Rechazaremos la hipótesis nula si I.M.Lejarza,
8 Siendo el valo crítico que verifica P ( ) = en una distribución d (n, N-g,g-1). En la práctica el contraste se realiza después de una estadístico en una F o una 2 transformación previa del DETERMINACION DE LAS VARIABLES MAS DISCRIMINANTES Como se ha comentado, uno de los objetivos de la discriminaciónn descriptiva es determinar cuáles son, de entre las variables disponibles, aquellas que tienen un mayor poder discriminativo. Es evidente que este objetivo es tanto más importante si el número de variables de las que se dispone información es muy elevado o si este número excede al número máximo de variables que pueden utilizarse en una factorización posterior. I.M.Lejarza,
9 Determinar qué variable es más discriminante y las que tienen, sucesivamente, mayor poder discriminativo puede hacerse a partir de un análisis de la varianza (univariante) para cada variable; obteniendo que una variable es tanto más discriminativa cuanto mayor sea su estadístico F. Si queremos determinar qué grupos de variables de un determinado tamaño es el más discriminativo, podemos considerar todos los posibles grupos de ese tamaño y realizar un análisis MANOVA, decantándonos por el grupo de variables que presente un menor valor de su estadístico de Wilks. Procediendo de esta manera, podemos, desgraciadamente, acabar seleccionando un conjunto de variables que resulten estar altamente correlacionadas entre sí, proporcionándonos, en consecuencia, una discriminación redundante. Para evitar este problema, los distintos algoritmos de discriminación "paso-a-paso " utilizan "criterios de tolerancia" para la selección de las variables como variables discriminantes De todas manera, la determinación del conjunto de variables a considerar como variables discriminantes es, en la práctica, algo que se realiza a la vez que la determinación de los factores o ejes discriminantes utilizando los ya mencionados procedimientos paso a paso. Especialmente nos centraremos en el procedimiento de selección y discriminación basado en la mínimización del estadístico de Wilks, que es el que utilizaremos aquí. I.M.Lejarza,
10 I.M.Lejarza,
11 I.M.Lejarza,
12 Determinación de los factores o funciones ( o ejes ) discriminantes Obtención de los factores discriminant tes Una vez obtenidas el conjunto de variables más discriminantes, la solución puede mejorarse obteniendo un conjunto alternativo de nuevass variables discriminantes, llamadas factores o funciones discriminantes, capaces de discriminar dee una forma más contundente y que se obtienen como combinación lineal de la soluciónn obtenida. En el siguiente gráfico se pone de manifiesto, lo que queremos decir: I.M.Lejarza,
13 I.M.Lejarza,
14 I.M.Lejarza,
Clasificación. Aurea Grané. Análisis Discriminante
Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis discriminante Análisis Discriminante y Clasificación Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Supongamos
Capítulo 8. Análisis Discriminante
Capítulo 8 Análisis Discriminante Técnica de clasificación donde el objetivo es obtener una función capaz de clasificar a un nuevo individuo a partir del conocimiento de los valores de ciertas variables
Tema 9. Análisis factorial discriminante
Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. 9.1. Introducción. Tema 9. Análisis factorial discriminante Supongamos que están denidos I grupos,
(DERIVADAS DE LA NORMAL)
DISTRIBUCIÓN NORMAL MULTIVARIANTE (DERIVADAS DE LA NORMAL) INTRODUCCIÓN PROPIEDADES LINEALIDAD DISTRIBUCIONES DERIVADAS DE LA NORMAL χ 2 DE PEARSON t DE STUDENT F DE SNEDECOR DISTRIBUCIÓN NORMAL MULTIVARIANTE
Tema 3 Normalidad multivariante
Aurea Grané Máster en Estadística Universidade Pedagógica Aurea Grané Máster en Estadística Universidade Pedagógica Tema 3 Normalidad multivariante 3 Normalidad multivariante Distribuciones de probabilidad
Tema 4. Análisis multivariante de la varianza
Máster en Técnicas Estadísticas Análisis Multivariante Año 2008 2009 Profesor: César Sánchez Sellero Tema 4 Análisis multivariante de la varianza 4 Presentación del modelo Se trata de comparar las medias
El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)
El análisis de correspondencias Ana María López Jiménez Dept. Psicología Experimental (USE) 4. El análisis de correspondencias 4.. Introducción 4.2. Tabla de correspondencias 4.3. Dependencia e independencia
ANÁLISIS DISCRIMINANTE
DEFINICIÓN: Cómo técnica de análisis de dependencia: Pone en marcha un modelo de causalidad en el que la variable endógena es una variable NO MÉTRICA y las independientes métricas. Cómo técnica de análisis
Análisis de Correlación Canónica y Análisis discriminante
Análisis de Correlación Canónica y Análisis discriminante Análisis de Regresión Múltiple TÉCNICAS DE DEPENDENCIA Variable/s Dependiente/s Variable/s Independiente/s Técnica 1 Nivel de medición Continuo
Estadística II Tema 1: Distribución normal multivariante
Estadística II Tema 1: Distribución normal multivariante José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Algunas propiedades de los vectores aleatorios Sea X = (X 1,..., X
1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos
TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría
DISTRIBUCIONES MULTIDIMENSIONALES DE PROBABILIDAD
DISTRIBUCIONES MULTIDIMENSIONALES DE PROBABILIDAD FUNCIÓN DE DISTRIBUCIÓN ( CONJUNTA ) DE UN VECTOR ALEATORIO FUNCIÓN DE CUANTÍA ( CONJUNTA) DE VECTORES ALETORIOS DISCRETOS FUNCIÓN DE DENSIDAD (CONJUNTA)
Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.
REGRESIÓN LINEAL. Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. Dada una población, hasta ahora hemos estudiado cómo a partir de una muestra extraída de ella podemos
Teórica básica. Incluimos. - Temas
Teórica básica Incluimos - Temas 1 - Tema 1: Fenómenos aleatorios. Conceptos de probabilidad. Propiedades. Independencia de sucesos. Teorema de Bayes. - Tema 2: Variables aleatorias. Variables discretas.
DISCRIMINACIÓN CUADRÁTICA MEDIANTE MATRICES DE COVARIANZAS
PESQUIMAT, Revista de la F.C.M. de la Universidad Nacional Mayor de San Marcos Vol. I - N'2 Pgs. 111-116 Lima - Perú Dic. 1998 DISCRIMINACIÓN CUADRÁTICA MEDIANTE MATRICES DE COVARIANZAS? Doris Gómez Ticerán
BLOQUE III. ANÁLISIS MULTIVARIANTE
BLOQUE III. ANÁLISIS MULTIVARIANTE CAPÍTULO 7 Teoría sobre análisis multivariante. El análisis multivariante engloba un grupo de técnicas o métodos estadísticos cuya finalidad es analizar simultáneamente
Análisis multivariante II
Análisis multivariante II Tema 1: Introducción Pedro Galeano Departamento de Estadística Universidad Carlos III de Madrid [email protected] Curso 2016/2017 Grado en Estadística y Empresa Pedro Galeano
Tema 8. Fundamentos de Análisis discriminante
Máster en Técnicas Estadísticas Análisis Multivariante. Año 2008 2009. Profesor: César Sánchez Sellero. Tema 8. Fundamentos de Análisis discriminante 8.1. Introducción. Empezamos deniendo el problema discriminante.
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA
ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA ANALISIS DE CLUSTER EN SPSS Opción: Analizar Clasificar ANALISIS DE CLUSTER EN SPSS Tres posibles OPCIONES 1.- Cluster en dos etapas 2.- K-means 3.- Jerárquicos
ANALISIS FACTORIAL. Jorge Galbiati R.
ANALISIS FACTORIAL Jorge Galbiati R El análisis factorial es un modelo matamático que pretende explicar la correlación entre un conjunto grande de variables observadas y un pequeño conjunto de factores
Regresión múltiple. Demostraciones. Elisa Mª Molanes López
Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +
Introducción al Análisis Multivariante
al Análisis Multivariante Vectores aleatorios, técnicas de análisis multivariante, distancias estadísticas Curso 2011-2012 Considero que el cerebro de cada cual es como una pequeña pieza vacía que vamos
Tema 2 Datos multivariantes
Aurea Grané Máster en Estadística Universidade Pedagógica 1 Aurea Grané Máster en Estadística Universidade Pedagógica 2 Tema 2 Datos multivariantes 1 Matrices de datos 2 Datos multivariantes 2 Medias,
Discriminación entre grupos
Discriminación entre grupos Discriminación entre grupos Son los grupos significativamente diferentes? Multivariate Analysis of Variance (MANOVA) Multi-Response Permutation Procedures (MRPP) Analysis of
Análisis de Correspondencias Simple
1 Capítulo 4 Análisis de Correspondencias Simple 41 INTRODUCCIÓN El Análisis de Correspondencias Simple permite describir las relaciones entre dos variables categóricas dispuestas en una tabla de contingencia
Introducción Clustering jerárquico Clustering particional Clustering probabilista Conclusiones. Clustering. Clasificación no supervisada
Clustering Clasificación no supervisada Javier G. Sogo 10 de marzo de 2015 1 Introducción 2 Clustering jerárquico 3 Clustering particional 4 Clustering probabilista 5 Conclusiones Introducción Objetivos
LICENCIATURA EN ECONOMÍA Y LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS
DEPARTAMENT D ECONOMIA APLICADA UNIVERSITAT DE VALENCIA LICENCIATURA EN ECONOMÍA Y LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS PROGRAMA DE ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA TEMA 1: INTRODUCCIÓN
Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Fundamentos de Estadística
Ficha Técnica Titulación: Grado en Ingeniería de Organización Industrial Plan BOE: BOE número 75 de 28 de marzo de 2012 Asignatura: Módulo: Fundamentos de Matemáticas Curso: 2º Créditos ECTS: 6 Tipo de
Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...
ÍNDICE SISTEMÁTICO PÁGINA Sumario... 5 Prólogo... 7 Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares... 9 Objetivos de la Unidad... 11 1. Población y muestra... 12 2. Parámetro
Análisis de la varianza. Magdalena Cladera Munar Departamento de Economía Aplicada Universitat de les Illes Balears
Análisis de la varianza Magdalena Cladera Munar [email protected] Departamento de Economía Aplicada Universitat de les Illes Balears CONTENIDOS Análisis de la varianza de un factor. Análisis de la varianza
ANÁLISIS DISCRIMINANTE (AD)
discrim_predictivo.doc 30//05 vgg ANÁLISIS DISCRIMINANTE (AD) Regresión con respuesta categórica Y Cómo depende Y de las variables X, X,... X p? cualitativa cuantitativas Planteamiento Predictivo del AD:
TEMA 3.- VECTORES ALEATORIOS.- CURSO
TEMA 3.- VECTORES ALEATORIOS.- CURSO 017-018 3.1. VARIABLES ALEATORIAS BIDIMENSIONALES. FUNCIÓN DE DISTRIBUCIÓN CONJUNTA. 3.. VARIABLES BIDIMENSIONALES DISCRETAS. 3.3. VARIABLES BIDIMENSIONALES CONTINUAS.
Tema 2: Análisis Discriminante
Tema 2: Análisis Discriminante P 1 P 2 Problema de clasificación: Ténemos observaciones que corresponden a 2 grupos P_1, P_2. Si nos dan uno nuevo x_0 a que grupo pertenece? Guión 1. Motivación 2. Clasificación
INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS
. Metodología en Salud Pública INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS Autor: Clara Laguna 7.1 INTRODUCCIÓN Los datos categóricos o variables cualitativas son muy frecuentes en
Laura de la Fuente Crespo. Análisis Discriminante
Laura de la Fuente Crespo Análisis Discriminante CONCEPTO DEL ANÁLISIS DISCRIMINANTE El Análisis Discriminante es una técnica estadística que se utiliza para clasificar a distintos individuos en grupos,
Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74
Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................
Estadística Económica y Estadística Empresarial
Universidad de Valladolid Facultad de Ciencias Económicas y Empresariales Departamento de Estadística y Econometría Licenciatura en Ciencias Económicas Sin docencia. Plan a extinguir Proyecto docente de:
Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u
CAPíTULO 6 Multicolinealidad 6.1. Introducción Uno de los supuestos básicos del modelo lineal general y = Xβ + u establece que las variables explicativas son linealmente independientes, es decir, la igualdad
Cuestiones propuestas de la primera prueba de la primera preparación
Cuestiones propuestas de la primera prueba de la primera preparación Temas a 9 de Teórica Básica Estas cuestiones van pensadas en la línea del primer examen Su dificultad conjunta tiene un nivel similar
PROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO CICLO BÁSICO DE INGENIERÍA ASIGNATURA
PROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO CICLO BÁSICO DE INGENIERÍA SEMESTRE ASIGNATURA 3er. PROBABILIDAD Y ESTADÍSTICA CÓDIGO HORAS
ÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Análisis Discriminante mediante SPSS
Universitat de Barcelona. Institut de Ciències de l Educació Análisis Discriminante mediante SPSS Mercedes Torrado-Fonseca, Vanesa Berlanga-Silvente Fecha de presentación: 23/02/2013 Fecha de
Números reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos.
MATEMÁTICAS I Contenidos. Aritmética y álgebra: Números reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos. Resolución e interpretación gráfica de ecuaciones e
ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
Técnicas de Inferencia Estadística II. Tema 1. Contrastes de hipótesis
Técnicas de Inferencia Estadística II Tema 1. Contrastes de hipótesis M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 1. Contrastes de hipótesis Contenidos
Estadística para la Economía y la Gestión IN 3401 Clase 5
Estadística para la Economía y la Gestión IN 3401 Clase 5 Problemas con los Datos 9 de junio de 2010 1 Multicolinealidad Multicolinealidad Exacta y Multicolinealidad Aproximada Detección de Multicolinealidad
GUIA DOCENTE ESTADISTICA
1 GUIA DOCENTE ESTADISTICA 1- Datos de identificación Asignatura: Estadística Carácter: Formación básica Titulación: Psicología Ciclo: Grado Curso: 1 Cuatrimestre: Anual Departamento: Metodología de las
T3. El modelo lineal básico
T3. El modelo lineal básico Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 41 Índice 1 Regresión lineal múltiple Planteamiento Hipótesis
Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables
Pág. N. 1 Índice general Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN 1.1 Diseño 1.2 Descriptiva 1.3 Inferencia Diseño Población Muestra Individuo (Observación, Caso, Sujeto) Variables Ejercicios de Población
Análisis de Datos. Clasificación Bayesiana para distribuciones normales. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Clasificación Bayesiana para distribuciones normales Profesor: Dr. Wilfrido Gómez Flores 1 Funciones discriminantes Una forma útil de representar clasificadores de patrones es a través
Sistemas de Reconocimiento de Patrones
Sistemas de Reconocimiento de Patrones p. 1/33 Sistemas de Reconocimiento de Patrones Luis Vázquez GTI - IIE Facultad de Ingeniería Universidad de la República Sistemas de Reconocimiento de Patrones p.
2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min
Estadística II Examen final enero 19/1/17 Curso 016/17 Soluciones Duración del examen: h y 15 min 1. 3 puntos El Instituto para la Diversificación y Ahorro de la Energía IDAE ha publicado un estudio sobre
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN
ÍNDICE CAPÍTULO 1. INTRODUCCIÓN 1.1. OBJETO DE LA ESTADÍSTICA... 17 1.2. POBLACIONES... 18 1.3. VARIABLES ALEATORIAS... 19 1.3.1. Concepto... 19 1.3.2. Variables discretas y variables continuas... 20 1.3.3.
Análisis descriptivo con SPSS. Favio Murillo García
Análisis descriptivo con SPSS Favio Murillo García Tablas de contingencia Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa
T2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica
ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación
INDICE Prefacio Como usar este libro Capitulo 1. Introducción Capitulo 2. Análisis exploratorio de los datos
INDICE Prefacio Como usar este libro Capitulo 1. Introducción 1 El comienzo de todo: determinación lo que se debe saber 2 Evaluación numérica de las unidades de observación con la ayuda de las escalas
CUERPO TÉCNICO, OPCION ESTADISTICA
CUERPO TÉCNICO, OPCION ESTADISTICA ESTADÍSTICA TEÓRICA BÁSICA TEMA 1. Fenómenos aleatorios. Conceptos de probabilidad. Axiomas. Teoremas de probabilidad. Sucesos independientes. Teorema de Bayes. TEMA
Ejercicios T.5 CONTRASTES PARAMÉTRICOS
Ejercicios T.5 CONTRASTES PARAMÉTRICOS 1. Un fabricante de perfume asegura que los frascos que produce contienen por término medio 100 ml. distribuyéndose el contenido de dichos frascos según una distribución
RECONOCIMIENTO DE PAUTAS
RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes
Capítulo 2. Medidas Estadísticas Básicas Medidas estadísticas poblacionales
Capítulo 2 Medidas Estadísticas Básicas 2.1. Medidas estadísticas poblacionales Sea X una variable aleatoria con función de probabilidad p(x) si es discreta, o función de densidad f(x) si es continua.
Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21
Espacios Vectoriales AMD Grado en Ingeniería Informática AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21 Objetivos Al finalizar este tema tendrás que: Saber si unos vectores son independientes.
INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres
INDICE Capitulo uno Introducción y estadísticas descriptiva 1.1. Introducción 1.2. descripción grafica de los datos 3 1.3. medidas numéricas descriptivas 11 Ejercicios 22 Apéndice: sumatorias y otras notaciones
Si u y v son vectores cualquiera en W, entonces u + v esta en W. Si c es cualquier numero real y u es cualquier vector en W, entonces cu esta en W.
Unidad 4 Espacios vectoriales reales 4.1 Subespacios Si V es un espacio vectorial y W un subconjunto no vacío de V. Entonces W es un subespacio de V si se cumplen las siguientes condiciones Si u y v son
Técnicas de Inferencia Estadística II. Tema 1. Contrastes de hipótesis
Técnicas de Inferencia Estadística II Tema 1. Contrastes de hipótesis Conchi Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2013/14 Tema 1. Contrastes de hipótesis Contenidos
Psicometría Tema 8 ANÁLISIS DE LA CALIDAD MÉTRICA DE LOS ÍTEMS
Psicometría Tema 8 ANÁLISIS DE LA CALIDAD MÉTRICA DE LOS ÍTEMS Psicometría Mª Isabel García Barbero, UNED. Universidad Nacional de Educación a Distancia, 2006 1 La evaluación de la calidad métrica de los
DISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO
TEMA II ESQUEMA GENERAL Diseño experimental de dos grupos: definición y clasificación Formatos del diseño y prueba de hipótesis Diseño experimental multigrupo: definición Formato del diseño multigrupo
La práctica del análisis de correspondencias
La práctica del análisis de correspondencias MICHAEL GREENACRE Catedrático de Estadística en la Universidad Pompeu Fabra Separata del apéndice D Glosario de términos Primera edición: julio 2008 ISBN: 978-84-96515-71-0
INDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN
CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN Antonio Morillas A. Morillas: C. no paramétricos (II) 1 1. Contrastes de aleatoriedad. Contraste de rachas. 2. Contrastes de localización 2.1 Contraste
Análisis Multivariante de Datos
Análisis Multivariante de Datos Curso 2016-2017 Por qué es importante realizar inferencia sobre los parámetros de la normal? La estimación máximo-verosímil (MV) de la distribución Normal son la media y
TEMA 1 Introducción 1.1. Concepto y características de la investigación comercial 1.2. La investigación comercial y el proceso de marketing de la
TEMA 1 1.1. Concepto y características de la investigación comercial 1.2. La investigación comercial y el proceso de marketing de la empresa 1.2.1. El proceso de marketing en la empresa 1.2.2. La función
ANÁLISIS DE COMPONENTES PRINCIPALES
CAPÍTULO 4 ANÁLISIS DE COMPONENTES PRINCIPALES 4.1 Introducción Al investigar un fenómeno desconocido se pretende abordarlo con muestras de diferentes variables, en las cuales muchas veces existe una fuerte
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos
Contrastes basados en el estadístico Ji Cuadrado
Capítulo 10 Contrastes basados en el estadístico Ji Cuadrado 10.1. Introducción Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no pueden cuantificarse
Práctica 4: Regresión Lineal Múltiple (1).
Práctica : Lineal Múltiple () Esta práctica está dedicada a resolver un problema de Lineal sin atender a ninguna cuestión relativa al cumplimiento de los supuestos del modelo, a la presencia de valores
Diplomado en Estadística Aplicada
Diplomado en Estadística Aplicada Con el propósito de mejorar las habilidades para la toma de decisiones, la División de Estudios de Posgrado de la Facultad de Economía ha conjuntado a profesores con especialidad
Tema: Análisis de valores faltantes con SPSS
Tema: Análisis de valores faltantes con SPSS 1.- Introducción Hemos de comenzar advirtiendo que el Procedimiento Valores perdidos no se incluye en el sistema Base de SPSS, por lo que solo estará disponible
7. De acuerdo con la gráfica siguiente, el contraste estadístico es:
1. Un investigador desea saber si los hombres y las mujeres difieren en flexibilidad cognitiva. Para ello, analiza los datos y obtienen los siguientes resultados. Satisfacen los datos el supuesto de homocedasticidad?
