PROBLEMAS TEMA 3: ANÁLISIS DE COMPONENTES PRINCIPALES. LICENCIADO EN ECONOMÍA

Documentos relacionados
Z i

Diplomatura en Ciencias Empresariales X Y

Matemáticas. Selectividad ESTADISTICA COU

Estadística aplicada a la comunicación

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

RELACIÓN DE EJERCICIOS TEMA 2

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

2.- Tablas de frecuencias

ESTADISTICA Y PROBABILIDAD. 1. Encuentra la media, moda, mediana, desviación estándar y varianza de la siguiente distribución de números

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Regresión y Correlación

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Precio de la gasolina regular (colones por litro, promedio anual)

Repaso Estadística Descriptiva

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

1. Caso no lineal: ajuste de una función potencial

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

Medidas de dispersión

PÁGINA 120. Pág. 1. Unidad 12. Estadística

A qué nos referimos con medidas de dispersión?

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Cómo introducir Prueba de Hipótesis para una media, utilizando experimentos en el salón de clase.

Medidas descriptivas I. Medidas de tendencia central A. La moda

UNIDAD 7 Medidas de dispersión

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Tema 2. Descripción Conjunta de Varias Variables

Módulo de Estadística

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Tema 1.- Correlación Lineal

El determinante de una matriz se escribe como. Para una matriz, el valor se calcula como:

Tema 8. Análisis de dos variables Ejercicios resueltos 1

Relación entre la altura y la distancia del suelo al ombligo

TEMA 8: DISTRIBUCIONES BIDIMENSIONALES PAÍSES A B C D E F G H I J R.P.C I.N

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

EJERCICIOS PAU: VALOR ACTUAL NETO (VAN)

Conceptos básicos estadísticos

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

Tema Contenido Contenidos Mínimos

Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan la mayor cantidad de info posible del conjunto de datos

Tema 2 Datos multivariantes

Técnicas de Investigación Social

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7.

Teoría de la decisión

Estadística. Análisis de datos.

EJERCICIOS PAU: VALOR ACTUAL NETO (VAN)

Variables estadísticas bidimensionales: problemas resueltos

ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.

Compartir Saberes. Guía para maestro. Función Afín. Guía realizada por Bella Peralta Profesional en Matemáticas.

Tema 2: Magnitudes aleatorias

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Esta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )

Tema 5. Muestreo y distribuciones muestrales

Introducción a la unidad 4:

Economía en la escuela

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

MEDIDAS DE TENDENCIA CENTRAL

Agrupa los resultados por lotes: Rechazados, revisables y aceptados y:

Estadística. 3) (Sept-99) Una variable aleatoria tiene una distribución normal de media y desviación típica. Si se extraen

FINANZAS CORPORATIVAS

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

IES EL PILES SELECTIVIDAD OVIEDO DPTO. MATEMÁTICAS Geometría

UNIDAD 6. Estadística

POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN

Hipótesis Alterna (H1): Existen relaciones entre dos variables cuantitativas (peso semillas y porcentaje

Tema 13. Los caracteres cuantitativos. Genética CC.MM.

Aplicaciones de la línea recta

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Esta definición se puede ampliar a cualquier par de bases de los espacio inicial y final MATRIZ DE UNA APLICACIÓN LINEAL EN BASES ARBITRARIAS

Práctica de cuerpo rígido

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

Gestión de la tabla de calificaciones:

Método de cuadrados mínimos

PROPUESTA DE ANÁLISIS ESTRATÉGICO UTILIZANDO MATRIZ SPACE Y MATRIZ DE INSUMO-PRODUCTO.

Tema 3. Relación entre dos variables cuantitativas

41 EJERCICIOS de MATRICES y GRAFOS 2º BACH. 3 ; k) B )

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

PRUEBA DE ACCESO (LOGSE) UNIVERSIDAD DE VALENCIA JUNIO (RESUELTOS por Antonio Menguiano)

ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA Estadística Descriptiva. Guía y Rubrica. Momento 2

4 Descripción conjunta de varias variables. Ejemplos y ejercicios.

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

CM0244. Suficientable

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ESTADÍSTICA. Tema 4 Regresión lineal simple

EJERCICIOS. Curso: Estadística. Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses

Hoja 6: Estadística descriptiva

Análisis de datos en los estudios epidemiológicos III Correlación y regresión

ESTADÍSTICA SEMANA 3

ESTADÍSTICA CON EXCEL

Y accedemos al cuadro de diálogo Descriptivos

Álgebra y Geometría Analítica I - LF 2016 Práctica 1: Algunos elementos de la Geometría Analítica

Transcripción:

1 PROBLEMAS TEMA 3: ANÁLISIS DE COMPONENTES PRINCIPALES. LICENCIADO EN ECONOMÍA Problema 1 Calcular para la matriz de covarianzas ( ) 5 2 S Y =, 2 2 (a) Las componentes principales Z 1 y Z 2. (b) La proporción de variabilidad total explicada por la primera componente principal. (c) Las comunalidades de las dos variables originales, cuando solo se retiene la primera componente principal. (d) Las correlaciones de las dos variables originales con la primera componente principal. Problema 2 Convertir la matriz de covarianzas del Problema 1 en una matriz de correlaciones R. (a) Determinar las componentes principales Z 1 y Z 2 de R. (b) Calcular la proporción de variabilidad total explicada por Z 1. (c) Compara las componentes calculadas en (a) con las obtenidas en el Problema 1. Son las mismas? Deberían serlo? (d) Calcular las comunalidades de las variables originales, cuando solo se retiene la primera componente principal. (e) Calcular las correlaciones de las dos variables con la primera componente principal. Problema 3 Sea la matriz de covarianzas 2 0 0 0 4 0. 0 0 4 Determinar las componentes principales Z 1, Z 2 y Z 3. Qué puedes comentar acerca de los vectores propios (y componentes principales) asociados a valores propios que son iguales? Problema 4 (Sept. 2004) Sea la matriz de covarianzas 1 2 0 S Y = 2 4 0, 0 0 2 proporcionar:

2 (a) Componentes principales. (b) Proporción de variabilidad explicada por cada una de las componentes obtenidas. c) Comunalidades de las variables originales si solo se retiene una componente principal. Qué variable/s está/n mejor explicada/s? d) Correlaciones de las variables originales con todas las componentes principales. Qué variable/s representa/n mejor a cada componente? Problema 5 (Feb. 2005) Con el fin de encontrar un índice económico de comparación de restaurantes españoles, se han medido tres variables sobre 30 restaurantes, X 1 =Gasto en publicidad, X 2 =Gasto en personal y X 3 =Beneficios netos. La matriz de covarianzas de dichas variables es S X = (a) Calcúlese las componentes principales. 2 1 0 1 1 1 0 1 2 (b) Qué proporción de variabilidad total explica cada componente?. (c) Si solo se desea obtener un índice que represente la información de las tres variables, cuál sería dicho índice? Qué variable es la mejor representada por dicho índice?. (d) Cómo está de correlado dicho índice con las variables X 1, X 2 y X 3?. Problema 6 (Sept. 2005) Se midieron las variables X 1 :Ventas y X 2 :Beneficios (en millones de $) a las 10 mayores corporaciones industriales estadounidenses, y se obtuvieron. el siguiente vector de medias y matriz de covarianzas ( 10 5 ), [ ] [ 62,309 10005,2 255,76 X =, S = 2,927 255,76 14,30 (a) Determinar las componentes principales. Observa la diferencia de magnitud entre los coeficientes de X 1 y de X 2. A qué crees que es debido? Qué solución propones a esto? (b) Proporcionar las varianzas de las componentes principales, y el porcentaje de variabilidad explicada por la primera componente. (c) Calcular las correlaciones entre la primera componente y las variables X 1 y X 2. Qué interpretación se le puede dar a la primera componente? ].

3 Problema 7 (Feb. 2006) Se han medido tres variables relacionadas con la calidad de vida de los ciudadanos en las provincias españolas, X 1 : Índice de precios, X 2 : Índice de densidad del tráfico y X 3 : Superficie media de parques por 1000 viviendas. Se han calculado las varianzas y covarianzas de dichas variables, y se ha obtenido la siguiente matriz S X = 3 1 2 1 3 2 2 2 4 (a) Sin hacer cálculos, Cuántas componentes principales hay como máximo? Cómo se definen dichas componentes principales? (b) Comprueba que los valores propios de la matriz de covarianzas son 0, 4 y 6. (c) Utilizando el Análisis de Componentes Principales, proporciona un solo índice que. represente a las tres variables de calidad de vida lo mejor posible. (d) De la variabilidad total de las provincias en las tres variables medidas, qué porcentaje recoge/explica el índice obtenido en (c)? (e) De la variabilidad que presentan las provincias en cada variable por separado, qué porcentaje explica/recoge el índice calculado en (c)? (f) Cuál es la correlación del índice obtenido en (c) con las tres variables de la calidad de vida? Según los resultados obtenidos valores altos del índice indican mejor calidad o peor calidad de vida? Problema 8 (Feb. 2007) Se midió el peso (X 1, en Kg.), la estatura (X 2, en cm.), el ancho de hombros (X 3, en cm.) y el ancho de caderas (X 4, en cm.) a n = 100 estudiantes de Economía, y se obtuvieron los siguientes resultados: Valores y vectores propios: x 1 = 54,25, x 2 = 161,73, x 3 = 36,53, x 4 = 30,1, 44,7 17,79 5,99 9,19 S X = 17,79 26,15 4,52 4,44 5,99 4,52 3,33 1,34 9,19 4,44 1,34 4,56 Valores 58.49 15.47 2.54 2.24 Vectores 0.833 0.509 0.188 0.106 0.503-0.855 0.020 0.123 0.136-0.059 0.111-0.983 0.187 0.074-0.975-0.089

4 (a) Seleccionar un número de componentes principales justificando adecuadamente los motivos de dicha elección. Escribir las componentes principales seleccionadas y su porcentaje de variabilidad explicado. (b) Calcular las comunalidades de las variables e interpretarlas. (c) Calcular las correlaciones entre las variables originales y las componentes principales. (d) A partir de las correlaciones obtenidas en (b), interpretar el significado de las componentes principales seleccionadas. Problema 9 (Feb. 2010) Se desea establecer un ranking entre distintos vinos españoles. Para esto, se valoran tres variables X 1 : Degustación, X 2 : Acidez total (contenido de ácido tartárico, garantía de buena elaboración) y X 3 : Sulfuro total (contenido en anhídrido sulfuroso, necesario para la conservación pero que puede afectar a la calidad). Un comité de expertos ha evaluado estas variables en n = 60 vinos españoles, asignando puntuaciones entre 1 y 3 sobre los niveles de estas variables. A partir de estas puntuaciones se ha calculado la siguiente matriz de covarianzas: 4/3 1/3 1/3 S X = 1/3 4/3 1/3 1/3 1/3 4/3 (a) (1 pto.) Define las componentes principales de (X 1, X 2, X 3 ). (b) (1 pto.) Calcula la primera componente principal, que será la variable que se utilizará para establecer el ránking entre los vinos. (c) (0.3 ptos.) Qué porcentaje de variabilidad recoge la primera componente principal? (d) (0.7 ptos.) Qué proporción de varianza de las variables originales está recogida por la primera componente principal? Cuál de las tres está mejor representada por esta componente? (e) (0.6 ptos.) Calcula los coeficientes de correlación entre cada una de las variables originales y la primera componente principal. (f) (0.4 ptos.) En función de los resultados del apartado (e), Cómo se caracterizan los vinos que ocuparán las primeras posiciones del ránking? Y los que ocuparán las últimas posiciones? Problema 10 (Sept. 2010) La siguiente tabla muestra los estadísticos descriptivos básicos referentes a las variables: X 1 : ratio inmovilizado/activo (inmoact), X 2 : ratio ventas/activos (ventact) y X 3 : ratio ventas/inmovilizado (ventim) tomadas a las 229 empresas españolas con mayores ventas:

5 Variable Media Desv. típica inmoact 0.481 0.248 ventact 1.477 1.270 ventinm 5.882 10.610 (a) (0.5 ptos.) A la vista de la información disponible sobre estas tres variables, justifica adecuadamente por qué sería más conveniente hacer un Análisis de Componentes Principales a partir de la matriz de correlaciones en lugar de la de covarianzas. (b) (0.5 pto.) Si las covarianzas entre cada par de variables son SX 2 1,X 2 = 0,140, SX 2 1,X 3 = 1,359 y SX 2 2,X 3 = 8,491, escribe las matrices de covarianzas y de correlaciones entre las tres variables. (c) (0.5 ptos.) Sabiendo que el mayor de los valores propios de la matriz de correlaciones es λ 1 = 2,065, calcula los otros valores propios. (d) (0.5 ptos.) Los vectores propios asociados a cada valor propio de la matriz de correlaciones vienen dados en la siguiente tabla: λ 1 = 2,065 λ 2 λ 3 v 1 v 2 v 3-0.539 0.824 0.177 0.585 0.516-0.625 0.607 0.234 0.760 Escribe las componentes principales de (X 1, X 2, X 3 ). (e) (0.5 ptos.) Escribe las varianzas de las componentes principales. Utilizando los tres criterios estudiados, dí con cuántas componentes te quedarías, justificando adecuadamente tu respuesta. (f) (1 pto.) Cuál de las tres variables originales está mejor representada por la primera componente? Justifica tu respuesta. (g) (1 pto.) Calcula los coeficientes de correlación entre cada una de las variables originales y la primera componente principal. (h) (0.5 ptos.) En función de los resultados del apartado anterior, cómo se caracterizan las empresas con mayores coordenadas positivas en la primera componente principal? Y cómo se caracterizan las empresas que tienen las menores coordenadas negativas? Puedes dar una interpretación a la primera componente principal?