Ejercicio 1 (20 puntos)

Documentos relacionados
Ejercicio 1(10 puntos)

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013

ENUNCIADO y SOLUCIONES. Problema 1

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Solución Examen Parcial IV Nombres: Apellidos: C.I.: Firma: Fecha: 22/06/2005

UNIVERSIDAD DE ATACAMA

ANÁLISIS DE REGRESIÓN

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Cómo introducir Prueba de Hipótesis para una media, utilizando experimentos en el salón de clase.

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Juan Carlos Colonia INFERENCIA ESTADÍSTICA

EJERCICIOS SOBRE CONTRASTE DE HIPÓTESIS

PATRONES DE DISTRIBUCIÓN ESPACIAL

1. La Distribución Normal

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

INGENIERÍA INFORMÁTICA DE GESTIÓN Junio 2005

ANÁLISIS ESTADÍSTICO CORRELACIÓN LINEAL

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

El primer paso en la realización de una investigación es planear las hipótesis de investigación. Definamos el concepto de hipótesis:

Tema 8: Contraste de hipótesis

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Tema 4: Modelos probabilísticos

ANÁLISIS ESTADÍSTICO PRUEBA DE HIPOTESIS

ANALISIS ESTADISTICO MINISTERIO DE ECONOMIA Y FINANZAS

ESTADÍSTICA Y PROBABILIDAD

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

... *Elasticidad ingreso del gasto en electricidad (Modelo Restringido). reg lviv ling

8 Resolución de algunos ejemplos y ejercicios del tema 8.

Universitat Pompeu Fabra Licenciatura de ADE y Economía Econometría I / 10143) Profesor: Javier Coronado Examen Final Diciembre 2011

Análisis Estadístico. Dra. Adela Del Carpio Rivera Doctor En Medicina

Tests de Hipótesis basados en una muestra. ESTADÍSTICA (Q) 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

INTEREXPORT TELECOMUNICACIONES Y SERVICIOS S.A.

CONTROL ESTADISTICO DE LA CALIDAD

INFERENCIA ESTADISTICA

Estadística. Examen Final. Convocatoria extraordinaria 26 de junio de 2017 Nombre Grupo Número de Examen

1.- Lo primero que debemos hacer es plantear como hasta ahora la hipótesis nula y la alternativa

10.3. Sec. Prueba de hipótesis para la media poblacional. Copyright 2013, 2010 and 2007 Pearson Education, Inc.

Ejercicio 1(12 puntos)

RESPUESTAS BREVES A LA PRÁCTICA 6

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS.

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

EJERCICIOS CAPITULO 9. GUJARATI-PORTER (2010)

Estimación de Parámetros.

Considerar la siguiente colección de datos {10, 12, 12, 12, 10, 30, 0, 0, 0, 0, 0, 30, 30} para contestar las preguntas del 1al 5.

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Universidad de la República, Facultad de Ciencias Económicas y Administración.

Contraste de hipótesis con STATGRAPHICS

T2. El modelo lineal simple

Prueba de Hipótesis 1

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

Tema 6: Modelos probabilísticos

Estadísticas Pueden ser

Capítulo. Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

4. Prueba de Hipótesis

Notas de clase Estadística R. Urbán R.

EXAMEN DE ESTADÍSTICA Septiembre 2011

Técnicas de Inferencia Estadística II. Tema 2. Contrastes de hipótesis en poblaciones normales

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

Multiple Linear Regression

Método de cuadrados mínimos

Probabilidad y Estadística Segundo del grado en Telecomunicaciones, UAM, Examen de la convocatoria extraordinaria,

Juan Carlos Colonia PRUEBA DE HIPÓTESIS

Ejemplos Resueltos Tema 4

Teorema Central del Límite (1)

Inferencia con una variable Tema 2

DISTRIBUCION JI-CUADRADA (X 2 )

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Verificación de una hipótesis sobre una media

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

Variables aleatorias 1. Problema 1

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Tema 5.5: Contrastes de hipótesis

HIPOTESIS ESTADISTICA

Econometría II. Hoja de Problemas 1

Contraste de Hipótesis

PRUEBAS DE ACCESO A LA UNIVERSIDAD MATERIAS DE MODALIDAD: FASES GENERAL Y ESPECÍFICA CURSO

PROBLEMAS DE DISTRIBUCIÓN NORMAL Y INTERVALOS DE CONFIANZA MATEMÁTICAS APLICADAS A LAS CC.SOCIALES II

ESTADISTICA GENERAL. PRINCIPALES DISTRIBUCIONES CONTINUAS Profesor: Celso Celso Gonzales

Tema 5: Contraste de hipótesis

Estadística. Convocatoria ordinaria. 23 de mayo de Nombre Grupo.. Titulación.Número de Examen..

Transcripción:

ESTADISTICA Y SUS APLICACIONES EN CIENCIAS SOCIALES. Examen Montevideo, 15 de diciembre de 2015. Nombre: C.I.: EXAMEN Libre Reglamentado El examen consta de dos partes. La primera parte debe ser realizada por todos los alumnos y el tiempo previsto es de 2 horas. La segunda parte debe ser realizada sólo por los alumnos libres. El tiempo adicional para esta segunda parte es de 1 hora. PRIMERA PARTE Ejercicio 1 (20 puntos) En primaria están interesados en analizar si hombres o mujeres presentan mayor sobrepeso. Por tal motivo se realiza un relevamiento del peso y la altura de los asistentes a fin de saber si hay una relación entre estas variables. Se plantea el siguiente modelo: donde peso es el peso en kilogramos de los asistentes de primaria, altura es la altura en centímetros y mujer es una variable que toma valor 1 si la observación corresponde a una mujer. Se estimó la regresión mediante MCO. Los resultados son los que se presentan en la siguiente tabla: Source SS df MS Number of obs = 4071 -------------+------------------------------ F( 2, 4068) = 682.02 Modelo 45.5532233 2 22.7766117 Prob > F = 0.0000 Residuos 135.853331 4068.033395607 R-squared = xxxxx -------------+------------------------------ Adj R-squared = xxxxx Total 181.406554 4070.044571635 Root MSE =.18274 ------------------------------------------------------------------------------ log(peso) Coef. Std. Err. t P> t [95% Conf. Interval -------------+---------------------------------------------------------------- log(altura) 1.598961 0.06751 xxxxx 0.000 1.466604 1.731317 mujer -0.034918 0.007868-4.44 0.000 -.0503454 -.0194924 _cons -4.623369 0.412140-11.22 0.000-5.43139-3.815348 ------------------------------------------------------------------------------ a) Interprete el coeficiente asociado a la variable altura. b) La variable que indica si la observación es mujer, es significativos al 5% para determinar el peso? Responda utilizando los datos de la tabla sin realizar cálculos adicionales. c) Contraste la siguiente hipótesis: la altura no influye en el peso de los estudiantes una vez que se ha controlado por el género. Explique cuál sería la hipótesis nula de este contraste, la hipótesis alternativa (puede suponer la que quiera), el estadístico utilizado para la prueba de hipótesis, la regla de rechazo y su conclusión a un nivel de significancia del 5%. d) Calcule el R 2 y el R 2 -ajustado de este modelo como indicadores de la bondad de ajuste del modelo. Evalúe el ajuste del modelo.

Ejercicio 2 (20 puntos) Una variable aleatoria X sigue una distribución Uniforme[a,b, con parámetros a = 10 y b = 50. a) Hallar la media de la distribución b) Determinar el valor de la variable que acumula una probabilidad de 95 % para valores menores o iguales (percentil 95 de la distribución). c) Calcular P(20 < X 45). Ejercicio 3 (20 puntos) Del total de jóvenes entre 14 y 29 años de edad del país, un 16,5 % no estudia ni trabaja. Entre las mujeres entre 14 y 29 años de edad, la proporción que no estudia ni trabaja es 21,5 %, mientras que en el grupo de los varones del mismo tramo de edad dicha proporción es solamente 11,8 %. a) Cuál es la proporción de varones en la población entre 14 y 29 años de edad? b) Si una persona es seleccionada al azar en el grupo de edades entre 14 y 29 años y se observa que no estudia ni trabaja, qué probabilidad hay de que sea una mujer? SEGUNDA PARTE Ejercicio 4 (20 puntos) La distribución de probabilidad conjunta de dos variables aleatorias (X, Y ) está dada por: P(X,Y) Y 0 1 2 X 0 0,08 0,1 0,15 2 0,05 0,12 0,08 4 0,20 0,12 0,10 a) Son independientes X e Y? Fundamentar. b) Hallar P(X 4/Y 1). c) Calcular P(X + Y 3). d) Hallar E(X/Y = 1). Ejercicio 5 (20 puntos) La media obtenida para una variable a partir de una muestra de tamaño 900 es igual a 290, con una desviación estándar muestral igual a 127. a) Obtenga los intervalos de confianza al 95% y 99% para la media. Justifique la distribución en el muestreo de la media muestral utilizada. b) Explique cuál es la interpretación que podemos dar a los valores obtenidos para ambos intervalos. c) Pruebe la hipótesis nula Ho) : = 300 contra la alternativa bilateral al 5% y 1%, explicando el procedimiento seguido. d) Explique la relación entre los resultados obtenidos en los puntos a y c.

SOLUCION Solución Ejercicio 1 (20 puntos) a) La interpretación de es la siguiente: ante un incremento de 1% en la altura de los estudiantes, el peso aumenta en 1.59%, manteniendo el sexo constante. b) Según la evidencia de los datos con los que contamos, el sexo del individuo es significativo para explicar el peso de los individuos. Esto se debe a que el valor-p de mujer es 0 (menor al valor de significancia del 5%). También podemos concluir lo mismo observando los intervalos al 95% de confianza que calcula el programa, ya que el 0 no cae en intervalo calculado por el programa (o sea que si se sacan 100 muestras aleatorias, en 95 de esas muestras el 0 no es un valor que aparezca en el intervalo). c) Las prueba de hipótesis que se solicita es: Se supone que la hipótesis alternativa es bilateral: El estadístico t solicitado es: La regla de rechazo es:, donde Por lo tanto, el estadístico calculado (23,68) es mayor al valor crítico y cae dentro de la zona de rechazo. Rechazamos H 0: la altura afecta al peso, aún cuando se ha controlado por el sexo de la persona. d) Para medir la bondad de ajuste del modelo a los datos utilizamos el o el -ajustado. Estos indicadores nos dice cuánto de la variabilidad de la variable dependiente logra ser explicada por el modelo. El -ajustado considera la cantidad de variables que se incorporan a la regresión, por lo que da una medida más acertada de lo que explica el modelo. La altura y el sexo de los estudiantes explican aproximadamente el 25% de la variabilidad total de su peso, por lo que el modelo no se ajusta muy bien a los datos de la muestra. Solución Ejercicio 2 (20 puntos) a) E(X) = = (a+b)/2 = 30 b) El área bajo la densidad entre 10 y x 0.95 es igual a 0.95. La densidad es un rectángulo con altura igual a 1/40=0.025. Por lo tanto (x 0.95 10)*0.025 = 0.95. Se obtiene x 0.95 = 0.95/0.025 + 10 = 48 c) P(20 < X 45) es igual al área bajo la densidad entre 20 y 45. P(20 < X 45) = (45 20)* 0.025 = 0.625.

Solución Ejercicio 3 (20 puntos) El espacio muestral relevante es el de los jóvenes entre 14 y 29 años de edad. Definamos a los eventos M (mujer), H (hombre) y N (no estudia ni trabaja). Se nos indica que: P(N) = 0.165; P(N / M) = 0.215; y P(N/H) = 0.118.. a) Utilizamos que el conjunto de los que no estudian ni trabajan es la unión de dos conjuntos disjuntos, los varones que no estudian ni trabajan (N H) y las mujeres que no estudian ni trabajan (N H C ). La proporción que no estudia ni trabaja P(N) = P(N H) + P(N H C ). Como P(N/H) = 0.118 sabemos que P(N H) = P(N/H) *P(H) = 0.118*P(H). A su vez sabemos que P(N H C ) = P(N/H C )*P(H C ) = 0.215*(1 P(H)) Esto permite escribir la probabilidad P(N) = 0.165 = 0.118*P(H) + 0.215*(1 P(H)) = 0.215 + (0.118 0.215)*P(H). Esto permite obtener 0.97P(H) = 0.215 0.165 con lo cual P(H) = (0.215 0.165)/0.97= 0.515 b) P(M /N) = P(N/M) *P(M) /P(N) = 0.215 * (1 0.515)/0.165 = 0.631. Solución Ejercicio 4 (20 puntos) a) X e Y serían independientes si se cumpliera P XY (x,y) = P X (x) * P Y (y) para todo x, y. En este caso no se cumple, ya que tenemos P XY (0,0) = 0.08 P X (0) * P Y (0) =0,33 *0,33 = 0.109. Con que en un caso solo no se cumpla la condición, las variables no son independientes. b) P(X 4/Y 1) = P(X 4 Y 1) / P(Y 1) = *P XY (4,1) + P XY (4,2)/ [P Y (1) + P Y (2) = [0.12 + 0.10/ [0.34 + 0.33 = 0,328. c) Se trata de una variable aleatoria nueva Z = X + Y, y se pide calcular P(Z 3). La nueva variable toma los valores 0, 1, 2, 3, 4, 5, 6, con las probabilidades: P Z (0) = 0.08; P Z (1) = 0.1; P Z (2) = 0.05 + 0.15 =0.2; P Z (3) = 0.12; P Z (4) = 0.08+ 0.20=0.28; P Z (5) = 0.12; P Z (6) = 0.10. Por tanto P(X+Y 3) = P(Z 3) = P Z (0) + P Z (1) + P Z (2) + P Z (3) = 0.08 + 0.10 + 0.2 + 0.12 = 0.5 d) E(X/Y = 1) = xp X/Y (x/y=1). La cuantía condicional se obtiene P X/Y (x/y=1)= P XY (x,y)/ P Y (1). Por tanto P X/Y (0/Y=1)= 0.1/0.34 = 0,294; P X/Y (2/Y=1)= 0.12/0.34 = 0,353; P X/Y (2/Y=1)= 0.12/0.34 = 0,353. Finalmente E(X/Y = 1) = 0*0,294 + 2*0,353 + 4* 0,353 = 2,118. Solución Ejercicio 5 (20 puntos) La media obtenida para una variable a partir de una muestra de tamaño 900 es igual a 290, con una desviación estándar muestral igual a 127. a) Como la muestra es grande (n=900), sabemos que aproximada Normal(0,1). El intervalo de confianza al 95% está dado por: sigue una distribución [ Con =0.05 y n=900 se tiene:

[ El valor de tablas z 0.975 = 1,96. En la muestra se obtiene = 290, y s= 127, lo cual genera el intervalo: [290 1.96*127/30, 290 + 1.96*127/30 = [281,7, 298,3 El intervalo de confianza al 99% establece =0.01. Por lo tanto: [ El valor de tablas z 0.995 = 2,576. Se genera el intervalo: [290 2.576*127/30, 290 + 2.576*127/30 = [279,1, 300,9 b) La probabilidad de obtener un intervalo que contenga el verdadero valor del parámetro es, en cada caso, 1 -. Eso no garantiza que el valor del parámetro se encuentra comprendido entre los extremos del intervalo concreto que se ha calculado para esa muestra en particular. c) Prueba de hipótesis Ho): = 300 H1): 300 Estadístico de la prueba: Distribución bajo H0: Región crítica: Rechazo H0) si aproximadamente Normal(0,1) aproximadamente Normal(0,1) i. Con =0.05. >1,96 = z 0.075 Rechazo Ho. ii. Con =0.01. <2,576 = z 0.075 No Rechazo Ho. d) Los intervalos de confianza y prueba de hipótesis están relacionados, pues ambos se basan en la misma distribución aproximada de la media muestral. El intervalo al 95% de confianza no contiene el valor 300, y la prueba de hipótesis al 95% rechaza la hipótesis nula de que la media es igual a 300. En cambio el intervalo al 99% sí incluye al valor 300, y en la prueba no se puede rechazar la hipótesis nula de que la media es igual a 300. Si se requiere más confianza ( más chico), se tiene menor precisión (intervalo más ancho).