EXAMEN DE ESTADÍSTICA

Documentos relacionados
ESTADÍSTICA CON EXCEL

El ejemplo: Una encuesta de opinión

Prácticas de Introducción a los Computadores Curso Hoja Gráficos: Hoja Regresión: ESPESOR 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 ESPESOR COSTES fij

Estadística Descriptiva y Probabilidad FORMULARIO

LA HOJA DE CÁLCULO. 1. INTRODUCCIÓN DE DATOS. CÁLCULOS CON FÓRMULAS.

Part I. Variables aleatorias unidimensionales. Estadística I. Mario Francisco. Definición de variable aleatoria. Variables aleatorias discretas

Estadística Descriptiva Bivariante e Intervalos de Confianza

Como usar Excel para resolver una regresión lineal usando la función predefinida estimacion.lineal.

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

CLASES DE ESTADÍSTICA II ESPERANZA ABSOLUTA

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

=A1+A2+A3+A4+A5+A6+A7+A8+B1+B2+B3+B4+B5+B6+B7+B8+C1+C2+C 3+C4+C5+C6+C7+C8

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Para aquellos que tengais conocimientos de Access es lo más parecido a una consulta de referencias cruzadas, pero con más interactividad.

Tema 4: Variables Aleatorias

3 ANALISIS DESCRIPTIVO DE LOS DATOS

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Cátedra: Estadística Técnica Facultad de Ingeniería UNCuyo. Índice D. Fernández & M. Guitart TABLA DE CONTENIDOS

Hoja de Cálculo. Práctica Coeficiente de correlación y recta de

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

Estadística. Sesión 4: Medidas de dispersión.

Tema 3: Análisis de datos bivariantes

Y accedemos al cuadro de diálogo Descriptivos

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

Variables aleatorias. Tema Introducción Variable aleatoria. Contenido

= 134, 5 Tercer cuartil: Q 3 = Pueden considerarse normales. =2 P 10 = 118 horas. f(x) =

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Open Office Calc. Elaboración de una tabla de valores de las áreas de la distribución normal

Método de cuadrados mínimos

MODELO DE RESPUESTAS Objetivos del 1 al 9

Variables aleatorias

ESTRUCTURA DEL EXAMEN DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II PARA ALUMNOS DE BACHILLERATO

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

A qué nos referimos con medidas de dispersión?

Tema 5. Muestreo y distribuciones muestrales

Manual Excel. Manual EXCEL. José Aurelio Pina Romero. José Aurelio Pina Romero Página 1

Distribuciones de Probabilidad.

1º BCNySyT Distribuciones binomial y normal Excel

Matemáticas. Selectividad ESTADISTICA COU

Práctica 2: Estadística Descriptiva (II)

LABORATORIO Nº 9 TABLAS DINÁMICAS

Vamos a utilizar la fórmula de la energía eléctrica y la fórmula de la potencia.

Z i

Coeficiente de Correlación

INDICE. Prólogo a la Segunda Edición

Manipulando celdas. Te recomendamos iniciar Excel 2007 ahora para ir probando todo lo que te explicamos.

1. Cómo introducir datos en SPSS/PC? - Recordatorio

2 Resolución de algunos ejemplos y ejercicios del tema 2.

Expresión decimal. Aproximación y estimación. Notación científica. Polinomios. Divisibilidad de polinomios. Regla de Ruffini.

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

2 4. c d. Se verifica: a + 2b = 1

GUIA DE AUTOAPRENDIZAJE #10 EXCEL 2003

Métodos Estadísticos de la Ingeniería Tema 7: Momentos de Variables Aleatorias Grupo B

Rendimiento de un activo

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Teoría de la decisión

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

UNIDAD 7 Medidas de dispersión

Tablas dinámicas Excel 2003

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Histogramas. Para crear un histograma. Para crear un histograma podemos utilizar el procedimiento Generador de gráficos en el Menú: o Gráficos:

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

UANL UNIVERSIDAD AUTONOMA DE NUEVO LEON PREPARATORIA 23

CM0244. Suficientable

Medidas de dispersión

INECUACIONES Y SISTEMAS DE INECUACIONES LINEALES.

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Problema 1.- Tengamos las puntuaciones de X, las predichas y las residuales:

2.- Tablas de frecuencias

Debemos obtener las medidas estadísticas más comunes.

EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

Práctica 04. Crear un registro de calificaciones

Prueba Integral Lapso /6

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

1 Tema 4: Variable Aleatoria Bidimensional y n-dimensional

Colegio de Geógrafos Delegación Territorial de Cantabria correo-e:

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

TEMA 3 REGRESIÓN Y CORRELACIÓN

Distribuciones de probabilidad bidimensionales o conjuntas

CORRELACION Y REGRESIÓN LINEAL

478 Índice alfabético


Operación de Microsoft Excel

TEMA 1: ESTADISTICA DESCRIPTIVA

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Aplicaciones de Estadística Descriptiva

Tema 2. Descripción Conjunta de Varias Variables

UNIVERSIDADES PÚBLICAS DE LA COMUNIDAD DE MADRID

Tema 4: Variables aleatorias multidimensionales

Departamento de Matemática Aplicada a las T.I.C. SOLUCIONES

TRABAJO: GRÁFICO EXCEL 2000

Transcripción:

EXAMEN DE ESTADÍSTICA SEGUNDA CONVOCATORIA ORDINARIA. 2001-2002 2 o curso de Ingeniería Técnica de Informática de Sistemas. Departamento de Estadística e Investigación Operativa 1. En el problema de la recta de mínimos cuadrados de Y sobre X (y = a + bx). (a) Define e interpreta la varianza residual de Y sobre X, S 2 e(y X). (b) Demuestre la relación entre las varianzas: S 2 Y, S2 Y (varianza de los valores ajustados) y S2 e(y X). (c) Define el coeficiente de determinación de Y sobre X, y justifique su interpretación. Se trata de una pregunta teórica que se encuentra desarrollada en los apuntes de la asignatura. 2. Se tienen dos urnas; la urna A contiene 5 bolas rojas y 3 blancas y la urna B contiene 1 bola roja y 2 blancas. Se lanza un dado equilibrado; si en el dado se obtiene un 3 o un 6, se extrae al azar una bola de B, que se introduce en A, y luego se extrae al azar una bola de A; si se obtiene otra puntuación en el dado, se extrae al azar una bola de A, que se introduce en B, y luego se extrae al azar una bola de B. Se pide calcular (a) Probabilidad de que al final del juego en la urna B, solamente queden dos bolas blancas. (b) Probabilidad de que las dos bolas extraídas sean rojas. Apartado (a) Apartado (b) P [B 1 ] = P [D 3,6 R B ] ] = P [D 3,6 ] P [R B D3,6 regla multipl. = 2 1 6 3 = 1 9 = 0.11111 P [RR] = P [ (D 3,6 R B R A ) (D c 3,6 R A R B ) ] = disj. = P [(D 3,6 R B R A )] + P [ (D3,6 c R A R B ) ] = regla multipl. = 2 1 6 6 3 9 + 4 5 2 6 8 4 = 61 216 = 0.2824 3. Sea la variable bidimensional (X, Y ), cuya tabla de frecuencias conjunta es X/Y 1 5 20 4 n 11 4 n 13 5 7 n 22 n 23 9 n 31 n 32 n 33 18 29 3

Se conocen los datos y x=9 = 6, x y=20 = 19 3, f 23 = 0.04 y la frecuencia relativa marginal de X = 5 que es 0.4. (a) Estudie la dispersión y la asimetría de la variable Y. (b) Estudie la posible existencia de observaciones outliers para la variable Y. (c) Complete la tabla. (d) Estudie la dependencia lineal entre ambas variables. Son independientes? Apartado (a) Para realizar estos cálculos no es necesario completar la tabla conjunta previamente, ya que la distribución de la variable Y la conocemos de forma completa Y n j 1 18 5 29 20 3 50 Medidas de dispersión (ȳ = 4.46, Q 1 = 1, Q 3 = 5) son S 2 y = 18.9684, S Y = 4.3527, CV Y = 0.97652, Rg(Y ) = 19, IQR Y = 4 Medidas de asimetría de la variable son γ Y 1 = 2.54618, As Y P = 0.12399 Apartado (b) Usando el método basado en la desviación típica, para k = 3 Para el método basado en el rango intercuartílico ( 8, 60582, 17.52582) [Q 1 1.5IQR, Q 3 + 1.5IQR] = [ 5, 11], [Q 1 3IQR, Q 3 + 3IQR] = [1, 17], Apartado (c) Se completa la tabla planteando las siguientes ecuaciones (1) ȳ x=9 = 1 n 31 + 5 n 32 + 20 n 33 = 6 (2) x y=20 = 4 n 13 3 + 5n 23 3 + 9 n 33 3 = 19 3 (3) f 23 = n 23 n = 0.04 (4) f 2 = 7 + n 22 + n 23 = 0.4 n (5) n = 18 + 29 + 3 = 50 (6) n 11 + 7 + n 31 = 18 (7) 4 + n 22 + n 32 = 29 (8) n 13 + n 23 + n 33 = 3 De (3) y utilizando (5) se obtiene n 23 = 0.04 50 = 2. De (4) y utilizando (3 y 5) se obtiene n 22 = 20 7 2 = 11. De (7) y utilizando lo anterior se obtiene n 32 = 14. De (2) y utilizando (8) se obtiene 4n 13 + 5 2 + 9(1 n 13 ) = 19; de donde 5n 13 = 19 9 10, es decir n 13 = 0. De (8) y utilizando lo anterior n 33 = 1 0 = 1.

De (1) y utilizando lo anterior n 31 + 5 14 + 20 1 = 6(n 31 + 15), de donde 5n 31 = 70 + 20 90, es decir n 31 = 0 y de (6) se obtiene n 11 = 11. X/Y 1 5 20 4 11 4 0 15 5 7 11 2 20 9 0 14 1 15 18 29 3 50 Apartado (d) Para estudiar la dependencia lineal utilizamos el coeficiente de correlación lineal r y vemos si r 2 0.75, ya que si es así, se diría que la dependencia lineal es aceptable (si fuese 1, la dependencia lineal es exacta): S X,Y = 2.566, r = 0.28445, r 2 = 0.08091 0.75 (S 2 X = 4.29, S X = 2.07123) Por otro lado se comprueba que las dos variables no son independientes, ya que por ejemplo no se cumple la condición de que las filas de la tabla conjunta de frecuencias absolutas sean proporcionales. 4. Sea X una variable aleatoria con función de densidad f(x) = kx + 1 2, para todo x [, 1]. (a) Determinar los valores de k para los cuales f(x) es ciertamente una función de densidad. (b) Calcular la esperanza y la moda de X. (c) Para qué valores de k se minimiza la varianza de X? Apartado (a) Debe verificarse que f(x) 0, para todo x [, 1]. Se han de distinguir dos casos: (a) Si k > 0, la función de densidad es una recta con pendiente positiva. Por lo tanto, tiene que imponerse que f() = k + 1/2 0, es decir, k 1/2. (b) Si k < 0, la recta tiene ahora pendiente negativa, por lo que es necesario que f(1) = k + 1/2 0, luego k /2. Se comprueba además que f(x) dx = 1, para cualquier valor de k, así que, de acuerdo con esto y lo visto anteriormente, para que f(x) sea función de densidad, k debe pertenecer al intervalo [/2, 1/2]. Apartado (b) Calculemos la esperanza de la variable X E [X] = x f(x) dx = x (kx + 1 2 ) dx = 2k 3 Por otra parte, para calcular la moda debemos tener en cuenta, al igual que en el primer apartado, el signo de la constante k. La moda es el valor que maximiza la función de densidad f(x). Ya que ésta es una función derivable en el intervalo [, 1], y además su derivada es igual a k, se obtiene que: (a) Si k > 0, entonces la moda de la variable X es 1. (b) Si k = 0, la moda es cualquier punto en el intervalo [, 1]. (c) Si k < 0, la moda es -1. Apartado (c) La varianza de la variable X es var(x) = E [ X 2] (E [X]) 2. Se tiene que E [ X 2] = x 2 f(x) dx = ( x 2 kx + 1 ) 2 dx = 1 3 De este modo, y conociendo, por el segundo apartado del problema, que E [X] = 2k 3, obtenemos que var(x) = 1 ( ) 2 2k 3 = 1 3 3 4k2 9 y se comprueba que esto se maximiza cuando k = 0, y se minimiza para k = ± 1 2, ya que se trata de una parábola cóncava.

5. Elija la opción que crea correcta en las siguientes cuestiones: Figura 1: Tabla dinámica Cuestión 1. para La pestaña que aparece en la tabla dinámica de la figura 1 junto al rótulo categoría sirve (a) hacer más grande la celda correspondiente. (b) abrir un menú de opciones sobre apariencia de la celda. (c) seleccionar las modalidades de categoría que se mostrarán en la tabla. (d) Ninguna de las anteriores. Cuestión 2. La función estadística frecuencia devuelve un rango de datos, por esta razón al salir del cuadro de diálogo de la figura 2 es necesario utilizar la combinación de teclas (a) Ctrl+Alt+F3. (b) Ctrl+Mayús+F1. (c) Ctrl+Mayús+Intro. (d) Ctrl+Alt+Intro. Cuestión 3. La utilidad de tablas dinámicas de Excel permite que en el interior de la tabla aparezcan diferentes tipos de datos como por ejemplo promedios o frecuencias absolutas de la submuestra de datos asociada a la categoría de fila y columna correspondiente. Cuál de los siguientes indicadores no está disponible en el menú de datos de dicha utilidad? (a) Máximo. (b) Suma. (c) Producto. (d) Mediana.

Figura 2: Cuadro de diálogo de la función frecuencia Cuestión 4. Supongamos que en una hoja de Excel los datos se encuentran en las casillas A1, A2 y A3 conteniendo respectivamente los números 1, 3 y 5, y en la C15 se escribe =A1+A$2+$A3. Si seleccionamos la casilla C15 y arrastramos con el ratón un lugar hacia abajo, el resultado que se obtendrá será: (a) 9. (b) 8. (c) 4. (d) 6. Cuestión 5. Al seleccionar en la barra de menús, Herramientas-Análisis de datos-estadística descriptiva, y modificar posteriormente los datos del rango de entrada, se modifican también los resultados? (a) Sí, automáticamente. (b) No, de ninguna forma. (c) Sí, si se especifica previamente. (d) Sí, si se especifica posteriormente. Las respuestas correctas son: cuestión 1 (c) cuestión 2 (c) cuestión 3 (d) cuestión 4 (d) cuestión 5 (b)