Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)

Documentos relacionados
INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

Tema 8: Contraste de hipótesis

Intervalos de confianza

INFERENCIA ESTADISTICA

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

Tema 4: Probabilidad y Teoría de Muestras

Teorema Central del Límite (1)

Tema 5. Muestreo y distribuciones muestrales

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

Tema 7 Intervalos de confianza Hugo S. Salinas

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Tema 5: Estimación puntual y por intervalos

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Tema 5: Introducción a la inferencia estadística

Intervalos para la diferencia de medias de dos poblaciones

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

INFERENCIA ESTADÍSTICA

Juan Carlos Colonia INTERVALOS DE CONFIANZA

Tema 4: Probabilidad y Teoría de Muestras

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

Tema 8. Muestreo. Indice

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Objetivos. 1. Variable Aleatoria y Función de Probabilidad. Tema 4: Variables aleatorias discretas Denición de Variable aleatoria

Unidad IV: Distribuciones muestrales

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

478 Índice alfabético

EJERCICIOS DE SELECTIVIDAD

Tema 11: Intervalos de confianza.

Variable Aleatoria Continua. Principales Distribuciones

Conceptos del contraste de hipótesis

Resumen teórico de los principales conceptos estadísticos

a. N(19 5, 1 2) P(19 X 21) = P( Z ) = = P = P P = = P P = P = = = El 55 72% no son adecuados.

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso

1. Estadística Descriptiva 9

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Tema 5. Muestreo y distribuciones muestrales

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

F (x, y) = no es la función de distribución acumulada de ningún vector aleatorio. b) Mostrar que. { (1 e x )(1 e y ) si x 0, y 0

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Grado en Ingeniería Informática Estadística Tema 5: Teoría Elemental del Muestreo e Inferencia Paramétrica Ángel Serrano Sánchez de León

TEMA 3: Contrastes de Hipótesis en el MRL

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Cálculo de Probabilidades II Preguntas Tema 1

ACTIVIDAD 2: La distribución Normal

Tema 9: Contraste de hipótesis.

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Contrastes de hipótesis. 1: Ideas generales

Prueba Integral Lapso /6

Determinación del tamaño de muestra (para una sola muestra)

Teoría de muestras 2º curso de Bachillerato Ciencias Sociales

Conceptos Básicos de Inferencia

ESTADÍSTICA. Tema 2 Nociones elementales de inferencia estadística

Tema 13: Distribuciones de probabilidad. Estadística

Tema 6. Variables aleatorias continuas

Ejercicio 1(10 puntos)

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Muestreo y Distribuciones muestrales. 51 SOLUCIONES

Métodos Estadísticos Multivariados

Técnicas Cuantitativas para el Management y los Negocios I

Estadistica II Tema 1. Inferencia sobre una población. Curso 2009/10

1. La Distribución Normal

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2011 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

2.- Tablas de frecuencias

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Contrastes de Hipótesis paramétricos y no-paramétricos.

INFERENCIA DE LA PROPORCIÓN

Definición de probabilidad

Teoría de la decisión

Introducción al Tema 8. Tema 6. Variables aleatorias unidimensionales Distribución. Características: media, varianza, etc. Transformaciones.

ESTADISTICA GENERAL. INFERENCIA ESTADISTICA Profesor: Celso Celso Gonzales

ESTADÍSTICA. Tema 4 Regresión lineal simple

PROBABILIDAD Y ESTADÍSTICA

Teoría de la decisión Estadística

Tema 7: Estadística y probabilidad

PATRONES DE DISTRIBUCIÓN ESPACIAL

6. ESTIMACIÓN DE PARÁMETROS

Estadística Avanzada y Análisis de Datos

proporciones y para la Estadística II Equipo Docente: Iris Gallardo Andrés Antivilo Francisco Marro

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

Estadística y sus aplicaciones en Ciencias Sociales 2. Modelos de probabilidad

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2004 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Análisis de la varianza ANOVA

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Tema 3. Comparaciones de dos poblaciones

Distribución Chi (o Ji) cuadrada (χ( 2 )

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Facultad de Ciencias Sociales - Universidad de la República

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística

Transcripción:

Tema 3: Estimación estadística de modelos probabilistas. (segunda parte) Estructura de este tema: 1 Técnicas de muestreo y estimación puntual. 2. 3 Contrastes de hipótesis.

Planteamiento del problema Sea X 1,..., X n una m.a. de una población X con función de distribución F θ, siendo θ un parámetro desconocido: X F θ. La estimación puntual nos proporciona un valor concreto como aproximación de un parámetro desconocido: ˆθ. Sin embargo, en general no se precisa la incertidumbre existente en dicha estimación. La estimación por intervalos de confianza nos proporciona un intervalo de valores donde el parámetro θ se puede encontrar, especificando además el grado de fiabilidad de la estimación. Observación: Cuando decimos que el estimador de µ es, p.e., 7.15, lo que estamos diciendo en realidad es que es, aproximadamente, 7, 15. Para cuantificar este aproximadamente lo hacemos con los Intervalos de Confianza.

Intervalos de confianza: Definiciones Un intervalo de confianza, IC, para el parámetro θ es un intervalo, calculado a partir de la muestra, que contiene a θ con un alto grado de fiabilidad. La fórmula general de los intervalos que vamos a estudiar es: IC(θ) = (ˆθ Margen de error) El margen de error (o error máximo) depende de la precisión del estimador utilizado, del grado de fiabilidad con el que queremos que el intervalo contenga al parámetro. El grado de fiabilidad de que el verdadero valor del parámetro se encuentre en el IC construido, se denomina nivel de confianza y se denota por 1 α, donde α es un valor entre 0 y 1 fijado previamente.

El nivel de confianza 1 α es la probabilidad de que θ se encuentre en el intervalo construido (IC): 1 α = P{θ IC(θ)} = P{θ (ˆθ Margen de error)} El nivel de significancia α es la probabilidad de equivocarnos al afirmar que el parámetro se encuentra en el IC obtenido: α = P{θ / IC(θ)} = P{θ / (ˆθ Margen de error)} Obs: Habitualmente se trabaja con niveles de confianza del 90% (α = 0.1), del 95% (α = 0.05) y del 99% (α = 0.01).

Cómo construir Intervalos de Confianza? Ejemplo ilustrativo : IC para la media de una población normal (con varianza σ 2 conocida) La resistencia de ciertos componentes eléctricos fabricados en un proceso es una v.a. que sigue una distribución Normal con media desconocida (en ohmios) y desviación típica conocida σ = 0.25 ohmios 2 : X N(µ, 0.25). Queremos estimar la concentración media, µ, con un nivel de confianza del 95%. Primer paso: De una muestra de 12 observaciones obtenemos que la concentración media es x = 24.93. Esto significa que µ 24.93. Obs: Por supuesto, µ 24.93. Si tomáramos otras 12 piezas distintas nos habría resultado una estimación de µ diferente. Un IC es una forma de precisar qué significa µ 24.93. Segundo paso: Queremos construir un IC de la forma ( x C) que contenga al verdadero valor µ. Cómo será C?...

) σ Teniendo en cuenta que si X N(µ, σ), entonces X N (µ, n, buscamos un número C tal que: P{ X C < µ < X + C} = 1 α P{µ C < X < µ + C} = 1 α Z= X µ σ/ n N(0,1) P{ C σ/ n < Z < C σ/ n } = 1 α P{Z C σ/ } = α n 2 }{{} = σ C = z α/2 n z α/2 Por tanto σ σ ) ( σ ) IC 1 α (µ) = ( x z α/2 n, x + z α/2 n = x z α/2 n }{{} error máximo

Si particularizamos a un nivel de confianza del 95% y tamaño muestral 12, se cumple: IC 95% (µ) = ( x 1.96 0.072) es decir: x 1.96 0.072 < µ < x + 1.96 0.072. Podemos afirmar que, aproximadamente para el 95% de las muestras de tamaño 12, se cumple que µ ( X 0.1411). Decimos que (24.93 0.1411) es un IC para µ a un nivel de confianza del 95%. Cuestiones: Con los mismos datos del ejemplo anterior calcula los IC cuyos nivel de confianza sean 90% y 99%. Si x = 24.93 pero la muestra era de 36 observaciones en lugar de 12. Calcula un IC de nivel 95%. Si x = 24.93 con una muestra de 36 observaciones pero σ = 1 en lugar de σ = 0.25. Calcula un IC de nivel 95%.

Fórmula general: Un IC con nivel de confianza 1 α para la media de una población normal con σ conocida viene dado por: ) σ IC 1 α (µ) = ( x z α/2 n Aparecen tres cantidades variables: la confianza, 1 α; el tamaño muestral, n; el error máximo, z α/2 σ n. A mayor tamaño muestral, n, se reduce el intervalo de confianza (se reduce el error). A mayor confianza exigida, 1 α, aumenta el intervalo de confianza (aumenta el error). Cualesquiera dos de estas tres cantidades permiten determinar la otra tercera. Fijado un nivel de confianza, podemos encontrar el tamaño de la muestra necesario para que el error de la estimación sea tan pequeño como queramos. Esto ocurre en el resto de los intervalos de confianza que veremos.

Interpretación del nivel de confianza Si para estimar un parámetro hemos recogido muchas muestras, con cada muestra obtendremos distintos intervalos de confianza. Entre éstos algunos contendrán el verdadero valor del parámetro y otros no. Al tomar muchos intervalos, la proporción de ellos que contiene al parámetro será aproximadamente el (1 α)100%. Ejemplo: Se extraen 100 muestras de tamaño n = 20 de una población normal con media µ = 0 y σ = 1. Para cada muestra se calcula x y el intervalo de confianza para µ de nivel 95% (suponemos varianza poblacional conocida) es: σ ) IC 95% (µ) = ( x z 0.025 n = ( x 1.96 1 20 ).

x (1) 1,..., x (1) 20 IC (1) 95% ( x (µ) = (1) 1.96/ ) 20. x (2) 1,..., x (2) 20 IC (2) 95% ( x (µ) = (2) 1.96/ ) 20.. x (100) 1,..., x (100) 20 IC (100) 95% ( x (µ) = (100) 1.96/ ) 20. Se representa un histograma de las 100 medias obtenidas, así como los 100 intervalos (en verde si contienen el valor 0 y en rojo si no). Medias Intervalos Frecuencias 0 5 10 15 20 25 3 2 1 0 1 2 3 0.4 0.2 0.0 0.2 0.4 0.6 1.5 1.0 0.5 0.0 0.5 1.0 1.5

Ejemplo 3.4: Con el fin de determinar las imprecisiones en la velocidad de transmisión en un servidor de la universidad, se descarga un fichero de 2Mb de él y se anota el tiempo necesario para la descarga. Suponemos que la variable Tiempo de descarga de ficheros de 2 Mg sigue una distribución Normal con desviación típica de 0, 12 seg 2. En el día de hoy se extrae una muestra aleatoria de 60 cuyo tiempo medio es de 4, 07 seg. (a) Hallar un IC del 99% para el tiempo medio de descarga del servidor el día de hoy. (b) Sin realizar los cálculos, determinar si un IC del 95% para la media poblacional tendría mayor, menor o la misma longitud que el de (a). (c) Se decide que mañana se tomará una muestra de 20. Sin realizar los cálculos, determinar si un IC del 99% para el tiempo medio de descarga mañana tendría mayor, menor o la misma longitud que el de (a). (d) Se sabe que la desviación típica poblacional para la descarga de hoy es de 0,15 seg 2. Sin realizar los cálculos, determinar si un IC del 99% para el tiempo medio de descarga hoy tendría mayor, menor o la misma longitud que el de (a).

Siguiente objetivo: Acabamos de ver cómo se deduce el IC para el parámetro µ de una v.a. X N(µ, σ), con σ un dato conocido: σ σ ) σ ) IC(µ) = ( x z α/2 n, x + z α/2 n = ( x z α/2 n La idea es ver cómo son los IC de los distintos parámetros asociados a las distribuciones que hemos estudiado en clase: IC(µ) si X N(µ, σ), con σ un dato desconocido, IC(σ) si X N(µ, σ), con µ un dato conocido o desconocido, IC(µ) e IC(σ) si X N(µ, σ) con ambos parámetros desconocidos. IC(p) si X Bernoulli(p) IC(λ) si X Poisson(λ) Todas estos intervalos se basan en el intervalo anterior, pero necesitamos estudiar unas variantes de la distribución normal.

Distribuciones asociadas a la normal Las siguientes distribuciones de probabilidad aparecen de modo natural a partir de muestras de distribuciones normales. La distribución χ 2 de Pearson Sean X 1,..., X n v.a. independientes idénticamente distribuidas (i.i.d.) con distribución N(0, 1). La variable aleatoria n i=1 X i 2 sigue una distribución χ 2 de Pearson con n grados de libertad: Densidad de la χ 2 n n i=1 X 2 i χ 2 n;α n χ 2 n;α z α N(0, 1) 1 0.8 0.6 0.4 χ 2 1 χ 2 2 χ 2 3 χ 2 4 χ 2 5 0.2 0 0 2 4 6 8

La distribución t de Student Sean Y, X 1,..., X n v.a.i.i.d. con distribución N(0, 1). La variable Y aleatoria sigue una distribución t de Student con n n i=1 X i 2 1 n grados de libertad: 1 n Y n i=1 X i 2 t n;α n t n;α z α N(0, 1) 0.4 0.3 0.2 0.1 Densidad de la t N(0,1) t 5 t 2 0 5 0 5

La distribución F de Fisher Sean X 1,..., X m, Y 1,..., Y n v.a.i.i.d. con distribución N(0, 1). La v.a. 1 m i=1 X i 2 n j=1 Y j 2 m 1 n sigue una distribución F de Fisher con m y n grados de libertad: 1 m 1 n m i=1 X 2 n j=1 Y 2 j i F m,n;α m, n F m,n;α z α N(0, 1) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Densidad de la F F 5,3 F 4,6 0 0 1 2 3 4 5 6

Puntos de Porcentaje de la distribución F Tablas de la distribución F n1,n 2 Normal (α = 0.05) y negrita (α = 0.01). n 1 grados de libertad: primer subíndice. n 2 : grados de libertad: segundo subíndice. Ejemplo: Para n1 = 9, n2 = 12 grados de libertad: P[ F > 2.80 ] = 0.05 P [ F > 4.39 ] = 0.01 n2 5 % (normal) y 1 % (negritas) puntos para la distribución de F n1 grados delibertad (para el mayor cuadrado medio) n2 1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 500 1 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254 1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.49 19.49 19.49 19.50 2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.48 99.49 99.49 99.50 99.50 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.71 8.69 8.66 8.64 8.62 8.59 8.58 8.56 8.55 8.54 8.53 8.53 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.41 26.35 26.28 26.24 26.18 26.15 26.13 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.87 5.84 5.80 5.77 5.75 5.72 5.70 5.68 5.66 5.65 5.64 5.63 4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.25 14.15 14.02 13.93 13.84 13.75 13.69 13.61 13.58 13.52 13.49 13.46 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.41 4.39 4.37 4.37 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.77 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.08 9.04 9.02 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.73 3.71 3.69 3.68 3.67 6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.40 7.31 7.23 7.14 7.09 7.02 6.99 6.93 6.90 6.88 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.53 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.27 3.25 3.24 3.23 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.36 6.28 6.16 6.07 5.99 5.91 5.86 5.79 5.75 5.70 5.67 5.65 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.24 3.20 3.15 3.12 3.08 3.04 3.02 2.99 2.97 2.95 2.94 2.93 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.56 5.48 5.36 5.28 5.20 5.12 5.07 5.00 4.96 4.91 4.88 4.86 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.03 2.99 2.94 2.90 2.86 2.83 2.80 2.77 2.76 2.73 2.72 2.71 9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.01 4.92 4.81 4.73 4.65 4.57 4.52 4.45 4.41 4.36 4.33 4.31 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.86 2.83 2.77 2.74 2.70 2.66 2.64 2.60 2.59 2.56 2.55 2.54 10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.60 4.52 4.41 4.33 4.25 4.17 4.12 4.05 4.01 3.96 3.93 3.91 5

Intervalos de confianza en poblaciones normales: X N(µ, σ) Propiedad: Sea X 1,..., X n una muestra aleatoria de una v.a. X, tal que X N(µ, σ). Entonces, los estimadores insesgados ˆµ = X y ˆσ 2 = S 2 x son v.a. independientes que verifican: X N ( ) σ µ, n X µ σ n N(0, 1) X µ S x n t n 1 (n 1) S 2 x σ 2 χ 2 n 1

Intervalos de confianza en poblaciones normales: X N(µ, σ) Intervalos de confianza para la media µ al nivel de confianza 1 α: Si σ es conocido: recordemos que ˆµ = X y usamos z α/2 ) ) σ σ σ IC 1 α (µ) = ( x z α/2 n, x + z α/2 n = ( x z α/2 n. Si σ es desconocido: recordemos además que ˆσ = S x y en lugar de buscar z α/2 en las tablas buscamos t n 1,α/2 ( ) s IC 1 α (µ) = x t n 1;α/2 si n 30 n ( ) s IC 1 α (µ) = x z α/2 si n > 30 n

Ejemplo 3.5: En el estudio de la temperatura máxima que puede alcanzar una resistencia, consideremos la v.a. tiempo que tarda en alcanzarla. Se obtiene la siguiente muestra: 1.7 1.6 1.8 1.9 (en segundos) Asumiendo normalidad en los datos: (a) Estima el tiempo medio µ para toda la población de resistencias. La estimación de µ es la media muestral: µ ˆµ = x x = 1.7 + 1.6 + 1.8 + 1.9 4 = 1.75. (b) Halla el error típico de la estimación anterior: E.T.( x)= s x n sx 2 = (1.7 1.75)2 + (1.6 1.75) 2 + (1.8 1.75) 2 + (1.9 1.75) 2 3 Por tanto s x = 0.017 0.13 y E.T.( x)= s x = 0.13 = 0.065. n 2 = 0.017

(c) Calcula un intervalo de confianza para µ al 90%. Como t 3;0.05 = 2.353 IC 90% (µ) = (1.75 2.353 0.065) = (1.597, 1.903). Podemos afirmar que 1.597 < µ < 1.903 con un nivel de confianza del 90%. (d) Calcula otro intervalo, pero ahora con un nivel del 95%. Como t 3;0.025 = 3.182, un I.C. con nivel de confianza 1 α = 0.95 es IC 95% (µ) = (1.75 3.182 0.065) = (1.543, 1.957). Podemos afirmar que 1.543 < µ < 1.957 con un nivel de confianza del 95%.

Intervalos de confianza en poblaciones normales: X N(µ, σ) IC para la varianza σ 2 al nivel de confianza 1 α: Recordemos que n 1 S 2 σ 2 x χ 2 n 1 y P σ 2 P σ 2 { χ 2 n 1;1 α/2 < (n 1)S 2 x { (n 1)S 2 x χ 2 n 1;α/2 σ 2 < σ 2 < (n 1)S 2 x χ 2 n 1;1 α/2 } < χ 2 n 1;α/2 = 1 α } = 1 α Por tanto, IC 1 α (σ 2 ) = ( (n 1)sx 2 χ 2, n 1;α/2 (n 1)s 2 x χ 2 n 1;1 α/2 )

Ejemplo 3.2 (cont.): Se contabiliza el tiempo (en milisegundos) de acceso a un registro de una base de datos. Debido a imprecisiones en los aparatos, las medidas tienen distribución normal. Se toma una muestra aleatoria de siete tiempos 1, 5 2, 1 1, 9 2, 3 2, 5 3, 2 3, 0 (ms) Utilizando estos datos (asumiendo normalidad) construye un IC al 90% para la desviación típica.

Intervalos de confianza en poblaciones normales IC para la diferencia de medias de dos poblaciones normales independientes, X N(µ 1, σ) e Y N(µ 2, σ), al nivel de confianza 1 α: Si σ es desconocido: Recordemos que ˆσ = S x y X µ S x / n t n 1. Por lo tanto ( ) donde IC 1 α (µ 1 µ 2 ) = x ȳ t m+n 2;α/2 s p 1 m + 1 n s 2 p = (m 1)s2 1 + (n 1)s2 2 m + n 2 es una media ponderada de las cuasivarianzas muestrales s 2 1 = 1 m 1 m i=1 (x i x) 2 y s 2 2 = 1 n 1, n (y i ȳ) 2. i=1

Ejemplo 3.6: La resistencia de ciertos componentes eléctricos fabricados en un proceso es una v.a. que sigue una distribución Normal. Un sistema acopla 2 componentes en serie, A y B, y se realizó un experimento para comparar la resistencia promedio para cada componente (X e Y respectivamente). Se realizaron 24 observaciones del proceso (doce de ellas para el A y las otras doce para el B) y se obtuvieron los siguientes datos: Para A: x = 26.8 ohmios, s 2 x = 15.57 ohmios 2 ; Para B: ȳ = 32.6 ohmios, s 2 y = 17.54 ohmios 2. Queremos saber si estos datos muestrales proporcionan evidencia de que B realmente tiene mayor resistencia o es fruto del azar. Para ello contesta a los siguientes apartados: (a) Calcular un intervalo de confianza del 95% para la diferencia. (Suponer varianzas iguales). (b) Teniendo en cuenta el resultado anterior cuál de los dos componentes tiene mayor resistencia?

Intervalos de confianza en poblaciones normales IC para la diferencia de medias de dos poblaciones normales independientes, X N(µ 1, σ 1 ) e Y N(µ 2, σ 2 ), al nivel de confianza 1 α: Si σ 1 y σ 2 son conocidas IC 1 α (µ 1 µ 2 ) = ( Si σ 1 y σ 2 son desconocidas ( IC 1 α (µ 1 µ 2 ) = σ 2 x ȳ z 1 α/2 m + σ2 2 n x ȳ t f ;α/2 s 2 1 m + s2 2 n ). ) ( s 2 1m + s2 2n ) 2 donde f es el entero más próximo a. (s 1 2/m)2 m 1 + (s2 2 /n)2 n 1

Intervalos de confianza en poblaciones normales IC para el cociente de las varianzas de dos poblaciones normales independientes, X N(µ 1, σ 1 ) e Y N(µ 2, σ 2 ), al nivel de confianza 1 α: ( ) ( σ 2 IC 1 s1 2 1 α σ2 2 = /s2 2, F m 1;n 1;α/2 1 s 2 1 /s2 2 F m 1;n 1;1 α/2 Observación: F n1 ;n 2 ;1 C = F n2 ;n 1 ;C Ejemplo 3.4 (cont.): En el estudio sobre la velocidad de transmisión en los servidores de la universidad, se quieren comparar dos de ellos: Servidor I y Servidor II; para lo que se estudia el Tiempo de descarga de ficheros de 2 Mg en cada uno (asumimos normalidad en los datos). Se realizan 56 observaciones: 31 con el Servidor I y 25 con el Servidor II; y se obtienen unas cuasivarianzas de 50 y 35 respectivamente. Podemos afirmar, al nivel 90%, que el Servidor I tiene mayor varianza? ).

Datos emparejados: Sea (X 1, Y 1 ),..., (X n, Y n ) una muestra aleatoria de (X, Y ) donde X e Y no son independientes, pero los pares (X i, Y i ) son independientes entre sí. Denotemos E(X ) = µ 1 y E(Y ) = µ 2 y supongamos que D = X Y N(µ = µ 1 µ 2, σ). Entonces D 1 = X 1 Y 1,..., D n = X n Y n es una muestra aleatoria de D. Podemos construir intervalos de confianza para µ = µ 1 µ 2 y para σ como mostramos en las transparencias correspondientes a una v.a con distribución: D N(µ, σ).

Ejemplo ilustrativo : Para comparar la eficiencia de dos compiladores de cierta marca conocida, se consideraron las variables: X = tiempo de ejecución (en seg.) para el Compilador A Y = tiempo de ejecución (en seg.) para el Compilador B. A continuación se seleccionaron al azar 14 programas y se ejecutaron con cada uno de los compiladores. Los resultados aparcen en la siguiente tabla: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 X 2.9 4.0 3.4 3.2 3.8 5.2 3.9 3.9 2.5 6.5 5.5 4.0 5.3 4.3 Y 3.9 3.9 3.3 4.3 3.2 3.5 2.7 2.4 3.6 2.1 4.0 3.9 4.0 2.0 Se desea estudiar si estos datos muestrales permiten concluir que el Compilador B es más eficiente que el Compilador A. Resolver este apartado suponiendo que la distribución de los tiempos de ejecución son Normales

El problema se ha reducido a trabajar con una v.a.: D N(µ, σ); donde µ = µ X µ Y y σ desconocido, por lo tanto hallamos d i = x i y i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 2.9 4.0 3.4 3.2 3.8 5.2 3.9 3.9 2.5 6.5 5.5 4.0 5.3 4.3 3.9 3.9 3.3 4.3 3.2 3.5 2.7 2.4 3.6 2.1 4.0 3.9 4.0 2.0 1.0 0.1 0.1 1.1 0.6 1.7 1.2 1.5 1.1 4.4 1.5 0.1 1.3 2.3 IC 90% (µ) = ( d tn 1;α/2 s ) ( d s ) d = d t13;0.05 n 14 donde d = 1 14 14 i=1 d i = 0.83 t 13;0.05 = 1.771 14 i=1 s d = (d i d) 2 = 1.39 13

Intervalos de confianza para otras distribuciones Teorema Central del Límite: Sea X 1,..., X n una muestra aleatoria de una v.a. X (discreta o continua) y n grande. Entonces ( Var(X ) ) X N E(X ), n X E(X ) Var(X ) n N(0, 1)

Intervalos de confianza para otras distribuciones Intervalo de confianza al 1 α para el parámetro p de una Bernoulli Sea X 1,..., X n una m.a. de X Bernoulli(p). Recordemos que E(X ) = p, V (X ) = p(1 p) y ˆp = X. Entonces ( ) x(1 x) IC 1 α (p) = x z α/2 (para n grande) n Intervalo para diferencia de proporciones de Bernoullis Sean X 1,..., X m e Y 1,..., Y n m.a.i. de X Bernoulli(p 1 ) e Y Bernoulli(p 2 ) respectivamente, tal que ˆp 1 = X y ˆp 2 = Ȳ. Utilizando los intervalos construidos en sección correspondiente obtenemos IC 1 α (p 1 p 2 ) = ( x ȳ z α/2 x(1 x) m + ) ȳ(1 ȳ) n (para m y n grandes)

Ejemplo 3.7: Se van a celebrar unas elecciones y el presidente de un cierto partido poĺıtico quiere hacer un sondeo de opinión. Después de extraer una muestra aletoria simple de tamaño 1000, se observó que 550 personas pensaban votarle a él. Podemos afirmar con un confianza del 99% que dicho presidente será reelegido?.

Intervalos de confianza para otras distribuciones Intervalo de confianza al 1 α para el parámetro λ de una Poisson Sea X 1,..., X n una muestra de X Pois(λ). Recordemos que E(X ) = V (X ) = λ y ˆλ = X. Entonces ( ) IC 1 α (λ) = x z α/2 x n (para n grande) Intervalo para diferencia de proporciones de Poissones Sean X 1,..., X m e Y 1,..., Y n m.a.i. de X Pois(λ 1 ) e Y Pois(λ 2 ) respectivamente, tal que ˆλ 1 = X y ˆλ 2 = Ȳ. Utilizando los intervalos construidos en sección correspondiente obtenemos ( ) x IC 1 α (λ 1 λ 2 ) = x ȳ z α/2 m + ȳ (para m y n grandes) n

Ejemplo 3.8: Admitiendo que el número de erratas por página de cierto libro sigue una distribución de Poisson, determinar un intervalo de confianza al 95% del número medio de erratas por página que contiene dicho libro, teniendo en cuenta que se eligieron al azar y con reemplazamiento 100 páginas en las que se observó una media muestral de 0.04 erratas por página.

Mínimo tamaño muestral El error cometido al estimar un parámetro θ mediante un intervalo de confianza IC 1 α (θ) es la semilongitud del intervalo. Observación: Esta definición tiene sentido principalmente en intervalos del tipo IC 1 α (θ) = (ˆθ semilongitud). Objetivo: Determinar el mínimo tamaño muestral n necesario para que el error cometido al estimar θ mediante un intervalo de confianza sea menor que una cierta cantidad. Queremos que la estimación por intervalo de confianza tenga una determinada precisión. El valor de n obtenido debe tomarse como orientativo, especialmente cuando la semilongitud del intervalo dependa de la muestra observada.

Ejemplo 3.9: Supongamos que la altura de los individuos de cierta población sigue una distribución N(µ, 7.5). Hallar el mínimo tamaño muestral necesario para estimar la altura media con un margen de error inferior a 2 y con una confianza del 90%. Determinar el error típico.