PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Documentos relacionados
Teorema Central del Límite (1)

Tema 5. Contraste de hipótesis (I)

Contrastes de hipótesis paramétricos

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

INFERENCIA ESTADISTICA

CONCEPTOS FUNDAMENTALES

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Técnicas Cuantitativas para el Management y los Negocios I

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

TEMA 4: CONTRASTES DE HIPÓTESIS. CONCEPTOS BÁSICOS

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

CAPÍTULO I. INTRODUCCIÓN. Cuando se requiere obtener información de una población, y se desean obtener los mejores

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

Ejercicios T2 y T3.- DISTRIBUCIONES MUESTRALES Y ESTIMACIÓN PUNTUAL

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

OPCIÓN A. La empresa A (x) tiene 30 trabajadores, la B (y) 20 trabajadores y la C (z) 13 trabajadores.

Tema 4: Probabilidad y Teoría de Muestras

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Tema 5 Algunas distribuciones importantes

MATERIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II INSTRUCCIONES Y CRITERIOS GENERALES DE CALIFICACIÓN

Objetivos. Epígrafes 3-1. Francisco José García Álvarez

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Estadística Avanzada y Análisis de Datos

Tema 4. Probabilidad Condicionada

CAPÍTULO 4 TÉCNICA PERT

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

Simulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Pruebas de Hipótesis Multiples

Fase 2. Estudio de mercado: ESTADÍSTICA

Conceptos Básicos de Inferencia

Tema 4: Probabilidad y Teoría de Muestras

Tema 5: Introducción a la inferencia estadística

EJERCICIOS DE ESTADÍSTICA:

CAPITULO V METODOLOGÍA DE LA INVESTIGACIÓN

A. Menéndez Taller CES 15_ Confiabilidad. 15. Confiabilidad

ESTADISTICA GENERAL. INFERENCIA ESTADISTICA Profesor: Celso Celso Gonzales

478 Índice alfabético

Tema 1.- Correlación Lineal

6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE

Estadística Inferencial. Sesión 5. Prueba de hipótesis

Facultad de Ciencias Sociales - Universidad de la República

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

1. CURSO: ESTADÍSTICA DESCRIPTIVA Y NOCIONES DE ESTADÍSTICA INFERENCIAL. 2. EN EL MARCO DE ACTIVIDADES DE POSGRADO: Acreditado para Doctorado.

Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

TEMA 3: Contrastes de Hipótesis en el MRL

CONTRASTES DE HIPÓTESIS PARAMÉTRICOS. La estadística en cómic (L. Gonick y W. Smith)

OTRAS HERRAMIETAS ESTADISTICAS UTILES. Dra. ALBA CECILIA GARZON

UNIDAD 4: FUNCIONES POLINOMIALES Y RACIONALES

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Los Métodos de Valoración Indirecta (Costo De Viaje)

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

2. METODOLOGÍA. Los tipos fundamentales de Estudios de Investigación, como nos recuerda Bavaresco, son cuatro:

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

CAPITULO 6. Análisis Dimensional y Semejanza Dinámica

UNIDAD III: APLICACIONES ADICIONALES DE LA DERIVADA

LIGAMIENTO Y RECOMBINACIÓN

Evidentemente, la superficie es un triángulo rectángulo de base 1 y altura también la unidad, por tanto su área es 1/2.

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

DISTRIBUCIONES BIDIMENSIONALES

4 E.M. Curso: Unidad: Estadísticas Inferencial. Colegio SSCC Concepción. Depto. de Matemáticas. Nombre: CURSO: Unidad de Aprendizaje: FUNCIONES

Variables aleatorias

CONTINUIDAD DE FUNCIONES. SECCIONES A. Definición de función continua. B. Propiedades de las funciones continuas. C. Ejercicios propuestos.

Reporte de Pobreza por Ingresos JUNIO 2015

ESTRUCTURA DEL EXAMEN DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II PARA ALUMNOS DE BACHILLERATO

Modelos de PERT/CPM: Probabilístico

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

Análisis de Decisiones II. Tema 17 Generación de números al azar. Objetivo de aprendizaje del tema

Conceptos básicos estadísticos

Lección 12: Sistemas de ecuaciones lineales

JUNIO Bloque A

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Intervalos para la diferencia de medias de dos poblaciones

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

Tema 5. Muestreo y distribuciones muestrales

Diseño de Bloques al azar. Diseño de experimentos p. 1/25

Unidad V. 5.1 Recta tangente y recta normal a una curva en un punto. Curvas ortogonales.

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Límites de una función

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual:

Análisis de datos Categóricos

3.1. Administración de la medición y de la información estratégica:


Juan Carlos Colonia INTERVALOS DE CONFIANZA

ANALISIS E INTERPRETACION DE DATOS SOBRE PERMANENCIA Y GASTOS DE LOS ALUMNOS EN LA UNIVERSIDAD NACIONAL DE INGENIERIA

Transcripción:

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07 TEMAS A ESTUDIAR En esta guía nos dedicaremos a estudiar el tema de Estimación por intervalo y comenzaremos a estudiar las pruebas de hipótesis paramétricas. Para ello deberás terminar de leer el Cap. 9 y comenzar con el capítulo 10 del Novales. Deberás comprender los conceptos de intervalo aleatorio e intervalo de confianza. Posteriormente, te dedicarás al estudio de la estimación por intervalo de distintos parámetros poblacionales: media, varianza y proporción. Concretamente es importante que conozcas los siguientes casos: Estimación de la media en población normal con varianza conocida. Estimación de la media en población normal con varianza desconocida. Estimación de la media en una muestra cualquiera. Estimación de proporción. Estimación de varianza en población normal con media conocida. Estimación de varianza en población normal con media desconocida. Estimación de diferencia de medias. Estimación de diferencia de proporciones. Estimación de diferencia de varianzas. Luego de leído el teórico intenta resolver los ejercicios 1, 2, 3, 4, 8 10, 11 y 13 de la Práctica 11. Los ejercicios 10 y 11 son similares puedes optar por uno de los dos. Luego de finalizar con la estimación por intervalos estudiarás los contrastes de hipótesis estadísticas o las pruebas de hipótesis. Para ello deberás leer el capítulo 10 del Novales. Como en todos los planes de trabajo intentaremos definirte prioridades en el estudio del tema, pero en este intentaremos resumirte algunos de los conceptos claves esperando que sea de utilidad para ti. Hasta el momento nuestro objetivo era encontrar una estimación para el parámetro de la población de interés, ahora lo que haremos será formular una hipótesis sobre un valor del parámetro y utilizaremos la información de una muestra aleatoria para confirmar o rechazar la hipótesis planteada. 1

A continuación te presentamos algunas definiciones que te deberás asegurarte de haber comprendido en profundidad: 1) DEF. HIPOTESIS ESTADISTICA : Consiste en realizar una afirmación respecto a alguna característica desconocida de una población de interés. 2) DEF. PRUEBA DE HIPOTESIS ESTADISTICA: Una prueba de hipótesis es considerada cualquier regla para decidir si rechazo la hipótesis estadística realizada con respecto a alguna característica desconocida de la población de interés, (llamada hipótesis nula H0). Esa regla se basa en una sola muestra aleatoria de la población de tamaño n, a partir de la cual se calculará algún estadístico apropiado llamado estadístico de prueba. Deberás comprender el método a utilizar en estas pruebas: a) Planteo del problema b) Definición de las hipótesis estadísticas, hipótesis nula y alternativa. c) Realización del muestreo necesario d) Determinación del estadístico adecuado e) Determinación por parte del investigador del criterio de decisión, en función de los datos muestrales. Antes de obtener la muestra, ya se ha conjeturado que el muestreo se llevará a cabo sobre una distribución con la hipótesis nula cierta. Si la afirmación es estadísticamente posible con evidencia experimental, entonces no existen elementos para rechazar la hipótesis nula (esto no significa que se decida la aceptación de la hipótesis nula). En cambio si la afirmación H0 no tiene apoyo estadístico con evidencia experimental la decisión será rechazar H0. Por lo tanto las posibles decisiones que se pueden tomar con una prueba de hipótesis son: a) No rechazar H0 ------ no quiere decir aceptar H0 b) Rechazar H0 ------------- apoyo probabilísticamente la hipótesis alternativa pero esto no significa que la afirmación sea que H1 sea verdad, solo puedo afirmar que: H0 es improbable y que H1 es probable 2

Estados de la naturaleza--------- hechos reales H0 es V H0 no V DECISIONES Rechazo H0 ERROR 1 CORRECTO No rechazo H0 CORRECTO ERROR 2 3) ERRORES INFERENCIALES: a) ERROR TIPO 1 ----- rechazo H0 cuando H0 es verdadera b) ERROR TIPO 2 ----- no rechazo H0 cuando H0 no es verdadera Las decisiones son excluyentes, por lo que luego de optar por una de ellas no puedo cometer los dos errores simultáneamente. Ex ante si podría cometer ambos, ya veremos más adelante como se consideran los dos errores cuando fijemos el criterio de decisión. Me interesan conocer las probabilidades de los errores: P(error 1) = P(rechazar H0/H0 cierta) = α P(error 2) = P( no rechazar H0/ H0 no es cierta) = β α nivel de significación de la prueba Se define como la máxima probabilidad de error de tipo 1 4) Las hipótesis estadísticas pueden ser simples o compuestas. Generalmente se da que: H0) simple H1) compuesta A su vez las compuestas podrán ser unilaterales o bilaterales: H0) θ = θ0 simple H1) θ > θ0 ó θ < θ0 compuesta unilateral H2) θ θ0 bilateral Sólo si las dos hipótesis, tanto la simple como la compuesta son simples se pueden determinar valores únicos de los tamaños de los errores de tipo 1 y 2. 3

5) DEF. DE REGION CRITICA O REGION DE RECHAZO DE LA PRUEBA: Es un conjunto de resultados muestrales tal que: Si t I (X1, X2,-------,Xn) C rechazo H0 donde t es la realización del estadístico a utilizar para estimar el parámetro poblacional, la realización del estadístico es un real, son operaciones con vectores (X1 X2 ---Xn) traspuesto. El criterio a utilizar para rechazar o no la hipótesis nula es ver si el estadístico evaluado en la muestra pertenece o no al intervalo de los reales en el cual considero que los casos que se pueden observar son raros considerando H0 cierta, y por lo tanto rechazo la hipótesis nula planteada. Si t I ( X1,X2.----Xn) C rechazo H0 Si t I (X1,X2,-----Xn) C no rechazo H0 OBS1: La región crítica son los valores muestrales que hacen pertenecer a la realización del estadístico al intervalo de rechazo de H0, es el dominio de la función por la se obtiene el estadístico: t = f (X1, X2,----Xn) dominio OBS 2: Si se rechaza H0 esto no significa que P(H0 sea correcta) = α Se debe dar una interpretación de P(error 1) similar a la de los intervalos de confianza, daremos una interpretación de frecuencia tomando muchas muestras de igual tamaño. Si la hipótesis nula es cierta y tomo muchas muestras aleatorias de la población de tamaño n fijo; debe esperarse que en un 100α% de las veces se encuentre un valor del estadístico perteneciente al intervalo de la Región Crítica ( I ), y por lo tanto debe rechazarse H0. 6) DEF. FUNCION DE POTENCIA: Dadas las hipótesis nula y alternativa H0 y H1 utilizadas en una prueba reativa al parámetro θ; se llama función de potencia P( θ ) a la función que para cada valor del parámetro da la probabilidad de rechazar H0 P(θ) = P (rechazar H0 / H0) = α P (rechazar H0 / H1) = 1- β(θ) La función de potencia es el error de tipo 1 cuando la hipótesis nula es verdadera y el complemento del error de tipo 2 cuando la hipótesis alternativa es verdadera. (Ver gráfica) 4

La palabra potencia hace refiere a la probabilidad de detectar que H0 es falsa, dado cualquier valor del parámetro. Al valor de la función de potencia en cada punto del espacio paramétrico se le denomina Potencia de la prueba en un punto. Cuándo puede decirse que una prueba es buena? Cuando se minimizen las probabilidades de error de tipo 1 y tipo 2 de la prueba. Esto significa minimizar la potencia de la prueba en H0 y lo más grande posible para los restantes valores de θ H1. En general no se pueden achicar los dos errores a la vez, sino que se mueven en forma inversa: Si achico la Región Crítica disminuye la P (error 1) Si achico la Región Crítica aumenta la P(error2) Existe algún procedimiento para que permita reducir ambas probabilidades de error simultáneamente? La respuesta es afirmativa siempre y cuando tenga posibilidades de agrandar el tamaño de la muestra utilizada para efectuar la prueba de hipótesis. Ahora bien, esto tiene importantes desventajas asociadas; económicas y de disponibilidad de tiempo por ejemplo. El mecanismo con un tamaño de muestra fija n es el siguiente: prefijar el error de tipo 1 en el máximo que se pueda o se quiera aceptar y elegir la Región Crítica Optima de manera de minimizar el error de tipo 2. La pregunta es: existe algún método para determinar regiones críticas que minimizen la P(error 2) o, lo que es lo mismo, que maximizen la función de potencia cuando H1 es cierta? 7) DEF. REGION CRITICA OPTIMA ( RCO ) PARA UN NIVEL DE SIGNIFICACION DADO α Dadas dos hipótesis simples con respecto a un parámetro θ: H0) θ = θ0 H1) θ = θ1 Se define a la Región Crítica Optima a la Región Crítica que tiene la máxima potencia para θ = θ1 de todas las Regiones Críticas con la misma potencia ( α ) para θ = θ0. Es la RC que dentro del conjunto de las RC de una prueba encontradas con el mismo nivel de significación α, minimizan la P ( error 2 ) 5

TEOREMA DE NEYMANN PEARSON Este teorema nos permite responder a la interrogante planteada anteriormente. Es un método que nos proporcionará las RCO de las pruebas que utilizen dos hipótesis simples referentes a un parámetro poblacional de interés, para un nivel de significación dado.. TEOREMA: H) Sea X: X f (x, θ ) (X1,X2,----Xn) es una MAS proveniente de X El problema consiste en probar: H0) θ = θ0 contra H1) θ = θ1 para un nivel de significación αdado. Si existe una Región Crítica C de tamaño α y una constante positiva k tal que: L0 (X1,X2,------Xn; θ0) / L1 (X1,X2,----Xn;θ1) k L0 (X1,X2,------Xn; θ0) / L1 (X1,X2,----Xn;θ1) k si k C si k C T) C es la mejor Región Critica de nivel de significación α para probar H0) θ = θ0 contra H1) θ = θ1 en donde L0 y L1 son las funciones de verosimilitudes relativas a H0 y H1. Esto significa que la potencia de la RCO encontrada por este método es máxima. OBSERVACIONES: a) La constante k > 0 se determina con la P ( T > k / θ0 ) = α. Por lo tanto es necesario conocer la distribución en el muestreo de T cuando θ = θ0 b) El teorema en ningún momento afirma que exista una RCO ni que esta sea única. La existencia de la RCO queda supeditada a la existencia del k > 0. En general no puede afirmarse la unicidad de la RCO. c) El teorema sirve para casos en que H1 no es una hipótesis simple. d) Pueden existir otros parámetros en la distribución de la variable aleatoria X 6

8) DEF REGION CRITICA UNIFORMEMENTE MAS POTENTE C es una RCUMP de nivel de significación α para probar la H0) θ = θ1 simple contra la alternativa H1 compuesta θ > θ1 ó θ < θ1 C es una RCO probar H0 contra cada hipótesis θ1 simple H1 compuesta 9) DEFINICION DEL P-VALUE En un análisis estadístico de los datos X, uno frecuentemente trabaja, con un modelo o hipótesis dada H 0 f(x) es una densidad continua. Se elige un estadístico T (X) para investigar la compatibilidad del modelo con los datos observados x obs, valores grandes de T indican menos compatibilidad con Ho. El p valor es entonces definido como: P ( T(x) t(obs) ) Definición: el P- valor es la probabilidad (bajo Ho cierta) de que el estadístico sea mayor que la realización del estadístico obtenido en la prueba. O sea es la probabilidad de que el estadístico a utilizar supere al valor del estadístico que obtuve con la muestra utilizada. Los p valor son la herramienta más comúnmente utilizada para medir la evidencia en contra de una hipótesis o modelos con hipótesis. Ejemplo de una prueba de hipótesis acerca de la media de una distribución. Ho) µ = µ o con µ 1 > µ o H1) µ = µ 1 Esta es una prueba de hipótesis donde la región crítica es a rama derecha..f ( X ) p- valor k x obs El nivel de significación de la prueba se calcula como la P{ X > k}. Es el área bajo la función de densidad de la media muestral a partir del valor crítico k. 7

El p- value es el área bajo la misma curva pero a partir de la realización del estadístico, en este caso x obs. Posibles valores del P-value: Por ser una probabilidad está entre 0 y 1. Si el p- value es igual al nivel de significación, entonces el valor del estadístico obtenido en la muestra es igual al nivel crítico de la prueba. O sea P { T > k } = α bajo Ho cierta. Si el p-value es menor que el nivel de significación de la prueba significa que el valor del estadístico obtenido en la prueba es mayor que el valor crítico k y por lo tanto la decisión sería rechazar Ho. Si el p- value es mayor que α, significa que la realización del estadístico es menor que el valor crítico k, por lo tanto la decisión a tomar es no rechazar Ho. Si P-value < α rechazo Ho Si P- value > α no rechazo Ho 8

A continuación te presentamos el cronograma para que puedas planificar el uso de tu tiempo: Tema Setiembre 3 4 5 6 7 10 11 12 13 14 17 18 19 20 21 Estimación por intervalo. Cap. 9 Ejercicios de estimación por intervalo Lectura del capítulo 10.1 del Novales Ejercicio 1 de la práctica 12 Lectura de los capítulos 10.2 a 10.4 del Novales Ejercicios 2, 4, 5,7 y 8 Lectura de los capítulos 10.5 a 10.11 del Novales Ejercicios 6, 15 y 17 Para el sector económico se recomiendan resolver además los ejercicios 18, 19 y 23. Te dejamos una semana de tu tiempo para que administres como quieras y tengas tiempo para repasar para el control. 9