PROYECTO DEL CURSO DE ESTADÍSTICA INFERENCIAL

Documentos relacionados
ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

Teorema Central del Límite (1)

Curso de nivelación Estadística y Matemática

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Estadísticas Pueden ser

Ejemplos Resueltos Tema 4

Estimación de Parámetros.

UNIVERSIDAD DE MANAGUA Al más alto nivel

1. Ordena los datos en una tabla de contingencia. Economía Matemáticas Literatura Biología

Estadística Inferencial. Sesión 4. Estimación por intervalos

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Caso particular: Contraste de homocedasticidad

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

UNIVERSIDAD ALONSO DE OJEDA ESTADISTICA II

INFERENCIA ESTADISTICA

Técnicas de Muestreo Métodos

Tema 9: Introducción al problema de la comparación de poblaciones

Tema 4: Estimación por intervalo (Intervalos de Confianza)

2. Plantear hipótesis considerando que: Hipótesis: Siendo una prueba no direccionada, el planteamiento de hipótesis, señalará que:

2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)

Tema 8: Contraste de hipótesis

DCA: Es el más simple de todos los diseños, solamente se estudia el. en diferentes tratamientos o niveles.

4. Prueba de Hipótesis

CONTRASTACIÓN DE HIPÓTESIS

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

Análisis de la varianza. Magdalena Cladera Munar Departamento de Economía Aplicada Universitat de les Illes Balears

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.

Introducción a la Inferencia Estadística

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Ejemplos Resueltos Tema 4

Cómo introducir Prueba de Hipótesis para una media, utilizando experimentos en el salón de clase.

Prueba de Hipótesis. Bondad de Ajuste. Tuesday, August 5, 14

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

PATRONES DE DISTRIBUCIÓN ESPACIAL

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN

Fase 2. Estudio de mercado: ESTADÍSTICA

DIFERENCIAS EN LA UTILIZACIÓN DE LA BIBLIOTECA DEL IIESCA ANTE UN CAMBIO DE INFORMACIÓN

Muestreo e intervalos de confianza

CONTRASTE DE HIPÓTESIS TEMA 4.1 CONTRASTES BILATERALES

BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN

DISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO

ESTADÍSTICA II UNIDAD I: ESTIMACIÓN DE PARÁMETROS 3RA PARTE (CLASE 20/09)

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

UNIVERSIDAD DE MANAGUA Al más alto nivel

Tema 7 Intervalos de confianza Hugo S. Salinas

Ejercicios T.5 CONTRASTES PARAMÉTRICOS

LECCIÓN PÚBLICA. Tema 5 Algunas Pruebas de Hipótesis. Profa. María Fátima Dos Santos

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Contraste de hipótesis paramétricas

Estadística Inferencial. Sesión 7. Pruebas de hipótesis para diferencia de medias y proporciones.

INTRODUCCIÓN AL ANÁLISIS DE DATOS FEBRERO Código asignatura: EXAMEN MODELO B DURACION: 2 HORAS

Conceptos Básicos de Inferencia

Esta proposición recibe el nombre de hipótesis

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

Diseño de experimentos Hugo Alexer Pérez Vicente

Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías

1.- Lo primero que debemos hacer es plantear como hasta ahora la hipótesis nula y la alternativa

Impacto del MÁSTER EN DIRECCIÓN DE COMERCIO INTERNACIONAL sobre la formación y el empleo. Metodología del estudio

UNIVERSIDAD DE ATACAMA

ESTADÍSTICA APLICADA. Tema 3: Contrastes de hipótesis

SEMINARIO DE INVESTIGACIÓN IV

2. Análisis de varianza


1. Realice la prueba de homogeneidad de variancias e interprete los resultados.

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Tipo de punta (factor) (bloques)

ANÁLISIS DE REGRESIÓN

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.

10.3. Sec. Prueba de hipótesis para la media poblacional. Copyright 2013, 2010 and 2007 Pearson Education, Inc.

Práctica 8: Test de hipótesis

1 CÁLCULO DE PROBABILIDADES

INFERENCIA ESTADISTICA

Departamento de Matemática Aplicada a la I.T. de Telecomunicación

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

, es la hipótesis nula. Por lo tanto no podemos obtener en un sentido absoluto las probabilidades de dichos

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

Tema 1: Distribuciones en el muestreo

b) Use la salida de SPSS para reproducir lo que pueda de los cálculos que hace SPSS. Estadísticos de contraste b TIEMPO

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

Regresión ponderada y falta de ajuste

Longitud = Calcular la media, la mediana, la moda y la desviación estándar de la muestra en Matlab.

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

TEMA 2 Diseño de experimentos: modelos con varios factores

Estadística Descriptiva

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X 2 CONCEPTO BÁSICO Frecuencia: es el número de datos que caen en cada celda. Frecuencias Observadas (fo):

HIPOTESIS ESTADISTICA

Fundamentos para la inferencia. Unidad 3 Parte II Estadísca Prof. Tamara Burdisso

Transcripción:

1 PROYECTO DEL CURSO DE ESTADÍSTICA INFERENCIAL Prof.: MSc. Julio R. Vargas A. I. INTRODUCCION El presente trabao está orientado a aplicar los conocimientos de estadística inferencial a un caso práctico o del mundo profesional, con el propósito de mostrar su aplicabilidad e importancia en el desarrollo de las actividades del mundo empresarial. Lo primero que se hizo fue definir el planteamiento del problema, el cual debe ser bien claro, preciso delimitado, luego se procedió calcular el tamaño de la muestra teniendo claro el error el nivel de significancia. Posteriormente se obtuvo la muestra o los elementos muéstrales. Con los datos muéstrales se procedió a su organización, clasificación procesamiento. Se aplicó el análisis de varianza como estadístico de prueba para contrastar la hipótesis nula. Las conclusiones se presentan al final del documento. II. PLANTEAMIENTO DEL PROBLEMA. Se aplicada una prueba a diferentes Personas con diferentes grados de escolaridad, se está interesado en probar si existe o no diferencia entre el grado de escolaridad (variable nominal) el promedio de la calificación obtenida por cada persona (variable numérica) en la prueba. El análisis de varianza (ANOVA) es una prueba que nos permite medir la variación de las respuestas numéricas como valores de evaluación de diferentes variables nominales. Tabla del Modelo Anova Fuentes de Grados de Suma de variación libertad cuadrados Tratamiento c-1 SCC (suma de (intergrupo) cuadrados de los tratamientos) Error n-c SCE(suma de (intragrupo) cuadrados del error) Total n-1 SCT(suma de cuadrados totales Media cuadrado CMC(cuadros medios de los tratamientos) CME(cuadrados medios del error) F F= CMC/CME

Para lo cual se requerirán las calificación de la prueba a cada persona sus diferentes grados de escolaridad, con lo que se intentará probar si existe o no diferencia entre el grado escolar (variable nominal) el promedio de la calificación (variable numérica). Para analizar si existe diferencia en los promedios se procede a realizar una prueba F que se explica posteriormente. III. CALCULO DEL TAMAÑO DE LA MUESTRA. La muestra estará formada el grupo de individuos que realmente se estudiarán, es un subconunto de la población. Para que se puedan generalizar a la población los resultados obtenidos en la muestra, ésta ha de ser «representativa» de dicha población. Para ello, se han de definir con claridad los criterios de inclusión exclusión, sobre todo, se han de utilizar las técnicas de muestreo apropiadas para garantizar dicha representatividad. Cuántas personas será necesario estudiar para estimar la media de las calificaciones que han las personas de acuerdo al grupo de escolaridad?. Para lo cual establecemos un nivel de confianza del 95% se admite un error de puntos como máximo; faltaría por conocer la desviación estándar de la población, la cual no conocemos. Por lo que la podemos obtener a partir de la prueba piloto que es de 0. Por lo que el número mínimo de personas que ha de estudiarse será de: n e / 1.96 *66. 796 64 Z e 56.6035 64 4.0094 e e 4.00943.004 Como hemos visto en el cálculo, estaremos admitiendo que con una muestra de n=64 individuos con escolaridades de Doctorados, Maestrías Estudiantes Universitarios. El error será menor a.004 puntos. (Aproximadamente puntos).

3 n = tamaño de la muestra = varianza de la población en estudio (en este caso no la conocemos) Z= El valor normalizado del nivel de confianza fiado que es 0.05 Hemos hecho una prueba piloto de treinta individuos para obtener la varianza muestral la cual es suficiente por ser muestra grande aleatoria para estimar al parámetro desconocido σ. Con la prueba piloto de 30 calificaciones obtuvimos la varianza muestral que usamos en la ecuación anterior. Estadísticos descriptivos N Mínimo Máximo Media Desv. típ. Varianza Calificación obtenida en la prueba 30 3.18399860 67.1504678 49.430357 8.17899957 66.796 N válido (según lista) 30 IV. Obtención de la muestra aleatoria del tamaño que sea definido para poder hacer inferencias válidas sobre la población en estudio. Las variables de interés para este estudio son: La calificación de las personas (CALIFICACIÓN) La escolaridad (GRADO ESCOLAR) Por lo que para efectos del estudio nos limitaremos a ellos a continuación se muestran los datos obtenidos en forma aleatoria. TABLA 1: CALIFICACIÓN GRADO ESCOLAR CALIFICACIÓN GRADO ESCOLAR 67.1504678 DOCTORADO 39.566768 ESTUDIANTE 64.3684105 DOCTORADO 39.0730994 ESTUDIANTE 60.91130604 ESTUDIANTE 38.7147563 DOCTORADO 55.38986355 ESTUDIANTE 34.9531637 ESTUDIANTE 53.917154 ESTUDIANTE 34.7777778 ESTUDIANTE 53.3460039 MAESTRÍA 34.71998 ESTUDIANTE 5.15984405 ESTUDIANTE 67.63611386 DOCTORADO 51.8684105 ESTUDIANTE 6.7700467 DOCTORADO 51.1768031 DOCTORADO 60.88483775 ESTUDIANTE 50.6306049 ESTUDIANTE 56.5014405 ESTUDIANTE 50.35477583 MAESTRÍA 51.7686180 ESTUDIANTE 48.38596491 MAESTRÍA 53.6308583 MAESTRÍA 47.07407407 DOCTORADO 50.7717945 ESTUDIANTE 44.09454191 MAESTRÍA 50.89056506 ESTUDIANTE 43.4150468 ESTUDIANTE 48.66061841 DOCTORADO

4 43.3781676 MAESTRÍA 5.6730843 ESTUDIANTE 41.806677 ESTUDIANTE 47.98778555 MAESTRÍA 41.571476 ESTUDIANTE 48.310647 MAESTRÍA 41.1539961 MAESTRÍA 46.83381069 DOCTORADO 40.845614 ESTUDIANTE 45.545004 MAESTRÍA 40.7984561 ESTUDIANTE 43.8708589 ESTUDIANTE 33.09835159 ESTUDIANTE 41.03983895 MAESTRÍA 3.1839986 ESTUDIANTE 41.53716416 ESTUDIANTE 58.49961104 ESTUDIANTE 43.38891669 ESTUDIANTE 56.1898349 ESTUDIANTE 39.98564149 MAESTRÍA 51.4687891 ESTUDIANTE 39.4669945 ESTUDIANTE 53.4198814 MAESTRÍA 38.4567793 ESTUDIANTE 53.7674174 ESTUDIANTE 39.8070585 ESTUDIANTE 50.9086877 ESTUDIANTE 37.09940719 ESTUDIANTE 49.4959961 DOCTORADO 41.1377888 DOCTORADO 50.07639845 ESTUDIANTE 34.419837 ESTUDIANTE 48.5558937 MAESTRÍA 40.8758583 ESTUDIANTE V. FORMULACION DE LA HIPOTESIS. Queremos confirmar que el grado académico no tiene ningún efecto en la calificación de la prueba, queremos por lo tanto comparar las medias µ 1 con µ µ 3 considerando que µ 1 representa la media de las calificaciones de las personas con grado de Doctor µ representa la media de las calificaciones de las personas con grados de Master µ 3 Es la media de las personas que son Estudiantes es decir no tiene grado académico. Este contrate lo queremos hacer contra la Hipótesis alternativa de que las medias son diferentes, para lo cual elegimos un nivel de significación de α=0.05 (es del 5%) Para lo cual formulamos formalmente la hipótesis. VI. ANALISIS DE LOS DATOS Y USO DEL ESTADÍSTICO DE PRUEBA PARA CONTRASTAR LA HIPOTESIS. ANALISIS DE VARIANZA (ANOVA) El primer paso es ordenar los datos de acuerdo al valor nominal que le corresponde para así obtener: El número de datos, el promedio la desviación estándar de cada uno de los valores nominales. De la TABLA 1 obtenemos los tres valores nominales que toma la variable GRADO ESCOLAR, estos tres valores son: 1 DOCTORADO, ESTUDIANTE, 3 MAESTRÍA.

5 La siguiente tabla nos muestra estos resultados. TABLA GRADO ESCOLAR CALIFICACIÓN TOTALES DOCTORADO ESTUDIANTE MAESTRÍA Cuadrados medios 7133.5799 88.000955 089.73531 15.78653 Desviación estándar 8.477715089 10.447904 8.383858417 4.6939914 media 47.939033 53.1789518 45.713683 47.071418 n 64 11 39 14 SUMA DE CUADRADOS 147677.5588 3199.45645 84170.669 31307.4401 1 3 67.1504678 60.91130604 53.3460039 64.3684105 55.38986355 50.3547758 51.1768031 53.917154 48.3859649 47.07407407 5.15984405 44.0945419 49.4959961 51.8684105 43.378168 38.7147563 50.6306049 41.153996 67.63611386 43.4150468 53.4198814 6.7700467 41.806677 48.5558937 48.66061841 41.571476 53.6308583 46.83381069 40.845614 47.9877855 41.1377888 40.7984561 48.31065 33.09835159 45.545 3.1839986 41.0398389 58.49961104 39.9856415 56.1898349 51.4687891 53.7674174 50.9086877 50.07639845 39.566768 39.0730994 34.9531637 34.7777778 34.71998 60.88483775 56.5014405 51.7686180 50.7717945 50.89056506 5.6730843 43.8708589 41.53716416 43.38891669 39.4669945 38.4567793 39.8070585 37.09940719 34.419837 40.8758583

6 Y1(Doctorado) 67.1504678 4509.397387 COMO ESTA TABLA 64.3684105 4143.9368 TAMBIÉN SE HACEN 51.1768031 614.039694 LOS CALCULOS 47.07407407 15.96845 PARA LOS DE OTROS 49.4959961 449.784683 38.7147563 1498.655769 67.63611386 4574.643898 6.7700467 3940.098594 48.66061841 367.855784 46.83381069 193.40584 41.1377888 169.31737 Suma de C. Cuadrados Medios Desv. Est. 53.1789518 3199.45645 88.000955 10.447904 formula de la desviación estándar Y(MASTER) 53.3460039 845.79613 50.3547758 535.60345 48.3859649 341.016 44.0945419 1944.3863 43.378168 1869.5088 41.153996 1698.70917 53.4198814 853.68373 48.5558937 357.67481 47.9877856 30.8756 48.31065 36.3539 45.545 07.4819 53.6308583 876.6896 41.039839 1684.6838 39.9856415 1598.85153 659.009985 31307.4401 = 47.071418

7 NOTACIÓN c número de valores nominales n totalde datos n promedio total i totalde datos de la - esima columna promedio de la.esima columna dato número i de la columna CM Corrección de la media SCC Suma del cuadrado de los tratamientos SCT Suma de los cuadrados totales SCE Suma de los cuadrados del error gl1 grados de libertad uno gl grados de libertad dos CMC Cuadrado medio de los tratamientos CME Cuadrado medio del error F Valor para la prueba F

8 Obtenemos: CM SCC SCT SCE gl1 gl CMC CME F c n c 1 c SCT CMC CME n n 1 i1 1 n c SCC gl1 SCE gl i CM CM SCC Para nuestro eemplo: c = 3 número de columnas (número de valores nominales DOCTORADO, ESTUDIANTE Y MAESTRÍA) n = 64 total de datos o muestra. n1 =11 DOCTORADO n = 39 ESTUDIANTE n3 =14 MAESTRÍA 47.939033 promedio total 1 3 1 3 53.1789518 promedio DOCTORADO 45.713683 promedio ESTUDIANTE 47.071418 promedio M AESTRÍA 88.000955 cuadrado del promedio DOCTORADO 089.73531 cuadrado del promedio ESTUDIANTE 15.78653 cuadrado del promedio M AESTRÍA CM n CM = 64 ( 47.939033) =64(36.713198) = 143149.6446 c SCC n 1 CM ( n 1 1 n n ) CM SCC = (11(88.000955)+39(089.73531)+14(15.78653))-143149.6446 3 3

9 SCC = (31108.01051+81499.67717+3101.0114) ))-143149.6446 SCC = 14368.6991-143149.6446 SCT 1 i1 i SCC= 479.054466 c CM SCT 147677.5588 143149.6447 SCT 457.914147 n SCE = SCT SCC =457.914147 479.054466 = 4048.859681 g.l. 1 = c-1 = 3-1 = g.l. = n-c = 64 3 = 61 SCC CMC g. l.1 SCE CME g. l. CMC F CME 479.054466 39.57331 4048.859681 66.37474886 61 39.57331 3.608710198 66.37474886 Fuentes variación Tratamiento (intergrupo) de ANOVA DE LOS RESULTADOS Grados de Suma de Media cuadrado libertad cuadrados SCC=479.0543 CMC=SCC/c-1 CMC=39.57 F F= CMC/CME Error (intragrupo) 61 SCE=4048.8600 CME=SCE/n-c CME=66.3748 F=3.6087 Total 63 SCT=459.9140 Para ello necesitamos F, gl.1 gl. Estos valores los buscamos es la Tabla F con v1= v=61 α=0.05 F(61,),0.05 =3. 15 Por lo tanto F > F(61,),0.05 Por lo tanto RECHAZAMOS Ho. (3.60 > 3.15)

10 F (61,,0.05)=3.15 VII. CONCLUSIONES Hemos utilizado el l método de análisis de varianza para comparación de promedios, que parte del supuesto inicial de que no existe diferencia entre los promedios que los resultados de la muestra son producto exclusivamente del azar. A este supuesto inicial es lo que conocemos como la hipótesis nula se le designa con H0. El procedimiento seguido con el Análisis de Varianza (ANOVA) nos conduce a establecer si entre las medias de los grupos ha o no diferencias significativas. Que como hemos visto en los cálculos finales de la prueba F ha evidencia que las medias parecen ser diferentes. No sabemos entre quienes ha diferencias es decir si entre las tres o solo en dos de ellas. Pero la prueba nos ha indicado que el supuesto que las medias eran iguales no se confirma, es decir parece que el grado académico tiene efecto en las calificaciones de las pruebas. Lo que implica que la hipótesis alternativa Ha se acepta, estos es existe al menos una parea de valores nominales cuos promedios son diferentes.