Aprende fácil estadística aplicada con SPSS Adquiere destrezas y habilidades para realizar diagnósticos

Documentos relacionados
CAPÍTULO 4 MARCO TEÓRICO

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

Prueba de Inferencia Estadística y Contraste de Hipótesis. 8 de octubre de 2012 GRUPO A

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

14. Contrastes no paramétricos

Inferencia en Regresión Lineal Simple

INTRODUCCIÓN AL ANÁLISIS DE DATOS SEPTIEMBRE 2014 Código asignatura: EXAMEN TIPO TEST MODELO B DURACION: 2 HORAS.

Medidas de Variabilidad

Estadísticos muéstrales

TEMA 14. ESCALAMIENTO CONJUNTO. INTRODUCCIÓN A LA TEORÍA DE LA RESPUESTA A LOS ITEMS (TRI)

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Análisis de la varianza de un factor

Análisis de la varianza de un factor

Aspectos fundamentales en el análisis de asociación

MUESTREO EN POBLACIONES FINITAS

) para toda permutación (p p 1 p

Erratas y modificaciones

IN540: Métodos Estadísticos para economía y gestión Profesores: Marcelo Henríquez, Felipe Avilés Auxiliares: José Miguel Carrasco

Un estimado de intervalo o intervalo de confianza ( IC

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Lo que nos interesa en el análisis de varianza de una vía es extender el test t para dos muestras independientes, para comparar más de dos muestras.

EJERCICIOS RESUELTOS VARIABLE ALEATORIA UNIDIMENSIONAL

Prueba de Evaluación Continua

DISTRIBUCIONES BIDIMENSIONALES

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Tema 4: Variables aleatorias

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

Tema 6. Estadística descriptiva bivariable con variables numéricas

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco

Control de la exactitud posicional por medio de tolerancias

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

Capítulo 12 CONTRASTES NO PARAMÉTRICOS

Ejercicios y Talleres. puedes enviarlos a

Estadistica No Parametrica

3. VARIABLES ALEATORIAS.

PyE_ EF2_TIPO1_

INTRODUCCIÓN. Técnicas estadísticas

CAPÍTULO X ESTADÍSTICA APLICADA A LA HIDROLOGIA

Figura 1

Tema 1.- Variable aleatoria discreta (V2.1)

, x es un suceso de S. Es decir, si :

Descripción de una variable

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Guía para el Trabajo Práctico N 5. Métodos Estadísticos en Hidrología

Medidas de centralización

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Problemas donde intervienen dos o más variables numéricas

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2011 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. 3 y

Contraste de Hipótesis

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

Modelos lineales Regresión simple y múl3ple

Métodos específicos de generación de diversas distribuciones discretas

Algunas aplicaciones del test del signo

Un ejemplo de Análisis Factorial de Correspondencias

Estadísticos muéstrales

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 1: Estadística Descriptiva Unidimensional

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

16/02/2015. Ángel Serrano Sánchez de León

AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

a) DIAGRAMA DE DISPERSION

Tema 1. Conceptos generales

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad

Instituto Nacional de Estadísticas Chile METODOLOGÍA. Encuesta Estructural de Transporte por Carretera Año contable 2012

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas

Modelos unifactoriales de efectos aleatorizados

EXPERIMENTACIÓN COMERCIAL(I)

MODELOS PARA DATOS DE RECUENTO

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

9Soluciones a los ejercicios y problemas

Tema 3: Procedimientos de Constrastación y Selección de Modelos

MEDIDAS DE ASOCIACIÓN: COEFICIENTES DE CORRELACIÓN Y DE REGRESIÓN I.- Introducción En el tema I estudiamos las medidas descriptivas para una

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2013 INSTITUTO NACIONAL DE ESTADÍSTICAS

Tema 5: Incumplimiento de las Hipótesis sobre el Término de Perturbación

TEMA 7. ANÁLISIS DE SUPERVIVENCIA

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Probabilidad Grupo 23 Semestre Segundo examen parcial

Resolución. Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos.

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

TEMA 1.- CONCEPTOS BÁSICOS

5ª Parte: Estadística y Probabilidad

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

ESTADÍSTICA UNIDIMENSIONAL

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

Transcripción:

Gestón Aeronáutca: Estadístca Teórca Facultad Cencas Económcas y Empresarales Departamento de Economía Aplcada Profesor: Santago de la Fuente Fernández Aprende fácl estadístca aplcada con SPSS Adquere destrezas y habldades para realzar dagnóstcos

Al analzar datos meddos por una varable cuanttatva, las pruebas estadístcas de estmacón y contraste frecuentemente empleadas se basan en suponer que se han obtendo de una dstrbucón de probabldad de tpo normal. En muchas ocasones esta suposcón no es válda, y en otras por tratarse de muestras pequeñas se sospecha que no es adecuada la suposcón. En estos casos se recurre a dos posbles mecansmos: Los datos se pueden transformar de forma que sgan una dstrbucón normal, o ben se puede acudr a pruebas estadístcas que no se basan en nnguna suposcón en cuanto a la dstrbucón de probabldad a partr de la que fueron obtendos, motvo por el que se denomnan pruebas no paramétrcas. Mentras que las pruebas que suponen una dstrbucón de probabldad determnada se denomnan pruebas paramétrcas. Las pruebas paramétrcas más habtuales se basan en la dstrbucón de probabldad normal, y al estmar los parámetros del modelo se supone que los datos consttuyen una muestra aleatora de esa dstrbucón, por lo que la eleccón del estmador y el cálculo de la precsón de la estmacón, elementos báscos para elaborar ntervalos de confanza y contrastar hpótess, dependen del modelo probablístco supuesto. Un procedmento estadístco es robusto cuando es poco sensble a alteracones en el modelo probablístco supuesto, es decr, cuando los resultados obtendos son aproxmadamente váldos cuando éste varía. Las nferencas en cuando a las medas son en general robustas, por lo que s el tamaño de la muestra es grande, los ntervalos de confanza y contrastes basados en la t de Student son aproxmadamente váldos, con ndependenca de la verdadera dstrbucón de probabldad de los datos. S ésta dstrbucón no es normal, los resultados de la estmacón serán poco precsos. PROCEDIMIENTOS PARA AJUSTAR DATOS A UNA DISTRIBUCIÓN DE PROBABILIDAD: Los más utlzados son el contraste Ch cuadrado de Pearson, la prueba de Kolmogorov Smrnov y la prueba de Shapro Wlks. CONTRASTE CHI CUADRADO DE PEARSON: La dea del contraste es senclla, se agrupan los datos en k clases (k 5) como s se fuera a construr un hstograma, cubrendo todo el rango posble de valores.

Es deseable dsponer del msmo número de datos en cada clase y al menos de tres datos en cada clase. Denotando por n al número de datos observados en la clase ésma, medante el modelo de probabldad que se desea verfcar se calcula la probabldad p asgnada en cada clase. En consecuenca, para una muestra de n datos, la frecuenca esperada según ese modelo de probabldad es e = n.p El índce de dscrepanca entre las frecuencas observadas n y las esperadas e que es prevsble encontrar s el modelo fuera el adecuado vene determnado por n n (n e ) n e e = = = n que se dstrbuye aproxmadamente como una Ch cuadrado s el modelo es correcto. S el modelo se especfca de forma completa con las probabldades p, conocdas antes de tomar los datos, el número de grados de lbertad es (k ). Cuando se han estmado p parámetros del modelo a partr de los datos, el número de grados de lbertad son (k p ) PRUEBA DE KOLMOGOROV SMIRNOV: Contraste váldo úncamente para varables contnuas, compara la funcón de dstrbucón (probabldad acumulada) teórca con la observada. Calcula un valor de dscrepanca, denotado habtualmente como D, que corresponde a la dscrepanca máxma en valor absoluto entre la dstrbucón observada y la dstrbucón teórca, proporconando un valor de probabldad p que corresponde, s se esta verfcando un ajuste a la dstrbucón normal, a la probabldad de obtener una dstrbucón que dscrepe tanto como la observada s verdaderamente se hubera obtendo una muestra aleatora (de tamaño n) de una dstrbucón normal. S la probabldad p es grande se acepta que los datos obtendos proceden de una dstrbucón normal. Cuando la probabldad p es muy pequeña no es aceptable suponer que los datos observados proceden de una dstrbucón normal. PRUEBA DE SHAPIRO WILKS: Prueba recomendada para el ajuste de los datos observados a una dstrbucón normal, sobre todo cuando la muestra es pequeña (n < 30) Mde el ajuste de la muestra a una recta al dbujarla en papel probablístco normal. Este tpo de representacón vene en programas de estadístca, de manera que permte además aprecar el ajuste o desajuste de forma vsual.

SOLUCIONES CUANDO SE RECHAZA LA HIPÓTESIS DE NORMALIDAD Cuando la dstrbucón de los datos observados es más apuntada que la normal k m4 (leptocúrtca), cuando el coefcente de curtoss g = 3> 0, donde m 4 = (x x) =σ σ k 4 n = m = (x x) 4, la solucón puede ser emplear pruebas no paramétrcas. n = S la dstrbucón es unmodal y asmétrca: Md Me x (asmetría a la derecha o postva) ó x Me M d (asmetría a la zquerda o negatva), la solucón más efectva suele ser utlzar una transformacón de los datos para convertrlos en normales. S la dstrbucón no es unmodal la utlzacón de transformacón de datos y los métodos no paramétrcos pueden no ser útles. Una alternatva a los métodos paramétrcos y a las pruebas no paramétrcas cláscas puede ser utlzar la metodología de estmacón autosufcente (no utlza más que los valores observados en la muestra). SPSS: Analzar/Pruebas no paramétrcas/ch cuadrado_ Exactas _ Monte Carlo TRANSFORMAR DATOS OBSERVADOS EN DATOS NORMALES La utlzacón de transformacones para lograr que los datos observados se ajusten a una dstrbucón normal es la solucón natural en muchas ocasones, ya que exsten gran número de parámetros que tenen una dstrbucón asmétrca. Entre las dstntas transformacones: La transformacón logarítmca Ln x converte dstrbucones observadas en aproxmadamente smétrcas. Se presentan problemas con la transformacón s la varable toma el valor 0, o s exsten valores muy pequeños, en esos casos, será adecuada la transformacón Ln(x + ). Está ndcada la transformacón logarítmca cuando la desvacón típca de los datos es proporconal a la meda o cuando el efecto de los factores es multplcatvo, en lugar de adtvo. La transformacón x cuando las varanzas son proporconales a la meda. Ocurre con frecuenca cuando los datos observados provenen de una dstrbucón de Posson. La transformacón ( / x) que precsa sumar una cantdad a cada valor cuando la varable toma el valor 0. 3

La transformacón x cuando la concentracón de los datos observados se encuentra a la derecha y la cola a la zquerda, comprme la escala para valores pequeños y la expande para valores altos. La transformacón (arc sen p ) cuando los datos son proporconales o porcentajes de una dstrbucón bnomal, en este caso las dferencas con una dstrbucón normal son más acusadas para valores pequeños o grandes de las proporcones. Los valores transformados se utlzan para los cálculos estadístcos basados en la teoría normal, para la presentacón de resultados se efectuará la transformacón nversa para que aparezcan en su escala de medda natural. Pruebas no paramétrcas son aquellas que no presuponen una dstrbucón de probabldad para los datos observados. En la mayor parte de los resultados estadístcos se dervan úncamente a partr de procedmentos de ordenacón y recuento. Convene utlzar pruebas no paramétrcas cuando se trabaja con muestras pequeñas (n < 0) en las que se desconoce s es váldo suponer la normaldad de los datos, tambén para corroborar los resultados obtendos a partr de la utlzacón basada en la dstrbucón normal. PRUEBA DE WILCOXON DE CONTRASTE DE SIGNOS DE LA MEDIANA: Permte calcular los datos observados con una medana teórca. Se utlza como alternatva de la prueba t de Student cuando no se puede suponer la normaldad de las muestras. Se aplca cuando la varable subyacente es contnua pero no se presupone nngún tpo de dstrbucón partcular. Es una prueba de comparacón de dos muestras relaconadas y por lo tanto no necesta una dstrbucón específca. Usa más ben el nvel ordnal de la varable dependente. Se utlza para comparar dos medcones relaconadas y determnar s la dferenca entre ellas se debe al azar o no (en este últmo caso, que la dferenca sea estadístcamente sgnfcatva). PRUEBA U DE MANN WHITNEY (tambén conocda como Mann Whtney Wlcoxon WMW): Contrasta s dos muestras proceden de poblacones equdstrbudas. Es una prueba muy utlzada, alternatva a la prueba paramétrca t de Student bmuestral. 4

El test se fundamenta en la dea: S dos muestras comparadas proceden de la msma poblacón, al juntar todas las observacones y ordenarlas de menor a mayor, cabría esperar que las observacones de una y otra muestra estuvesen ntercaladas aleatoramente. Por el contraro, s una de las muestras pertenece a una poblacón con valores mayores o menores que la otra poblacón, al ordenar las observacones, estas tenderán a agruparse de modo que las de una muestra queden por encma de las de la otra muestra. En esta línea, la prueba de Mann Whtney contrasta que la probabldad de que una observacón de la poblacón X supere a una observacón de la poblacón Y es gual a la probabldad de que una observacón de la poblacón Y supere a una observacón de la poblacón X. Es habtual encontrar que la prueba de Mann Whtney compara medanas, afrmacón que solo es certa cuando las poblacones comparadas dferen úncamente en su localzacón, pero el resto de característcas (dspersón, asmetría, etc) son guales. Al gual que ocurre con muchas pruebas no paramétrcas, la prueba de Mann Whtney es menos potente que el test t de Student (tene menos probabldad de rechazar la hpótess nula cuando realmente es falsa) ya que gnora valores extremos. En los tests t de Student al trabajar con medas tenen en cuenta los valores extremos. Esto hace que la prueba de Mann Whtney sea más robusta que los tests t de Student, concretamente la perdda de potenca es del 5%. Condcones necesaras de la prueba de Mann Whtney: a) No es necesaro aumr que las muestras se dstrbuyen de una forma normal o que proceden de poblacones normales. b) Los datos tenen que ser ndependentes. c) Los datos tenen que ser ordnales o ben se tenen que poder ordenar de menor a mayor. d) Igualdad de varanzas entre grupos (homocedastcdad). e) S compara medanas, ambas muestras han de tener el msmo tpo de dstrbucón: dspersón, asmetría, etc. Exsten otras pruebas no paramétrcas, entre las más habtuales: Prueba de Kruskal Walls para comparar k muestras Prueba de Fredman para comparar k muestras pareadas (bloques) Coefcente de correlacón de Spearman para rangos Prueba de rachas de Wald Wolfowtz 5

ESTADÍSTICA TEÓRICA PRÁCTICAS SPSS CONTRASTE DE NORMALIDAD Cuando los datos no están agrupados y el tamaño muestral es pequeño, no se utlza el test χ de Pearson de bondad de ajuste, sno los contrastes de normaldad de Lllefors y de Shapro Wlk. En nnguno de estos dos contrastes se especfcan los parámetros poblaconales en la hpótess de normaldad. El Contraste de normaldad de Lllefors plantea las hpótess: H: 0 La muestra procede de una dstrbucón normal con meda y desvacón típca desconocdas H: La muestra no procede de una dstrbucón normal Cuando p_valor >αse acepta la hpótess nula de normaldad El Contraste de normaldad de Shapro Wlk plantea las hpótess: H: 0 F(x) es la funcón de dstrbucón normal (la muestra procede de una poblacón normal) H: F(x) no es la funcón de dstrbucón normal (la muestra no procede de una poblacón normal) S p_valor >αse acepta la hpótess nula de que la muestra procede de una poblacón normal SPSS: Analzar/Estadístcos descrptvos/explorar Gráfcos/Gráfcos con pruebas de normaldad Vsor de datos: Estadístco de Kolmogorov Smrnov con correccón de sgnfcacón de Lllefors Estadístco de Shapro Wlk CONTRASTE HOMOGENEIDAD DE VARIANZAS Para evaluar s las muestras se han extraído de poblaconales con varanzas guales (homogenedad de varanzas o homocedastcdad) se utlza la prueba de Levene. Prueba de homogenedad de varanzas de Levene plantea las hpótess: H: 0 La muestras se han extraído de poblacones con varanzas guales H: La muestras se han extraído de poblacones con varanzas dstntas Cuando el p_valor >αse asume la hpótess nula de gualdad de varanzas SPSS: Analzar/Comparar medas/prueba T para muestras ndependentes Cuando el p_valor >αse asume la hpótess nula de gualdad de varanzas 6

Se han recogdo calfcacones de una muestra de alumnos de un máster de Gestón Aeronáutca en dos Unversdades, obtenendo: Madrd 90 98 97 99 68 60 6 56 79 8 84 8 79 85 90 Barcelona 69 7 73 75 6 60 85 96 95 80 96 98 78 79 67 a) Construr un ntervalo de confanza para la dferenca de medas poblaconales con un nvel de sgnfcacón del 5% b) Contrastar con α= 0,05 los datos obtendos en la Unversdad Autónoma sabendo que la puntuacón meda en los masteres de Gestón es de 74 puntos Antes de construr un ntervalo de confanza se debe verfcar s las muestras proceden de dos dstrbucones normales N( μmadrd, σ Madrd) y N( μbarcelona, σ Barcelona). Para ello, se procede a efectuar la prueba de normaldad de Lllefors. 7

8

En las dos Pruebas las dos Unversdades tenen un p_valor(sg.) > 0,05 con lo que se acepta la hpótess nula que establece que las calfcacones en las Unversdades proceden de dstrbucones normales. Hay que construr un ntervalo de confanza para la dferenca de medas ( μmadrd μ Barcelona) en el caso de poblacones normales de varanzas σmadrd, σ Barcelona desconocdas (se desconoce s son guales o dstntas) y muestras pequeñas nmadrd + nbarcelona = 30 Se necestar realzar una Prueba de homogenedad de varanzas o homocedastcdad para dlucdar s las varanzas son guales o dstntas. Para ello, se utlza la Prueba de Levene: 9

s 3,88 Autónoma xautónoma = 80,60 sautónoma = 3,88 = Error típco meda = = = 3,5840 n 5 I( μ Autónoma) = xautónoma t 0,05, 4. ± = 80,60 ±,45. 3,584 = 7,9, 88,87 s,65 Barcelona ybarcelona = 79 sbarcelona =,65 = Error típco meda = = = 3,57 n 5 I( μ Barcelona) = ybarcelona t 0,05, 4. ± = 79 ±,45. 3,57 = 7,03, 85,986 El estadístco F de Levene acepta la hpótess nula de que las muestras se han extraído de dos poblacones con varanzas guales cuando p_valor(sg.) >α p_ valor (Sg.) = 0,89 > 0,05 Se acepta la gualdad de varanzas poblaconales La prueba tambén puede ser utlzada como una prueba prncpal para responder a una pregunta ndependente de sí dos sub muestras en una poblacón dada tenen varanzas guales o dferentes. Los test de la F de Snedecor son bastantes robustos ante las desvacones de la normaldad y tenen efectos dferentes sobre las estmacones de sgnfcacón ( α, Error Tpo I) dependendo de s hay desvacones por sesgo (smetría) y curtoss (apuntamento). El sesgo tene poco efecto sobre la sgnfcacón, ncrementando levemente el Error tpo I. La curtoss tene un efecto más marcado sobre el estadístco F: Cuando el coefcente m4 g = 3> 0 el estdístco F tende a ser menor de lo que debería (ncrementa el Error Tpo II: 4 σ Acepta la hpótess nula cuando de hecho es falsa) 0

m4 S g = 3< 0 el estadístco F tende a ser mayor de lo que debería (ncrementa el Error 4 σ Tpo I: Rechaza la hpótess nula cuando de hecho es certa) Cuando la prueba de Levene muestra sgnfcacón, se debe cambar a pruebas generalzadas (pruebas no paramétrcas), lbre de supuestos de homocedastcdad. A la vsta de la Prueba de muestras ndependentes... El ntervalo de confanza 8,3 μmadrd μbarcelona,5 cubre el 0, lo que ndca que no exste dferenca sgnfcatva en las puntuacones del máster en las dos Unversdades. El p_valor = 0,744 > 0,05 =α por lo que se acepta la hpótess nula H: 0 μ Madrd = μ Barcelona de gualdad de medas poblaconales. Dferenca medas = x y = 80,6 79 =,6 Madrd Barcelona x y,6 = = = 4,843 Madrd Barcelona Estadístco contraste t 0,330 α p = p_ valor (Sg.blateral) = P t8 > 0,330 =. P t 8 > 0,330 = 0,744 Longtud Intervalo =,5 ( 8, 3) = 9,84 =. t 0,05, 8. =. t 0,05, 8. 4,843 9,84 t0,05, 8 = =,048. 4,843 4,843 = Error típco dferencas = 4,843 = s p. + sp = = 3,63 5 5 + 5 5 SPSS estuda el contraste blateral o de dos colas. Para resolver contrastes unlaterales o de una cola hay que dvdr el p_ valor Sg.blateral entre, consderando s la cola es a la derecha o a la zquerda.

Sea la varable aleatora X Calfcacones en el máster U. Autónoma Madrd Madrd x 90 98 97 99 68 60 6 56 79 8 84 8 79 85 90 5 5 5 5 5 5 = = Madrd σmadrd Madrd Madrd Madrd 09 0043 α = x = x = = 80,6 α = x = = 6676, n. 5. 79,84 σ =α α = 6676, 80,6 = 79,84 s = = = 9,6857 n 4 Sea la varable aleatora Y Calfcacones en el máster U. Autónoma Barcelona Barcelona y 69 7 73 75 6 60 85 96 95 80 96 98 78 79 67 j 5 5 85 95843 j 5 5 5 5 j= j= Barcelona σbarcelona Barcelona Barcelona Barcelona α = y= y = = 79 α = y = = 6389,53 n. 5. 48,53 σ =α α = 6389,53 79 = 48,53 s = = = 59,49 n 4 Intervalo de confanza para la razón de varanzas de dos poblacones normales: s Madrd /sbarcelona s Madrd /s Barcelona I( σmadrd / σ Barcelona) =, F0,05, 4, 4 F0,975, 4, 4 9,6857 / 59,49 9,6857 / 59,49 I( σmadrd / σ Barcelona) =, = 0,474, 3,09,554 0,395 El ntervalo cubre el y se admte que las dos varanzas son guales con un 95% de fabldad. Intervalo de confanza para la dferenca de medas poblaconales de dos dstrbucones normales ( μmadrd μ Barcelona) con tamaños muestrales pequeños y varanzas desconocdas pero guales. I( μmadrd μ Barcelona ) = (x y) ± t α /, n + n.s p. + n n (n ) s + (n ) s 4. 9,6857 + 4. 59,49 s = = = 75,943 sp = 3,63 n n 8 p + Error típco dferenca s p. + = 3,63. + = 4,8430 0,05, 8 n n 5 5 t =,048

Estadístco contraste: x y,6 t = = = 0,3304 4,8430 I( μmadrd μ Barcelona) = (80,6 79) ±,048. 3,63. + = 8,385,,585 5 5 Cuando no se cumplen alguno de los supuestos de Normaldad y Homocedastcdad Se elmnan valores extremos Transformar los datos Utlzar la prueba U de Mann Whtney Que sea robusta quere decr que mantene la valdez de los Errores Tpo I y de Tpo II aunque la muestra no se dstrbuya de forma normal S no se cumple el supuesto de Normaldad la Prueba t de Student es sufcentemente robusta para aplcarla. La prueba U de Mann Whtney es una buena alternatva al test t de Student cuando no se cumplen los requstos exgdos para la aplcacón de tests paramétrcos. 3

Intervalo de confanza para la meda poblaconal del Grado de Gestón Aeronáutca de la Unversdad Autónoma de Madrd. Contrastar con el nvel 0 es obtener solo un ntervalo de confanza. 4

Intervalo de confanza: s Madrd I( μ Madrd ) = x ± tα/, n t0,05, 4 =,45 nmadrd 5 5 09 0043 α = x = x = = 80,6 α = x = = 6676, 5 5 5 5 = = n. σ 5. 79,84 σ =α α = 6676, 80,6 = 79,84 s = = = 9,6857 n 4 Madrd Madrd Madrd Madrd Madrd Error típco de la meda: s 9,6857 n 5 = x = = 3,5840 Estadístco contraste: x μ x 0 80,6 = = = = s / n 3,5840 0 t, 4888 x b) Hpótess nula H: 0 μ= 74 Hpótess alternatva H: μ 74 Se trata de un contraste blateral o de dos colas. Se acepta H 0 s p_ valor(sg.blateral) > 0,05 5

p_ valor(sg.blateral) = 0,087 > 0,05 Se acepta la hpótess nula Error típco de la meda: s 9,6857 n 5 = x = = 3,5840 Estadístco contraste: x μ x μ 80,6 74 6,6 = = = = = s / n 3,5840 3,5840 0 0 t,845 x Intervalo de confanza: I( μ 74) = 6,600 t 0,05, 4. ± = 6,600 ±,45. 3,584 =,087, 4,87 Como el ntervalo de confanza cubre el 0 se admte la hpótess nula. Sendo la varable aleatora X Puntuacón en el máster de Gestón Aeronáutca en UAM Se trata de un muestreo pequeño de la poblacón normal con varanza desconocda. En consecuenca, x t n μ, s x n Como la hpótess alternatva H: μ 74en la decsón son váldos valores de μ tanto mayores o menores que 74 por lo que se trata de un contraste blatreral o de dos colas. x k Se acepta H Regla de decsón 0 x > k Se rechaza H k x k Se acepta H0 o ben x < k ó x > k Se rechaza H 6

Bajo la hpótess nula H: 0 μ = 74con los datos muestrales: n= 5, x = 80,6, sx = 3,88, = 3,584 se tene x t ( 74, 3,584) 4 ( ) ( ) α= P Rechazar H H Certa = P x < k t 74, 3,584 + P x > k t 74, 3,584 = 0 0 4 4 x 74 k 74 x 74 k 74 k 74 k 74 = P < P P t4 P t4 0,05 0, 3,584 3,584 + > = < + > = + 3,584 3,584 3,584 3,584 05 k 74 74 k 74 k P t4 < P t4 0,05,45 k 66,33 3,584 = > 3,584 = = = 3,584 k 74 k 74 P t4 > = 0,05 =,45 k = 8,6876 3,584 3,584 La meda muestral observada x = 80,6 se encuentra ncluda en la regón de aceptacón 80,6 66,33, 8,6867 por lo que se acepta que la meda poblaconal sea 74. α p_ valor Sg (blateral) = P Rechazar meda muestral H Certa p 0 x 74 80,6 74 αp p_ valor Sg (blateral) = P x 80,6 t4( 74, 3,584) > = P > 3,584 3,584 = = P t4 >,845 = P t4 <,845 + P t4 >,845 =. P t4 >,845 =. 0,0435 = 0,087 Interpolando en la tabla t de Student:,76,45 0,05 0,05 =,845,45 x 0,05 x = 0,0435 Como p_ valor(sg.blateral) = 0,087 > 0,05 =α Se acepta H0 7

α p = 0,0435 < 0,05 =α Se rechaza H 0: μ 74 α p = 0,9565 > 0,05 =α Se acepta H 0: μ 74 8

Contrastes de bondad de ajuste Uno de los problemas fundamentales de la nferenca no paramétrca consste en examnar la bondad de ajuste de una dstrbucón. Para resolver un problema de bondad de ajuste cabe destacar dos métodos: Contrastes de la Ch cuadrado y Contrastes de Kolmogorov Smrnov. El objetvo del contraste de bondad del ajuste normal es saber sí una muestra (X, X,, X k) procede de una poblacón teórca con dstrbucón normal N( μ, σ) Sea una poblacón donde sea analza un carácter X con modaldades excluyentes, denotando por n la frecuenca observada (número de elementos que presentan la modaldad x), sendo k = n = n con k modaldades y n el número total de elementos. Se orgna la Tabla de Contngenca: Carácter X X X X X k Frecuenca observada n n Frecuenca teórca e e n e n k e k Ahora se establece la hpótess nula H0 consstente en suponer que la dstrbucón teórca escogda representa ben a la dstrbucón observada (empírca) y que, por tanto, las desvacones entre las frecuencas observadas y las teórcas son debdas al azar. Para ello, se defne el estadístco k k k (n e ) n e e = = χ = = n una Ch cuadrado de Pearson con (k ) grados de lbertad. que sgue aproxmadamente Con un nvel de sgnfcacón α (resgo α ) se acepta la hpótess nula s: k (n e ) k α,k e = χ = < χ k (n e ) En caso contraro, χ k = χα,k se rechaza la hpótess nula e = El test de la Ch cuadrado se puede aplcar en stuacones donde se desea decdr s una sere de datos (observacones) se ajusta o no a una funcón teórca prevamente determnada (Bnomal, Posson, Normal, Hpergeométrca). Es necesaro hacer algunas consderacones: 9

Hay que tener en cuenta el número de modaldades que admte el carácter, al haber más modaldades la Ch cuadrado va sendo cada vez más grande. Es necesaro que las frecuencas esperadas de las dstntas modaldades no sea nferor a cnco (e > 5). S hay alguna modaldad que tenga una frecuenca esperada menor que cnco se agrupan dos o mas modaldades contguas en una sola hasta lograr que la nueva frecuenca esperada sea mayor que cnco. En la práctca se admte un 0% de modaldades nferor a cnco. S para obtener frecuencas esperadas se necestan hallar p parámetros entonces los grados de lbertad de la Ch cuadrado son (k p) s son ndependentes y (k p ) s son excluyentes las modaldades. 0

3. La tabla refleja el número de accdentes mortales de tráfco que se producen en una carretera a lo largo de un período de tempo. Accdentes mortales por día 0 3 4 5 Número de días 3 78 98 60 5 8 Se ajustan los datos a una dstrbucón de Posson?. Utlzar un nvel de sgnfcacón 0,05

Hpótess nula H: 0 Los accdentes mortales de tráfco sguen una dstrbucón de Posson El p_ valor(sg. asntótcablateral) = 0,964 > 0,05 =α Se acepta la hpótess nula H0 Hpótess nula H 0 : La dstrbucón empírca se ajusta ala dstrbucón de Posson La hpótess nula se acepta a un nvel de sgnfcacón α sí (n e ) n χ = = < χ k k k p n ; k p e e α = = estadístco contraste estadístco teórco k Número ntervalos p Número parámetros a estmar La dstrbucón de Posson se caracterza porque sólo depende del parámetro λ que concde con la meda. Sea la varable aleatora X = Número de accdentes mortales por día y n Número de días x n xn P(x k) p = = e = n. p 0 3 0 0,496 4,80 78 78 0,3464 73,0 98 96 0,404 0,0 3 60 80 0, 55,60 4 5 00 0,0386 9,30 5 8 40 0,007 5,35 n = 500 694 6 694 n 540 = x =λ= x = =,388,388 P(x k) e k! k,388 = = k= 0,,5

Las probabldades con que ocurren los accdentes mortales por día k= 0,,5 se obtenen susttuyendo los valores de k en k,39 P(x = k) = e k! Para verfcar s el ajuste de los datos a una dstrbucón de Posson se acepta o no, medante una,39 χ, hay que calcular las frecuencas esperadas = (e n. p ) Dando lugar a una tabla de contngenca x 6, no tenendo que agrupar columnas contguas al no aparecer frecuencas esperadas menor que cnco x 0 3 4 5 Frecuencas 3 e = 4,80 78 e = 73,0 98 e3 = 0,0 Los grados de lbertad son cuatro: k p = 6 = 4 60 e4 = 55,60 5 e5 = 9,30 8 e6 = 5,35 Estadístco de contraste: 6 6 (n e ) n 3 e e = = χ = = n = 3 78 98 60 5 8 = + + + + + 500 = 9, 435 4,80 73,0 0,0 55,60 9,30 5,35 Estadístco teórco: χ 0,05; 4 = 9,488 El estadístco de contraste (bondad de ajuste) es menor que el estadístco teórco, (9, 435 < 9, 488), por lo que se acepta la hpótess nula, es decr, con un nvel de sgnfcacón 0,05, los accdentes mortales de tráfco en la carretera se ajustan a una dstrbucón de Posson. 3

Con un nvel de sgnfcacón 0,05 se desea comprobar s las puntuacones obtendas en un test de ntelgenca se dstrbuyen según una ley normal. Los datos obtendos fueron: 5 70 87 79 54 65 76 9 64 78 73 00 86 58 8 9 77 68 55 99 90 7 5 89 67 46 8 04 88 59 83 75 84 57 7 80 4

5

6

En el test de Kolmogorov Smrnov con la correccón de Lllefors resultan cuatro modaldades con un un p_valor (Sg.) > 0,05 con lo que se admte la hpótss nula de que la muestra procede de una dstrbucón normal. Con el contraste de Shapro Wlk se llega a la msma afrmacón. 7

o procedmento: 8

El p_valor (Sg. Asntótca) = 0,366 > 0,05 aceptando la hpótess nula de que las puntuacones sguen una ley normal con una sgnfcacón α = 0,05 3 o procedmento: 9

El p_valor (Sg. Asntótca blateral) = 0,969 > 0,05 aceptando la hpótess nula de que las puntuacones sguen una ley normal con una sgnfcacón α = 0,05 El método de aplcacón de la Prueba de ajuste para la normaldad de la dstrbucón de frecuencas es: Número de ntervalos = 36 = 6 Xmáx Xmín 04 46 Ampltud del Intervalo = = 0 n 6 Utlzando ntervalos de clase convenentes, se clasfcan los datos en una dstrbucón de frecuencas: Intervalos x n p e = pn 45 55 50 4 0,0594,4 55 65 60 5 0,563 5,63 65 75 70 7 0,53 9,05 75 85 80 0 0,64 9,4 85 95 90 7 0,66 5,98 95 05 00 3 0,0683,46 n= 36 Se calcula la meda y la desvacón típca: En este caso, μ = 75,56 y σ= 4,4 30

6 6 70 3000 α = x = x. n = = 75,56 α = x. n = = 596,67 n 36 n 36 = = σ =α α = 596,67 75,56 = 07,35 σ = 07,35 = 4, 4 x x Medante la tabla de la normal se calculan las probabldades de cada uno de los ntervalos: [ ] 45 75,56 x 75,56 55 75,56 P 45 < x < 55 = P < < P[, z, 43] 4, 4 4, 4 4,4 = < < = = P, 43 < z <, = P z >, 43 P z >, = 0,0764 0,070 = 0,0594 [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] P 55 < x < 65 = P, 43 < z < 0,73 = P 0,73 < z <, 43 = P z > 0,73 P z >, 43 = = 0,37 0,0764 = 0,563 [ ] [ ] [ ] [ ] [ ] P 65 < x < 75 = P 0,73 < z < 0,04 = P 0,04 < z < 0,73 = P z > 0,04 P z > 0,73 = = 0, 4840 0,37 = 0,53 [ ] [ ] [ ] [ ] [ ] [ ] P 75 < x < 85 = P 0,04 < z < 0,66 = P z > 0,04 P z > 0,66 = P z > 0,04 P z > 0,66 = = 0, 4840 0,546 = 0,64 P[ 85 < x < 95] = P[ 0,66 < z <,35] = P[ z > 0,66] P[ z >,35] = 0,546 0,0885 = 0,66 P[ 95 < x < 05] = P[,35 < z <,05] = P[ z >,35] P[ z >,05] = 0,0885 0,00 = 0,0683 Las condcones necesaras para aplcar el test de la Ch cuadrado exgen que al menos el 80% de los valores esperados de las celdas sean mayores que 5. Cuando esto no ocurre hay que agrupar modaldades contguas en una sola hasta lograr que la nueva frecuenca sea mayor que cnco. Intervalos x n p e = pn n n /e 45 65 55 9 0,57 7,77 8 0,4 65 75 70 7 0,53 9,05 49 5,4 75 85 80 0 0,64 9,4 00 0,63 85 05 95 0 0,344 8,44 00,85 Se halla el estadístco de contraste: n= 36 38,3 4 4 (n e ) n e e = = χ = = n = 38,8 36 =,8 Para esta prueba el número de grados de lbertad es gual al número de clases k= 4 menos tres 4 parámetros que han tendo que calcularse: n = n, μ y σ por tratarse de modaldades ndependentes (k p) = 3

El estadístco teórco para un nvel de sgnfcacón α = 0,05 es, por tanto, χ 0,05, = 3,84 Sendo χ =,8 < 3,84 =χ se afrma que las puntuacones en el test de ntelgenca se 0,05, dstrbuyen normalmente a un nvel α= 0,05 3

Para conocer la opnón de los cudadanos sobre la actuacón del alcalde de una determnada cudad se realza una encuesta a 404 personas. Los resultados se recogen en la sguente tabla: Desacuerdo De acuerdo No contestan Mujeres 84 78 37 Varones 8 6 5 Contrastar, con un nvel de sgnfcacón del 5%, que no exsten dferencas de opnón entre hombres y mujeres ante la actuacón del alcalde. 33

34

El contraste de homogenedad de la hpótess nula H : 'No exste dferenca entre hombres y 0 mujeres respecto a la opnón', analza s hombres y mujeres proceden de la msma poblacón o no. Esto es, s se comportan de manera semejante respecto a la opnón de la actuacón del alcalde. El test de Ch cuadrado tene p_valor (Sg. Asntótca blateral) = 0,007 < 0,05, afrmando que en cuanto al sexo exste dferenca de opnón respecto al alcalde con una fabldad del 95%. El test G da la razón de verosmltud, prueba de hpótess que presenta mejores resultados que el test de Ch cuadrado de Pearson, tene un p_valor (Sg. Asntótca blateral) = 0,007 < 0,05 con lo que se rechaza la hpótess nula. Hpótess nula: H :'No exste dferenca entre hombres y mujeres respecto a la opnón' 0 Se forma una tabla de contngenca x 3: En cada frecuenca observada (n ) =,,k ; j =, en la tabla, m de contngenca se tene una frecuenca teórca o esperada e que se calcula medante la expresón: n x n j e = p. n=, donde p son las probabldades de que un elemento tomado de la muestra n presente las modaldades x de X e y j de Y. 35

Mujeres Varones Desacuerdo De acuerdo No contestan n 84 e = 99,50 g = 0,69 8 e = 0, 50 g = 0,4 78 e = 68,96 g = 0,3 6 e = 7,04 g = 0,36 37 e3 = 30,54 g3 = 0,9 5 e3 = 3,46 g3 = 0,30 n 0 40 6 n = 404 j Sendo e > 5, j no es necesaro agrupar flas o columnas contguas 99 05 99. 0 99. 40 99. 6 e = = 99,50 e = = 68,96 e 3 = = 30,54 404 404 404 05. 0 05. 40 05. 6 e = = 0,5 e = = 7,04 e 3 = = 3, 46 404 404 404 Estadístco de contraste Ch cuadrado: (n e ) n = χ = n k m k m (k ). (m ) e j j e = = = j= j 3 (n e ) (84 99,5) (78 68,96) (37 30,53) (8 0,5) χ = = + + + + e 99,50 68,96 30,54 0,50 = j= (6 7,04) (5 3, 46) + + = 9,787 7,04 3, 46 o ben, 3 = j= n 84 78 37 8 6 5 n = + + + + + 404 = 9,787 e 99,50 68,96 30,54 0,50 7,04 3, 46 Estadístco teórco χ 0,05, = 5,99 Como χ = 9, 7787 > 5,99 =χ 0,05, se rechaza la hpótess nula, concluyendo que las muestras no son homogéneas, es decr, no proceden de la msma poblacón, hombres y mujeres no opnan lo msmo respecto al alcalde. Estadístco de contraste razón de verosmltud: n G n.ln e = 3 = j= 36

84 78 37 g = Ln 0,69 g Ln 0,3 g 3 Ln 0,9 99,50 = = 68,96 = = 30,54 = 8 6 5 g = Ln 0,4 g Ln 0,36 g 3 Ln 0,30 0,50 = = = = = 7,04 3, 46 n = (X n G n.ln e = 3 = = j= = x 84. ( 0,69) + 78. 0,3 + 37. 0,9 + 8. ( 0,4) + 6. ( 0,36) + 5. ( 0,30) = = 9,83 3 n G = n.ln = 9,83 > 5,99 =χ0,05, e con lo que se rechaza la hpótess nula, por = j= tanto, exste dferenca sgnfcatva entre la opnón de hombres y mujeres. El test G da la razón de verosmltud es una prueba de hpótess que presenta mejores resultados que el test de la Ch cuadrado de Pearson. 37

Tres métodos de empaquetado de tomates fueron probados durante un período de cuatro meses; se hzo un recuento del número de klos por 000 que llegaron estropeados, obtenéndose los sguentes datos: Meses A B C Total 6 0 0 6 8 3 3 8 8 4 30 4 9 4 6 39 Total 3 44 5 7 Con un nvel de sgnfcacón de 0,05, analzar s los tres métodos tenen la msma efcaca. 38

El test Ch cuadrado de Pearson presenta p_valor (Sg. Asntótca blateral) = 0,975 > 0,05 =α con lo que se acepta la hpótess nula 'No exste dferenca entre los métodos de empaquetado' 39

H: 0 'No exste dferenca entre los métodos de empaquetado' Con la smple observacón de los datos, el empaquetado A parece ser el mejor, ya que es el que menos klos de tomates estropeados tuvo. Ahora ben, esta stuacón puede ser engañosa, ya que hay que tener en cuenta el número de klos que se empaquetaron. Para tomar una decsón sobre s hay dferenca entre los dferentes métodos de empaquetado, se contrasta la hpótess nula. Se forma la tabla de contngenca 3 x 4 donde e n = x n n j Meses Empaquetado A B C Total 6 e = 6,35 g = 0,057 0 e = 9,0 g = 0,04 0 e3 = 0,65 g3 = 0,063 6 6 8 e = 7,8 g = 0,04 e =,09 g = 0,079 e3 = 3,0 g3 = 0,088 3 3 3 8 e3 = 7,3 g3 = 0,089 8 e3 = 0,39 g3 = 0,6 4 e33 =,8 g33 = 0,3 30 30 4 9 e4 = 9,5 g4 = 0,056 4 e4 = 3,5 g4 = 0,036 6 e43 = 5,97 g43 = 0,00 Total 3 44 5 7 6. 3 6. 44 6. 5 = = 6, 35 = = 9, 0 = = 0,65 7 7 7 3. 3 3. 44 3. 5 = = 7, 8 = =, 09 = = 3,0 7 7 7 30. 3 30. 44 30. 5 = = 7, 3 = = 0, 39 = =,8 7 7 7 39. 3 39. 44 39. 5 = = 9, 5 = = 3, 5 = 5,97 7 7 7 = e e e 3 e e e 3 e e e 3 3 33 e e e 4 4 43 Estadístco de contraste Ch cuadrado: 4 3 n χ (4 ). (3 ) =χ 6 = n e = j= 39 39 40

4 3 n 6 0 0 8 8 8 4 χ 6 = n = + + + + + + + + + e 6,35 9,0 0,65 7,8,09 3,0 7,3 0,39,8 = j= 9 4 6 + + + = 8,4 7 =,4 9,5 3,5 5,97 Estadístco teórco o esperado: χ 0,05, 6 =,59 Sendo χ 6 =, 4 <,59 =χ 0,05, 6, el estadístco observado es menor que el estadístco teórco o esperado, por tanto, se acepta la hpótess nula, concluyendo que los tres métodos de empaquetado tenen la msma efcenca. Estadístco de contraste razón de verosmltud: n G n.ln e = 4 3 = j= 6 0 0 g = Ln 0,057 g Ln 0,04 g3 Ln 0,063 6,35 = = 9, 0 = = 0,65 = 8 g = Ln 0, 04 g Ln 0, 079 g3 Ln 0,088 7,8 = =,09 = = 3,0 = 8 8 4 g3 = Ln 0, 089 g3 Ln 0,6 g33 7,3 = = 0,39 = = Ln 0,3,8 = 9 4 6 g4 = Ln 0,056 g4 Ln 0,036 g43 Ln 0,00 9,5 = = 3,5 = = 5,97 = 4 3 n G= n.ln = = j= e = x [6. ( 0,057) + 0. 0,04 + 0. ( 0,063) + 8. 0,04 +. 0,079 +. ( 0,088) + 8. 0,089 + 8. ( 0,6) + 4. 0,3 + 9. ( 0,056) + 4. 0,036 + 6. 0,00] =,74 4 3 n Como G = n. Ln =,74 <,59 =χ0,05, 6 e se acepta la hpótess nula, por tanto, = j= no exste dferenca sgnfcatva entre los métodos de empaquetado. 4

Para comprobar s los operaros encontraban dfcultades con una prensa manual de mprmr, se hzo una prueba a cuatro operaros anotando el número de atascos sufrdos al ntroducr el msmo número de hojas, dando lugar a la sguente tabla: Operaro A B C D Obstruccones 6 7 9 8 Con un nvel de sgnfcacón del 5%, exste dferenca entre los operaros? 4

El p_valor (Sg. asntótca) = 0,09 < 0,05 =α Se rechaza la hpótess nula que establece que no exste dferenca entre los operaros, con una sgnfcacón α = 0,05 Establecendo la hpótess nula H: 0 'No exste dferenca entre los operaros' La probabldad de que se atascase una hoja sería / 4 para todos los operaros. De este modo, el número de atascos esperados para cada uno de ellos sería e = 0 =,, 4 Se elabora la tabla de contngenca x 4: Operaro A B C D Total Obstruccones 6 0 7 0 9 0 Se acepta la hpótess nula, a un nvel de sgnfcacón α s 8 0 40 40 43

k k (n e ) n k n, k e e α = = χ = = < χ estadístco contraste estadístco teórco k número ntervalos Estadístco contraste: 4 n 6 7 9 8 3 e 0 0 0 0 = χ = n= + + + 40= 9 Estadístco teórco: χ 0, 05, 3 = 7,85 Sendo χ 3 = 9 > 7,85 =χ 0,05, 3 se rechaza la hpótess nula, concluyendo que exste dferenca sgnfcatva entre los operaros respecto al número de atascos en la prensa de mprmr. 44

Novecentos cncuenta escolares se clasfcaron de acuerdo a sus hábtos almentcos y a su coefcente ntelectual: Coefcente Intelectual < 80 80 90 90 99 00 Nutrcón buena 45 8 77 9 Nutrcón pobre 3 7 3 0 Total 76 55 90 9 A un nvel de sgnfcacón del 5%, se pde: Hay relacón entre las dos varables tabuladas?. Calcular los coefcentes Ph, V de Cramer y Coefcente de contngenca. 45

46

En el contraste de Ch cuadrado el p_valor (Sg. asntótca blateral) = 0,0 < 0,05 =α En consecuenca, se rechaza la hpótess nula de ndependenca entre los hábtos almentcos y el coefcente ntelectual, habendo, por tanto, dependenca estadístca entre las varables. En el contraste de Razón de verosmltudes, más precso que el contraste Ch cuadrado, el p_valor = 0,05 < 0,05 =α, rechazando la hpótess nula de ndependenca entre la nutrcón y el coefcente ntelectual. Las meddas nomnales sólo aprovechan nformacón nomnal. Úncamente nforman del grado de asocacón exstente, no de la dreccón o naturaleza de la asocacón. Los coefcente Ph, V de Cramer y Coefcente de contngenca el p_valor = 0,0 < 0,05 =α con lo que se rechaza la hpótess nula de ndependenca de las varables en estudo. S ben exste una relacón baja r = V = φ Cramer C = 0,0 47

El grado de dependenca entre la nutrcón y el coefcente ntelectual vene dada por el Coefcente de Contngenca. El coefcente de contngenca toma valores entre 0 y. Un coefcente de 0 ndca ndependenca, mentras que cuando se apoxma a ndca una asocacón perfecta. El coefcente de correlacón Ph en las tablas x tene el msmo valor que al coefcente de correlacón de Pearson. Su valor está determnado por la dstrbucón de dos varables, fuera del rango típco de los coefcentes, para consegur que el rango de valores se encontrase entre 0 y se creó el Coefcente de Contngenca. El coefcente V de Cramer ncluye una pequeña modfcacón de la Ph. En las tablas x el valor de V Cramer y Ph son déntcos. El coefcente V Cramer varía entre 0 y. Cuando VCramer = 0 no hay relacón entre las varables, cuando VCramer = hay una relacón perfecta, cuando VCramer > 0,3 se consdera una correlacón sgnfcatva. Se trata de un contraste de ndependenca entre el coefcente ntelectual y los hábtos almentcos. Se establecen las hpótess: H:'Las 0 varables analzadas son ndependentes' H:'Exste dependenca entre las dos varables' Se elabora la tabla de contngenca x 4, donde e n = x n j n Nutrcón buena Coefcente Intelectual < 80 80 90 90 99 00 45 e = 5, 47 g = 0,03 8 e = 33,6 g = 0,0 77 e3 = 73,80 g3 = 0,0 9 e4 = 09, 47 g4 = 0,04 n 869 Nutrcón pobre 3 e = 3,53 g = 0,8 7 e =,74 g = 0, 3 e3 = 6,0 g3 = 0, 0 e4 = 9,53 e4 = 0,67 n 76 55 90 9 950 j 869. 76 869. 55 869. 90 869. 9 e = = 5, 47 e = = 33, 6 e3 = = 73, 80 e4 = = 09, 47 950 950 950 950 8. 76 8. 55 8. 90 8. 9 e = = 3,53 e = =,74 e3 = = 6,0 e4 = = 9,53 950 950 950 950 Estadístco de contraste: 4 n χ ( ). (4 ) =χ 3 = n e = j= 8 48

4 n 45 8 77 9 3 7 3 0 χ 3 = n = + + + + + + + 950 = e 5, 47 33,6 73,80 09, 47 3,53,74 6,0 9,53 = j= = 9,75 O ben, = j= 4 (n e ) (45 5, 47) (8 33,6) (77 73,80) (9 09, 47) χ 3 = = + + + + e 5, 47 33,6 73,80 09, 47 (3 3,53) (7,74) (3 6,0) + + + 3,53,74 6,0 (0 9,53) + = 9,75 9,53 Estadístco teórco: χ 0,05, 3 = 7,85 Como χ = 9, 75 > 7,85 =χ se rechaza la hpótess nula, concluyendo hay dependenca 3 0,05,3 estadístca entre el coefcente ntelectual y la almentacón. Estadístco de contraste razón de verosmltud: n G n.ln e = 4 3 = j= 45 8 77 9 g = Ln 0,03 g Ln 0,0 g3 Ln 0,0 g4 Ln 0,04 5, 47 = = 33,6 = = 73,80 = = 09, 47 = 3 7 3 0 g Ln 0,8 g Ln 0, g3 Ln 0, g4 Ln 3,53,74 6,0 9, 53 = = = = = = = = 0,67 4 n G= n.ln = = j= e = x [45. ( 0,03) + 8. ( 0,0) + 77. 0,0 + 9. 0,04 + 3. 0,8 + 7. 0, + 3. ( 0,) + 0. ( 0,67)] = 0,506 4 n Como G = n. Ln = 0,506 <,59 =χ0,05, 6 e se acepta la hpótess nula, por tanto, = j= no exste dferenca sgnfcatva entre el coefcente ntelectual y la almentacón. El grado de dependenca se cuantfca medante el Coefcente de contngenca: χ3 9,57 C = = = 0,0 χ + n 9,57 + 950 3 El grado de dependenca es del 0,% por lo que la asocacón entre las varables es baja. En tablas de dmensón kxk el valor máxmo que toma es C máxmo = k k 49

El coefcente Ph tene una nterpretacón smlar al coefcente de correlacón de Pearson. En una tabla x se encuentra relaconado con el estadístco Ch cuadrado de Pearson. La nterpretacón del coefcente de correlacón de Pearson y el coefcente Ph se debe tomar con precaucón, mentras que el coefcente de correlacón ρ varía entre y ndcando cuando adquere el valor 0 ausenca de relacón. El coefcente Ph tene un máxmo que está determnado por la dstrbucón de dos varables. Coefcente Ph: χ3 9,57 φ= = = 0,0 n 950 El coefcente V Cramer es un valor de medda ndependente del tamaño de la muestra, medda smétrca para la ntensdad de la relacón entre dos o más varables de la escala nomnal, cuando al menos una de las varables tene por lo menos dos valores posbles. El rango de la V Cramer se encuentra entre 0 y. Un valor VCramer > 0,3 es consderado como una correlacón sgnfcatva. Cuando VCramer = 0 ndca que no hay relacón entre las varables, VCramer = refleja que hay una relacón perfecta, mentras que s VCramer = 0,6 hay una relacón relatvamente ntensa. χc χ3 9,57 VCramer = = = = 0,0 n. mín(k, m ) 950. mín(, 4 ) 950 50

5