ESTADÍSTICA NO PARAMÉTRICA: PRUEBA CHI-CUADRADO χ 2



Documentos relacionados
Análisis de datos en los estudios epidemiológicos II

INFERENCIA ESTADÍSTICA. CONTRASTE DE HIPÓTESIS

Ejemplos y ejercicios de. Análisis Exploratorio de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2014 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

MARTINGALAS Rosario Romera Febrero 2009

OPCIÓN A EJERCICIO 1_A

Para construir intervalos de confianza recordemos la distribución muestral de la proporción muestral $p :

MC Fco. Javier Robles Mendoza Primavera 2009

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

UNIVERSIDAD DE ATACAMA

Tema 9. Inferencia Estadística. Intervalos de confianza.

INFERENCIA ESTADÍSTICA: ESTIMACIÓN DE UNA PROPORCIÓN

BIOESTADISTICA ( ) Estudios de prevalencia (transversales) 1) Características del diseño en un estudio de prevalencia, o transversal.

Estimación puntual y por intervalos de confianza

Sucesiones numéricas.

DISTRIBUCION DE FRECUENCIA (DATOS AGRUPADOS)

ESTADÍSTICA DESCRIPTIVA: UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M.

IES Fco Ayala de Granada Junio de 2013 (Reserva 2 Modelo 1 ) Soluciones Germán-Jesús Rubio Luna

ESTIMACIÓN PUNTUAL Y ESTIMACIÓN POR INTERVALOS DE CONFIANZA

16 Distribución Muestral de la Proporción

CAPÍTULO 7: INFERENCIA PARA PROPORCIONES Y MEDIAS

IES Fco Ayala de Granada Sobrantes de 2006 (Modelo 2 Septiembre) Solución Germán-Jesús Rubio Luna

PRUEBAS DE ACCESO A LA UNIVERSIDAD FASE GENERAL: MATERIAS DE MODALIDAD

Métodos Estadísticos de la Ingeniería Tema 9: Inferencia Estadística, Estimación de Parámetros Grupo B

= Adj(A ) = 0 1-2/8 3/ /8 3/8 1-2/8 3/

Modelos lineales en Biología, 5ª Curso de Ciencias Biológicas Clase 28/10/04. Estimación y estimadores: Distribuciones asociadas al muestreo

PRUEBAS DE HIPÓTESIS

SOLUCIONES DE LOS PROBLEMAS DE LA OME 49ª. 1. Sean a, b y n enteros positivos tales que a b y ab 1 n. Prueba que

2. LEYES FINANCIERAS.

Matemáticas I - 1 o BACHILLERATO Binomio de Newton

Propuesta A. { (x + 1) 4. Se considera la función f(x) =

Muestreo. Tipos de muestreo. Inferencia Introducción

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

IES Fco Ayala de Granada Sobrantes de 2002 (Modelo 3 Junio) Solución Germán-Jesús Rubio Luna

INFERENCIA ESTADÍSTICA: ESTIMACIÓN DE UNA PROPORCIÓN

Gradiente, divergencia y rotacional

CURSO CONVOCATORIA:

Medidas de Tendencia Central

SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS JUNIO 2014 MODELO 3 (COLISIONES) OPCIÓN A

Transformaciones Lineales

5. Aproximación de funciones: polinomios de Taylor y teorema de Taylor.

OPCIÓN A EJERCICIO 1_A Sean las matrices A =

Calculamos los vértices del recinto convexo, resolviendo las ecuaciones las rectas de dos en dos.

SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS SOBRANTES 2008 (MODELO 5)

IES Fco Ayala de Granada Sobrantes de 2008 (Modelo 3 Junio) Solución Germán-Jesús Rubio Luna 12 2 = , es decir

1. Lección 11 - Operaciones Financieras a largo plazo - Préstamos (Continuación)

Planificación contra stock

Capítulo 2. Operadores

REVISIÓN DE ALGUNOS INDICADORES PARA MEDIR LA DESIGUALDAD XAVIER MANCERO CEPAL

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Tema 3. Polinomios y otras expresiones algebraicas (Estos conceptos están extraídos del libro Matemáticas 1 de Bachillerato.

IES Fco Ayala de Granada Sobrantes de 2001 (Modelo 5 Septiembre) Solución Germán-Jesús Rubio Luna

TEMA 5: INTERPOLACIÓN

METODOLOGÍA UTILIZADA EN LA ELABORACIÓN DEL ÍNDICE DE PRECIOS AL POR MAYOR EN LA REPÚBLICA DE PANAMÁ I. GENERALIDADES

TEMA 3.- OPERACIÓN FINANCIERA

Estadística Descriptiva

ELEMENTOS DE ÁLGEBRA MATRICIAL

Progresiones. Objetivos. Antes de empezar. 1.Sucesiones.. pág. 74 Definición. Regla de formación Término general

ESTADÍSTICA. Al preguntar a 20 individuos por el número de personas que viven en su casa, hemos obtenido las siguientes respuestas:

Estimación puntual y por intervalos

SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS SOBRANTES 2012 (MODELO 2)

Polinomios. Definición de polinomio y sus propiedades. Grado de un polinomio e igualdad de polinomios

CONCEPTOS BÁSICOS DE PRESTAMOS.

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2015 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Tema 6. Sucesiones y Series. Teorema de Taylor

Práctica 6: Vectores y Matrices (I)

Revisión de conceptos: S 2 p ( 1 p ) Distribución binomial: Programa de Efectividad Clínica 2003 Bioestadística Vilma E. Irazola.

SOLUCIONES Modelo 2 PRUEBA DE ACCESO A LA UNIVERSIDAD DEL AÑO ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II

Por: Lic. Eleazar J. García. República Bolivariana de Venezuela Tinaco.- Estado Cojedes. INTEGRALES INDEFINIDAS

UNIDAD 7: ESTADÍSTICA INFERENCIAL

(PROBABILIDAD) (tema 15 del libro)

IES Fco Ayala de Granada Sobrantes de 2001 (Modelo 2) Solución Germán-Jesús Rubio Luna

Soluciones problemas del Tema 2

IES Fco Ayala de Granada Sobrantes de 2006 (Modelo 5 ) Solución Germán-Jesús Rubio Luna OPCIÓN A

Ejercicio 1. Sea el recinto limitado por las siguientes inecuaciones: y + 2x 2; 2y 3x 3; 3y x 6.

IES Fco Ayala de Granada Sobrantes 2014 (Modelo 2 ) Soluciones Germán-Jesús Rubio Luna

INTERVALOS DE CONFIANZA Y TAMAÑO MUESTRAL. 1. Una muestra aleatoria de 9 tarrinas de helado proporciona los siguientes pesos en gramos

MATEMÁTICAS 1214, PARCIAL 3 PROBLEMAS PARA PRACTICAR SOLUCIONES. 1. Para cada sucesión infinita abajo, determine si converge o no a un valor finito.

Práctica 7 CONTRASTES DE HIPÓTESIS

PRUEBAS DE ACCESO A LA UNIVERSIDAD FASE ESPECÍFICA: MATERIAS DE MODALIDAD

EXAMEN DE TÉCNICAS PARA EL ANÁLISIS DEL MERCADO. 11-Septiembre-2014.

Estimación puntual y por Intervalos de Confianza

PRESENTACIONES ESTADISTICAS. Número de Trabajadores (frecuencia)

Fórmula de Taylor. Si f es continua en [a,x] y derivable en (a,x), existe c (a,x) tal que f(x) f(a) f '(c) = f(x) = f(a) + f '(c)(x a)

SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS SOBRANTES 2008 (MODELO 4)

A = 1. Demuestra que P (1) es cierta. 2. Demuestra que si P (h) es cierta, entonces P (h + 1) es cierta.

Matemáticas 2º de Bachillerato Ciencias Sociales

CONCEPTOS BÁSICOS DE PROBABILIDAD Y ESTADÍSTICA

Soluciones Hoja de Ejercicios 2. Econometría I

IES Fco Ayala de Granada Sobrantes de 2011 (Modelo 1) Enunciado Germán-Jesús Rubio Luna

GENERALIDADES. La Empresa de Transmisión Eléctrica, S. A. (ETESA) maneja 151 estaciones, clasificadas de la siguiente manera:

Tests de Hipótesis basados en dos muestras. ESTADÍSTICA (Q) 23. TESTS E INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES

Solución del examen de Investigación Operativa de Sistemas de septiembre de 2004

4. CONCEPTO BASICOS DE PROBABILIDADES

ESTADÍSTICA BÁSICA. Discretas. Función de masa de probabilidad: P(X=x i ) Sólo se toma un conjunto finito valores {x 1, x 2,...}

Este centro consta de 20 cuartos sencillos, 12 cuartos dobles, 7 corredores y 4 salas de sesiones.

11. TRANSFORMADOR IDEAL

UNIDAD Nº 2. Leyes financieras: Interés simple. Interés compuesto. Descuento.


EJERCICIO 1. , a partir de las frecuencias observadas, nij. , que se dan en la tabla del ejercicio.

Transcripción:

Estadística o Paramétrica ESTADÍSTICA NO PARAMÉTRICA: PRUEBA CHI-CUADRADO χ Autores: Jua Fracisco Moge Ivars (jmoje@uoc.edu), Ágel A. Jua Pérez (ajuap@uoc.edu) ESQUEMA DE CONTENIDOS Estadística o Paramétrica Prueba CHI-CUADRADO UNA VARIABLE DOS VARIABLES Prueba de Bodad del Ajuste Prueba de Homogeeidad Prueba de Idepedecia Proyecto e-math 1 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica OBJETIVOS El objetivo de este e-block es el estudio de varias cuestioes e relació co v.a. cualitativas ó cuatitativas cuyos datos está recogidos e forma de tabla de frecuecias. El deomiador comú a todas ellas es que su tratamieto estadístico está basado e la misma distribució teórica: la distribució χ (chi-cuadrado ó ji-cuadrado). E esecia se va a abordar tres tipos de problemas: a) Prueba de Bodad de Ajuste, cosiste e determiar si los datos de cierta muestra correspode a cierta distribució poblacioal. E este caso es ecesario que los valores de la variable e la muestra y sobre la cual queremos realizar la iferecia esté dividida e clases de ocurrecia, o equivaletemete, sea cual sea la variable de estudio, deberemos categorizar los datos asigado sus valores a diferetes clases o grupos. b) Prueba de Homogeeidad de varias muestras cualitativas, cosiste e comprobar si varias muestras de ua carácter cualitativo procede de la misma població (por ejemplo: estas tres muestras de alumos proviee de poblacioes co igual distribució de aprobados?. Es ecesario que las dos variables medibles esté represetadas mediate categorías co las cuales costruiremos ua tabla de cotigecia. c) Prueba de Idepedecia, cosistete e comprobar si dos características cualitativas está relacioadas etre sí (por ejemplo: el color de ojos está relacioado co el color de los cabellos?). Auque coceptualmete difiere del aterior, operativamete proporcioa los mismos resultados. Este tipo de cotrastes se aplica cuado deseamos comparar ua variable e dos situacioes o poblacioes diferetes, i.e., deseamos estudiar si existe diferecias e las dos poblacioes respecto a la variable de estudio. CONOCIMIENTOS PREVIOS Este math-block supoe ciertos coocimietos básicos de estadística (iferecia y probabilidad), así como coocimietos básicos del software estadístico MINITAB. CONCEPTOS FUNDAMENTALES Muestra: Parte de ua població que se toma cuado es imposible acceder a toda ella. La elecció de la muestra se hace co la iteció de, a partir de la iformació que ella proporcioa, exteder sus resultados a toda la població a la que represeta. Muestra aleatoria: (Muestra elegida al azar) Aquella muestra tomada de la població e la que todo idividuo tiee la misma probabilidad de resultar elegido para ella, y esto co idepedecia etre idividuos. Fució de Distribució: Fució que hace correspoder a cada uo de los valores de ua variable aleatoria la probabilidad de que tal variable aleatoria tome u valor igual o iferior al dado. Fució de Probabilidad: Fució que hace correspoder a cada uo de los valores de la variable aleatoria discreta su probabilidad. Cotraste de hipótesis: Cojuto de reglas tedetes a decidir cuál de dos hipótesis la ula ó la alterativa- debe aceptarse e base al resultado obteido e ua muestra. Es de dos colas cuado la alterativa es la egació de la ula. De ua cola e caso cotrario. Proyecto e-math Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica Variable aleatoria: Toda fució que toma diversos valores uméricos, depediete de los resultados de u feómeo aleatorio, co distitas probabilidades. Variable aleatoria discreta. Las variables aleatorias discretas so aquellas que preseta u úmero fiito de valores, costituye ua sucesió umerable. Variable aleatoria cotiua. Las variables aleatorias cotiuas puede tomar u úmero ifiito de valores e u itervalo determiado. Variable categórica. Ua variable categórica es ua variable que clasifica cada idividuo de ua població e ua de las varias clases mutuamete excluyetes e que ésta se divide. Variable umérica. Correspode a los datos expresados e ua escala cotiua umérica. Proyecto e-math 3 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica PRUEBA DE BONDAD DE AJUSTE INTRODUCCIÓN Estamos iteresados e determiar si los datos dispoibles de ua muestra aleatoria simple de tamaño correspode a cierta distribució teórica. El primer paso a realizar cosiste e descompoer el recorrido de la distribució teórica e u úmero fiito de subcojutos: A 1, A,..., A k. Después, clasificar las observacioes muestrales, segú el subcojuto a que perteezca. Y, por último, comparar las frecuecias observadas de cada A i co las probabilidades que les correspodería co la distribució teórica a cotrastar. OBJETIVOS Compreder la importacia de este método para medir si los datos resultates de ua muestra proviee de ua distribució teórica. Metodología útil para validar las hipótesis sobre la distribució teórica e la població que se realiza e la estadística paramétrica, i.e., cotrastes de hipótesis, itervalos de cofiaza, regresió lieal, etc. CONOCIMIENTOS PREVIOS Se debe poseer uos coocimietos míimos de Iferecia Estadística, i.e., Estadística Descriptiva, Itervalos de Cofiaza y Cotrastes de Hipótesis. Es preciso coocer el maejo de algú paquete estadístico y recomedable alguas ocioes del paquete MINITAB. BONDAD DEL AJUSTE (I) Supogamos que teemos u úmero k de clases e las cuales se ha ido registrado u total de observacioes ( será pues el tamaño muestral). Deotaremos las frecuecias observadas e cada clase por O 1, O,..., O k (O i es el úmero de valores e la clase A i ). Se cumplirá: O 1 O... O k = Lo que queremos es comparar las frecuecias observadas co las frecuecias esperadas (teóricas), a las que deotaremos por E 1, E,..., E k. Se cumplirá: E 1 E... E k = FRECUENCIA OBSERVADA FRECUENCIA ESPERADA CLASE 1 O 1 E 1 CLASE O E......... CLASE K O K E K Total N Se tratará ahora de decidir si las frecuecias observadas está o o e cocordacia co las frecuecias esperadas (es decir, si el úmero de resultados observados e cada clase correspode Proyecto e-math 4 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica aproximadamete al úmero esperado). Para comprobarlo, haremos uso de u cotraste de hipótesis usado la distribució Chi-cuadrado: El estadístico de cotraste será χ = k i= 1 ( O E ) i E i i Observar que este valor será la suma de k úmeros o egativos. El umerador de cada térmio es la diferecia etre la frecuecia observada y la frecuecia esperada. Por tato, cuato más cerca esté etre sí ambos valores más pequeño será el umerador, y viceversa. El deomiador permite relativizar el tamaño del umerador. Las ideas ateriores sugiere que, cuato meor sea el valor del estadístico χ, más coheretes será las observacioes obteidas co los valores esperados. Por el cotrario, valores grades de este estadístico idicará falta de cocordacia etre las observacioes y lo esperado. E este tipo de cotraste se suele rechazar la hipótesis ula (los valores observados so coheretes co los esperados) cuado el estadístico es mayor que u determiado valor crítico. Notas: χ (1) El valor del estadístico se podrá aproximar por ua distribució Chi-cuadrado cuado el tamaño muestral sea grade ( > 30), y todas las frecuecias esperadas sea iguales o mayores a 5 (e ocasioes deberemos agrupar varias categorías a fi de que se cumpla este requisito). () Las observacioes so obteidas mediate muestreo aleatorio a partir de ua població particioada e categorías. BONDAD DEL AJUSTE (II) U experimeto multiomial es la geeralizació de u experimeto biomial: 1. Cosiste e pruebas idéticas e idepedietes.. Para cada prueba, hay u úmero k de resultados posibles. 3. Cada uo de los k posibles resultados tiee ua probabilidad de ocurrecia p i asociada (p 1 p... p k = 1), la cual permaece costate durate el desarrollo del experimeto. 4. El experimeto dará lugar a u cojuto de frecuecias observadas (O 1, O,..., O k ) para cada resultado. Obviamete, O 1 O... O k =. E ocasioes estaremos iteresados e comparar los resultados obteidos al realizar u experimeto multiomial co los resultados esperados (teóricos). Ello os permitirá saber si uestro modelo teórico se ajusta bie o o a las observacioes. Para ello, recurriremos a la distribució Chi-cuadrado, la cual os permitirá realizar u cotraste sobre la bodad del ajuste. Cocretamete, usaremos el estadístico χ = k i= 1 ( O E ) i E i i co k 1 grados de libertad. Podemos calcular cada frecuecia esperada (teórica) multiplicado el úmero total de pruebas por la probabilidad de ocurrecia asociada, es decir: E i = * p i i = 1,..., k Proyecto e-math 5 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica CASOS PRÁCTICOS EJEMPLO: E cierta máquia Expededora de Refrescos existe 4 caales que expide el mismo tipo de bebida. Estamos iteresados e averiguar si la elecció de cualquiera de estos caales se hace de forma aleatoria o por el cotrario existe algú tipo de preferecia e la selecció de alguo de ellos por los cosumidores. La siguiete tabla muestra el úmero de bebidas vedidas e cada uo de los 4 caales durate ua semaa. Cotrastar la hipótesis de que los caales so seleccioados al azar a u ivel de sigificació del 5%. Caal Número de bebidas cosumidas mediate este expededor 1 13 3 18 4 17 SOLUCIÓN: Para realizar el cotraste de Bodad de Ajuste debemos calcular las frecuecias esperadas de cada suceso bajo la hipótesis de uiformidad etre los valores. Si la selecció del caal fuera aleatoria, todos los caales tedría la misma probabilidad de selecció y por lo tato la frecuecia esperada de bebidas vedidas e cada uo de ellos debería ser aproximadamete la misma. Como se ha vedido e total 70 refrescos, la frecuecia esperada e cada caal es E i = * p i = 70* ¼ = 17.5 i = 1,..., k El estadístico del cotraste sería: χ (13 17.5) = 17.5 ( 17.5) 17.5 (18 17.5) 17.5 (17 17.5) 17.5 =.348 Este valor debemos compararlo co el valor crítico de la distribució libertad. Este valor es: χ 0.95 (3) = 7. 81 χ co (4-1)=3 grados de Puesto que el valor del estadístico (.34) es meor que el valor crítico, o podemos rechazar la hipótesis de que los datos se ajusta a ua distribució uiforme. Es decir, que los caales so seleccioados aleatoriamete etre los cosumidores. EJEMPLO: Estamos iteresados e comprobar la perfecció de u dado cúbico (u dado ormal de 6 caras). Para esto realizamos 100 lazamietos del dado aotado los putos obteidos e cada lazamieto. A la vista de los resultados obteidos, podemos cocluir que el dado o es perfecto?. Nivel de sigificació (5%) Putuació e el dado Número de veces que se obtiee la putuació. 1 14 Proyecto e-math 6 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica 3 18 4 17 5 0 6 9 SOLUCIÓN: Si el dado estuviera equilibrado, e el resultado de lazarlo sucesivamete se debería obteer aproximadamete el mismo úmero de veces cada ua de las caras del dado. E este ejercicio debemos cotrastar si la distribució del dado es ua distribució uiforme, co probabilidad de obteer cada ua de las caras igual a 1/6. Podemos calcular de ua forma muy secilla el úmero esperado de resultados obteidos e cada clase multiplicado la probabilidad de obteer cada ua de las caras (p = 1/6) por el úmero de lazamietos ( = 100). Podemos observa que los valores observados y esperados o parece coicidir, por lo tato, a priori parece haber evidecias de irregularidades e el dado. Calculemos el estadístico χ co ayuda del Calculator de MINITAB. Proyecto e-math 7 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica Calc > Calculator Proyecto e-math 8 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica Calc > Colum Statistics Co el resultado: Colum Sum Sum of CHI-CUADRADO = 6,4675 Calculemos fialmete el p-valor asociado a este estadístico. E este caso, como trabajamos co u cotraste uilateral, p-valor= P( χ >6,4675) = 1- P( χ < 6,4675) dode χ sigue ua distribució Chi-cuadrado co k-1=5 grados de libertad. Por tato: Proyecto e-math 9 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Calc > Probability Distributios > Chi-square Estadística o Paramétrica Cumulative Distributio Fuctio Chi-Square with 5 DF x P( X <= x) 6,4675 0,7367 Así pues, p-valor = 1 0,7367 = 0, 633. Por tato, podemos cosiderar que el p-valor o es sigificativo. Cocluiremos, a pesar de las evidecias que había e u pricipio, que o hay evidecias para rechazar que el dato fuera correcto, i.e., o podemos rechazar la distribució uiforme para los posibles resultados del dado. Proyecto e-math 10 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

PRUEBA DE HOMOGENEIDAD Estadística o Paramétrica INTRODUCCIÓN Estamos iteresados e determiar si los datos correspodietes a dos o más muestras aleatorias proviee de la misma població. Nuevamete el cojuto de posibles valores de las observacioes se divide e k cojutos disjutos: A 1, A,..., A k. ; clasificado e ellos las observacioes de cada muestra. Si ij represeta el úmero de observacioes de la muestra i que perteece al cojuto A j, los datos puede tabularse e lo que se deomia ua tabla de cotigecia. Muestra A 1 A... A k. Total 1 11 1 1 k 1.... m Total 1 k. m1 m mk m..1.. k La hipótesis de que las m poblacioes so homogéeas, se traduce e que cada cojuto A j debe teer ua probabilidad teórica p j, descoocida, pero que o varia de la població i a la població i. Esto debe verificarse para todas las categorías, i.e., las categorías debe ser homogéeas e las diversas muestras. OBJETIVOS Compreder la importacia de este método para medir si dos muestras aleatorias proviee de la misma població. Notar que e la estadística o paramétrica, como es este cotraste, o se realiza cotrastes sobre parámetros de la població (cotraste de igualdad de medias),i.e., se realiza cotrastes sobre la població orige. Metodología muy útil para comparar diversas muestras y extraer coclusioes sobre la igualdad e las distribucioes poblacioales de cada ua de ellas. CONOCIMIENTOS PREVIOS Se debe poseer uos coocimietos míimos de Iferecia Estadística, i.e., Estadística Descriptiva, Itervalos de Cofiaza y Cotrastes de Hipótesis. Es preciso coocer el maejo de algú paquete estadístico y recomedable alguas ocioes del paquete MINITAB. Proyecto e-math 11 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica CONCEPTOS FUNDAMENTALES Del mismo modo que la Prueba de Bodad de Ajuste, e este caso debemos comparar las frecuecias observadas e cada ua de las muestras y para cada categoría co las frecuecias bajo el supuesto de homogeeidad e las poblacioes. E este caso las frecuecias observadas correspode al úmero de idividuos de la muestra i e la clase j, i.e., ij. El estadístico de cotraste será χ = i= 1 k ( ij eij ) j= 1 e ij Dode e ij es la frecuecia esperada bajo el supuesto de homogeeidad, que puede represetarse como i p j, es decir, el úmero de idividuos e la muestra i por la probabilidad de que ocurra la característica j e la població. Para el cálculo de las probabilidades de perteecer u idividuo a cada ua de las categorías podemos utilizar: Por lo tato : pi =. j / e = ij i.. j / Observar que este valor será la suma de *k úmeros o egativos. El umerador de cada térmio es la diferecia etre la frecuecia observada y la frecuecia esperada. Por tato, cuato más cerca esté etre sí ambos valores más pequeño será el umerador, y viceversa. El deomiador permite relativizar el tamaño del umerador. Las ideas ateriores sugiere que, cuato meor sea el valor del estadístico χ, más coheretes será las observacioes obteidas co los valores esperados. Por el cotrario, valores grades de este estadístico idicará falta de cocordacia etre las observacioes y lo esperado. E este tipo de cotraste se suele rechazar la hipótesis ula (los valores observados so coheretes co los esperados) cuado el estadístico es mayor que u determiado valor crítico. Notas: χ (3) El valor del estadístico se podrá aproximar por ua distribució Chi-cuadrado cuado el tamaño muestral sea grade ( > 30), y todas las frecuecias esperadas sea iguales o mayores a 5 (e ocasioes deberemos agrupar varias categorías a fi de que se cumpla este requisito). (4) Las observacioes so obteidas mediate muestreo aleatorio e cada muestra a partir de ua població particioada e categorías. Cocretamete, usaremos el estadístico χ = k i= 1 ( O E ) i E i i co (-1)(k 1) grados de libertad. Proyecto e-math 1 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica CASOS PRÁCTICOS EJEMPLO : Estamos iteresados e estudiar la fiabilidad de cierto compoete iformático co relació al distribuidor que os lo sumiistra. Para realizar esto, tomamos ua muestra de 100 compoetes de cada uo de los 3 distribuidores que os sirve el producto comprobado el úmero de defectuosos e cada lote. La siguiete tabla muestra el úmero de defectuosos e para cada uo de los distribuidores. Compoetes Compoetes Defectuosos correctos Distribuidor 1 16 94 100 Distribuidor 4 76 100 Distribuidor 3 9 81 100 49 51 300 SOLUCIÓN: Debemos realizar u cotraste de homogeeidad para cocluir si etre los distribuidores existe diferecias de fiabilidad referete al mismo compoete. Compoetes Compoetes Defectuosos correctos Distribuidor 1 16 (16.33) 94 (83.66) 100 Distribuidor 4 (16.33) 76 (83.66) 100 Distribuidor 3 9 (16.33) 81 (83.66) 100 49 51 300 Las frecuecias esperadas bajo homogeeidad so las represetadas etre parétesis. El estadístico del cotraste será: (16 16.33) (4 16.33) (9 16.33) χ = 16.33 16.33 16.33 (94 83.66) (76 83.66) (81 83.66) 83.66 83.66 83.66 = 8.963 Este valor del estadístico Ji-cuadrado es mayor que el valor para el ivel de sigificació del 5%, por lo tato debemos cocluir que o existe homogeeidad y por lo tato que hay diferecias etre los tres distribuidores. χ 0.05 () = 5. 99 Proyecto e-math 13 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica EJEMPLO: Estamos iteresados e estudiar la relació etre cierta efermedad y la adicció al tabaco. Para realizar esto seleccioamos ua muestra de 150 idividuos, 100 idividuos o fumadores y 50 fumadores. La siguiete tabla muestra las frecuecias de efermedad e cada grupo (Completar la tabla). Padece la No Padece la Efermedad efermedad Fumadores 1 88 100 No Fumadores 5 5 50 37 113 150 Realizar u cotraste de homogeeidad y obteer las coclusioes sobre la relació etre las variables. SOLUCIÓN: Para cosiderar este cotraste como u cotraste de Homogeeidad supoemos que las persoas fumadoras y las persoas o fumadoras costituye dos poblacioes difereciadas. U estudio similar cosistiría e cosiderar a los fumadores y o fumadores como ua característica de ua població y por lo tato este ejemplo podría platearse como u cotraste de idepedecia, ver PRUEBA DE INDEPENDENCIA. E este ejemplo queremos cotrastar la hipótesis de que las proporcioes de efermos e ambas poblacioes ( Fumadores y No Fumadores) es la misma. La represetació de la tabla de cotigecia e Miitab debe ser la misma que la aterior: Proyecto e-math 14 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica Miitab realiza los cálculos por osotros: Stat > Tables > Chi-square Test: Expected couts are prited below observed couts Padece No Padece Total 1 1 88 100 4,67 75,33 5 5 50 1,33 37,67 Total 37 113 150 Chi-Sq = 6,505,130 13,009 4,60 = 5,903 DF = 1, P-Value = 0,000 E los resultados aparece las frecuecias esperadas bajo el supuesto de homogeeidad. Co u p-valor de 0,000 hay suficiete evidecia e cotra de que la hipótesis ula sea cierta. Por tato, la rechazaríamos, i.e.; parece evidete que los fumadores tiee ua mayor propesió a padecer la efermedad. Proyecto e-math 15 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

PRUEBA DE INDEPENDENCIA Estadística o Paramétrica INTRODUCCIÓN Estamos iteresados e determiar si dos cualidades o variables referidas a idividuos de ua població está relacioadas. Se diferecia de los cotrastes ateriores e que e este caso estamos iteresados e ver la relació existete etre dos variables de ua misma població, o queremos cotrastar la distribució teórica de ua variable (prueba de bodad de ajuste) i e comparar la distribució de ua úica variable e dos poblacioes (prueba de homogeeidad). OBJETIVOS Compreder la importacia de este método para medir relacioes etre variables si realizar supuesto adicioales sobre las distribucioes de estas. Alterativa muy potete para medir relacioes etre variables categóricas, dode o es posible aplicar los métodos clásicos de Iferecia Estadística como la Regresió Lieal. Tambié es aplicable a variables cuatitativas si o se verifica los supuestos ecesarios a satisfacer por otras técicas estadísticas. Idetificar las diferecias coceptuales etre el test de homogeeidad y el Test de Idepedecia. CONOCIMIENTOS PREVIOS Se debe poseer uos coocimietos míimos de Iferecia Estadística, i.e., Estadística Descriptiva, Itervalos de Cofiaza y Cotrastes de Hipótesis. Es preciso coocer el maejo de algú paquete estadístico y recomedable alguas ocioes del paquete MINITAB. PRUEBA DE INDEPENDENCIA Supogamos que de elemetos de ua població se ha observado dos características X e Y, obteiédose ua muestra aleatoria simple bidimesioal (X 1,Y 1 ),(X,Y ),...,(X,Y ). Sobre la base de dichas observacioes se desea cotrastar si las características poblacioales X e Y so idepedietes o o. Para ello se dividirá el cojuto de posibles valores de X e k cojutos disjutos A 1,A,...,A k ; mietras que el cojuto de posibles valores Y será descompuesto e r cojutos disjutos: B 1,B,...,B r. Al clasificar os elemetos de la muestra, aparecerá u cierto úmero de ellos, ij, e cada ua de las k r clases así costituidas, dado lugar a ua tabla de cotigecia de la forma: A 1 A... A k. Total B 1 11 1 1 k 1. B 1 k.... B r r1 r rk r. Total. 1.. k Proyecto e-math 16 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica Al igual que para el Test de homogeeidad, el estadístico del cotraste será r k ( ij eij ) χ = co (k-1)(r-1) grados de libertad. e i= 1 j= 1 ij Dode: e = ij i.. j / EJEMPLO: Para estudiar la depedecia etre la práctica de algú deporte y la depresió, se seleccioó ua muestra aleatoria simple de 100 jóvees, co los siguietes resultados: Si depresió Co depresió Deportista 38 9 No deportista 31 Determiar si existe idepedecia etre la actividad del sujeto y su estado de áimo. Nivel de sigificació (5%) SOLUCIÓN: Debemos primero calcular las frecuecias esperadas bajo el supuesto de idepedecia. La tabla de frecuecias esperadas sería: Si depresió Co depresió Deportista 3.43 14.57 47 No deportista 36.57 16.43 53 69 31 100 Calculamos ahora el estadístico del cotraste: (38 3.43) (9 14.57) (31 36.57) ( 16.43) χ = = 5.8 3.43 14.57 36.57 16.43 Este valor debemos compararlo co el percetil de la distribució libertad. χ 0.95 (1) = 3. 84. χ co (-1)(-1)=1 grado de Por lo tato como el valor del estadístico es superior al valor crítico, cocluimos que debemos rechazar la hipótesis de idepedecia y por lo tato asumir que existe relació etre la depresió e los hábitos deportistas del idividuo. Proyecto e-math 17 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica EJEMPLO: U estudio que se realizó co 81 persoas referete a la relació etre la catidad de violecia vista e la televisió y la edad del televidete produjo los siguietes resultados. SOLUCIÓN: 16-34 34-55 55 ó más Poca violecia 8 1 1 Mucha Violecia 18 15 7 Idica los datos que ver violecia e la televisió depede de la edad del televidete, a u ivel de sigificació del 5%? Debemos realizar u test de idepedecia para ver si existe relació etre la violecia vista e televisió co el grupo de edad al que perteece el idividuo. Dado que el test de Idepedecia, o difiere del test de Homogeeidad a ivel operacioal, el desarrollo es aálogo al ejercicio de Miitab de la secció aterior. Itroducimos los valores de la tabla de cotigecia del siguiete modo: Proyecto e-math 18 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica Stat > Tables > Chi-Square Test: Chi-Square Test Expected couts are prited below observed couts 16-34 34-55 55 ó más Total 1 8 1 1 41 13,16 13,67 14,17 18 15 7 40 1,84 13,33 13,83 Total 6 7 8 81 Chi-Sq =,04 0,03 3,89,074 0,08 3,371 = 11,169 DF =, P-Value = 0,004 El valor del estadístico del cotraste es 11,169. El p-valor asociado a este valor es 0,004. Por lo tato a u ivel de sigificació del 0.005 deberemos rechazar la hipótesis ula de idepedecia, y por lo tato cocluir que existe diferecias etre el tipo de televisió cosumida y la edad del televidete. Proyecto e-math 19 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)

Estadística o Paramétrica BIBLIOGRAFÍA [1] Baró, J. y Alemay, R. (000): Estadística II. Ed. Fudació per a la Uiversitat Oberta de Cataluya. Barceloa. [] Peña Sáchez de Rivera, D. (1987): Estadística. Modelos y Métodos. Volume. Aliaza Editorial. Madrid. ISBN: 84-06-8110-5 [3] Johso, R. R. (1996): Elemetary statistics. Belmot, etc. : Duxbury, cop [4] R. Vélez y A. García: Cálculo de Probabilidades y Estadística Matemática. Ciecias Matemáticas. UNED. [5] A. Martí Adrés y J. de D. Lua del Castillo: 50 ± 10 horas de Bioestadística Edicioes Norma. Proyecto e-math 0 Fiaciado por la Secretaría de Estado de Educació y Uiversidades (MECD)