Distribuciones de parámetros conocidos

Documentos relacionados
10.5. Contraste de independencia de variables cualitativas

Contrastes basados en el estadístico Ji Cuadrado

Estudiaremos tres tipos de contrastes, cada uno de los cuales trata de responder a la pregunta correspondiente: Bondad del ajuste Proceden los datos

Tema 9: Relación entre variables categóricas

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Caso particular: Contraste de homocedasticidad

Principios de Bioestadística

Contrastes de Hipótesis paramétricos y no-paramétricos.

Test χ 2 de Bondad de Ajuste y Test de Independencia

ESTADÍSTICA 1 o CC. Ambientales Tema 5: Contrastes de hipótesis no paramétricas

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

Contraste de hipótesis paramétricas

Si dos o más genes se heredan independientemente, y cada gen controla un fenotipo diferente, cada fenotipo también se hereda independientemente.

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

Estadística. Contrastes para los parámetros de la Normal

Tema 13: Contrastes No Paramétricos

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población

Bioestadística y uso de software científico TEMA 4 DATOS CATEGÓRICOS COMPARACIÓN DE PROPORCIONES

Inferencia Estadística

INFERENCIA ESTADISTICA CUADRADO) CHI-CUADRADO. x i. Variable Aleatoria [N(µ, σ) ] Muestras (N=1) Tipificando. = i σ z 2. = σ

EXAMEN DE ESTADÍSTICA Junio 2011

Estimación de Parámetros.

TEMA Nº 2 CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTRA

PATRONES DE DISTRIBUCIÓN ESPACIAL

INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Estadística Inferencia Estadística

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación

Tema 7. Contrastes no paramétricos en una población

Tema 9: Introducción al problema de la comparación de poblaciones

En las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre.

Tests de hipótesis. Técnicas de validación estadística Bondad de ajuste. Pruebas de bondad de ajuste. Procedimiento en una prueba de hipótesis

PRUEBA CHI-CUADRADO. Para realizar un contraste Chi-cuadrado la secuencia es:

Tema 10: Introducción a los problemas de Asociación y Correlación

Prueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados):

U ED Tudela Diseños de Investigación y Análisis de Datos - Tema 7

Tema 9: Contraste de hipótesis.

Contrastes sobre la media Sea X 1, X 2,..., X n una m.a.s. extraída de una población normal X con media desconocida µ. Se desea contrastar:

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

EXAMEN DE ESTADISTICA Junio 2007

Aplicación de la distribución empírica: Tests de bondad de ajuste

Prof. Jose Jacobo Zubcoff Universidad de Alicante 1

Técnicas de Inferencia Estadística II. Tema 2. Contrastes de hipótesis en poblaciones normales

Tema 8: Contrastes de hipótesis

CONTRASTE DE HIPÓTESIS

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

Inferencia en tablas de contingencia

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 12) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

CONTRASTE DE HIPÓTESIS TEMA 4.1 CONTRASTES BILATERALES

Bioestadística: Inferencia Estadística. Análisis de Una Muestra

Tests de Hipótesis basados en una muestra. ESTADÍSTICA (Q) 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA

Conceptos básicos de inferencia estadística (II): Contrastes de hipótesis (repaso)

Técnicas de Inferencia Estadística II. Tema 5. Contrastes de homogeneidad

TEMA 10 COMPARAR MEDIAS

Técnicas de Inferencia Estadística II. Tema 5. Contrastes de homogeneidad

Tablas de contingencia y contrastes χ 2

CONTRASTE DE HIPÓTESIS

Inferencia Estadística. Estimación y Contrastes

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

DISEÑO Y ANÁLISIS DE DATOS I. SEGUNDO PARCIAL. JUNIO 2015

Estadística Inferencial. Resúmen

Tema 8: Contraste de hipótesis

Ejercicios T.5 CONTRASTES PARAMÉTRICOS

Contraste de Hipótesis

Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN

Técnicas de Inferencia Estadística II. Tema 4. Contrastes para la mediana y otros cuantiles

PREGUNTAS TIPO EXAMEN. 1. Cuál de las siguientes medidas es una medida de Centralización?

Conceptos del contraste de hipótesis

Prueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya):

Tema 6: Introducción a la inferencia estadística Parte 1

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Estado civil Frecuencia observada Casado 50 Soltero 30 Viudo 15 Divorciado 5 Total 100

CONTRASTE DE HIPÓTESIS

Genética "Herencia Mendeliana"

Pasos. i Aplicar la prueba X 2 para determinar la significación estadística de las proporciones entre ambas variables (no son iguales)

Profesor: Carlos Valle Página:

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Contrastes de hipótesis paramétricos

Contrastes de hipótesis. 1: Ideas generales

ESTADÍSTICA 1 o CC. Ambientales Tema 4: Contrastes de hipótesis paramétricas

TEMA 8. Contraste de hipótesis de la media

Universidad Técnica de Babahoyo CONTRASTE DE HIPÓTESIS

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Tema 8. Contrastes no paramétricos. 8.1 Introducción

7. Inferencia Estadística. Métodos Estadísticos para la Mejora de la Calidad 1

Pruebas de Hipótesis

Tema 6: Contraste de hipótesis

CONTRASTES DE HIPÓTESIS

Limitaciones de la prueba (las mismas que para la prueba de Independencia):

Estadística. Para el caso de dos variables aleatorias X e Y, se puede mostrar que. Pero y son desconocidos. Entonces. covarianza muestral

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA

LIGAMIENTO Y RECOMBINACIÓN

Ejemplos Resueltos Tema 4

1) Características del diseño en un estudio de cohortes.

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Curso de Estadística con R: Nivel Medio

Teorema Central del Límite (1)

Transcripción:

10.3. CONTRASTE DE BONDAD DE AJUSTE PARA DISTRIBUCIONES265 350 300 observaciones esperado(x) 250 Frecuencias esperadas 200 150 100 Frecuencias observadas 50 0 55 60 65 70 75 80 85 90 Figura 10.2: En los contrastes de distribuciones, se compara si las observaciones (histograma) se distribuye según una ley de probabilidad conocida. 10.3.1. Distribuciones de parámetros conocidos Deseamos contrastar si la v.a. X sigue una ley de distribución X 1 P[X = 1] = p 1 2 P[X = 2] = p 2... i P[X = i] = p i... k P[X = k] = p k donde todos los p i están fijados (hipótesis H 0 ). Entonces por lo mencionado anteriormente, el contraste consiste en:

266 Bioestadística: Métodos y Aplicaciones k χ 2 (O i n p i ) 2 exp = n p i i=1 χ 2 teo = χ 2 k 1,1 α Si χ 2 exp χ 2 teo no rechazamos H 0 ; Si χ 2 exp > χ 2 teo se rechaza H 0 En este contraste se comete cierto error de aproximación y por tanto será tanto mejor cuanto mayor sea n. Ejemplo Dadas dos parejas de genes Aa y Bb, la descendencia del cruce efectuado según las leyes de Mendel, debe estar compuesto del siguiente modo: Leyes de Mendel Frecuencias Fenotipo relativas AB 9/16 Ab 3/16 ab 3/16 ab 1/16 Elegidos 300 individuos al azar de cierta población se observa la siguiente distribución de frecuencias: Frecuencias Fenotipo observadas AB 165 Ab 47 ab 67 ab 21 Total 300 Se puede aceptar que se cumplen las leyes de Mendel sobre los individuos de dicha población? Solución:

10.3. CONTRASTE DE BONDAD DE AJUSTE PARA DISTRIBUCIONES267 El contraste a realizar es: H 0 : Se cumplen las leyes de Mendel H 1 : No se cumplen H 0 : H 1 : p AB = 9/16 p Ab = 3/16 p ab = 3/16 p ab = 1/16 p AB 9/16 p Ab 3/16 p ab 3/16 p ab 1/16 y y y o bien o bien o bien Para ello vamos a representar en una sóla tabla las frecuencias observadas, junto con las que serían de esperar en el caso de que H 0 fuese cierta: Fenotipo O i E i Oi 2/E i AB 165 300 9/16 = 168, 75 161,33 Ab 47 300 3/16 = 52, 25 42,27 ab 67 300 3/16 = 52, 25 85,91 ab 21 300 1/16 = 18, 75 23,52 Total 300 300 313,03 Bajo la hipótesis de que H 0 sea cierta, se tiene que: χ 2 exp = i O 2 i /E i n χ 2 4 0 1 ya que 4 son los posibles fenotipos, no se ha estimado ningún parámetro (la distribución según las leyes de Mendel es conocida), y sobre las cantidades E i existe solamente una restricción, que es: i E i = 300. Por otro lado, χ 2 exp = i O 2 i /E i n = 313, 03 300 = 13, 03 que según la tabla de la distribución χ 2 es aproximadamente el percentil 99, 5 de la distribución χ 2 3. Por tanto la significatividad del contraste es del

268 Bioestadística: Métodos y Aplicaciones 0, 5 % < 5 %, lo que nos conduce a rechazar la hipótesis de que la población de la que la muestra ha sido extraída sigue las leyes de Mendel. Al mismo resultado llegamos sin calcular con precisión la significatividad del contraste, sino considerando que el valor teórico máximo que admitimos para el estadístico experimental con un nivel de significación del 5 % es el percentil 95 de χ 2 3, es decir, χ 2 teo = χ 2 3;0,95 = 7, 815 y claramente ocurre que χ 2 exp > χ 2 teo, por lo que se rechaza la hipótesis nula. Obsérvese también que el que se haya rechazado la hipótesis nula significa que hay diferencia estadísticamente significativa entre las frecuencias observadas y las esperadas. Figura 10.3: Aunque aparentan ser aproximadamente iguales las frecuencias observadas y esperadas, existe diferencia estadísticamente significativa entre ellas. 10.3.2. Distribuciones con parámetros desconocidos Supongamos que la distribución de X que queremos contrastar no especifica ciertos valores de r parámetros

10.4. CONTRASTE DE HOMOGENEIDAD DE MUESTRAS CUALITATIVAS269 X Fam (θ 1,..., θ r ) = X 1 P[X = 1] = p 1 (θ 1,..., θ r ) 2 P[X = 2] = p 2 (θ 1,..., θ r )... i P[X = i] = p i (θ 1,..., θ r )... k P[X = k] = p k (θ 1,..., θ r ) Estimemoslos a partir de la muestra, y consideremos las cantidades p i = p i (ˆθ 1,..., ˆθ r ) Entonces el contraste consiste en k χ 2 (O i n p i ) 2 exp = n p i=1 i χ 2 teo = χ 2 k r 1,1 α Si χ 2 exp χ 2 teo no rechazamos H 0 ; Si χ 2 exp > χ 2 teo se rechaza H 0 10.4. Contraste de homogeneidad de muestras cualitativas Vamos a generalizar el contraste de comparación de dos proporciones (página 244). Consideremos una variable cualitativa (o cuantitativa agrupada en intervalos) que puede tomar valores en diferentes clases. Se toman r muestras diferentes y se desea contrastar: H 0 : Las r muestras son homogéneas con respecto a la variable H 1 : Alguna muestra es diferente La manera de proceder consiste en representar las r muestras en una tabla del tipo

270 Bioestadística: Métodos y Aplicaciones Frec. Muestra 1 Muestra 2 Muestra r clases Clase 1 O 11 O 12 O 1r F 1 Clase 2 O 21 O 22 O 2r F 2.................. Clase k O k1 O k2 O kr F k Tamaño muestras C 1 C 2 C r T donde O ij frecuencia observada de la clase i en la muestra j F i = C j = k O ij número de individuos de la clase i j=1 r O ij total de individuos de la muestra j i=1 r k T = F i = C i total de individuos muestreados i=1 j=1 Bajo la hipótesis H 0, la frecuencia esperada para la clase i en la muestra j es compárese con la condición de independencia en tablas de doble entrada, relación (??): E ij = F i C j T La diferencia entre lo esperado y lo observado la mide el estadístico χ 2

10.4. CONTRASTE DE HOMOGENEIDAD DE MUESTRAS CUALITATIVAS271 χ 2 exp = r k i=1 j=1 (O ij E ij ) 2 E ij = r k Oij 2 E i=1 j=1 ij T Su distribución es aproximadamente χ 2 gl, donde los grados de libertad, gl = a b c, se calculan teniendo en cuenta que a = k r número de casillas b = k 1 número de parámetros estimados c = r relaciones impuestas sobre lose ij (10.2) Por tanto χ 2 χ 2 (k 1) (r 1) y rechazamos H 0 si χ 2 exp > χ 2 (k 1) (r 1),1 α. Ejemplo Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos poblaciones. Para ello se elige una muestra aleatoria simple de cada una de ellas, obteniéndose los datos reflejados en la tabla: Frec. Obs. A B AB 0 Muestra 1 90 80 110 20 Muestra 2 200 180 240 30 Qué conclusiones pueden obtenerse de estos datos si se usa un nivel de significación del 5 %? Solución: Poseemos una variable cualitativa X, que es el grupo sanguíneo, y debemos contrastar si la distribución es la misma en la primera población y la segunda. Para ello planteamos el contraste de homogeneidad conveniente:

272 Bioestadística: Métodos y Aplicaciones H 0 : La variable X se distribuye igualmente en ambas poblaciones H 1 : La distribución no es homogénea Para ello escribimos la que sería la distribución de frecuencias esperadas. Éstas se calculan a partir de las frecuencias marginales de la distribución de frecuencias esperadas: Frec. Esp. A B AB 0 Muestra 1 91,58 82,11 110,53 15,79 300 Muestra 2 198,42 177,89 239,47 34,21 650 290 260 350 50 950 El estadístico del contraste mide las discrepancia entre las observaciones observadas y esperadas: χ 2 exp = 2 4 i=1 j=1 Oij 2 950 = 902 E ij 91, 58 + + 302 950 = 1, 76 34, 21 Los valores críticos están a la derecha del percentil 95 del la distribución χ 2 (2 1) (4 1) = χ2 3, que es χ2 teo = χ 2 3;0,95 = 2, 35. Por tanto de dichas muestras no se obtiene evidencia estadística suficiente en contra de que exista una distribución homogénea del grupo sanguíneo en ambas poblaciones. 10.5. Contraste de independencia de variables cualitativas A partir de una población se toma mediante muestreo aleatorio simple una muestra de tamaño n. En cada observación se analizan dos características cualitativas A y B ( o cuantitativas agrupadas en intervalos), las cuales presentan r y s modalidades respectivamente. Deseamos contrastar si las dos variables son independientes, o sea, queremos realizar un test de significación para las hipótesis: