Contrastando la independencia

Documentos relacionados
Tema 9: Relación entre variables categóricas

DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES RELACION DE DOS CARACTERES Relación entre variables cualitativas

Contrastes de hipótesis

Estimación de Parámetros.

Tema 13: Contrastes No Paramétricos

DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X 2 CONCEPTO BÁSICO Frecuencia: es el número de datos que caen en cada celda. Frecuencias Observadas (fo):

En las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre.

10.5. Contraste de independencia de variables cualitativas

Tema 5. Estadística descriptiva bivariable con variables categóricas y numéricas

Prueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados):

Tema 10: Introducción a los problemas de Asociación y Correlación

Bioestadística y uso de software científico TEMA 4 DATOS CATEGÓRICOS COMPARACIÓN DE PROPORCIONES

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Estado civil Frecuencia observada Casado 50 Soltero 30 Viudo 15 Divorciado 5 Total 100

Distribuciones de parámetros conocidos

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

2 Contraste de independencia

ANEXO VI. DETALLE ESTADÍSTICO

Prueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya):

FLACSO / Facultad Latinoamericana de Ciencias Sociales Maestría en Ciencias Políticas & Sociología Metodología de la Investigación Social

5.5 Modelo de regresión. se especificó en los términos siguientes: (6.3.1) 1,2,3,..N. Donde:

Folleto de Estadísticas. Teoría del 2do Parcial

Contrastes basados en el estadístico Ji Cuadrado

Tema B6. Tablas de contingencia. Ejemplo

Tests de hipótesis. Técnicas de validación estadística Bondad de ajuste. Pruebas de bondad de ajuste. Procedimiento en una prueba de hipótesis

Hipótesis Alternativa H 1 : ϑ Θ 1

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Estudiaremos tres tipos de contrastes, cada uno de los cuales trata de responder a la pregunta correspondiente: Bondad del ajuste Proceden los datos

Prof. Jose Jacobo Zubcoff Universidad de Alicante 1

Pruebas de bondad de ajuste

PRUEBA CHI-CUADRADO. Para realizar un contraste Chi-cuadrado la secuencia es:

Soluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 2008 Primera semana

PRUEBAS DE BONDAD DE AJUSTE y DE INDEPENDENCIA

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

ESTADÍSTICA 1 o CC. Ambientales Tema 5: Contrastes de hipótesis no paramétricas

Tema 6: Introducción a la inferencia estadística Parte 1

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Distribuciones Fundamentales de Muestreo. UCR ECCI CI-0115 Probabilidad y Estadística Prof. Kryscia Daviana Ramírez Benavides

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

Contraste de Hipótesis

Tema 8: Contrastes de hipótesis

Introducción a la inferencia estadística

Soluciones a los nuevos ejercicios propuestos

TABLAS DE CONTINGENCIA

Limitaciones de la prueba (las mismas que para la prueba de Independencia):

DISEÑO Y ANÁLISIS DE DATOS I. SEGUNDO PARCIAL 2016

Tablas de contingencia y contrastes χ 2

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

C.2. Prueba de Ji Cuadrado ( no paramétrica)

Principios de Bioestadística

Técnicas de Inferencia Estadística II. Tema 5. Estadísticos de orden

CAPITULO IV ANÁLISIS DE LOS RESULTADOS. Hubo un mayor número de participantes mujeres, que hombres, lo que es

Validación de hipótesis de un proceso de Poisson no homogéneo

EJERCICIO PROPUESTO CHI-CUADRADO O BONDAD DE AJUSTE

Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.

INFERENCIA ESTADISTICA CUADRADO) CHI-CUADRADO. x i. Variable Aleatoria [N(µ, σ) ] Muestras (N=1) Tipificando. = i σ z 2. = σ

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

LIGAMIENTO Y RECOMBINACIÓN

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO

4. Obtén las siguientes tablas de doble entrada para las variables Dispersión y Formación:

PRUEBAS DE BONDAD DE AJUSTE

ETSI de Topografía, Geodesia y Cartografía

Genética "Herencia Mendeliana"

GUIÓN TEMA 3. CONTRASTE DE HIPÓTESIS EN EL MRL Contrastes de hipótesis en el MRL

Universidad Técnica de Babahoyo CONTRASTE DE HIPÓTESIS

Bioestadística. Curso Capítulo 9

ESTADÍSTICA BIVARIADA

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

La práctica del análisis de correspondencias

TEMA 3: Contrastes de Hipótesis en el MRL

Contrastes de Hipótesis

CONTRASTES DE HIPÓTESES

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Algunas pruebas no paramétricas: Test de Mann-Whitney y Test de Wilcoxon

Caso particular: Contraste de homocedasticidad

Estadística Los parámetros estadísticos más usuales son: Media aritmética

Soluciones a los ejercicios propuestos del Tema 5

Estadística II Examen final enero 19/1/17 Curso 2016/17 Soluciones Duración del examen: 2 h y 15 min

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

Ejemplos Resueltos Tema 4

Probabilidad condicionada y el teorema de Bayes

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

EXAMEN DE ESTADÍSTICA Septiembre 2011

DISEÑO EXPERIMENTAL FACTORIAL DE GRUPOS

Tema 15: Contrastes de hipótesis sobre algunos parámetros

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

Tema 5.5: Contrastes de hipótesis

Intervalos de conanza

ECONOMETRÍA I. Tema 6: Heterocedasticidad. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

Inferencia en tablas de contingencia

Estadística Inferencial

Estadística II. Prueba de bondad de ajuste Conceptos, aplicación

1) Características del diseño en un estudio de cohortes.

Matemática Aplicada y Estadística - Farmacia Soluciones del Primer Examen Parcial - Grupo 3

1. La distribución ji-cuadrada. La distribución ji-cuadrada surge de la suma de normales estándar al cuadrado, su definición formal es la siguiente:

Transcripción:

M. Wiper Análisis Estadístico del Delito 1 / 20 Contrastando la independencia Michael Wiper Departamento de Estadística Universidad Carlos III de Madrid

M. Wiper Análisis Estadístico del Delito 2 / 20 Objetivo Introducir las ideas básicas de contrastes de independencia.

M. Wiper Análisis Estadístico del Delito 3 / 20 ¾Hay evidencias de alguna relación entre la política carcelaria y la reincidencia? La tabla representa una pequeña muestra. Queremos ver si proporcione información sobre la población más grande de delincuentes de guante blanco.

M. Wiper Análisis Estadístico del Delito 4 / 20 Ideas básicas de contrastes de independencia Queremos ver si existe relación alguna entre las dos variables.

M. Wiper Análisis Estadístico del Delito 4 / 20 Ideas básicas de contrastes de independencia Queremos ver si existe relación alguna entre las dos variables. Vamos a suponer que no hay relación ninguna, es decir que la política carcelaria y el grado de reincidencia son independientes.

M. Wiper Análisis Estadístico del Delito 4 / 20 Ideas básicas de contrastes de independencia Queremos ver si existe relación alguna entre las dos variables. Vamos a suponer que no hay relación ninguna, es decir que la política carcelaria y el grado de reincidencia son independientes. A ver si los datos proporcionen evidencias en contra de la independencia.

M. Wiper Análisis Estadístico del Delito 5 / 20 Hipótesis nula y experimental Formalmente, la hipótesis nula es H 0 : la política carcelaria y el grado de reincidencia son independientes. Intentamos buscar evidencias en contra de H 0 y a favor de la hipótesis experimental o alternativa: H 1 : la política carcelaria y el grado de reincidencia son dependientes.

M. Wiper Análisis Estadístico del Delito 6 / 20 La tabla con frecuencias relativas Las tabla proporciona las proporciones en cada celda. En la muestra, un 60 % de los delincuentes han ido a la cárcel. Luego, nuestra mejor previsión para la población es que un 60 % de los delincuentes son encarcelados.

M. Wiper Análisis Estadístico del Delito 7 / 20 ¾Qué esperariamos ver bajo independencia? Recordamos que si A y B son independientes, P(A B) = P(A)P(B).

M. Wiper Análisis Estadístico del Delito 8 / 20 ¾Qué esperariamos ver bajo independencia? Estimamos que: P(cárcel y reincidente) = P(cárcel)P(reincidente) = 0,6 0,31 = 0,186

M. Wiper Análisis Estadístico del Delito 9 / 20 ¾Qué números absolutos esperariamos ver bajo independencia? Había 167 personas en la muestra. Si fuesen independientes las variables, esperariamos haber visto 0,186 167 personas encarcelados y reincidentes.

M. Wiper Análisis Estadístico del Delito 10 / 20 ¾Qué números absolutos esperariamos ver bajo independencia? Otra manera más rápida para calcular los números esperados es total en la la total en la columna/total Tenemos 100 52/167 = 31,138.

M. Wiper Análisis Estadístico del Delito 11 / 20 ¾Son muy diferentes los números observados y esperados? Calculamos una medida de diferencia entre las dos tablas.

M. Wiper Análisis Estadístico del Delito 12 / 20 El estadístico ji-cuadrado Calculamos el estadístico: χ 2 = fc (O fc E fc ) 2 E fc.

M. Wiper Análisis Estadístico del Delito 12 / 20 El estadístico ji-cuadrado Calculamos el estadístico: χ 2 = fc (O fc E fc ) 2 E fc. En nuestro ejemplo χ 2 = (33 31,138)2 + 31,138 = 0,403 (19 20,862)2 20,862 + (67 68,862)2 68,862 + (48 46,138)2 46,138 ¾Cómo decidimos si este número proporciona evidencia en contra de la independencia?

M. Wiper Análisis Estadístico del Delito 13 / 20 Los grados de libertad Primero calculamos los grados de libertad grados de libertad = (número de las 1) (número de columnas 1) En nuestro caso tenemos 2 las y dos columnas y luego son (2 1) (2 1) grados de libertad.

M. Wiper Análisis Estadístico del Delito 14 / 20 Tablas de la distribución ji-cuadrado Suponiendo que fuesen independientes, la probabilidad de ver un valor tan grande como 0,403 es entre 97,5 % y 20 %.

M. Wiper Análisis Estadístico del Delito 15 / 20 Errores de tipo I y de tipo II Existen dos posibles conculsiones y dos posibles errores.

M. Wiper Análisis Estadístico del Delito 15 / 20 Errores de tipo I y de tipo II Existen dos posibles conculsiones y dos posibles errores. ¾Cuál de los dos errores parece más serio?

M. Wiper Análisis Estadístico del Delito 16 / 20 El nivel de signicación y el p-valor Normalmente se ja el error de tipo I o nivel de signicación en un valor pequeño como 5 % o 1 %.

M. Wiper Análisis Estadístico del Delito 16 / 20 El nivel de signicación y el p-valor Normalmente se ja el error de tipo I o nivel de signicación en un valor pequeño como 5 % o 1 %. Se rechaza H 0 si el p-valor es menor que el nivel de signicación.

M. Wiper Análisis Estadístico del Delito 16 / 20 El nivel de signicación y el p-valor Normalmente se ja el error de tipo I o nivel de signicación en un valor pequeño como 5 % o 1 %. Se rechaza H 0 si el p-valor es menor que el nivel de signicación. En nuestro caso, el p-valor es entre 20 % y 97,5 %, muy por arriba del 5 %.

M. Wiper Análisis Estadístico del Delito 16 / 20 El nivel de signicación y el p-valor Normalmente se ja el error de tipo I o nivel de signicación en un valor pequeño como 5 % o 1 %. Se rechaza H 0 si el p-valor es menor que el nivel de signicación. En nuestro caso, el p-valor es entre 20 % y 97,5 %, muy por arriba del 5 %. Luego no hay ninguna evidencia en contra de H 0.

M. Wiper Análisis Estadístico del Delito 16 / 20 El nivel de signicación y el p-valor Normalmente se ja el error de tipo I o nivel de signicación en un valor pequeño como 5 % o 1 %. Se rechaza H 0 si el p-valor es menor que el nivel de signicación. En nuestro caso, el p-valor es entre 20 % y 97,5 %, muy por arriba del 5 %. Luego no hay ninguna evidencia en contra de H 0. No hay evidencias estadística de una relación entre la política carcelaria y la reincidencia.

M. Wiper Análisis Estadístico del Delito 17 / 20 Marijuana y inclinación política A menudo en la prensa se sugiere que la gente de izquierdas son más porreras que la gente más conservador o de derechas. La siguiente tabla, tomada del artículo Attitutes about Marijuana and Political Views publicado en 1973 en la revista Psychological Reports muestra las inclinaciones políticas y frecuencia de uso de marijuana de una muestra de estudiantes en esta epoca. ¾Existen evidencias reales de una relación entre las dos variables?

M. Wiper Análisis Estadístico del Delito 18 / 20 Hipótesis ¾Qué son la hipótesis nula y alternativa? H 0 : no hay relación entre la inclinación política y el uso de marijuana. H 1 : sí hay una relación.

M. Wiper Análisis Estadístico del Delito 19 / 20 Valores esperados suponiendo independencia ¾Cómo calculamos el número 494,38? ¾Parece que exista alguna relación?

M. Wiper Análisis Estadístico del Delito 20 / 20 Ji-cuadrado,grados de libertad, p-valor, conclusión El estadístico ji-cuadrado es χ 2 = (479 494,38)2 494,38 + + (85 49,03)2 49,03 = 64,64.

M. Wiper Análisis Estadístico del Delito 20 / 20 Ji-cuadrado,grados de libertad, p-valor, conclusión El estadístico ji-cuadrado es χ 2 = (479 494,38)2 494,38 + + (85 49,03)2 49,03 = 64,64. Hay r = 3 las y c = 3 columnas y luego los grados de libertad son (3 1) (3 1) = 4.

M. Wiper Análisis Estadístico del Delito 20 / 20 Ji-cuadrado,grados de libertad, p-valor, conclusión El estadístico ji-cuadrado es χ 2 = (479 494,38)2 494,38 + + (85 49,03)2 49,03 = 64,64. Hay r = 3 las y c = 3 columnas y luego los grados de libertad son (3 1) (3 1) = 4.

M. Wiper Análisis Estadístico del Delito 20 / 20 Ji-cuadrado,grados de libertad, p-valor, conclusión El estadístico ji-cuadrado es χ 2 = (479 494,38)2 494,38 + + (85 49,03)2 49,03 = 64,64. Hay r = 3 las y c = 3 columnas y luego los grados de libertad son (3 1) (3 1) = 4. ½El p-valor es p < 0,001!

M. Wiper Análisis Estadístico del Delito 20 / 20 Ji-cuadrado,grados de libertad, p-valor, conclusión El estadístico ji-cuadrado es χ 2 = (479 494,38)2 494,38 + + (85 49,03)2 49,03 = 64,64. Hay r = 3 las y c = 3 columnas y luego los grados de libertad son (3 1) (3 1) = 4. ½El p-valor es p < 0,001! ½Hay fuertes evidencias de una relación entre la inclinación política y el nivel de uso de la marijuana!