Análisis de datos Categóricos

Documentos relacionados
Análisis de datos Categóricos

Análisis de datos Categóricos

Inferencia en tablas de contingencia

Descripción de tablas de contingencia

Facultad de Matemáticas Departamento de Estadística e Investigación Operativa TRABAJO FIN DE GRADO. Tablas de Contingencia

Guillermo Ayala Gallego Universidad de Valencia

Análisis de datos categóricos

Estadística Bayesiana

Análisis de datos Categóricos

1. Modelos Loglineales tablas de 2 entradas

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Análisis de datos Categóricos

Otra medida alternativa para la distancia entre ˆπ y p muy usada es la deviance. Λ= máx ω. Si queremos testear. el cociente estaría dado por

Análisis de datos Categóricos

2. ESTADÍSTICA DESCRIPTIVA 15 Estadística descriptiva.. Variables aleatorias Descripción de variables cuantitativas

Tema 9: Relación entre variables categóricas

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

Distribuciones de parámetros conocidos

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Facultad de Medicina Título: Utilidad clínica de la tabla 2x2

Prueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya):

Tema 10: Introducción a los problemas de Asociación y Correlación

Definición Una hipótesis es una afirmación acerca de un parámetro.

Limitaciones de la prueba (las mismas que para la prueba de Independencia):

Distribuciones de probabilidad II

Estadística Bayesiana

BIOESTADISTICA ( ) Evaluación de pruebas diagnósticas. 1) Características del diseño en un estudio para evaluar pruebas diagnósticas.

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Unidad 3. Probabilidad. Javier Santibáñez (IIMAS, UNAM) Inferencia Estadística Semestre / 22

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Tema 4. Intervalos de confianza. Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 4: Intervalos de confianza 1

1 CÁLCULO DE PROBABILIDADES

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

Asignatura : INFERENCIA ESTADÍSTICA I Titulación : DIPLOMADO EN ESTADÍSTICA Profesor : ISABEL MOLINA PERALTA Capítulo 5 : INTERVALOS DE CONFIANZA

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Tema 3: Estimación puntual. Estadística Aplicada (Bioquímica). Profesora: Amparo Baíllo Tema 3: Estimación puntual 1

Estudio descriptivo de dos variables

Prof. Eliana Guzmán U. Semestre A-2015

Análisis de datos Categóricos

1. Modelos para conteos

EXÁMEN INFERENCIA ESTADÍSTICA I Diplomado en Estadística Convocatoria de Febrero 2006

Soluciones a los nuevos ejercicios propuestos

1 Descripción de datos con gráficas 7. 2 Descripción de datos con medidas numéricas 47. Contenido. 2.1 Descripción de un conjunto de datos mediante

Teorema del límite central

1 CÁLCULO DE PROBABILIDADES

Inferencia: Tarea 3. medio número de mujeres media(años ) des. estándar(años) Rural Urbano

10.5. Contraste de independencia de variables cualitativas

MEDIDAS DE ASOCIACION

Capítulo 5: Probabilidad e inferencia

Estimación por intervalos

Conceptos básicos de inferencia estadística (I): Inferencia estadística (repaso)

Aplicación de la distribución empírica: Tests de bondad de ajuste

MATEMÁTICAS II PROBABILIDAD DISTRIBUCIÓN BINOMIAL DISTRIBUCIÓN NORMAL

Distribuciones Fundamentales de Muestreo. UCR ECCI CI-0115 Probabilidad y Estadística Prof. Kryscia Daviana Ramírez Benavides

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

Contrastes de Hipótesis paramétricos y no-paramétricos.

Técnicas Cuantitativas para el Management y los Negocios I

Esquema Matemáticas CCSS

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Bioestadística: Inferencia Estadística. Análisis de Una Muestra

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

Resumen de Probabilidad

Estudiaremos tres tipos de contrastes, cada uno de los cuales trata de responder a la pregunta correspondiente: Bondad del ajuste Proceden los datos

Algunas Distribuciones Discretas de Probabilidad. UCR ECCI CI-1352 Investigación de Operaciones I Prof. M.Sc. Kryscia Daviana Ramírez Benavides

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población

ESTIMACION INFERENCIA ESTADISTICA

Estimación de Parámetros

Técnicas de Muestreo I

Técnicas Cuantitativas para el Management y los Negocios I

Cálculo de Probabilidades II Preguntas Tema 2

RESUMEN CONTENIDOS TERCERA EVALUACIÓN PROBABILIDAD DISTRIBUCIÓN BINOMIAL DISTRIBUCIÓN NORMAL

1. Estimación. f(y) = θ e y θ, y > 0 0, en otro punto

DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES RELACION DE DOS CARACTERES Relación entre variables cualitativas

1. Estudios observacionales. 2. Estudios experimentales. 1. Estudios transversales. 2. Estudios longitudinales (prospectivos o retrospectivos)

Cálculo de Probabilidades II Preguntas Tema 1

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

Tema 3: PROBABILIDAD - III

Estadística. Tema 2. Variables Aleatorias Funciones de distribución y probabilidad Ejemplos distribuciones discretas y continuas

Tema 8. Fundamentos de Análisis discriminante

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

El Bootstrap paramétrico y no parametrico y su aplicación en los modelos log-lineal Poisson

Teoría de muestras 2º curso de Bachillerato Ciencias Sociales

Universidad Autónoma de Sinaloa

Tema 9: Contraste de hipótesis.

ESTADÍSTICA II UNIDAD I: ESTIMACIÓN DE PARÁMETROS 3RA PARTE (CLASE 20/09)

CONTRASTE DE HIPÓTESIS

Unidad IV: Distribuciones muestrales

Diseño o de un estudio epidemiológico

Estimación de Parámetros.

Lista de Ejercicios (Parte 1)

Bioestadística para Reumatólogos


1) Características del diseño en un estudio de cohortes.

Folleto de Estadísticas. Teoría del 2do Parcial

Tema 7: Introducción a la Teoría sobre Estimación

Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

INTERVALOS DE CONFIANZA

Transcripción:

Tablas de contingencia de dos vías Universidad Nacional Agraria La Molina 2017-1

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Tablas de contingencia Sean X y Y dos variables categóricas con I y J categorías respectivamente. El término tabla de contingencia fue introducido por Karl Pearson (1904). Una tabla de contingencia que tiene I las y J columnas es llamada una tabla I J. Tabla 1: Uso de aspirina y ataque al corazón Ataque fatal Ataque no fatal Sin Ataque Placebo 18 171 10845 Aspirina 5 99 10933

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Probabilidad conjunta y marginal Sea π ij la probabilidad que (X, Y ) se encuentre en la la i y columna j de la tabla de contingencia. La distribución de probabilidad conjunta para (X, Y ) se denota por {π ij }. Las distribuciones marginales se denotan por {π i+ } para la variable en la y {π +j } para la variable en columna. Se cumple que: π i+ = j π ij y π +j = i π ij

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Probabilidad condicional Sea π j i la probabilidad de clasicar un elemento en la columna j de Y, dado que pertenece al grupo i de X. Las probabilidades {π 1 i,, π J i } forman la distribución condicional de Y en el grupo i de X. Tabla 2: Probabilidad conjunta, marginal y condicional Columna Grupo 1 2 Total 1 π 11 (π 1 1 ) π 12 (π 2 1 ) π 1+ (1.0) 2 π 21 (π 1 2 ) π 22 (π 2 2 ) π 2+ (1.0) Total π +1 π +2 1.0

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Sensitividad y Especicidad Tabla 3: Probabilidades condicionales estimadas Cáncer de Diagnóstico seno Positivo Negativo Total Si 0.82 0.18 1.00 No 0.01 0.99 1.00 Si la persona tiene cáncer, la probabilidad de que el diagnóstico de la prueba sea positivo es llamada sensitividad (π 1 1 ). Si la persona no tiene cáncer, la probabilidad de que el diagnóstico de la prueba sea negativo es llamada especicidad (π 2 2 ).

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Prevalencia, VPP y VPN La prevalencia de una enfermedad es la proporción de personas en una población que tienen dicha enfermedad en un determinado momento. El valor predictivo positivo (VPP) es la probabilidad que la persona tenga cáncer, dado que el diagnóstico de la prueba es positivo. El valor predictivo negativo (VPN) es la probabilidad que la persona no tenga cáncer, dado que el diagnóstico de la prueba es negativo.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Independencia Dos variables categóricas son independientes si todas sus probabilidades conjuntas son iguales al producto de sus marginales: π ij = π i+ π +j i = 1,, I j = 1,, J Dos variables son independientes cuando {π j 1 = = π j I } para j = 1,, J. La independencia es tambien llamada homogeneidad en las distribuciones condicionales.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Poisson, multinomial e hipergeométrica Si el tamaño de muestra no es jo se usa la distribución de Poisson. La función de probabilidad conjunta es: exp{ µ ij } µn ij ij n ij! i j Cuando el tamaño de muestra es jo se usa la distribución multinomial. La función de probabilidad conjunta es: n! n 11! n IJ! i j π n ij ij

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Poisson, multinomial e hipergeométrica Si los totales en la son jos se usa la notación n i = n i+. Suponga que las n i observaciones de Y en el grupo i de X son independientes cada una con distribución de probabilidad {π 1 i,, π J i }. Los conteos {n ij } satisfacen j n ij = n i y tienen la forma multinomial: n i! π n ij n i1! n ij! j i Cuando los totales en la y columnas son jos la distribución de muestreo apropiada es la hipergeométrica. j

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Ejemplo: Cinturón de seguridad Suponga que se desea estudiar la relación entre el uso del cinturón de seguridad con el tipo de accidente de auto. Tabla 4: Tipo de accidente y uso del cinturón Uso del Tipo de accidente cinturón Fatal No fatal Si No Los resultados del estudio seran resumidos en el formato de la tabla anterior.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Ejemplo: Cinturón de seguridad Suponga que se desea clasicar los accidentes para el próximo año, entonces el tamaño de muestra es una variable aleatoria y n ij P(µ ij ). Suponga que se toma una muestra de 200 registros policiales de los accidentes ocurridos el año pasado, entonces el tamaño de muestra es jo y {n ij } M(n = 200, {π ij }). Suponga que se eligen al azar 100 registros de accidentes fatales y 100 de accidentes no fatales, entonces los totales por columna son jos y cada una se convierte en una muestra binomial independiente.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Ejemplo: Cáncer al pulmón La siguiente tabla es parte de un estudio de la relación entre el hábito de fumar y la presencia de cáncer al pulmón. Tabla 5: Hábito de fumar y cáncer al pulmón Hábito de Cáncer al pulmón fumar Casos Control Si 688 650 No 21 59 709 709 En este tipo de estudios por lo general Y = presencia de cáncer al pulmón y X = hábito de fumar.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Ejemplo: Cáncer al pulmón Si la distribución marginal de la presencia de cáncer al pulmón es ja y lo que se observa corresponde al hábito de fumar se trata de un estudio retrospectivo o estudio caso-control (mirar al pasado). Suponga que en un estudio similar se elige una muestra de adolescentes y 60 años después se observa la presencia de cáncer al pulmón para los fumadores y no fumadores en la muestra. En este caso se trata de un estudio prospectivo. Existen dos tipos de estudios prospectivos: ensayos clínicos y estudios de cohorte.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Ejemplo: Cáncer al pulmón En un ensayo clínico los sujetos serian colocados al azar en el grupo de fumadores y no fumadores. En un estudio de cohorte los sujetos harian su propia el elección sobre su hábito de fumar. Si los sujetos en la muestra son clasicados simultáneamente según el hábito de fumar y la presencia de cáncer al pulmón entonces el diseño es transversal. Los diseños de tipo caso-control, cohorte y transversal son estudios observacionales. En contraste, un ensayo clínico es un estudio experimental ya que se tiene la ventaja de controlar los sujetos que recibiran cada tratamiento.

Notación y estructura de probabilidad Independencia de variables categóricas Distribuciones de muestreo Tipos de estudios Ejemplo: Cáncer al pulmón Los estudios prospectivos consideran los totales para X como jos (n i = j n ij) y cada la como una muestra multinomial independiente sobre Y. Los estudios retrospectivos consideran los totales para Y como jos {n +j } y cada columna como una muestra multinomial independiente sobre X. En un estudio transversal el tamaño de muestra es jo pero no los totales de la y columna por lo que los I J conteos en la tabla se consideran una muestra multinomial.

Diferencia de proporciones Riesgo relativo Odds ratio Diferencia de proporciones En general, para los individuos en el grupo i la probabilidad que la variable respuesta pertenezca a la categoría 1 denotada como éxito es π 1 i. Con solo dos posibles resultados, π 2 i = 1 π 1 i y por simplicidad π i = π 1 i. La diferencia de la proporción de éxitos en cada grupo es π 1 π 2. La diferencia de la proporción de fracasos en cada grupo es π 2 π 1. La variable respuesta Y es estadísticamente independiente de X cuando π 1 π 2 = 0.

Diferencia de proporciones Riesgo relativo Odds ratio Diferencia de proporciones Un estimador para la diferencia de proporciones es: El error estándar es: σ(ˆπ 1 ˆπ 2 ) = ˆπ 1 ˆπ 2 π 1 (1 π 1 ) n 1 + π 2(1 π 2 ) n 2 Si el tamaño de muestra es grande, el intervalo (1 α) 100 % de Wald es: (ˆπ 1 ˆπ 2 ) z 1 α/2ˆσ(ˆπ 1 ˆπ 2 )

Diferencia de proporciones Riesgo relativo Odds ratio Riesgo relativo Una diferencia de proporciones puede ser más importante cuando éstas se encuentran cerca de 0 o 1 que cuando se encuentran cerca de 0.5. La diferencia entre 0.010 y 0.001 tiene mayor relevancia que la diferencia entre 0.410 y 0.401 aún cuando el valor es el mismo. El riesgo relativo se dene por: r = π 1 π 2 0 La condición de independencia se da cuando el riesgo relativo es igual a uno.

Diferencia de proporciones Riesgo relativo Odds ratio Riesgo relativo El riesgo relativo muestral es: ˆr = ˆπ 1 ˆπ 2 El error estándar asintótico de log ˆr es: 1 π1 σ (log ˆr) = + 1 π 2 π 1 n 1 π 2 n 2 El intervalo de conanza (1 α) 100 % para log r es: log ˆr z 1 α/2ˆσ (log ˆr)

Diferencia de proporciones Riesgo relativo Odds ratio Odds ratio Si π es la probabilidad de éxito, entonces el odds se dene por: Ω = π 1 π Si π = 0.75 entonces Ω = 3 lo cual indica que la probabilidad de éxito es 3 veces la probabilidad de fracaso. Inversamente: π = Ω 1 + Ω Si la tabla es 2 2, en el grupo i el odds es: Ω i = π i 1 π i

Diferencia de proporciones Riesgo relativo Odds ratio Odds ratio El cociente de Ω 1 y Ω 2 : es llamado el odds ratio. θ = Ω 1 Ω 2 = π 1/ (1 π 1 ) π 2 / (1 π 2 ) Si las probabilidades de celda son {π ij } el odds ratio es: θ = π 11/π 12 π 21 /π 22 = π 11π 22 π 12 π 21 Un nombre alternativo para θ en tablas 2 2 es razón producto cruzado.

Diferencia de proporciones Riesgo relativo Odds ratio Odds ratio El odds ratio siempre es un número positivo. Cuando X y Y son independientes entonces Ω 1 = Ω 2 y por consiguiente θ = 1. Si θ > 1 los sujetos en el grupo 1 tienen mayor probabilidad de tener éxito que los sujetos en el grupo 2, es decir π 1 > π 2. Si 0 < θ < 1 entonces π 1 < π 2. Si θ = 4 el odds para el éxito en el grupo 1 es cuatro veces el odds en el grupo 2. Los valores de θ alejados de 1 en alguna dirección representan una fuerte asociación.

Diferencia de proporciones Riesgo relativo Odds ratio Odds ratio Dos valores representan el mismo grado de asociación pero en dirección opuesta cuando una es la inversa de la otra. Si θ = 0.25 el odds para el éxito en el grupo 1 es 0.25 veces el odds correspondiente en el grupo 2 o equivalentemente, el odds para el éxito en el grupo 2 es 4 veces el odds correspondiente en grupo 1. Para el proceso de inferencia es conveniente usar log θ que es simétrico con respecto a cero, ya que log 4 = 1.39 y log 1/4 = 1.39. No se requiere identicar una variable respuesta para usar θ. El odds ratio es válido para diseños prospectivos, retrospectivos o transversales.

Diferencia de proporciones Riesgo relativo Odds ratio Odds ratio El odds ratio muestral es: El estimador modicado es: ˆθ = n 11n 22 n 12 n 21 θ = (n 11 + 0,5) (n 22 + 0,5) (n 12 + 0,5) (n 21 + 0,5) El error estándar estimado para log ˆθ es: ( ˆσ log ˆθ ) = 1 n 11 + 1 n 12 + 1 n 21 + 1 n 22

Diferencia de proporciones Riesgo relativo Odds ratio Odds ratio Los estimadores ˆθ y θ tienen la misma distribución normal asintótica con respecto de θ. Si el tamaño de muestra es grande, el intervalo de conanza (1 α) 100 % de Wald para log θ es: log ˆθ ( z 1 α/2ˆσ log ˆθ ) El intervalo correspondiente para θ es: { exp log ˆθ ( z 1 α/2ˆσ log ˆθ )}

Diferencia de proporciones Riesgo relativo Odds ratio Ejemplo: Uso de aspirina y ataque al corazón La proporción que sufrió ataque al corazón en el grupo placebo es 0.0171 y en el grupo aspirina es 0.0094. La diferencia de proporciones es 0.0077. El riesgo relativo es 1.82 lo cual nos dice que la proporción que sufre ataque al corazón en el grupo placebo es 1.82 veces la proporción correspondiente en el grupo aspirina. La razón de odds muestral es 1.83. El odds de los que sufren ataque al corazón en el grupo placebo es 1.83 veces el odds correspondiente al grupo aspirina.

Diferencia de proporciones Riesgo relativo Odds ratio Ejemplo: Cáncer al pulmón y hábito de fumar Se considera que Y = Cáncer al pulmón y X = Hábito de fumar. La tabla 5 consta de dos muestras binomiales sobre X considerando Y jo. La probabilidad que un sujeto sea fumador dado que tiene cáncer al pulmón es 0.9704. La probabilidad que un sujeto sea fumador dado que no tiene cáncer al pulmón es 0.9168 Sin embargo no es posible estimar la probabilidad de tener cáncer al pulmón dado que la persona fuma.

Diferencia de proporciones Riesgo relativo Odds ratio Ejemplo: Cáncer al pulmón y hábito de fumar Tampoco es posible estimar diferencias de proporciones o la razón de probabilidades para los que tienen cáncer al pulmón. Sin embargo se puede calcular el odds ratio: ˆθ = 688 59 650 21 = 3 La interpretación puede usar la dirección que sea de interés aún cuando el estudio fuese retrospectivo. El odds estimado de cáncer al pulmón para fumadores fué 3 veces el odds estimado para los no fumadores.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J En un estudio del efecto de X sobre Y es posible controlar alguna otra variable que podría inuir en dicho efecto. Suponga que se desea estudiar el efecto de ser un fumador pasivo en el desarrollo de cáncer al pulmón. Se podria comparar la proporción de fumadores pasivos con cáncer al pulmón entre los grupos formados por los cónyuges que fuman y no fuman. Sin embargo los fumadores pasivos tienden a ser más jóvenes en el grupo donde el cónyuge no fuma y como se sabe la gente joven tiene menos posibilidades de tener cáncer al pulmón.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Una tabla parcial resulta de construir tablas de clasicación para X y Y en cada nivel de Z. La tabla de contingencia de dos vías obtenida combinando las tablas parciales se llama tabla marginal XY. Una tabla marginal en lugar de controlar Z lo que hace es ignorarla ya que no contiene información con respecto de ella. Las relaciones en una tabla parcial son llamadas asociaciones condicionales debido a que se reeren al efecto de X sobre Y condicionado en uno de los niveles de Z.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Ejemplo: Pena de muerte Se desea estudiar el efecto de las características raciales sobre la pena de muerte. Se clasicaron 674 sujetos que fueron acusados de múltiples asesinatos en Florida entre 1976 y 1987. Las variables son Y = pena de muerte, X = raza del asesino y Z = raza de la víctima. Se estudia el efecto de la raza del asesino sobre el veredicto de la pena de muerte, considerando la raza de la víctima como variable control. La tabla 6 contiene tablas parciales 2 2 que relacionan la raza del asesino con el veredicto según la raza de la víctima.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Ejemplo: Pena de muerte Tabla 6: Veredicto para la pena de muerte Pena de muerte Víctima Asesino Si No Porcentaje Blanca Blanca 53 414 11.3 % Negra 11 37 22.9 % Negra Blanca 0 16 0.0 % Negra 4 139 2.8 % Total Blanca 53 430 11.0 % Negra 15 176 7.9 %

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Ejemplo: Pena de muerte La tabla anterior muestra el porcentaje de acusados que recibieron la pena de muerte. Cuando las víctimas fueron de raza blanca la pena de muerte fue impuesta al 22.9 % y 11.3 % de los asesinos negros y blancos respecivamente. Cuando las víctimas fueron de raza negra la pena de muerte fue impuesta al 2.8 % de los asesinos negros y a ninguno de raza blanca. Ignorando la raza de la víctima la pena de muerte fue impuesta al 11.0 % y 7.9 % de los asesinos blancos y negros respectivamente.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Odds ratios condicionales y marginales Suponga una tabla 2 2 K y sea µ ijk la frecuencia esperada en la celda correspondiente. Se ja Z = k y se dene el odds ratio condicional como: y el odds ratio marginal como: θ XY (k) = µ 11kµ 22k µ 12k µ 21k θ XY = µ 11+µ 22+ µ 12+ µ 21+ Cuando se sustituyen los valores de µ ijk por las frecuencias observadas se obtienen los odds ratios muestrales.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Odds ratios condicionales y marginales Si θ XY = 1 se dice que existe independencia marginal. Si θ XY (k) = 1 se dice que existe independencia condicionada a que Z = k. La independencia condicional a Z = k es equivalente a: para todo i, j. Pr(Y = j X = i, Z = k) = Pr(Y = j Z = k) La independencia condicional no implica la independencia marginal.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Asociación homogénea Una tabla 2 2 K tiene una asociación XY homogénea cuando: θ XY (1) = θ XY (2) = = θ XY (K) es decir, el tipo de asociación entre X y Y es el mismo para las distintas categorías de Z. Si existe una asociación XY homogénea entonces también tenemos una asociación XZ homogénea y una asociación YZ homogénea. Se dice también que no existe interacción entre las dos variables con respecto a sus efectos en la otra variable.

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Asociación homogénea Sean X = Fumador (Si, No), Y = Cáncer de pulmón (Si, No) y Z = Edad (< 45, 45-65, > 65). Suponga que los odds ratios condicionales son: θ XY (1) = 1,2 θ XY (2) = 3,9 θ XY (3) = 8,8 El efecto de fumar se acentúa conforme la edad es mayor. La edad se denomina efecto modicador, dado que el efecto de fumar queda modicado cuando la edad aumenta.

Odds ratios en tablas I J Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Considere el subconjunto de (I 1) (J 1) odds ratios locales: θ ij = π ijπ i+1,j+1 π i,j+1 π i+1,j i = 1,, I 1 j = 1,, J 1 Los odds ratios locales usan las celdas en las y columnas adyacentes. Otro subconjunto básico es: α ij = π ijπ I,J π I,j π i,j i = 1,, I 1 j = 1,, J 1

Introducción Odds ratios condicionales y marginales Asociación homogénea Odds ratio en tablas I J Ejemplo Se realizó un estudio retrospectivo sobre cáncer al pulmón y consumo de tabaco en pacientes de hospitales en Inglaterra. Tabla 7: Cáncer de pulmón y consumo de tabaco Número de cigarrillos Cáncer Control Ninguno 7 61 Menos de 5 55 129 5-14 489 570 15-24 475 431 25-49 293 154 50 a más 38 12