METODOS ESTADISTICOS PARA ANALISIS BIVARIADO

Documentos relacionados
METODOS ESTADISTICOS PARA ANALISIS BIVARIADO

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

CONCEPTOS BASICOS DE MUESTREO VARIABLE ALEATORIA. (Concepto no matemático)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

Folleto de Estadísticas. Teoría del 2do Parcial

Lucila Finkel Temario

Nota de los autores... vi

2. ESTADÍSTICA DESCRIPTIVA 15 Estadística descriptiva.. Variables aleatorias Descripción de variables cuantitativas

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

ESTUDIOS ANALITICOS DISEÑO Y ANALISIS

7. De acuerdo con la gráfica siguiente, el contraste estadístico es:

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

Micro currículo OBJETIVO GENERAL. Al finalizar este curso, el alumno estará en capacidad de:

DISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO

Diseño de experimentos - prueba de hipótesis.

Dr. Abner A. Fonseca Livias

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN INGENIERÍA QUÍMICA

Estadísticos Aplicados en el SPSS 2008

Inferencia Estadística. Pruebas paramétricas y no paramétricas. Análisis de datos

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

INDICE Capitulo 1. Nociones Básicos sobre el SPSS/PC+ Capitulo 2. Nociones Básicos sobre Probabilidad

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

ESTADÍSTICA APLICADA A LA MEDICINA LABORAL

ANÁLISIS DE REGRESIÓN

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO

INDICE. Prólogo a la Segunda Edición

478 Índice alfabético

Pruebas estadís,cas para evaluar relaciones

BIOSESTADÍSTICA AMIGABLE

Objetivo: Proponer modelos para analizar la influencia

TEMA 10 Correlación y regresión. El modelo de regresión simple

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

Inferencia estadística. Hipótesis estadística Errores! y " BC. Nathalia Navarro Trevisan

Nota 2. Estadísticas avanzadas Muestreos Complejos, R. Linear, R.Logística y Análisis de Supervivencia

Guía de taller de Economía Cuantitativa V. Profesor: ALBERTO REYES DE LA ROSA.

Conocer los principales métodos de la estadística inferencial e identificar sus aplicaciones a diversas áreas del conocimiento y de la cotidianidad.

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Ing. MSc. Luis Fernando Restrepo Gómez

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

DISEÑO EXPERIMENTAL Biología, 2º Ciclo Profesores: Mauro Santos y Hafid Laayouni PROGRAMA TEÓRICO

INTRODUCCIÓN AL ANÁLISIS DE DATOS FEBRERO Código asignatura: EXAMEN MODELO B DURACION: 2 HORAS

Modelación estadística: La regresión lineal simple

1) Inferencia estadística

Supuestos y comparaciones múltiples

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial

Estadística II Ejercicios Tema 5

Manual de bolsillo del MegaStat * * MegaStat es un complemento estadístico para el Excel elaborado por el profesor J. B. Orris de Butler University.

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

DISEÑOS EXPERIMENTALES DE DOS GRUPOS Y MULTIGRUPO

Pruebas Paramétricas y No paramétricas. Para la comprobación de hipótesis

ÍNDICE INTRODUCCIÓN... 21

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ESTADISTICA AVANZADA. Análisis de la Variancia Anova One Way Kruskal-Wallis Bloques (Friedman)

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

Definición de Correlación

Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS

Universidad Autónoma de Sinaloa

Prueba T de Student. Descripción de la Prueba T de student. Proceso de cálculo. Criterios de la prueba T de student

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

ÍNDICE. Prefacio... xi

Introducción a estadística

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías

CURSO - TALLER METODOLOGÍA DE LA INVESTIGACIÓN Y ESTADÍSTICA INFERENCIAL. Dirigido a Profesionales de la Salud. opción

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

TALLER DE INTRODUCCIÓN A LOS NEGOCIOS

Método de cuadrados mínimos

Parte de las notas tomadas de: Prof. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Estimación de Parámetros.

GUIA DOCENTE ESTADISTICA

Introducción a las pruebas de hipótesis

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 12) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Al nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C).

Asignatura: BIOESTADISTICA. Curso: º de Medicina.

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

Diplomado en Estadística Aplicada

INDICE 1. Introducción 2. Recolección de Datos Caso de estudio

Nombre de la asignatura: Estadística I. Carrera: Ingeniería en Desarrollo Comunitario. Clave de la asignatura: DCM-0510

2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)

CURSO METODOLOGÍA DE LA INVESTIGACIÓN Y ESTADÍSTICA BÁSICA. Dirigido a Profesionales de la Salud. Febrero -Diciembre

CURSO - TALLER METODOLOGÍA DE LA INVESTIGACIÓN Y ESTADÍSTICA INFERENCIAL. Dirigido a Profesionales de la Salud

19 Código: EST 2 Duración del ciclo en semanas:

TEMA 4 Modelo de regresión múltiple

Transcripción:

CAPITULO 5 METODOS ESTADISTICOS PARA ANALISIS BIVARIADO El análisis bivariado permite examinar si existe relación (asociación) entre dos variables. Las variables pueden ser ambas numéricas, una numérica y la otra categórica o ambas categóricas En el área de la Higiene y Seguridad Industrial el análisis bivariado permite examinar si existe asociación estadística entre exposición y efecto. La estadística proporciona los métodos (Pruebas de significancia) para determinar si la asociación o diferencia observada entre los grupos es o no estadísticamente significante. Estadísticamente significante quiere decir es poco probable o improbable que la diferencia observada entre los grupos pueda ser explicada por efectos del azar. Por consiguiente, existe asociación estadística entre exposición y efecto. Si se demuestra que el estudio tiene validez interna (control de sesgos) y precisión, es posible concluir que la asociación observada es real, o que los hallazgos obtenidos con el estudio son verdaderos. La aplicación de pruebas de significancia estadística requiere el conocimiento de los siguientes conceptos: 93

5.1. DECISIONES ESTADÍSTICAS Son aquellas que se toman a partir de la información obtenida en el estudio (información muestral). 5.2. HIPÓTESIS ESTADÍSTICAS Son enunciados de relación entre variables (exposición efecto) que pueden ser verdaderos o falsos. 5.3. HIPÓTESIS NULA Se nota por Ho. y puede ser verdadera o falsa. La Hipótesis nula consiste en una proposición de no diferencia. Se establece con el ánimo de rechazarla con base con los resultados del estudio. Rechazar una Hipótesis nula significa que es muy poco probable que la Hipótesis nula sea cierta y que los resultados obtenidos en el estudio se deban a simple azar. La Ho se rechaza o no se rechaza pero nunca se debe hablar de aceptarla 5.4. HIPÓTESIS ALTERNA Se nota por Ha. y puede ser verdadera o falsa. Cuando se rechaza la Hipótesis nula, el investigador por descarte acepta la hipótesis alterna (Ha.) Aceptar una Hipótesis alterna significa que existe una verdadera asociación entre exposición efecto o que las diferencias obtenidas en el estudio son reales. 94

El contraste de la Ho., se basa en distribuciones de probabilidad por lo cual siempre se llega a conclusiones con márgenes pequeños de probabilidad de error. (nivel de significancia ) 5.5. PRUEBAS DE SIGNIFICANCIA ESTADÍSTICA Son procedimientos que facilitan decidir si una Hipótesis nula se rechaza o no se rechaza. La aplicación de estas pruebas parte del supuesto de que se ha utilizado un diseño de muestreo probabilístico (al azar, sistemático, estratificado o conglomerados) para obtener la información muestral que permita tomar decisiones estadísticas. 5.6. Errores en la Prueba de Hipótesis En el contraste de la Ho., se puede cometer dos tipos de error: Error Tipo I ( ). Consiste en rechazar una Hipótesis nula verdadera. Este error se conoce como nivel de significancia estadística a partir del cual se toma la decisión de rechazar o no rechazar la Hipótesis nula. Generalmente se considera un nivel de significancia igual o menor a 5% ( = 0.05, =0.01, etc.). Error Tipo II ( ). Consiste en no rechazar una Hipótesis nula falsa. El cuadro siguiente resume los dos tipos de error. 95

Conclusión con base en la prueba de significancia estadística Rechazar Ho. No rechazar Ho. Estado Real de la Ho. Verdadera Falsa Poder del Error Estudio (1- ) Decisión Correcta Error (1- ) 5.7. PODER ESTADÍSTICO DE UN ESTUDIO (POTENCIA) Capacidad que tiene el estudio para rechazar una Hipótesis nula falsa. Capacidad que tiene el estudio de detectar diferencias cuando realmente las hay Probabilidad de que los resultados del estudio sean verdaderos Usualmente en el diseño de una muestra, se establecen apriori valores de poder iguales o mayores a 80%. Los errores y son inversamente proporcionales y su punto de equilibrio sucede cuando = 0.05 (confianza del 95%) y = 0.20 (poder del 80%). 96

5.8. PASOS PARA APLICAR UNA PRUEBA DE SIGNIFICANCIA ESTADÍSTICA. Primero : Establecer la Hipótesis nula (Ho.) y alterna (Ha.) Segundo: Definir el nivel de significancia (usualmente del 5%). Tercero : Definir y aplicar la estadística de prueba para obtener el valor de probabilidad (valor-p). La correcta aplicación de la estadística de prueba (fórmula estadística) depende de el nivel de medición de las variables (nominal, ordinal, numérico), de los supuestos que se deben cumplir y del tamaño de muestra o cantidad de datos para analizar. Se recomienda asesorarse de un buen estadístico. Cuarto : Comparar el valor-p con el nivel de significancia : Si valor-p menor o igual que entonces rechazar la Ho. Esto significa que es poco probable o improbable que el azar explique las diferencias observadas. Por consiguiente existe asociación estadística entre las variables que se están comparando Si valor-p mayor que entonces No rechazar la Ho. Esto significa que es probable o muy probable que el azar explique las diferencias observadas. Por consiguiente no existe asociación estadística entre las variables que se están comparando 97

5.9. METODOS ESTADISTICOS PARA EXAMINAR ASOCIACION ENTRE UNA VARIABLE CATEGORICA (INDEPENDIENTE) Y OTRA NUMERICA (DEPENDIENTE) Exposición Efecto Categorías Grupos Valores Numéricos 1. MAS DE DOS GRUPOS 2. Análisis de varianza de una via (One Way): Estadística F 3. Métodos de comparaciones múltiples: Scheffe Tukey Duncan Student- Newman- Keuls 2. SOLAMENTE DOS GRUPOS 1. Análisis de varianza de una vía (One way): Estadística F 2. Prueba t de Student: En este caso t = F 3. Pruebas No Paramétricas cuando los supuestos de normalidad estadística y homogeneidad de varianza no se cumplen: Prueba U de Mann Whitney, Wilcoxon Matched- Pairs Signed rank test 98

Ejemplo 1: Se desea estudiar si existe relación entre ingesta de alcohol etílico y tiempo de reacción (seg) a un estímulo auditivo. Tiempo de reacción (seg.) a un estímulo auditivo por grupo de estudio. GRUPO A GRUPO B 1 4 7 2 5 8 3 6 9 4 7 10 5 8 11 GRUPO C Los resultados del análisis estadístico univariado se muestran a continuación: GRUPO A B C Promedio Aritmético 3.0 6.0 9.0 Varianza 2.5 2.5 2.5 Desviación estándar 1.581 1.581 1.581 Total Datos 5 5 5 Bajo la Hipótesis Nula (Ho) se esperaría de que si no existe asociación entre ingesta de alcohol etílico y tiempo de reacción (seg) a un estímulo auditivo, se esperaría igual promedio de tiempo de reacción en cada uno de los grupos. Ho: A = B = C La hipótesis alterna sería Ha: A B C Ensayo bilateral Ha: A B c Ensayo unilateral 99

Aplicando los pasos para la prueba de Significancia Estadística se tiene: Primero: Establecer la hipótesis nula (Ho) y alterna (Ha) Ho: No existe asociación entre ingesta de alcohol etílico y tiempo de reacción (seg.) a un estímulo auditivo. Ha: Si existe asociación entre ingesta de alchohol etílico y tiempo de reacción (seg) a un estímulo auditivo. Segundo: Definir el nivel de significancia = 0.05 Tercero: Seleccionar y aplicar la Estadística de Prueba: F Partiendo del supuesto de que las muestras provienen de distribuciones normales y como las varianzas obtenidas son homogéneas se puede utilizar análisis de varianza de una vía ANOVA, (One Way): FUENTE DE VARIACION SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADOS MEDIOS ESTADISTICA F VALOR-p Entre grupos 90 2 45 Dentro de grupos 30 12 2.5 18.0 0.000435 Total 120 14 Cuarto: Como el valor p es menor que = 0.005 se rechaza la Hipótesis Nula y se acepta la hipótesis alterna. Análisis: Los resultados obtenidos muestran que es muy poco probable (valor-p= 0.000435) que las diferencias observadas en los tiempos promedios de reacción (seg) para los grupos A, B, C se puedan explicar por simple azar. Por consiguiente, hay diferencias estadísticamente significantes a nivel = 0.05 Conclusión: Existe asociación entre ingesta de alcohol etílico y tiempo de reacción (seg) a un estímulo auditivo. 100

Si en lugar de haber comparado tres grupos se hubiesen comparado dos, para contrastar los promedios se puede utilizar la estadística t de student o la estadística F, siempre y cuando se cumplan los supuestos de normalidad estadística y homogeneidad de varianzas. En estos casos siempre t = F El esquema de la página siguiente ilustra diferentes métodos para aplicación de la estadística t. 5.10. METODOS ESTADISTICOS PARA EXAMINAR ASOCIACION ENTRE DOS VARIABLES CATEGORICAS. Ambas Nominales Ambas Ordinales RH EXPOSICIÓN SEXO + - TOTAL GRAVEDAD 0 1 2 H Leve M Moderada TOTAL Severa TOTAL TOTAL Coeficientes de asociación. Coeficientes de correlación no - Contingencia de Cramer paramétricos - Chi-cuadrado. Prueba de la mediana - Probabilidad exacta de Fisher. Prueba U de Mann-Withney - Prueba Q de Cochran. Anova de dos clasificaciones de - Coeficiente PHI Friedman Coeficientes de Concordancia 101

- Kappa de Cohen - Prueba de McNemar Ejemplo: La tabla siguiente corresponde a los hallazgos en un estudio de Investigación Operativa. Se desea probar si hubo un cambio estadísticamente significante después de aplicada la intervención. CONSULTA DEMORADA (%) EN CONSULTA EXTERNA ANTES Y DESPUES DE LA INTERVENCION CONSULTA EXTERNA % CONSULTA SITUACION SI NO TOTAL DEMORADA Antes 63 37 100 63.0 Después 16 84 100 16.0 En este ejemplo ambas variables son categóricas nominales. Por haber utilizado muestras diferentes de usuarios antes y después de la intervención se consideran muestras independientes. Además, como el tamaño de las muestras es suficientemente grande (100) cumple los supuestos de normalidad estadística y pueden utilizarse para el análisis pruebas aproximadas como la estadística Z, la estadística chi-cuadrado corriente y chi-cuadrado de Mantel y Haenzel, en lugar de pruebas exactas como la Dos binomial o la Hipergeométrica. Como medida de fuerza de asociación se puede utilizar el riesgo relativo porque la consulta demorada se puede considerar Incidencia Acumulada 102

Aplicando los pasos de una prueba de significancia estadistica tenemos: Primero: Establecer la Hipótesis nula (Ho) y alterna (Ha). Ho: No existen diferencias en los porcentajes de consulta demorada antes y después de aplicada la intervención. Ha: Existen diferencias significantes en los porcentajes de consulta demorada antes y después de aplicada la intervención. Segundo: Definir el nivel de significancia = 0.05 Tercero: Seleccionar y aplicar la estadística de prueba para obtener el valor de probabilidad. (valor-p). - La estadística Z para diferencia de proporciones arroja un valor-p igual a 0.0000 - La estadística chi-cuadrado corriente da un valor p igual a 0.0000 Siempre estas dos estadísticas dan resultados iguales en una tabla de cuatro casillas! Cuarto: Comparar el valor-p con el nivel de significancia : Como el valor-p de la prueba de significancia es menor que el nivel de significancia, se rechaza la Hipótesis Nula. Análisis: El porcentaje de consulta demorada después de la intervención cambió dramáticamente de 63% (antes) a 16% (después). Estas diferencias pueden deberse al efecto de la intervención aplicada y no a simple azar. 103

5.11. METODOS ESTADISTICOS PARA EXAMINAR ASOCIACION ENTRE DOS VARIABLES NUMERICAS Cuando se tienen dos variables numéricas el mejor análisis estadístico es el de correlación y regresión. En Epidemiología clínica este modelo se utiliza mucho en estudios farmacológicos de dosis respuesta. Dosis Respuesta Variable numérica Variable numérica 5.11.1. Introducción al análisis de regresión Nomenclatura y conceptos básicos 1. Regresión. Este término se debe al biólogo Galton quién, estudiando la estatura de hijos y padres, quería ver en que medida la estatura de los hijos señalaba un regreso, una regresión hacia la estatura media de la raza, cuando la de sus padres se separaba de ella. Esta técnica estadística busca analizar la relación existente entre una variable aleatoria dependiente Y y una o más variables aleatorias independientes X 1, X 2,...X k. La relación o ecuación de regresión de Y en función de X 1, X 2,...X k se denota por Y =f(x 1, X 2,...X k ); puede ser lineal, curvilínea, diagonal, ortogonal, polinomica, etc. 104

Con base en un análisis de regresión se puede cuantificar en que medida uno o más variables independientes X i explican (o predicen) el comportamiento o variabilidad de una variable dependiente Y. 5.11.2. Análisis de regresión lineal simple Definir variables: independiente y dependiente Definir tipo de regresión: Lineal o no Lineal Verificar supuestos estadísticos Si supuestos no se cumplen utilizar métodos No Paramétricos Anexar análisis de varianza y coeficiente de determinación Para análisis utilizar las tablas siguientes: a) Análisis de Correlación Estadístico Coeficiente de Correlación Intervalo de confianza (95%) Coeficiente de determinación Valor Coeficiente de correlación lineal r de Pearson Indica el grado de asociación lineal entre dos variables. Se obtiene sacando la raíz cuadrada al coeficiente de determinación. Coeficiente de determinación : 2 Es una medida de la bondad de ajuste del modelo. Resulta del cociente de dividir la suma de cuadrados debida a la regresión (SCR) entre la suma total de cuadrados (SCT). 105

El coeficiente de determinación varía entre cero y uno e indica que tanto la variabilidad de la variable dependiente es explicada por la variable independiente. Se puede expresar en porcentaje. Si en una regresión lineal 2 = 0, significa no asociación lineal entre las variables. Pero, puede existir otro tipo de asociación entre ellas. b) Análisis de Varianza para Regresión Se utiliza para probar la bondad del modelo de regresión. Esto es, que tan útil es la variable independiente para explicar el comportamiento de la variable dependiente Y. Fuente de variación Grados de libertad Suma de cuadrados Cuadrados Medios Estadística F Valor-p Regresión 1 Error (Residual) n 2 Total n - 1 Expresión fundamental del análisis de varianza para regresión. SCT = SCR + SCE SUMA TOTAL SUMA CUADRADOS SUMA CUADRADOS DEL CUADRADOS DE LA REGRESION ERROR (RESIDUALES) Recordar que 2 = SCR / SCT 106

La variabilidad observada en la variable dependiente (suma de cuadrados totales = SCT) se subdivide en dos partes; la variabilidad debida al modelo de regresión (SCR) y variabilidad debida al error en la estimación (Residuales = SCE). La suma de los cuadrados debida al modelo de regresión (SCR) tiene p-1 grados de libertad, donde p es el número de parámetros ( i ) en el modelo, con i = 1, 2, 3,...k. Es un modelo de regresión lineal simple la SCR siempre tiene un grado de libertad. La SCE (Residuales) tiene n-p grados de libertad donde n es el total de casos en el estudio. Al dividir cada una de estas sumas de cuadrados por sus correspondientes grados de libertad se obtiene los denominados MEAN SQUARE (Cuadrados medios) que son las varianzas de la regresión y de los residuales. El valor del estadístico F resulta de dividir el cuadrado medio de regresión entre el cuadrado medio residual. El estadístico F se utiliza para probar la hipótesis de que la variable independiente no contribuye con ninguna información para predecir la variable dependiente. Esto equivale a probar estadísticamente que : Ho = 1 = 0 en Regresión Lineal Simple 107

c) Ecuación de Regresión Ecuación de regresión lineal simple utilizada para estimar el valor medio de Y ó predecir un valor particular de Y con base en un valor específico de X obtenido de la información muestral. y = 0 + 1 X donde: y = E( y /X ) = valor esperado promedio para un valor particular de la variable independiente X. 0 = Intercepto con eje y 1 = Pendiente y = Valor esperado promedio de la variable dependiente x = Valor particular de la variable independiente d) E(Y / X) = o + 1 + Modelo probabilistico de regresión lineal simple. Esta ecuación indica lo siguiente: para cualquier X, los valores de Y varían de manera aleatoria alrededor de su media E(Y / X) en forma de distribución normal de media cero y varianza 2. E ( Y / X 1 ) E ( Y / X 2 ) X 1 X 2 108

La letra indica el error aleatorio (medición) y se supone con distribución normal de media cero y con igual varianza 2 (homocedasticidad). Este modelo supone también, los valores Y i independientes y las medidas de distribución de la variable Y condicionadas a los X i, situadas en una recta denominada línea de regresión verdadera (linealidad). e) Supuestos para análisis de regresión lineal SUPUESTO 1 Debe existir linealidad Coeficiente r de Pearson. entre X, Y. Esta se puede comprobar con el En el análisis residual el error debe : SUPUESTO 2 Distribuirse Normal Esto se debe comprobar utilizando un test para bondad de ajuste o también mediante el test de Shapiro - Wilk que evalúa la correlación entre los residuales y los valores esperados. Gráficamente se debe obtener lo siguiente: y i y i X ó Y 109

Cuando existe heterocedasticidad (no homogeneidad de varianzas) el gráfico dará : y i y i X ó Y Si el gráfico de residuales muestra una tendencia lineal, se debe añadir otra variable independiente al modelo : y i - y i X ó Y Si se observa una tendencia parabólica, se opta por añadir un termino cuadratico o lineal al modelo : y i - y i X ó Y 110

Los errores deben ser independientes Esto se puede probar con el test de DURBIN WATSON. Los errores deben tener varianza costante. 5.12. Ejemplo: Análisis de Regresión entre Dosis (grm) de alcohol etílico ingerida y tiempo de reacción (seg) a un estímulo auditivo. a) Tabla de Datos Dosis (grms) 0 500 1000 1 4 7 2 5 8 3 6 9 4 7 10 5 8 11 b) Análisis de Correlación Estadístico Valor Coeficiente correlación 0.87 Intervalo Confianza (95%9 0.64 0.95 Coeficiente Determinación (%) 75% c) Análisis de Varianza Fuente de Variación Grados de libertad Suma de cuadrados Cuadrados Medios Regresión 1 90 90 Error 13 30 2.3077 Total 14 120 Estadística F Vapor -p 39.0 0.0000 d) Ecuación de Regresión Lineal 111

COEFICIENTES Variable Promedio coeficientes Limite confianza 95% Error Estadistica Inferior Superior Estándar F DOSIS 500.0 0.006 ( 1) 0.0041169 0.0078831 0.0009608 39.0000 Intercepto 3.000 ( o) Tiempo esperado promedio de reacción = 3.0 + 0.006 x dosis (grm) Análisis: El coeficiente de correlación estimado (0.87) indica que existe una relación lineal fuerte entre dosis de alcohol etílico y tiempo de reacción. Su intervalo de confianza no incluye el cero (no correlación) lo cual está indicado que dicho coeficiente es significativamente diferente de cero. El coeficiente de determinación (75%) muestra que la dosis ingerida explica en un 75% el comportamiento del tiempo promedio de reacción (seg) a un estímulo auditivo. El otro 25% lo explicarán otras variables. Con los supuestos verificados, la prueba de bondad de ajuste del modelo de regresión arrojó un valor p igual a 0.0000 mucho menor que = 0.05 Conclusión: El análisis de regresión y correlación confirman una fuerte asociación entre dosis respuesta y permite utilizar la recta de regresión para estimar tiempos de reacción (seg.) según diferentes dosis (grm) de alcohol etílico entre 0 grm y 1000 grm 112

5.13. TALLER SOBRE REGRESION Y CORRELACION LINEAL SIMPLE La tabla siguiente muestra la cantidad de glucosa inyectada y la cantidad retenida en 18 usuarios hospitalarios. GLUCOSA GLUCOSA CASO INYECTADA RETENIDA CASO INYECTADA RETENIDA 1 0.073 0.072 10 1.160 1.040 2 0.159 0.154 11 1.193 0.871 3 0.222 0.217 12 1.301 1.065 4 0.390 0.290 13 1.323 1.132 5 0.463 0.458 14 1.460 1.430 6 0.512 0.500 15 1.590 1.440 7 0.753 0.686 16 1.824 1.307 8 0.926 0.832 17 1.960 1.953 9 1.130 0.820 18 2.2.16 1.565 Fuente: Datos de James C. Cain y William P. Belk, The Asimilation Rate of Intravenously Injected Glucose in Hospital Patients, American Journak of the Medical Sciences, Vol. 203, No. 3 March 1942, pp.359-363. 5.13.1. Actividades 1. Realice el diagrama de correlación. 2. Determine si el grado de correlación entre las variables es estadísticamente diferente de cero. 3. Interprete el coeficiente de determinación obtenido (r 2 ) 4. Determine si la bondad de ajuste de una línea de Regresión es buena o no. 5. Plantee la ecuación de Regresión para estimaciones. 6. Estime la cantidad media retenida de Glucosa (gm/kgm x hora) en un paciente al que se le aplican 1.5gms. y su error estándar. Que significan estos resultados? 113

Salidas de computador con SPSS Correlation coefficient r = 0.97 r 2 =0.93 95% confidence limits: 0.91 <R<0.99 Source df Sum of Squares Means Square F-statistic Regression 1 4.5439 4.5439 218.87 Residuals 16 0.3322 0.0208 Total 17 4.8760 Coefficients 95% confidence Partial Variable Mean Coefficient Lower Upper Std Error F-test INYECTADA 1.0364 0.8041454 0.697610 0.910681 0.054355 218.8727 Y- Intercept 0.0461482 5.14. BILIOGRAFIA 1. CARVAJAL Reynaldo. Métodos Estadísticos para Análisis Epidemiológico. En proceso de publicación. Santiago de Cali: Univalle, 1998 2. KENNETH J. Rothman. Modern Epidemilogy, Segunda Edición, Boston: Little, Brown and Company, 1986. 3. MEYER L. Paul. Probabilidad y Aplicaciones Estadísticas. México: Fondo Educativo Interamericano A.S. 1973. 4. MENDENHALL William. Estadística para Administración y Economía, México: Grupo Editorial Iberoamericana, 1981. 5. SIDNEY Siegel. Estadística no Paramétrica. Séptima Reimpresión, México: Editorial Trillas, 1982. 6. MENDEMHALL W. Scheaff R. Wackerly D. Estadística Matemática con Aplicaciones. México: Grupo Editorial Iberoamerica, S.A. 1986. 114