Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías

Documentos relacionados
2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Análisis de la varianza ANOVA

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

INDICE. Prólogo a la Segunda Edición

Tema IV. EL ANOVA de un factor

Tipo de punta (factor) (bloques)

Se asignaron al azar ratas en condiciones similares a cuatro dietas (A D). Dos semanas después se midió el tiempo de coagulación.

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Diseño de Bloques al azar. Diseño de experimentos p. 1/25

ANEXO I. ANÁLISIS DE LA VARIANZA.

Esquema (1) Análisis de la Varianza y de la Covarianza. ANOVA y ANCOVA. ANOVA y ANCOVA 1. Análisis de la Varianza de 1 Factor

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

Prof. Dr. José Perea Dpto. Producción Animal ANÁLISIS DE EXPERIMENTOS

TEMA 5 VALIDEZ DE LA INVESTIGACIÓN (II): Validez de conclusión estadística

Métodos Estadísticos Multivariados

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

478 Índice alfabético

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

Pruebas para evaluar diferencias

Pruebas de Hipótesis Multiples

Análisis de Componentes de la Varianza

CM0244. Suficientable

Tema 7: Modelos de diseños de experimentos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

PATRONES DE DISTRIBUCIÓN ESPACIAL

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

ÍNDICE INTRODUCCIÓN... 21

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Factores no controlables

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Tema I. Introducción. Ciro el Grande ( A.C.)

Estadísticos Aplicados en el SPSS 2008

10. DISEÑOS EXPERIMENTALES

Evaluación de Regnum 25 EC en el cultivo de maíz para la producción de grano. Rodolfo Alberto Rubio Chávez. Maíz (Zea mays)

Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013

Indicaciones para el lector... xv Prólogo... xvii

LAB 13 - Análisis de Covarianza - CLAVE

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4

Introducción al análisis de la varianza (ANOVA)

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

en Enfermería del Trabajo

Tema 6. Variables aleatorias continuas

El ejemplo: Una encuesta de opinión

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Método de cuadrados mínimos

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS AGRICOLA, PECUARIAS Y DEL MEDIO AMBIENTE ECAPMA

ANÁLISIS DISCRIMINANTE

Medidas de posición relativa

Diseño completamente al azar. Diseño de experimentos p. 1/111

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística

Tema 2 Estadística Descriptiva

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

ESTADÍSTICA DESCRIPTIVA

PRÁCTICA 3: Ejercicios del capítulo 5

Comparación de medias

Teoría de la decisión

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

UNIVERSIDAD NACIONAL DE FORMOSA FACULTAD DE HUMANIDADES

bloques SC Suma de Cuadrados k trat bloques

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

b) dado que es en valor absoluto será el área entre -1,071 y 1,071 luego el resultado será F(1,071)-(1-F(1,071)=0,85-(1-0,85)=0,7

PROGRAMA COMPLETO DEL CURSO DE BIOESTADÍSTICA APLICADA A LAS CIENCIAS DE LA SALUD

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN PLAN DE ESTUDIOS DE LA LICENCIATURA EN QUÍMICA INDUSTRIAL

Muestreo e inferencia

Pero qué hacemos cuando no se cumple la normalidad o tenemos muy pocos datos?

Contrastes de Hipótesis paramétricos y no-paramétricos.

Diseño Estadístico de Experimentos

Estadísticos Descriptivos

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor

EXPERIMENTACIÓN. Eduardo Jiménez Marqués

CURSO: Métodos estadísticos de uso frecuente en salud

MANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

Capítulo II Diseño Completamente Aleatorizado

Puntuación Z ESTADÍSTICA APLICADA A LA EDUCACIÓN I. L.A. y M.C.E. Emma Linda Diez Knoth

Medidas de dispersión

EJERCICIOS ANALISIS DE DISEÑOS EXPERIMENTALES Y CUASIEXPERIMENTALES CON SPSS

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Cómo se hace la Prueba t a mano?

Presentación de la tercera edición Autores

Tema 5: Introducción a la inferencia estadística

no paramétrica comparar más de dos grupos de rangos (medianas)

Análisis de datos Categóricos

Comparación de Varias Muestras

CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara

El análisis de la varianza de un factor es una extensión del test de t para dos muestras independientes, para comparar K muestras.

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Probabilidad y Estadística, EIC 311

Contrastes de hipótesis. 1: Ideas generales

Transcripción:

ANOVA I 19-8-2014

Estas dos clases ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías ANOVA II - ANOVA factorial - ANCOVA (análisis de covarianza) - ANOVA anidada - ANOVA de medidas repetidas - Repaso transformación de datos y test a priori y a posteriori

Cuartiles En estadística descriptiva, un cuartil es uno de los tres valores que dividen el set de datos en cuatro partes iguales, cada parte representa un cuarto de la muestra o la población Primer cuartil (Q1) = Percentil 25: 25% de datos mas bajos Segundo cuartil (Q2) = Mediana: Percentil 50. Tercer cuartil (Q3) = Percentil 75: 75% de los datos quedan abajo La diferencia entre Q3 y Q1 se llama Rango intercuartil.

Boxplots

Varianza, SD y GL (DF) n i1 ( x ) i n 1 2 s 2, varianza Grados de libertad n i1 ( x ) i n 1 2 s Desviación estándar El término grado de libertad (gl o df) es una medida del número de piezas independientes de información en la que se basa la precisión de la estimación de un parámetro. Good J (1973) What are Degrees of Freedom? American Statistician. 27: 227-228

Diseño experimental y Método estadístico 0.99 26 3.875 2345 28 435 39% 44% 34 P = F = t = X 2 = Los datos cumplen las exigencias mínima para el test a realizar?

Test paramétricos 1.- Normalidad: QQ plots, Residuales Shapiro test 2.- Homocedasticidad: Bartlett test Levene test 3.- Independencia: deber del investigador

Transformación de datos Conocemos algunas transformaciones: Si distribución de datos es binomial = arcsen (y) Si es binomial negativa = arcsen(y) Poisson = y ½

Transformación Box Cox Box, GEP & DR Cox (1964) "An analysis of transformations". Journal of the Royal Statistical Society, Series B 26 (2): 211 252. Basado en una familia de transformaciones Importante: -2-1 0 0.5 1 2 Lambda (λ) Power (Power Family) 1/y 2 1/y log y y ½ y y 2

De t de Student a F de Fisher M1 M2 - Comparar dos grupos de datos : t Student

De t de student a F de Fisher Si se tiene tres grupos de datos: M1 M2 M3 Podemos utilizar test de t En total: tres comparaciones independientes Problemas: 1. Aumenta el error Tipo I, se ven más diferencias cuando no existen. En otras palabras algunas comparaciones pueden mostrar diferencias significativas cuando no existen.

Problemas: 2. La estructura del test Solo considera la varianza de los dos y no tres grupos

Diseño experimental y Método estadístico Variable dependiente Variable independiente Variable respuesta (una o varias) Factor (es) (una o varias)

Tratamientos y niveles Niveles de un factor H1 H2 T1 T2 T3 Tratamientos: combinación de niveles de los factores Ejemplo: - 2 Factores - 6 tratamientos

ANOVA Modelo aditivo o lineal y ij = + i + ij Var dependiente o Var respuesta Promedio de los parámetros Efecto aleatorio o error Efecto provocado por los tratamientos H O : µ 1 = µ 2 = µ 3 H 1 : al menos un tratamiento es diferente

Dos vías de variación En ANOVA, una estimación de la variabilidad entre grupos es comparada con la variabilidad dentro de los grupos. Variación Total Variación dentro grupos: Variación debido al azar entre individuos del mismo tratamiento Variación entre grupos: Variación debido al azar y el efecto del tratamiento (si existe)

Variabilidad entre grupos 6 tratamientos (I al VI): variabilidad entre las medias Las grandes diferencias entre medias probablemente no es azar Se rechaza HO: hay efecto del tratamiento en al menos un grupo

Variabilidad dentro de los grupos 6 tratamientos: gran variabilidad entre medias de los grupos. Pero se observa mas variabilidad dentro de los grupos Probablemente no se pueda rechazar HO

F de Fisher del ANOVA F Variabilidad entre los grupos Variabilidad dentro de los grupos Variación Total Variación dentro grupos: Variación debido al azar entre individuos del mismo tratamiento Variación entre grupos: Variación debido al azar y el efecto del tratamiento (si existe)

Ejemplo 1 F Variabilid ad entre los grupos Variabilid ad dentro de los grupos F 1

Ejemplo 2 F Variabilid ad entre los grupos Variabilid ad dentro de los grupos F 1

F de Fisher Variación Total Variación dentro grupos Variación entre grupos Cuadrados medios dentro Cuadrados medios entre F MS MS entre dentro Cuadrados medios entre cuadrados medios dentro

F de Fisher F MS MS entre dentro Suma de cuadrados dentro MS dentro SS df dentro dentro grados de libertad dentro Suma de cuadrados entre MS entre SS df entre entre grados de libertad entre s 2 (X X ) 2 n 1 Suma de cuadrados Grados de libertad

Suma de cuadrados total SS total SS entre SS dentro Grados de libertad total df total df entre df dentro

Factor T 1 T 2... Tt TOTAL y 11 y 21... y t1 y 12 y 22... y t2............ y 1n y 2n... y tn TOTALES (n) Y 1o Y 2o... Y to Y oo PROMEDIOS y 1o y 2o... y to y oo (y ij -y oo ) 2

(y ij -y oo ) 2 (y ij -y oo ) 2 = (y ij -y io ) 2 + (y io -y oo ) 2 Suma de cuadrados total (SCT) Suma de Cuadrados dentro tratamientos (SCD) Suma de Cuadrados entre tratamientos (SCE) PARTICION DE LA VARIANZA

Factor T 1 T 2... Tt TOTA L y 11 y 21... y t1 y 12 y 22... y t2............ y 1n y 2n... y tn TOTALES (n) Y 1o Y 2o... Y to Y oo PROMEDIOS y 1o y 2o... y to y oo s 2 Varianza ( x ) i x n 1 2 (y ij -y oo ) 2 = (y ij -y io ) 2 + (y io -y oo ) 2

Esquema de una ANOVA Fuente de Suma de Cuadrados Gl Cuadrados medios F P Variación T (entre) t-1 SCE/GL entre CM entre /CM dentro i 2 2 ( Y / n) Y / nt i 0 00 (dentro error) o 2 ij ij y Y / n i 2 i0 t(n-1) SCE/GL dentro TOTAL ij y 2 2 ij Y00 / nt nt-1 Tres elementos importantes: i ( Y / n) 2 i0 i, j 2 y ij Y 2 / nt 00 n = total de muestras t = tratamientos

Comparaciones múltiples (a posteriori) Dunnett Tukey = test mas recomendado Scheffe = bastante error Tipo I Student-Newman- Keuls(SNK) = bastante error Tipo I LSD (Fisher) Hay sensibilidad al desbalance de los datos

Controlando error tipo I Tabla de datos M1 M2 M3 Tabla de Comparaciones múltiples M1 M2 M3 M1 X X M2 X M3 Corrección Bonferroni α/n donde n el número de comparaciones

ANOVA dos vías y ijk = + i + j + j i + k(ij) SS T SS i SS j SS ij SS E

Fuente de Variación Suma de Cuadrados Entre i t-1 SCE/GL entre CM entre /CM dentro Gl Cuadrados medios F P Entre j Interaccion i*j (dentro o error) TOTAL nt-1 SCE/GL dentro

ANOVA dos vías: datos J1 30 34 23 J2 43 54 44.. j3 34 45 56.. i1 i2 i3 i4 20 24 23 33 34 34.. 24 35 26.. 50 54 53 53 54 54.. 54 55 56.. 40 44 43 43 44 44.. 44 45 46.. Suma de cuadrados i = Suma de Cuadrados de j = Suma de Cuadrados Interacción i*j=

Interpretación de la interacción Dos factores Dos niveles cada uno

Ver tarea 1