Escuela Nacional de Estadística e Informática ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA

ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA Lima Perú 2013

DISEÑO COMPLETAMENTE ALEATORIZADO Es el diseño más simple y sencillo de realizar, en el cual los tratamientos se asignan al azar entre las unidades experimentales y viceversa. Este diseño tiene amplia aplicación cuando las unidades experimentales son muy homogéneas, es decir, la mayoría de los factores actúan por igual entre las unidades experimentales. Esta situación se presenta en los experimentos de laboratorio donde casi todos los factores están controlados. También en ensayos clínicos y en experimentos industriales. En ensayos de invernaderos es muy útil así como en experimentos agrícolas donde ha sido ampliamente utilizado. La homogeneidad de las unidades experimentales puede lograrse ejerciendo un control local apropiado (seleccionando por ejemplo, sujetos, animales o plantas de la misma edad, raza, variedad o especie). Pero se debe tener presente que todo material biológico, por homogéneo que sea, presenta cierta variabilidad cuyos factores no se conocen y son, por lo tanto, incontrolables. Así pues, si logramos controlar factores cualitativos como sexo, camada, color, raza o cuantitativos como peso, edad, consumo; podremos eliminar su influencia del error experimental; la varianza de este componente disminuiría y en consecuencia, aumentaría la eficiencia del experimento posibilitando la detección de efectos entre los tratamientos o condiciones experimentales si es que los hay. Su nombre se deriva del hecho de que existe completamente una aleatorización. También se le conoce como diseño de una vía o un solo criterio de clasificación en virtud de que las respuestas se hallan clasificadas únicamente por los tratamientos. Este diseño no impone ninguna restricción en cuanto a las unidades experimentales, éstas deberán ser, en todo caso, homogéneas. El Diseño en su estructura no se ve afectado por el número igual o desigual de observaciones por tratamiento. Numero de Pagina: 2

MODELO ADITIVO LINEAL El modelo aditivo lineal es una expresión algebraica que involucra a todos los factores presentes en la investigación. Resulta útil para sintetizar qué factores son independientes o dependientes, cuáles son fijos o aleatorios, cuáles son cruzados o anidados. Para este diseño el modelo lineal es como sigue: Donde: Es la variable respuesta (variable de interés o variable medida) Es la media general del experimento Es el efecto del i-ésimo tratamiento Es el error aleatorio asociado a la variable respuesta., MODELO DE EFECTOS FIJOS, ALEATORIOS Y MIXTO Cómo se observa el efecto del tratamiento puede ser fijo, aleatorio o mixto. MODELO I (Modelo de efectos fijos) Cuando los factores son fijos el investigador ha escogido los factores en forma no aleatoria y sólo está interesado en ellos. En este caso el investigador asume que lo cual refleja la decisión del investigador de que únicamente está interesado en los tratamientos presentes en el experimento. La mayor parte de los experimentos de investigación comparativa pertenecen a este modelo. MODELO II (Modelo de efectos aleatorios o modelo de componentes de varianza) Cuando los factores son aleatorios, el investigador selecciona al azar los de interés de varios que dispone y los asigna a las unidades experimentales. En este caso el investigador asume que los tratamientos están distribuidos normalmente e independientemente con media cero y varianza constante, lo cual refleja la decisión del investigador de que sólo está interesado en una población de tratamientos, de los cuáles únicamente una muestra al azar (los tratamientos) están presentes en el experimento. Numero de Pagina: 3

MODELO MIXTO Hace referencia a aquellos casos en los cuales el investigador considera tanto factores fijos como aleatorios en el mismo experimento. La especificación del modelo es importante en el diseño y análisis del experimento. Su importancia radica en el hecho de que sirven para indicar cuáles van a ser los cuadrados medios esperados. Estos cuadrados medios se utilizan para calcular el estadístico F de Fisher. A manera de ejemplo, se exponen los cuadrados medios esperados para igual y desigual número de observaciones por tratamiento. IGUAL NÚMERO DE OBSERVACIONES POR TRATAMIENTO Fuente de variación Modelo I Modelo II Tratamiento Error experimental DESIGUAL NÚMERO DE OBSERVACIONES POR TRATAMIENTO La prueba F se puede obtener con los cuadrados medios esperados. Por ejemplo, la prueba F para tratamientos en el modelo II con igual número de observaciones se obtiene mediante: Numero de Pagina: 4

Según este cociente de varianzas, F deberá tener un valor cercano a la unidad, cuando las medias de los tratamientos sean iguales, esto es y deberá aumentar cuando las medias de tratamientos difieran de manera considerable. La representación esquemática para este diseño es: Observaciones Tratamientos 1 2 a 1 Y11 Y21 Ya1 2 Y12 Y22 Ya2 3 Y13 Y23 Ya3............ Y1n1 Y2n2 Yana Totales Y1. Y2. Yk. Medias La representación esquemática plantea la forma cómo se van a determinar los efectos: El efecto debido al tratamiento ( ) viene dado por: ( ) Esta suma de cuadrados de tratamiento puede ser calculada así: Numero de Pagina: 5

( ) O también: Donde: ( ) El efecto de la variación total puede ser determinado por: ( ) O también: El efecto del error experimental puede ser estimado por la suma de cuadrados totales menos la suma de cuadrados de los tratamientos, esto es: TABLA DE ANOVA El cuadro de análisis de varianza (ANOVA) es un arreglo dado por las fuentes de variación, seguido de los grados de libertad, de las sumas de cuadrados, de los cuadrados medios de cada componente, así como el valor del estadístico F y su probabilidad de significación (valor p). El esquema es como sigue: Numero de Pagina: 6

Fuente de Grados de Suma de Cuadrados Valor variación libertad Cuadrados Medios F Tratamiento Error Total SUPUESTOS Son tres los supuestos que debe cumplir el ANOVA, y son: Normalidad de los efectos Se refiere a que las respuestas deben de provenir de poblaciones con distribución normal, es decir, deben poseer distribución normal dentro de cada grupo de tratamiento. Este supuesto puede ser probado postulando las siguientes hipótesis: Los datos provienen de una población con distribución normal. Los datos no provienen de una población con distribución normal. La prueba que se utiliza en este caso es la de hapiro Wilk para muestras pequeñas (menos de 30 datos) y Kolmogorov Smirnov para muestras grandes (más de 30 datos) Homogeneidad de varianzas Se refiere a que cada respuesta debe poseer dentro de cada tratamiento una variación parecida o igual que la del otro tratamiento. Las varianzas poblacionales son iguales en todos los grupos. Las varianzas poblacionales son diferentes en todos los grupos. La aplicación de la prueba estadística debe conducir a un no rechazo de la hipótesis nula para que exista homogeneidad de varianzas. Independencia de los errores de un tratamiento a otro. Numero de Pagina: 7

EJEMPLO: Se hace un estudio acerca de la efectividad de tres marcas de insecticida para matar moscas. Para ello cada insecticida se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas, expresado en porcentaje. Se realizan 6 repeticiones y los resultados obtenidos son los siguientes: Insecticida Número de réplicas 1 2 3 4 5 6 1 72 65 67 75 62 73 2 55 59 68 70 53 50 3 64 74 61 58 51 69 Desarrollo: Paso 1: Identificamos el objetivo del investigador. Determinar la efectividad para matar moscas de las tres marcas de insecticida. Paso 2: Identificar el Factor, los niveles del factor y la variable respuesta. Factor: Insecticida Niveles del factor: Tres niveles Variable respuesta: Porcentaje de moscas muertas. Paso 3: Plantear el Modelo., Donde: Es la media general del experimento Es el efecto del i-ésimo tratamiento Es el error aleatorio asociado a la variable respuesta. Numero de Pagina: 8

Es el efecto del primer insecticida sobre el porcentaje de moscas muertas. Es el efecto del segundo insecticida sobre el porcentaje de moscas muertas. Es el efecto del tercer insecticida sobre el porcentaje de moscas muertas. Paso 4: Identificar las poblaciones. Población 1: Porcentaje de moscas muertas utilizando el primer insecticida. Población 2: Porcentaje de moscas muertas utilizando el segundo insecticida. Población 3: Porcentaje de moscas muertas utilizando el tercer insecticida. Paso 5: Identificar los parámetros. Porcentaje promedio de moscas muertas utilizando el primer insecticida. Porcentaje promedio de moscas muertas utilizando el segundo insecticida. Porcentaje promedio de moscas muertas utilizando el tercer insecticida. Paso 6: Verificar el supuesto de normalidad. El porcentaje promedio de moscas muertas utilizando el primer insecticida tiene distribución normal. El porcentaje promedio de moscas muertas utilizando el primer insecticida no tiene distribución normal. El porcentaje promedio de moscas muertas utilizando el segundo insecticida tiene distribución normal. El porcentaje promedio de moscas muertas utilizando el segundo insecticida no tiene distribución normal. El porcentaje promedio de moscas muertas utilizando el tercer insecticida tiene distribución normal. El porcentaje promedio de moscas muertas utilizando el tercer insecticida no tiene distribución normal. Paso 7: Verificar el supuesto de igualdad de varianzas. Las varianzas poblacionales son iguales en las tres poblaciones. Las varianzas poblacionales son diferentes en las tres poblaciones. Numero de Pagina: 9

Paso 8: Plantear las hipótesis para el ANOVA El porcentaje promedio de moscas muertas es igual utilizando los tres insecticidas. El porcentaje promedio de moscas muertas es diferente con al menos uno de los tres insecticidas. O también: Estas mismas hipótesis también se pueden plantear como sigue: No existe efecto de los insecticidas sobre el porcentaje de las moscas muertas. Existe efecto de los insecticidas sobre el porcentaje de las moscas muertas. Este planteamiento de hipótesis es también correcto, sin embargo, no se tratan de hipótesis estadísticas ya que este tipo de hipótesis deben de ser redactadas involucrando los parámetros a estimar. Paso 9: Si en el paso anterior se rechaza la hipótesis nula, entonces se procede a aplicar una prueba de comparaciones múltiples. Numero de Pagina: 10