- Si se repite un experimento, en condiciones indistinguibles, los resultados presentan variabilidad.

Introducción Los modelos que vamos a estudiar son usados para averiguar si una o más variables o factores afectan nuestra variable de interés. Ejemplos donde esta disciplina puede ser utilizada son: - Prever el contenido de partículas en el aire en función de la densidad de tráfico, la hora del día y las condiciones meteorológicas. - Estudiar la influencia del tipo de pila eléctrica y de la marca en la duración de las pilas. - Determinar como depende la duración de una depresión de variables personales y sociales. - Determinar la organización de los productos de un supermercado para mejorar las ventas. 1

Introducción - Si se repite un experimento, en condiciones indistinguibles, los resultados presentan variabilidad. - Si la experimentación se realiza en un laboratorio donde la mayoría de las causas de variabilidad están muy controladas. - Pero si se experimenta en procesos industriales, administrativos,... la variabilidad es grande en la mayoría de los casos. - El objetivo del diseño de experimentos es estudiar si utilizar un determinado tratamiento produce una mejora en el proceso o no. 2

Introducción - La metodología del Diseño de Experimentos estudia cómo variar las condiciones habituales de realización de un proceso empírico para aumentar la probabilidad de detectar cambios significativos en la respuesta. - Para que la metodología de diseño de experimentos sea eficaz es fundamental que el experimento esté bien diseñado. 3

Por qué realizar experimentos? - Determinar las principales causas de variación en la respuesta. - Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable de interés o respuesta. - Comparar las respuestas en diferentes niveles de observación de variables controladas. - Obtener un modelo estadístico-matemático que permita hacer predicciones de respuestas futuras. 4

Por qué realizar experimentos? No siempre es posible el tener datos históricos y aunque los tuviésemos, estos tienen ciertas desventajas: - Inconsistencia de los datos: cambios de personas, mejoras del personal por procesos de aprendizaje, motivación, cambios en las máquinas. - Variables con fuerte correlación. Puede ocurrir que en el proceso existan dos o más variables altamente correlacionadas que pueden llevar a situaciones confusas. Puede haber confusión en los efectos, o problemas con una variable oculta. - El rango de las variables controladas es limitado. 5

Tipos de Variabilidad Uno de los principales objetivos de los modelos de diseño de experimentos, es controlar la variabilidad. Los resultados de cualquier experimento están sometidos a tres tipos de variabilidad: Variabilidad sistemática y planificada Variabilidad típica de la naturaleza del problema y del experimento Variabilidad sistemática y no planificada 6

Variabilidad sistemática y planificada - Originada por las distintas condiciones experimentales impuestas en el diseño por expreso deseo del experimentador. - Cuando este tipo de variabilidad está presente y tiene un tamaño importante, se espera que las respuestas tiendan a agruparse formando grupos (clusters). - Es deseable que exista esta variabilidad y que sea identificada y cuantificada por el modelo. 7

Variabilidad típica de la naturaleza y del experimento Ruido aleatorio que contiene el error de medida. Es una variabilidad impredecible e inevitable. - Diferencia entre diferentes medidas de un mismo objeto. - Existe un patrón de comportamiento, todas las medidas tienen a fluctuar en torno a un valor central y siguiendo un modelo probabilístico que podemos estimar. - Es una variabilidad que va a estar siempre presente pero que es tolerable. 8

Variabilidad sistemática no planificada - Debida a causas desconocidas y no planificadas. En otras palabras, los resultados están siendo sesgados sistemáticamente por causas desconocidas. - La presencia de esta variabilidad supone la principal causa de conclusiones erróneas y estudios incorrectos al ajustar un modelo estadístico. - Existen dos estrategias básicas para tratar de evitar la presencia de este tipo de varibilidad: la aleatorización y la técnica de bloques. 9

Control de la Variabilidad Para controlar la variabilidad existen tres técnicas: Replicados Aleatorización Formación de bloques 10

Planificación de un experimento La forma tradicional que se utilizaba en la experimentación se basaba en estudiar los factores uno a uno. Los inconvenientes de esta metodología son: - Es necesario un gran número de pruebas. - Las conclusiones obtenidas en el estudio de cada factor tiene un campo de validez muy restringido. - No es posible estudiar la existencia de interacción entre los factores. - Es inviable, en muchos casos, por problemas de tiempo o costo. - Las técnicas de diseño de experimentos estudian simultáneamente los efectos de todos los factores de interés. Mayor eficacia y con mejores resultados. 11

Etapas diseño de experimentos 1. Definir los objetivos del experimento. 2. Identificar todas las posibles fuentes de variación 3. Elegir las unidades experimentales en relación con las condiciones de estudio. 4. Especificar las medidas de la respuesta, el procedimiento experimental y anticiparse a las posibles dificultades. 5. Ejecutar un experimento piloto. 6. Especificar el modelo. 7. Esquematizar los pasos del análisis. 8. Determinar el tamaño muestral. 9. Revisar las decisiones anteriores. 12

1.- Definir los objetivos del experimento - Definir las preguntas concretas y objetivos. - Esquematizar el tipo de respuestas que se esperan obtener - Esta lista se puede refinar según avanza el experimento. 13

2.- Fuentes de variación Una fuente de variación es cualquier causa que pueda generar variabilidad en la respuesta. Es recomendable hacer una lista de todas las posibles fuentes de variación del problema, distinguiendo las que generarán una mayor variabilidad. Se distinguen dos tipos: Factores tratamiento: son aquellas fuentes cuyo efecto sobre la respuesta es de particular interés para el experimentador. Factores nuisance: son aquellas fuentes que no son de interés directo pero que se contemplan en el diseño para reducir la variabilidad no planificada. 14

2.- Fuentes de variación: Factores -Factores y sus niveles. Se denomina factor tratamiento a cualquier variable de interés para el experimentador cuyo posible efecto sobre la respuesta se quiere estudiar. -Los niveles de un factor tratamiento son los tipos o grados específicos del factor que se tendrán en cuenta en la realización del experimento. -Los factores tratamiento pueden ser cualitativos o cuantitativos. - En el tratamiento matemático de los modelos de diseño de experimento los factores cuantitativos son tratados como cualitativos y sus niveles son elegidos equiespaciados o se codifican. 15

2.- Fuentes de variación: Definiciones Cuando en un experimento se trabaja con más de un factor, se denomina: Tratamiento a cada una de las combinaciones de niveles de los distintos factores. Observación es una medida en las condiciones determinadas por uno de los tratamientos. Experimento factorial es el diseño de experimentos en que existen observaciones de todos los posibles tratamientos. 16

2.- Fuentes de variación: Unidades Experimentales Son el material donde evaluar la variable respuesta y al que se le aplican los distintos niveles de los factores tratamiento: - en informática, ordenadores, páginas web, buscadores de internet, - en medicina, individuos humanos u animales, - en industria, lotes de material, trabajadores, máquinas. Las unidades experimentales tienen que ser representativas de la población de la respuesta. Por ejemplo si el estudio es sobre estudiantes universitarios, las conclusiones no se puede extrapolar a todo el país. 17

2.- Fuentes de variación: Factores nuisance - bloque Además de los factores tratamiento, también influyen otros factores, de escaso interés en el estudio. Para controlar su influencia se crean nuevos factores: Factor bloque. En algunos casos el factor nuisance puede ser fijado en distintos niveles, de modo que es posible controlar su efecto a esos niveles. Entonces la forma de actuar es mantener constante el nivel del factor para un grupo de unidades experimentales, se cambia a otro nivel para otro grupo y así sucesivamente. Estos factores se denominan factores de bloqueo (factores-bloque) y las unidades experimentales evaluadas en un mismo nivel del bloqueo se dice que pertenecen al mismo bloque. 18

2.- Fuentes de variación: Factores nuisance factores ruido y covariables Ruido. Si el experimentador está interesado en la variabilidad de la respuesta cuando se modifican las condiciones experimentales, entonces los factores nuisance son incluidos deliberadamente en el experimento y no se aisla su efecto por medio de bloques. Se habla entonces de factores ruido. 19

2.- Fuentes de variación: Factores nuisance factores ruido y covariables Covariable. Si el factor nuisance es una propiedad cuantitativa de las unidades experimentales que puede ser medida antes de realizar el experimento (el tamaño de un fichero informático, la presión sanguínea de un paciente en un experimento médico o la acidez de una parcela de tierra en un experimento agrícola). El factor se denomina covariable y juega un papel importante en el análisis estadístico. 20

3.- Unidades Experimentales La regla de asignación o diseño experimental especifica que unidades experimentales se observarán bajo cada tratamiento. Hay diferentes posibilidades: diseño factorial o no, anidamiento, asignación al azar en determinados niveles de observación, el orden de asignación, etc. En la práctica, existen una serie de diseños estándar que se utilizan en la mayoría de los casos. 21

4.-Especificar las Medidas de la respuesta, procedimiento y anticiparse a posibles dificultades Determinar la variable respuesta o de interés (unidades de medida) Pensar detenidamente en posibles problemas que se puedan presentar: permitirá descubrir nuevas fuentes de variación, simplificaciones del procedimiento antes de empezar, Clarificar la forma en que se harán las mediciones: unidades de medida, tiempo en el que se harán las medidas, 22

5.-Ejecutar un experimento piloto Realizar un número reducido de observaciones, lo que permitirá: Practicar la técnica experimental elegida y ver posibles problemas en la recogida de datos. Si el piloto es grande pude ayudar a seleccionar el modelo adecuado al experimento principal. Los errores experimentales observados pueden ayudar a calcular el número de observaciones necesarias. 23

6.-Especificar el modelo El modelo habitual será: Y = Σα i + ε Factores de efectos fijos: Los niveles han sido seleccionados por el experimentador. Factor de efectos aleatorios: Se incluye en el procedimiento una muestra aleatoria de los posibles niveles del mismo. Según los factores seleccionados hablaremos de modelo de efectos fijos, aleatorios o mixtos. 24

7.-Esquematizar los pasos del análisis estadístico El análisis dependerá de: Objetivos del paso 1. Diseño del paso 3. Modelo del paso 5. Habrá que incluir: Estimaciones que hay que calcular. Contrastes a realizar. Intervalos de confianza que se calcularán. Diagnosis y crítica del grado de ajuste del modelo a la realidad. 25

8.- Determinar el tamaño de la muestra Se trata de calcular el número de observaciones a tomar para alcanzar los objetivos del experimento. Existen algunas fórmulas, según el modelo. No obstante, como se requerirá a priori el conocimiento del tamaño de la variabilidad no planificada, será conveniente sobreestimarla. El experimento piloto ayudará a la decisión además de experiencias previas en diseños experimentales semejantes. 26

9.- Revisar las decisiones anteriores. Modificar si es necesario Hay que tener en cuenta que: Si el diseño está mal planificado no se podrán extraer conclusiones correctas. Hay que comprender la totalidad de los objetivos antes de comenzar el análisis. No se debe invertir todo el presupuesto en un primer conjunto de experimentos y utilizar en su diseño toda la información previa disponible. La estrategia experimental debe ser conocida por todo el personal afectado. 27

Resumen de los principales conceptos Unidad experimental Variable de interés o respuesta. Factor Factor tratamiento Factor bloque Niveles Tratamiento Observación experimental Tamaño del experimento Interacción de factores Ortogonalidad de factores Diseño equilibrado o balanceado 28

Principios básicos en el diseño de experimentos Principio de aleatorización El bloqueo La factorización del diseño 29

Algunos diseños experimentales clásicos Diseño completamente aleatorizado: Respuesta = Constante + Efecto Tratamiento + Error Diseño en bloques, con un factor bloque: Respuesta = Constante + Efecto Bloque + Efecto Tratamiento + Error Diseño con dos o más factores bloque: Respuesta = Constante + Efecto Bloque Fila + Efecto Bloque Columna + Efecto Tratamiento + Error ** Bloques cruzados y bloques anidados 30

Algunos diseños experimentales clásicos Diseño con dos o más factores: Respuesta = Constante + Efecto Factor Fila + Efecto Factor Columna + Error Fracciones Factoriales: En lugar de usar 2 k observaciones se utiliza 2 k-p, simplificando el modelo. 31