Diseños cross-over (alternativos): Aspectos metodológicos y analíticos*

Diseños cross-over (alternativos): Aspectos metodológicos y analíticos* Jaime Arnau Gras y Manuel Viader Junyent El diseño alternativo o cross-over, conocido también como diseño change-over, es un esquema de investigación experimental donde cada una de las unidades de observación o sujetos recibe dos o más tratamientos y en el cual el orden de aplicación de dichos tratamientos a los diversos sujetos viene determinado por la estructura del propio diseño. El diseño alternativo más simple (y probablemente el más utilizado en la práctica) es conocido por diseño 2 x 2 (2 tratamientos-2 períodos). En esta disposición la mitad de los sujetos recibe el tratamiento A y posteriormente cambia y recibe el tratamiento B; la otra mitad recibe los tratamientos en orden inverso. De este modo quedan definidos dos grupos experimentales diferenciados por la secuencia de aplicación de los tratamientos. Obviamente, el principal propósito de los diseños alternativos es sustraerde las comparaciones de los tratamientos (y períodos) cualquier componente que se refiera a las diferencias entre sujetos. Ahora bien, dada la estructura del diseño se derivan una serie de efectos que constituyen sus más importantes desventajas, sobre todo en los diseños 2 x 2. Estos efectos reciben el nombre genérico de efectos de orden (Louis, Lavori, Bailar y Polansky, 1986). Un primer efecto de orden es conocido como "carry-over" o efecto residual de orden k, en el cual los efectos de cierto tratamiento se extienden más allá del período de aplicación hasta los siguientes k períodos. Un segundo efecto de orden es el asociado al período, obviamente relacionado con el lugar que ocupa el tratamiento en la secuencia experimental. De acuerdo con lo expuesto, el esquema de un diseño alternativo quedaría, en el caso más sencillo (2 x 2), del siguiente modo:

El análisis de los datos generados en este diseño puede plantearse a partir de un modelo que, a diferencia de los propuestos por otros autores (Anderson y McLean, 1974) incluye, además de los tres componentes básicos del modelo de diseño de cuadrado latino (efecto de sujetos, efecto de periodo u orden y efecto de tratamiento), el efecto residual de los tratamientos, referido específicamente a la diferencia entre tales efectos, es decir, a la presencia o no de transferencia asimétrica entre tratamientos. Cabe destacar que la estructura de análisis es similar a la de un diseño split-plot. En efecto, la suma de cuadrados total es dividida en dos grandes componentes: SC entre-sujetos, que incluye SC carry-over y residual entre-sujetos, y SC intra-sujetos, que se descompone en SC de tratamientos (ajustada a los periodos), SC de periodos (ajustada a los tratamientos) y SC residual intra-sujetos (Hills y Armitage, 1979). Se asumiría que los efectos de sujetos son independientes y distribuídos con media cero y varianza común para los distintos grupos. De este modo el cuadro-resumen del ANOVA para el diseño alternativo 2 x 2 toma la siguiente forma: La estrategia de análisis plantearía como paso preliminar la prueba de la hipótesis de nulidad en cuanto a la igualdad de los efectos residuales. Dada la importancia de esta hipótesis, suele aconsejarse (Grizzle, 1965) que se rechace a un nivel del 10%. En efecto, cuando dicha hipótesis de nulidad puede aceptarse la interpretación de los resultados es simple, puesto que basta tener en cuenta los posibles efectos de tratamientos y periodos. El problema se complica considerablemente en presencia de efectos carry-over significativos, más aún cuando no existe una sola explicación para el rechazo de la hipótesis de

nulidad de tales efectos. Como ocurre en otros diseños, el problema fundamental radica en la confusión entre algunos de los efectos presentes en el diseño y los consiguientes errores de interpretación que pueden producirse. En particular, de la estructura del diseño y de los datos utilizados de forma consiguiente para el cálculo de los distintos efectos se deriva la confusión entre los efectos de grupo, efectos residuales e interacción Tratamientos x Periodos. Obviamente, esto no representaría ninguna dificultad si dichos efectos poseyeran una magnitud despreciable en relación con el efecto principal de los tratamientos experimentales, pero indudablemente esta es una presuposición fuerte que debería ser contrastada de forma eficaz. El problema de las posibles diferencias entre los grupos experimentales puede solucionarse mediante una utilización adecuada de las técnicas de aleatorización en la formación de los grupos. Sin embargo, se plantean dificultades objetivas en el momento de aplicar estas técnicas en situaciones aplicadas y, en particular, en la práctica clínica. Si no es posible una aleatorización completa en la formación de los grupos experimentales, se hace imprescindible la introducción de un periodo de observación pre-tratamiento a fin de valorar la equivalencia inicial de los grupos, aunque ciertamente esta solución posee importantes limitaciones, tal y como se ha demostrado repetidamente en el análisis de diseños cuasi -experimentales. La importancia de la igualdad de los efectos residuales y, por tanto, de la inexistencia de transferencia asimétrica entre tratamientos, puede demostrarse con cierta facilidad si se atiende a los efectos fijos que se asumen en el análisis de los datos de este tipo de diseño. Dichos efectos se expresan en la siguiente tabla 3, (caso 2 x 2): Solamente en el caso de que los dos efectos residuales sean idénticos puede plantearse una comparación correcta entre los tratamientos a partir de la promediación de periodos distintos. En efecto, bajo el supuesto de igualdad de los efectos residuales los valores esperados de las diferencias entre periodos en cada uno de los grupos serían los siguientes: Obviamente estos dos valores esperados son idénticos (en valor absoluto) en caso de que sea cierta la hipótesis nula Ho: 1 = 2, lo cual permite contrastar dicha hipótesis de forma inmediata.

Un razonamiento parecido podría efectuarse en lo que se refiere al contraste de las diferencias globales entre periodos. En este último caso es también condición indispensable la igualdad de los efectos residuales entre tratamientos. La alternativa más simple que puede utilizarse cuando los efectos residuales son desiguales consistiría en analizar únicamente los datos obtenidos durante el primer periodo de observación (Grizzle, 1965). De este modo el diseño quedaría reducido a una estructura de grupos al azar. Sin embargo, es obvio que se produce una gran pérdida de información y se pierden también las ventajas de la estructura de medidas repetidas, en particular la comparación entre los tratamientos a partir de datos entre-sujetos. Por otra parte, Willan y Pater (1986) han mostrado que en muchos casos el posible sesgo introducido por la presencia de efectos residuales desiguales se ve compensado por la reducción de varianza producida por la utilización de los datos de los diversos periodos. En cualquier caso, es posible plantear otras líneas de acción, de entre las cuales destacaremos las siguientes: Introducción de periodos de observación sin tratamiento Una solución relativamente eficaz consistiría en introducir una observación sin tratamientos antes del primer periodo de intervención e intercalar otras observaciones sin tratamiento entre los distintos periodos de intervención. Una primera ventaja de este planteamiento consistiría en la posibilidad de evaluar directamente los efectos residuales mediante una comparación entre las fases de no tratamiento pre y post intervención. Pueden plantearse también contrastes para la interacción Tratamientos x Periodos tanto si se asume como si no la presencia de efectos residuales significativos (Jones y Kenward, 1989). En caso de presencia de tales efectos el contraste del efecto de los tratamientos podría plantearse mediante una comparación entre observaciones pre-tratamiento y primer periodo de intervención, salvando de este modo el principio básico de establecer comparaciones intrasujetos, aunque resulta obvia la pérdida de información producida al no utilizarse los datos del segundo periodo de tratamiento. Por otra parte, sugerimos la posible utilidad del uso de periodos de "línea base" intercalados entre los tratamientos y de duración variable, con una observación al final del periodo. Una elección adecuada de los intervalos podría permitirnos establecer el carácter temporal o permanente de los efectos residuales y su duración aproximada, lo cual constituye sin duda una información importante para el planteamiento de futuros estudios. Sin embargo, resulta evidente que este tipo de planteamiento posee importantes límites en la práctica habitual. Utilización de diseños de alto orden En el caso frecuente de que se utilicen dos tratamientos, se considerarán de alto orden aquellos diseños alternativos que incluyan más de dos grupos experimentales (diferenciados por la secuencia de introducción de los tratamientos) y/o más de dos periodos de tratamiento. Las ventajas principales de este tipo de disposición radican en la mayor potencia en la detección de transferencia asimétrica entre tratamientos (puesto que puede utilizarse para ello información intra-sujeto) y en la posibilidad de evitar, en algunos casos, la confusión entre efectos residuales e interacción Tratamientos x Periodos. El problema que se plantea en el caso de los diseños de alto orden radica en la gran cantidad

posible de alternativas de las cuales se dispone y, consecuentemente, en la necesidad de establecer un criterio de "optimidad" en la selección del diseño, combinando criterios metodológicos, estadísticos y pragmáticos. Ciertamente, desde el punto de vista de las posibilidades de análisis existe un conjunto de diseños que pueden considerarse óptimos. Por ejemplo, en caso de que se desee mantener únicamente dos periodos de observación es óptima la utilización del denominado diseño de Balaam, que presentaría la siguiente estructura: De la estructura del diseño de Balaam se deriva la posibilidad de obtener una estimación del efecto de los tratamientos a partir de datos intrasujeto aun en el caso de presencia de transferencia asimétrica. Los estimadores del efecto de los tratamientos en caso de presencia de efectos residuales desiguales o de ausencia de tal diferencia vienen dados por los siguientes contrastes: Claramente, la primera de estas estimaciones está corregida respecto a la existencia de efectos residuales asimétricos. La principallimitación del diseño de Balaam radica en que no permite estimar de forma independiente el efecto carry-over y la interacción Tratamientos x Periodos. Para evitar esta confusión es necesario recurrir a diseños de estructura más compleja (por ejemplo, un diseño de tres periodos con 6 secuencias de tratamiento permite estimar de forma independiente todos los efectos, aun a costa de aumentar considerablemente la complejidad del análisis). Debe considerarse también el hecho de que el aumento del número de periodos permite aumentar considerablemente la precisión del diseño: por ejemplo, la introducción de un periodo extra en el diseño de Balaam permite reducir la varianza del estimador de los efectos residuales desde 42/N hasta.5 2/N (Jones y Kenward, 1989).

Introducción de medidas repetidas intraperiodos La existencia de diferentes observaciones dentro de cada periodo de tratamiento y, eventualmente, en los posibles periodos de no tratamiento, introduce algunas posibilidades suplementarias para el análisis de los datos en diseños alternativos. Particularmente, la elección de intervalos entre observaciones adecuados permitiría valorar la evolución temporal del efecto de los diversos tratamientos e, indirectamente, sobre la posible existencia de efectos residuales. Esta información estaría contenida en la estimación de la interacción Carry-over x Ocasiones. Si pudiera demostrarse, por ejemplo, que un tratamiento posee un efecto residual decreciente que incide únicamente sobre las primeras observaciones del siguiente periodo de tratamiento, podría optarse por utilizar únicamente los últimos registros de cada periodo. La estructura de los datos en diseños alternativos que incluyen medidas repetidas intraperiodos es relativamente especial, puesto que tales datos constituyen un conjunto de series de observación que probablemente poseen estructuras de covarianza distintas dentro de cada periodo. Esto sugiere la necesidad de plantear alternativas a la utilización del ANOVA clásico, y para ello se ha sugerido al menos una soluciones relevante. La idea fundamental para esta solución consiste en reducir las diversas medidas repetidas a un pequeño conjunto de estadísticos que pueden ser analizados tanto mediante técnicas univariables como desde una perspectiva multivariable. Por ejemplo, puede intentarse el ajuste de un polinomio de grado bajo a cada una de las funciones obtenidas dentro de cada periodo. Los parámetros estimados para tal polinomio en cada uno de los sujetos constituirían los nuevos datos a utilizar como entradas en técnicas estadísticas clásicas. Otra posibilidades de reducción de los datos originales serían la utilización de medidas de centralización, cálculo del área bajo cada una de las curvas, niveles máximos y/o mínimos, etc. En caso de que no sea posible o conveniente la reducción de los datos, es necesario recurrir a un ANOVA para un diseño split-plot con medidas repetidas para cada tratamiento (Greenhouse y Geisser, 1959), o bien a técnicas generales como el análisis de ante-dependencia (Kenward, 1987). Referencias ANDERSON, V.L. y MCLEAN, R.A. (1974). Design ofexperiments. New York: Marfel Dekker GREENHOUSE, S.W. y GEISSER, S. (1959). Psychometrika, 24, 95-112 GRIZZLE, J.E. (1965). The two-period change-over design and its use in clinical trials. Biometrics, 21, 467-480 HILLS, M. y ARMITAGE, P. (1979). The two period cross-over clinical trial. British Joumal of Clinical Pharmacology, 8, 7-20 JONES, B. y KENWARD, M.G. (1989). Design and analysis of cross-over trials. London: Chapman and Hall KENWARD, M.G. (1987). A method for comparing profiles of repeated measurements. Applied Statistics, 36, 296-308 LOUIS, T.A,LAVORI, P.W.BAILAR, J.C. y POLANSKY, M. (1986). Cross-over and selfcontrolled designs in clinical research. En J.C. Bailar y F. Mosteller (Eds.): Medical uses of statistics. Waltham (Mass.): NUM Books WILLAN, A.R. y PATER, J.L. (1986). Carryover and the two period crossover design. Biometrics, 42, 593-599