Redalyc. Mandeville, Peter B.

Redalyc Sistema de Información Científica Red de Revistas Científicas de América Latina, el Caribe, España y Portugal Mandeville, Peter B. Tema 27: Pruebas de equivalencia (parte II) Ciencia UANL, vol. 14, núm. 3, julio-septiembre, 2011, pp. 347-350 Universidad Autónoma de Nuevo León Monterrey, México Disponible en: http://www.redalyc.org/src/inicio/artpdfred.jsp?icve=40219049018 Ciencia UANL ISSN (Versión impresa): 1405-9177 rciencia@mail.uanl.mx Universidad Autónoma de Nuevo León México Cómo citar? Número completo Más información del artículo Página de la revista www.redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

Tips Bioestadísticos Tema 27: Pruebas de equivalencia (parte II) Peter B. Mandeville What s the difference between a physicist, a mathematician, and a statistician? The physicist calculates until he gets a correct result and concludes that he has proven a fact. The mathematician calculates until he gets a wrong result and concludes that he has proven the contrary of a fact. The statistician calculates until he gets a correct result about an obviously wrong proposition and concludes NOTHING, because the explanation is the task of the scientist who consulted the statistician. 1 L a metodología estadística para las pruebas de equivalencia y no inferioridad incluye la realización de la prueba de hipótesis, la construcción de un intervalo de confianza y la predicción del tamaño de la muestra. Se discutieron variables de respuesta continuas, anteriormente, en el tema 25. 2 Este artículo describe la metodología para variables de respuesta binomial. Se definen los extremos binomiales como el valor absoluto de la probabilidad de éxito para un grupo estándar (Ps) y la probabilidad de éxito para un grupo experimental (Pe), es decir,. La estadística de la prueba es la estadística z, derivada de la aproximación normal a la distribución binomial donde Ns es el tamaño de la muestra estándar, y Ne es el tamaño de la muestra experimental. Tenga en cuenta que el error estándar (SE) es una función de Ps y Pe, y no la tasa media de éxito en el enfoque estándar de pruebas de hipótesis, porque la hipótesis de nulidad supone una diferencia en las tasas de éxito. Se rechaza la hipótesis de nulidad y se concluye equivalencia de las tasas de éxito entre los tratamientos estándar y experimentales, si o si el valor p del resultado es menor que δ. 3 Un intervalo de confianza es un procedimiento alterno para tomar la decisión de aceptar o rechazar la hipótesis alternativa y se calcula: 3 CIENCIA UANL / AÑO 14, No. 3, JULIO - SEPTIEMBRE 2011 347

TIPS BIOESTADÍSTICOS > z0 [1] -2.592593 El siguiente ejemplo es de Atherton-Skaff y Sloan, 3 y el código es R. 4,5 Se pone a prueba un producto estándar (S) contra un producto experimental, E. Se encuentra que S es exitosa en 85 de 100 pacientes, y que E es exitosa en 78 de 99 pacientes. Son los dos tratamientos igualmente eficaces para una? Se calcula: > Ps <- 85/100 > Ps [1] 0.85 > Pe <- 78/99 > Pe [1] 0.7878788 > SE <- sqrt(ps*(1-ps)/100+pe*(1-pe)/99) > SE [1] 0.05443473 > z0 <- (Ps-Pe-0.10)/SE > z0 [1] -0.7407407 y se calcula el valor p > pnorm(-0.74) [1] 0.22965 Al nivel de significancia de 5%, no se rechaza la hipótesis de nulidad y se podría concluir que la diferencia en las tasas de éxito entre los dos medicamentos sería tanto como. 3 Los tratamientos tienen diferente eficacia. Puede descartarse que las drogas sean más de 20% diferentes en términos de tasa de éxito, porque si fue probada, se obtendrá > z0 <- (Ps-Pe-0.20)/SE con un valor p de. > pnorm(z0) [1] 0.004762777 Se considerarán las drogas equivalentes para. 3 El límite superior del intervalo de confianza para la diferencia es 0.152. > (Ps-Pe)+qnorm(1-0.05)*SE [1] 0.1516584 > (Ps-Pe)-qnorm(1-0.05)*SE [1] -0.02741594 El límite superior del intervalo de confianza no es menor que, por lo que no puede concluirse que la diferencia entre los productos sea inferior a 10%. 3 Este enfoque es diferente al método convencional del intervalo de confianza, en que se rechaza la hipótesis de nulidad, y se dice que los dos tratamientos son diferentes, si se encuentra el intervalo de confianza completamente por encima de la estadística de prueba, es decir, se rechaza cuando se observan grandes diferencias. 3 En la prueba de equivalencia se rechaza cuando se observan pequeñas diferencias. El CI indica cuáles son los valores de δ consistentes con los datos. Este intervalo de confianza puede interpretarse como la definición del menor valor que se elige para δ, y todavía rechazar que la hipótesis de nulidad de no equivalencia es. Valores mayores que tendrán un valor de p menor que, por lo tanto, se rechazará la hipótesis de nulidad y se concluirá equivalencia. Cualquier valor de δ menor que 0.152 favorece el no rechazo de la hipótesis de nulidad. La potencia de la prueba es. El menor valor de δ para que se concluyan equivalencias 348 CIENCIA UANL / AÑO 14, No. 3, JULIO - SEPTIEMBRE 2011

PETER B. MANDEVILLE también es el límite superior del intervalo de confianza a 95%. 3 Puede escribir una función que incorpora el código anterior: El tamaño de muestra necesario es: 6 BinomEquiv<-function(Rs,Ns,Re,Ne, delta, alpha =0.05){ Ps <- Rs/Ns Pe <- Re/Ne SE <- sqrt(ps*(1-ps)/ns+pe*(1-pe)/ne) z0 <- (Ps-Pe-delta)/SE p <- pnorm(z0) CL <- c((ps-pe)-qnorm(1-alpha)*se, (Ps-Pe)+qnorm(1- alpha)*se) print(list(ps=ps,pe=pe,delta=delta,alpha=alpha,z =z0,p=p,cl=cl)) } > BinomEquiv(Rs=85,Ns=100,Re=78,Ne=99,delta=0.10) $Ps [1] 0.85 $Pe [1] 0.7878788 Puede escribir una función que incorpora el código anterior: > NRBinomEquiv <- function(ps,pe,delta,alpha =0.05,beta=0.20){ n <- (qnorm(1-alpha)+qnorm(1-beta))^2*(ps*(1- Ps)+Pe*(1-Pe))/(Ps-Pe-delta)^2 n } Para será necesario > NRBinomEquiv(Ps=0.85,Pe=0.7878788,delta=0.10) [1] 1269.54 1270 repeticiones por grupo. Para será necesario $Delta [1] 0.1 > NRBinomEquiv(Ps=0.85,Pe=0.7878788,delta=0.20) [1] 95.8173 $Alpha [1] 0.05 $Z [1] -0.695857 $P [1] 0.2432592 $CL [1] -0.02741594 0.15165837 96 repeticiones por grupo. Referencias 1. http://www.illinoisstate.edu/~gcramsey/statotherpro.html 2. Peter B. Mandeville. 2011. Tips Bioestadisticos. Tema 25: Pruebas de equivalencia (parte 1). CIENCIA UANL / Vol. XIV, No. 1, enero marzo de 2011: 98-100. 3. Pamela Atherton-Skaff y Jeff Sloan. 1998. Design and Analysis of Equivalence Trials via the SAS System. Proceedings of the Twenty-Third Annual SAS Users Group International. Paper 219. March 22-25, 1998, Nashville, TN, USA. CIENCIA UANL / AÑO 14, No. 3, JULIO - SEPTIEMBRE 2011 349

TIPS BIOESTADÍSTICOS 4. R. Ihaka y R. Gentleman. 1966. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics Vol. 5, pag. 299-314. 5. R Development Core Team. 2011. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.r-project.org/. 6. William C. Blackwelder. 1982. Proving the Null Hypothesis in Clinical Trials. Controlled Clinical Trials 3:345-353. 350 CIENCIA UANL / AÑO 14, No. 3, JULIO - SEPTIEMBRE 2011