UNIVERSIDAD DE MANAGUA Al más alto nivel SIMULACIÓN DE SISTEMAS Guía práctica #2 Pruebas estadísticas para números pseudo aleatorios Prof.: MSc. Julio Rito Vargas A. Grupo: Ingeniería Industrial Objetivos: o Conocer las pruebas estadísticas que deben aplicarse a un conjunto de números de números pseudo aleatorios antes de usarse para un modelo de simulación. o Aplicar las pruebas estadísticas de uniformidad y de independencia a un conjunto ri de números pseudo aleatorios. o Validar que el conjunto ri de números pseudo aleatorios realmente está conformado por números aleatorios o no; a un nivel de confianza alfa (α) usando pruebas estadísticas. I. Introducción: Para realizar una simulación se requiere números aleatorios en el intervalo (0,1), a los cuales se hará referencia como ri, es decir, una secuencia de ri ={ r1, r2 =, r3 =, r4 =,, rn } que contiene n números, todos ellos diferentes; n recibe el nombre de período o ciclo de vida del generador que creo la secuencia ri. Los ri constituyen la parte medular de la simulación de procesos estocásticos y generalmente se usan para generar el comportamiento de variables aleatorias, tanto continuas como discretas. De Debido a que no es posible generar números realmente aleatorios es necesario consideraremos los ri como números pseudo aleatorios, generados por medios de algoritmos determinísticos que requieren parámetros de arranque. Para simular el comportamiento de una o más variables aleatorias es necesario contar con un conjunto suficientemente grande de ri que permita, por ejemplo que la secuencia tenga al menos un periodo de vida de n=2 31 =2, 174, 483, 648. De acuerdo con L Ecuyer una secuencia de ri con período de vida n=2 31 es pequeña; de hecho, incluso una secuencia de ri que contenga un ciclo de vida de n=2 64 se Julio Rito Vargas Pág. 1
considera pequeño. En la actualidad contamos con generadores de y procesadores capaces de construir una secuencia ri con periodo de vida de n=2 200. Usted se preguntará por que debemos una secuencia grande de números aleatorios ri suficientemente grandes. Lo cual ilustramos con el siguiente ejemplo. Suponga que queremos simular que tiene 5 cajeros en paralelo, cada uno de los cuales atiende aproximadamente 50 clientes diarios. Para simular el tiempo de atención se requiere un generador de variable aleatoria en función de ri por ejemplo Ti=5+2ri, expresado en minutos para toda i=1,2,3,,n. Si simulamos el tiempo de atención de manera aislada, es decir sin considerar el tiempo transcurrido desde la llegada de éstos, serán necesarios 5x50=250 números ri para similar un día; si deseáramos simular 5 días se necesitan 250x5=1250 ri. Ahora bien, si consideramos el tiempo desde la llegada de los clientes, precisaríamos de 250 ri para simular el tiempo transcurrido desde la llegada al banco de los 250 clientes por día y 250x5 = 1250 ri para simular el correspondiente al total atendidos durante 5 días. Por lo tanto se requieren 2500 números pseudo aleatorios ri para simular la operación del banco durante 5 días. Como los resultados no pueden basarse en una sola simulación del sistema; por lo el contrario es necesario realizar varias réplicas de la misma, corriendo cada una de ellas con números pseudo aleatorios diferentes. Retomando el ejemplo del banco, simular 5 días otra vez significa que necesitamos 2500 ri para realizar la simulación del sistema de atención al cliente con dos réplicas. Usted se podrá imaginar cuántos números ri serán necesarios para simular la operación del banco durante 9 réplicas, o cuántos números ri se requieren para simular un sistema productivo durante un año, con varias líneas de producción y cada línea de producción con varias estaciones y cada estación con uno o más procesos. En la guía número 3 aprenderemos a generar números pseudo aleatorios basados en varios algoritmos; por ahora vamos a considerar que esos números ya los hemos obtenidos requerimos si son útiles para ser usados para un modelo de simulación. Pruebas estadísticas para los números pseudo aleatorios Julio Rito Vargas Pág. 2
A continuación se analizará las pruebas estadísticas básicas que se emplean generalmente para determinar si un conjunto de números pseudo aleatorios entre 0 y 1 cumplen con las propiedades básicas de independencia y uniformidad. El objetivo, otras palabras, es validar que el conjunto ri realmente está conformado por números aleatorios. Es importante mencionar que las pruebas que se mencionaran no son únicas. Pruebas de Uniformidad: Una de las pruebas de datos más importantes que debe cumplir un conjunto de números ri es de uniformidad. Para comprobar su acatamiento se han desarrollados pruebas estadísticas tale como las pruebas Chi-cuadradas y de Kolmogorov Smirnov. En cualquiera de ambos casos, para probar la uniformidad de los números de un conjunto ri es necesario formular las siguientes hipótesis: H0: ri U(0,1) Los números son uniformes. H1: ri no son uniformes. o Prueba Chi-cuadrada. La prueba Chi-cuadrada busca determinar si los números del conjunto ri se distribuyen uniformemente en el intervalo (0,1). Para llevar a cabo esta prueba es necesario dividir el intervalo (0,1) en m subintervalos, en donde es recomendable m= n. Posteriormente se clasifica cada número pseudo aleatorio del conjunto ri en los m intervalos. A la cantidad de números ri que clasifican en cada intervalo se le denomina frecuencia observada (Oi), y la cantidad de de números ri que se espera encontrar en cada intervalo se le llama frecuencia esperada (Ei); tericamente la ri es igual a n/m. A partir de los valores Oi y Ei se determina el estadístico m X o 2 = (E i O i ) 2 i=1 Si el valor del estadístico X o 2 es menor que el valor de X α,m 1 2, entonces no se puede rechazar que el conjunto de datos ri sigue una distribución uniforme. En caso contrario, se rechaza que ri sigue una distribución uniforme. E i Julio Rito Vargas Pág. 3
o Prueba Kolmogorov - Smirnov Propuesta por Kolmogorov y Smirnov, ésta es una prueba estadística que también nos sirve para determinar si un conjunto ri cumple la propiedad de uniformidad. Es recomendable aplicarla en conjuntos ri pequeños, por ejemplo n < 20. El procedimiento es el siguiente. 1. Ordene de menor a mayor los número ri r1 r2 r3 rn 2. Determine los valores D +, D - y D con las siguientes ecuaciones. D + = máx 1<i<n { i n r i} D = máx 1<i<n {r i i 1 n } D = máx {D +, D } 3. Determinar el valor crítico D α,n de acuerdo con la tabla de valores críticos de Kolmogorov-Smirnov para un grado de confianza α y según el tamaño de la muestra n. 1. Si el Valor D es mayor que el valor crítico D α,n se concluye que los números del conjunto ri, no siguen una distribución uniforme; de lo contrario se dice que no se ha detectado diferencia significativa entre la distribución de los números del conjunto ri y la distribución uniforme. (Nota: ver ejemplo de esta prueba en la página 36 del libro de Simulación y análisis de sistemas con Promodel) o Pruebas de Independencia Recuerde que las dos propiedades más importantes que deben satisfacer los números de un conjunto ri son uniformes e independientes. Hemos comentados anteriormente dos pruebas para determinar si los números ri son uniformes. A continuación hablaremos de las pruebas estadísticas que tratan de corroborar si los números en el intervalo (0,1) son independientes o en otras palabras, si parecen aleatorios. H0: los números del conjunto ri son independientes. H1: los números del conjunto ri no son independientes. Julio Rito Vargas Pág. 4
Prueba de corridas o Julio Rito Vargas Pág. 5
Prueba de Poker Julio Rito Vargas Pág. 6
ACTIVIDAD PRÁCTICA II. Cálculos para la prueba estadística Chi-cuadrada. Julio Rito Vargas Pág. 7
Intervalos Frecuencia observada (OI) Frecuencia esperada (Ei=n/m) (Oi - Ei) (Oi - Ei) 2 (Oi - Ei) 2 /Ei 2 El Valor teórico de X 0.95,9 =16.919 este valor debe compararlo con lo que resulte de la tabla anterior. 9 2 ( oi ei ) x e i 0 i 2 Conclusión; el conjunto de números xi analizados según la prueba estadística Chicuadrada evidencia que III. Prueba de Independencia Realice la prueba de Corrida y Poker. Julio Rito Vargas Pág. 8
Julio Rito Vargas Pág. 9
PARA ENTREGAR: DETERMINE SI EL CONJUNTO DE NÚMEROS PSEUDO ALEATORIOS SON UNIFORMES E INDEPENDIENTES. USE LA PRUEBAS: CHICUADRADA Y POKER. Julio Rito Vargas Pág. 10