La simulación de Montecarlo en la enseñanza de la Estadística. Ramón Sebastián Salat Figols 1

Documentos relacionados
Contraste de Hipótesis

PROGRAMA DE CURSO. Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT

PROGRAMA DE CURSO. Horas de Trabajo Personal Horas de Cátedra. Básica. Resultados de Aprendizaje

CAPITULO 8 MUESTRAS ALEATORIAS Y NUMEROS ALEATORIOS

Teorema Central del Límite (1)

Elementos de probabilidad e inferencia estadística en el seguro

Fecha de elaboración: 2003 Fecha de última actualización: F1232 Probabilidad y Estadística 1/9

Conceptos Básicos de Inferencia

UNIDAD 4. INFERENCIA ESTADÍSTICA. Prof. Eliana Guzmán U. Semestre A-2015

RESUMEN PROGRAMACIÓN ESTADÍSTICA II. 2. Calcular permutaciones, variaciones y combinaciones.

Folleto de Estadísticas. Teoría del 2do Parcial

Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.

07 Estimación puntual e introducción a la estadística inferencial

Técnicas Cuantitativas para el Management y los Negocios I

Estadística Inferencial. Resúmen

Tema 5 Algunas distribuciones importantes

Caso 105. Tamaño de muestra y potencia de una prueba. Diseño de experimentos. Jesús López Fidalgo

Estadística Clase 3. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Tema 6 Algunas distribuciones importantes Hugo S. Salinas

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población

Estadística Clase 4. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

SIMULACIÓN EN EXCEL DE VARIABLES ALEATORIAS DISCRETAS

Probabilidad Condicional

1 CÁLCULO DE PROBABILIDADES

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Problemas de Estimación de una y dos muestras

Estimación de Parámetros.

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

Diseño de experimentos Hugo Alexer Pérez Vicente

EJERCICIOS DE PRUEBA DE HIPOTESIS

Matemáticas aplicadas a las Ciencias Sociales II

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

Nota de los autores... vi

DISTRIBUCIÓN N BINOMIAL

Cómo introducir Prueba de Hipótesis para una media, utilizando experimentos en el salón de clase.

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Estudios Superiores Aragón Ingeniería Mecánica Programa de Asignatura

UNIDAD IV PROBABILIDAD

Matemáticas aplicadas a las Ciencias Sociales II

Esta proposición recibe el nombre de hipótesis

El procedimiento de decisión incluye la posibilidad de equivocarnos, por lo tanto nuestra conclusión bien puede ser errónea

Inferencia estadística

CM0244. Suficientable

Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA

4. NÚMEROS PSEUDOALEATORIOS.

Información general. Obligatoria básica o de fundamentación X. Obligatoria profesional. Horas de trabajo independiente del estudiante

INDICE. Capitulo Uno.

UNIVERSIDAD AUTÓNOMA DE ZACATECAS PLAN ANALÍTICO

Estadística Inferencia Estadística

INFERENCIA ESTADÍSTICA MUESTRAL TEMA 2: ESTIMACIÓN POR INTERVALO

Algunas observaciones sobre las inconsistencias del uso de la aproximación normal en intervalos de confianza cuando las observaciones son Bernoullis

5. LAS DISTRIBUCIONES MÁS IMPORTANTES

Régimen de Cursada: Semestral Carácter): Obligatoria Correlativas: Matemática II Profesor/es: María B. Pintarelli Hs. semanales : 6 hs.

Conceptos Básicos de Inferencia

INTRODUCCION A LA SIMULACION DE MODELOS. Simulación es la descripción de un sistema a través de modelos que se pueden aplicar a varias disciplinas.

VARIABLES ALEATORIAS

PLAN DE CURSO DIDACTICA DE LA ESTADISTICA CÓDIGO DEL CURSO TOTAL HORAS DEL CURSO 96 HORAS TRABAJO PRESENCIAL 32

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A.

10/03/2015. Ángel Serrano Sánchez de León

PRECISIÓN DE SISTEMAS DE MEDICIÓN DESTRUCTIVOS CON MEDICIONES SIMULTÁNEAS.

PROGRAMA ANALÍTICO DE ASIGNATURA

Contrastes basados en el estadístico Ji Cuadrado

Estadística. Contrastes para los parámetros de la Normal

UNIDAD III. ESTADÍSTICA Y PROBABILIDAD. Tema. Probabilidad

INSTITUTO POLITÉCNICO NACIONAL SECRETARÍA ACADÉMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

Estadísticas Pueden ser

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

EXPOSICIÓN UNIDAD II

Estadística I Tema 5: Introducción a la inferencia estadística


Planificaciones Probabilidad y Estadística A. Docente responsable: MANCILLA AGUILAR JOSE LUIS. 1 de 5

CUADERNILLO DE TRABAJO IV DE LA MATERIA DE PROBABILIDAD. CAPÍTULO V: INFERENCIA ESTADÍSTICA PARA UNA SOLA MUESTRA

Adriana Pérez y Gerardo Cueto Facultad de Ciencias Exactas y Naturales, Universidad de Buenos Aires

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE CONTADURÍA Y ADMINISTRACIÓN TÉCNICAS DE ESTADÍSTICA MOTIVANTE

ANÁLISIS DE REGRESIÓN

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Planificaciones Probabilidad y Estadística A. Docente responsable: MANCILLA AGUILAR JOSE LUIS. 1 de 6

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

Facultad de Ciencias Sociales - Universidad de la República

1. OBJETIVOS: Universidad de Belgrano Facultad de Ingeniería y Tecnología Informática. Página 1/6

DEPARTAMENTO: Matemáticas NOMBRE DEL CURSO: Probabilidad y Estadística CLAVE: 1016M ACADEMIA A LA QUE PERTENECE: Probabilidad y Estadística

AZAR, PROBABILIDAD Y GEOGEBRA

Tema 14: Inferencia estadística

Tema 14: Inferencia estadística

Aproximación frecuencialista de la Probabilidad

Tema 9: Contraste de hipótesis.

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Análisis de Datos en Física de Partículas

PROTOCOLO. Fechas Mes/año Clave Semestre 4to Elaboración 01/08/05 Nivel Licenciatura X Maestría Doctorado

ÍNDICE. Prefacio... xi

Test χ 2 de Bondad de Ajuste y Test de Independencia

PE - Probabilidad y Estadística

CONTRASTE DE HIPÓTESIS

Transcripción:

La simulación de Montecarlo en la enseñanza de la Estadística. Ramón Sebastián Salat Figols 1 Introducción La formación en estadística, actualmente es de gran importancia, ya que en el mundo moderno muchos conocimientos de importancia se presentan en forma estadística. Es necesario dar la importancia que merecen los conceptos relativos a la inferencia estadística. Las actividades colectivas que deban desarrollar los estudiantes, han de promover la evolución para los significados de las palabras tales como probabilidad de un evento, estimación puntual de parámetros, pruebas de hipótesis y aproximación por probabilidad. Para ello, es necesario diseñar contextos de exploración de dichos términos, efectivos e independientes de una excesiva formación en probabilidad. Por ejemplo, si se quiere explorar los conceptos de pruebas de hipótesis en el contexto de la realización de lanzamientos de una moneda, es posible construir exploraciones sin conocer necesariamente la distribución de probabilidades y las propiedades de una distribución binomial, esto es, empleando simulación. Estos contextos de actividades serán el soporte indispensable de los significados de los términos mencionados. En este trabajo, se presentan varios ejemplos de cómo utilizar simulación para crear algunos de éstos contextos. Se presentan propuestas para los conceptos de probabilidad de un evento, estimación puntual de parámetros, pruebas de hipótesis y teorema del límite central. En todos los casos se usaron programas en lenguaje Python y para todos ellos y muchos otros más, es posible crear un programa para que el estudiante pueda explorar estos conceptos por sí mismo. Objetivos El objetivo de este trabajo es mostrar que, empleando simulación, es posible crear contextos de exploración de conceptos fundamentales de estadística, sin requerir una excesiva preparación previa de probabilidad, que promuevan la creación de significados indispensables en la formación estadística de los estudiantes. 1 Escuela Superior de Física y Matemáticas del Instituto Politécnico Nacional.

Marco teórico Durante el proceso educativo, dentro y fuera de la escuela, se van modificando los significados de las palabras a través de la acción y la interacción social (Vigotsky, 2001); de manera que el significado que tiene para las personas cada palabra, depende de la historia de su interacción social y de las actividades realizadas e interiorizadas. Por esta razón, es de la mayor importancia dentro del proceso educativo, crear contextos (sociales) en los que se desarrollen actividades verdaderamente pertinentes a la construcción de significados necesarios dentro del proceso. La riqueza y pertinencia de dichos contextos, determina en gran medida el resultado educativo. Las dificultades en la adquisición de los conceptos fundamentales de estadística ya han sido estudiadas (Batanero, 2014). También existen propuestas estudiadas en clase acerca de cómo emplear simulación para promover la comprensión de conceptos fundamentales de estadística (Romeu, 1986). Desarrollo. A continuación se desarrollarán varios ejemplos de cómo utilizar simulación en computadora para crear contextos de exploración de conceptos que promuevan su comprensión en base a la actividad individual y colectiva. Los ejemplos se basan en programas escritos en Python. A manera de ejemplo, se presenta el código de uno de éstos programas. 1. La interpretación frecuencial de la probabilidad. Para introducir por primera vez el concepto de probabilidad se puede recurrir a la interpretación frecuencial, es decir, identificar la probabilidad de ocurrencia de un evento como la fracción de veces en que ocurre un evento en la repetición de un número grande de veces de un experimento aleatorio. Por ejemplo, se puede considerar el experimento aleatorio de lanzar una moneda al aire y observar la proporción de resultados águila. Por supuesto puede realizarse el experimento, lanzando una moneda al aire, pero el número de lanzamientos que pueden realizarse, será una limitación para observar la tendencia. Si se usa simulación, fácilmente podemos considerar números de lanzamientos superiores al millón. En la Fig. 1, se muestran los resultados de simular cien millones de lanzamientos.

Figura 1. Lanzamiento de una moneda. En la Fig. 1, se observa claramente una tendencia en la proporción del número de águilas entre el número de lanzamientos, pero ésta tendencia tiene que ser conceptualizada en congruencia con la teoría de probabilidades. Si N a y N son el número de lanzamientos que resultaron águila y el número total de lanzamientos, respectivamente, entonces: lim P ( N A N N 1 2 ) = 0 Esta ecuación puede deducirse fácilmente empleando la desigualdad de Chevyshev. Como puede observarse, la convergencia es en probabilidad. Esta cuestión puede convertirse en un tema de discusión en clase entre los alumnos y con el profesor, de tal manera, que los resultados de la simulación pueden aprovecharse para analizar colectivamente, cuestiones teóricas profundas. 2. La estimación de parámetros. Supóngase que se quiere estimar la proporción de focos defectuosos producidos por una fábrica. Para ello, se selecciona una muestra de mil focos y se observa la proporción de focos defectuosos en dicha muestra; es decir, nuestra estimación de la proporción de focos defectuosos, se calcula a partir de la muestra, dividiendo el número de focos defectuosos en la muestra entre el número total de focos. Pero, si se toman varias muestras de mil focos, se observará que el estimador varía. Suponiendo que se sabe que la fracción de defectuosos es de 0.02, se puede simular el valor del estimador para, por ejemplo, varias muestras de tamaño 1,000 y 10,000. La distribución del estimador se muestra en la Fig. 2, para ambos casos.

Figura 2. Estimación puntual. Como usualmente no se conoce la proporción de focos defectuosos, su estimación siempre estará sujeta a una cierta incertidumbre. La propia figura sugiere que aumentando el tamaño de la muestra, se puede reducir la incertidumbre. 3. Pruebas de hipótesis. Supóngase que se quiere decidir si una moneda es honesta o no (es decir, si la probabilidad de obtener águila es igual a la probabilidad de obtener sol ), lanzándola 20 veces y observando el número de águilas. A la hipótesis de que la moneda es honesta la llamamos hipótesis nula y se acostumbra a denotar por H 0. La regla de decisión que se aplica es la siguiente: Si el número de águilas es menor que 6 o mayor que 14, se rechazará la hipótesis nula. Esta regla de decisión conlleva dos tipos de error, uno llamado error tipo I, que consiste en rechazar H 0 dado que H 0 sea cierta y otro, llamado error tipo II, que consiste en aceptar H 0, dado que H 0 sea falsa. Por medio de simulación, se puede estimar la probabilidad de cometer el error tipo I. Se simulan 1,000,000 secuencias de 20 lanzamientos suponiendo H 0 verdadera, esto es, suponiendo que la probabilidad de obtener águila sea 0.5 y calculando la proporción de secuencias en las cuales se rechaza H 0, o sea, la proporción de secuencias en las que el número de águilas sea menor que 6 o mayor que 14. A continuación se muestra el código del programa escrito en lenguaje Python:

from random import random n=20 nr=1000000 cuenta=0 for i in range(nr): ag=0 for j in range(n): if random()<0.5: ag=ag+1 if ag<6 or ag>14: cuenta=cuenta+1 print(cuenta/nr) En este programa, el número de águilas de las secuencias de 20 lanzamientos, se almacena en la variable ag y el número de secuencias para las cuales se obtuvo un número de águilas mayor que 14 o menor que 6, se almacena en la variable cuenta. La probabilidad de cometer error tipo I estimada por simulación es 0.041. Este resultado significa que si repitiéramos muchas veces la aplicación de la regla, aproximadamente en un 4.1% de las veces se cometería el error tipo I; en éstas 4.1% de las veces, se estaría rechazando H 0, aunque ésta sea verdadera. A la probabilidad de cometer error tipo I se le llama nivel de significancia de la prueba. Para el cálculo de cometer error tipo II, hay que considerar que si H 0 es falsa, la probabilidad p de obtener águila puede ser cualquier valor entre 0 y 1, excepto 0.5 y calcular para cada uno de éstos valores, la probabilidad de que el número de águilas tome valores entre 5 y 15. Por lo tanto, el error tipo II es una función de p. En la Fig. 3, se muestra al error tipo II como una función de p. 4 Teorema del límite central. La suma de n variables aleatorias independientes e igualmente distribuidas, cuando n es grande, sigue una distribución normal. Una actividad interesante para hacer a este teorema plausible es simular valores para una variable aleatoria formada por la suma de n variables aleatorias independientes e igualmente distribuidas. Por ejemplo, puede considerarse la suma de 50 variables aleatorias uniformemente distribuidas en [0,1]. En la Fig. 4, se muestra la distribución de frecuencias de ésta variable y de la función de densidad de la normal correspondiente.

Figura 3. Error tipo II. Del mismo modo es posible simular los casos en que las variables aleatorias siguen otras distribuciones, diferentes de la uniforme. También es posible explorar la calidad de la aproximación en términos de la variación del número de variables consideradas. Figura 4

Conclusiones. La simulación en computadora es un recurso importante que posibilita la creación de contextos de exploración de conceptos fundamentales de estadística, sin requerir una formación amplia de probabilidad. Existen dos formas de utilizar este recurso: Uno, es comprometiendo al estudiante con la elaboración de programas de computadora; otro, es utilizar programas previamente elaborados para explorar los conceptos. Hoy en día, puede ser recomendable la primera alternativa o ambas. Las representaciones gráficas y numéricas, obtenidas por la ejecución de los programas, también son un recurso importante, para lograr diferentes representaciones de los conceptos. Un enfoque como el presentado, puede ser un auxiliar útil al iniciar un curso de estadística, como una manera de introducir las ideas fundamentales de la materia. Referencias Batanero, C. (2015). Understanding randomness: Challenges for research and teaching. Ninth Congress of European Research in Mathematics Education. Prague: 2015. Romeu, J.L. (1986). Teaching engineering statistics with simulation: a classroom Experience. The Statistician 35, pp. 441-447. Vigotsky, Lev S. (2001). Pensamiento y lenguaje. Ciudad de México: Ediciones Quinto Sol.