Práctica 4 TEOREMA CENTRAL DEL LÍMITE

Documentos relacionados
Práctica 3 DISTRIBUCIONES DE VARIABLES ALEATORIAS DISCRETAS

Distribuciones de Probabilidad.

Práctica 3: Distribuciones de Probabilidad Binomial, Poisson y Normal

Práctica 5 MÉTODOS DESCRIPTIVOS PARA DETERMINAR LA NORMALIDAD

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Estadística I Guión de la Práctica 2 Probabilidad y modelos probabilísticos; Introducción a la inferencia estadística

Variables aleatorias 1. Problema 1

ACTIVIDAD 2: La distribución Normal

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Práctica 2: Estadística Descriptiva (II)

Práctica 4: Variables Aleatorias y Simulación

Práctica de MODELOS DE PROBABILIDAD

MICROSOFT EXCEL PARA DIRECCIÓN FINANCIERA I. 1. Resolución de problemas de simulación de Montecarlo mediante el uso de la hoja de cálculo.

ESTADÍSTICA CON EXCEL

Figura 1. Generación de variables aleatorias.

Prácticas de Introducción a los Computadores Curso Hoja Gráficos: Hoja Regresión: ESPESOR 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 ESPESOR COSTES fij

Intervalos de confianza con STATGRAPHICS

VARIABLES ALEATORIAS CONTINUAS

Sujeto Grupo C.I. 1 A B A 98 4 A B 99. Sujeto TCMañ TCtar

Teorema Central del Límite. Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso F. San Segundo.

1. La Distribución Normal

Práctica de SIMULACIÓN

Objetivo. Conocer la forma de calcular las Medidas de Dispersión de una distribución con OpenOffice Calc CALC: MEDIDAS DE DISPERSIÓN

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

Tema 6. Variables aleatorias continuas

3 ANALISIS DESCRIPTIVO DE LOS DATOS

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

ANEXO.- DISTRIBUCIÓN BINOMIAL. DISTRIBUCIÓN NORMAL

Estadísticas y distribuciones de muestreo

PRÁCTICAS DE ESTADÍSTICA CON R

DOCUMENTO 2: DISTRIBUCIÓN DE PROBABILIDAD DISCRETA: LA DISTRIBUCIÓN BINOMIAL

1. Muestras aleatorias de las distribuciones usuales

Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias

Modelos de distribuciones discretas y continuas

6.3. Distribuciones continuas

Estadística con. Práctica 3: Probabilidad. Introducción. 1. Modelos discretos. M. Iniesta Universidad de Murcia

Estadistica II Tema 0. Repaso de conceptos básicos. Curso 2009/10

Tema 4: Probabilidad y Teoría de Muestras

Capítulo 13 Contrastes sobre medias Los procedimientos Medias y Prueba T

Y accedemos al cuadro de diálogo Descriptivos

Bioestadística. El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

Definición de probabilidad

Bioestadística. El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

APROXIMACIÓN A UNA DISTRIBUCIÓN NORMAL

Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

Tema 6. Variables aleatorias continuas. Distribución Normal

Ejercicio 1. Ejercicio 2

ESTADISTICA GENERAL. PRINCIPALES DISTRIBUCIONES CONTINUAS Profesor: Celso Celso Gonzales

ETSI de Topografía, Geodesia y Cartografía

TEMA 10 COMPARAR MEDIAS

( ) DISTRIBUCIÓN UNIFORME (o rectangular) 1 b a. para x > b DISTRIBUCIÓN DE CAUCHY. x ) DISTRIBUCIÓN EXPONENCIAL. α α 2 DISTRIBUCIÓN DE LAPLACE

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

Apuntes de Estadística

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

TH. DE CHEBYSHEV DISTRIB. NORMAL.

Distribuciones Continuas

Modelos de distribuciones discretas y continuas

ESTADÍSTICA DESCRIPTIVA

9.- Análisis estadísticos con R Commander

Tema 13: Distribuciones de probabilidad. Estadística

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

Tablas de Tarifas WhitePaper Abril de 2016

TEMA 2: DISTRIBUCIÓN DE PROBABILIDAD

Manipulando celdas. Te recomendamos iniciar Excel 2007 ahora para ir probando todo lo que te explicamos.

Capítulo. Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

INTRODUCCIÓN AL MANEJO DE STATGRAPHICS

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A.

Estadística Descriptiva Univariante

Tema 4: Probabilidad y Teoría de Muestras

Tema 7. Variables Aleatorias Continuas

REPASO DE ESTADÍSTICA DESCRIPTIVA

Técnicas Cuantitativas para el Management y los Negocios I

Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev

Variable Aleatoria Continua. Principales Distribuciones

PRÁCTICAS DE ESTADÍSTICA CON R

GRADO en INGENIERIA de TELECOMUNICACION (Sistemas de comunicaciones, audiovisuales y telemática)

Modelos de Probabilidad con Statgraphics

Manejo de las tablas

Estadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Departamento de Matemática Aplicada CÁLCULO COMPUTACIONAL. Licenciatura en Química (Curso ) Matrices Práctica 1

Discretas. Continuas

Práctica de Control Estadístico de Procesos Control por Variables

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

ACTIVIDAD 3: Intervalos de Confianza para 1 población

INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS

ENUNCIADO y SOLUCIONES. Problema 1

ALGUNAS CUESTIONES DESTACABLES EN INFERENCIA ESTADÍSTICA

Cálculo de probabilidad. Tema 3: Variables aleatorias continuas

DISEÑO DE PRESENTACIONES EN LA ENSEÑANZA. Diapositivas de diagrama

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

EXAMEN DE ESTADÍSTICA Septiembre 2011

DISTRIBUCIÓN NORMAL. Modelo matemático: f ( x ) = σ 2 π

Ordenar datos- Filtrar registros. Excel 2007

Open Office Calc. Elaboración de una tabla de valores de las áreas de la distribución normal

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.

GRADO de TELECOMUNICACIONES

Como usar Excel para resolver una regresión lineal usando la función predefinida estimacion.lineal.

Estadística. Generalmente se considera que las variables son obtenidas independientemente de la misma población. De esta forma: con

Variables aleatorias

Transcripción:

Práctica 4. Teorema Central del Límite 1 Práctica 4 TEOREMA CENTRAL DEL LÍMITE Objetivos: En esta práctica utilizaremos el paquete SPSS para ilustrar el Teorema Central del Límite. Además calcularemos el área de la cola de algunas funciones de distribución y las representaremos gráficamente. Índice: 1. Generación de muestras aleatorias 2. Área de la cola 3. Función de distribución 4. Teorema Central del Límite 5. Ejercicios

Práctica 4. Teorema Central del Límite 2 1. Generación de muestras aleatorias En este apartado consideraremos la generación de una muestra de una población con distribución conocida pero de la que no disponemos de datos. Por ejemplo, de una población con distribución Normal de media 20 y desviación típica 5 vamos a generar 100 datos. En primer lugar, necesitamos crear un nuevo banco de datos (Archivo/Nuevo/Datos), al que podemos llamar Normal. SPSS genera los datos de una determinada distribución y los sitúa en una columna con la longitud que tenga el banco de datos; es decir, el número de filas con datos que aparezcan en el Editor de datos. Dado que acabamos de crear el fichero, no contendrá ningún dato, por lo que la primera operación a realizar será el rellenar la primera columna con datos. Para ello basta con que nos situemos en la casilla correspondiente a la columna 1, fila 100 (Datos/Ir a Caso) e insertemos un número cualquiera. Seleccionamos Transformar/Calcular y nos aparece la ventana de calcular variables. En el campo Variable de destino, escribimos m1 como nombre de la variable que vamos a crear. De la lista de funciones que nos ofrece el SPSS, seleccionamos RV.NORMAL(media,desv_típ) y, con el puntero la situamos en el campo Expresión numérica. Vemos, entonces que en lugar de media y desv_típ aparecen unos interrogantes, que sustituiremos por los valores de la media y la desviación típica de la distribución Normal de la que pretendemos simular una muestra, en este caso, µ=20, σ=5: Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS genera una muestra que añade en la primera columna libre del editor de datos.

Práctica 4. Teorema Central del Límite 3 La siguiente tabla muestra algunas de las funciones que proporcionan un valor aleatorio de una distribución determinada. Los argumentos son los parámetros de la distribución. Podéis consultar la ayuda del SPSS para obtener una lista exhaustiva de todas las funciones disponibles. Expresión Descripción RV.BINOM(n,prob) Devuelve un valor aleatorio de la distribución binomial, con el número de intentos y el parámetro de probabilidad especificados. RV.EXP(forma) Devuelve un valor aleatorio de una distribución exponencial, con el parámetro de forma especificado RV.GEOM(prob) Devuelve un valor aleatorio de una distribución geométrica, con el parámetro de probabilidad especificado. RV.LNORMAL(a,b) Devuelve un valor aleatorio de la distribución lognormal, con los parámetros especificados. RV.NORMAL(media,d_típ) Devuelve un valor aleatorio de la distribución normal, con la media y la desviación típica especificadas. RV.T(gl) Devuelve un valor aleatorio de la distribución t de Student, con los grados de libertad gl especificados. RV.UNIFORM(mín,máx) Devuelve un valor aleatorio de la distribución uniforme, con el mínimo y el máximo especificados Ejercicio 1: Generar muestras de tamaño 100 para las distribuciones siguientes: Normal(0,1), Normal(2,4), t-student(10), Binomial(8,0.3) y Binomial(10,0.1) 2. Área de la Cola En este apartado vamos a ver cómo calcular el área de la cola de una distribución conocida. En concreto consideramos la expresión P(x a) siendo x una variable aleatoria y a un valor determinado. Utilizamos el mismo procedimiento que en apartado anterior. Seleccionamos Transformar/Calcular y nos aparece la ventana de calcular variables. En el campo Variable de destino, escribimos el nombre de la variable que vamos a crear. De la lista de funciones que nos ofrece el SPSS, consideramos las que comienzan por cdf, escogemos la que queramos y, con el puntero la situamos en el campo Expresión numérica. En la tabla siguiente se muestran algunas de las funciones que podemos utilizar: Expresión CDF.BINOM(cant,n,prob ) Descripción Devuelve la probabilidad acumulada de que el número de éxitos en los n intentos, con una probabilidad de éxito prob para cada uno, sea menor o igual que la cantidad cant

Práctica 4. Teorema Central del Límite 4 CDF.GEOM(cant,prob) CDFNORM(valorz) CDF.NORMAL(cant,med, dev_típ) CDF.T(cant,gl) CDF.UNIFORM(cant,mín, máx) Devuelve la probabilidad acumulada de que el número de intentos para obtener un éxito, cuando la probabilidad de éxito es la dada por prob, sea menor o igual que la cantidad cant Devuelve la probabilidad de que una variable aleatoria normal, con media 0 y desviación típica 1, sea menor que el valorz, el cual debe ser un valor numérico Devuelve la probabilidad acumulada de que un valor de la distribución normal, con la media y la desviación típica especificadas, sea menor que la cantidad cant. Devuelve la probabilidad acumulada de que un valor de la distribución t de Student, con los grados de libertad gl especificados, sea menor que la cantidad cant. Devuelve la probabilidad acumulada de que un valor de la distribución uniforme, con el mínimo y máximo especificados, sea menor que la cantidad cant. Por ejemplo para obtener el valor de P(x 3) para una variable x con distribución Normal(1,2), seleccionaremos la función CDF.NORMAL(cant,media,desv_típ) y reemplazaremos el primer campo por 3, el segundo por 1 y el tercero por 2. Es importante notar que el valor de P(x a) coincide con el de P(x < a) si la función de distribución es continua como en el caso de la Normal o la t de Student, pero no coincide si es discreta como en el caso de la Binomial. De manera similar podemos realizar el cálculo inverso al planteado; esto es, dado el valor del área de la cola p, obtener el valor de a tal que: P(x a)=p Para calcular el percentil 95 de una distribución Normal(1,2), seleccionamos Transformar/Calcular y en el campo Expresión numérica introducimos la expresión IDF.NORMAL(0.95,1,2). Notar que la función utilizada es similar a la anteriormente descrita salvo que comienza por IDF en lugar de CDF y que el primer argumento es p en lugar de a. Para obtener una lista de las funciones inversas disponibles en SPSS consultar la Ayuda en la ventana de Calcular Variable. Ejercicio 2: Obtener el valor de P(x 3), P(x 5) y P(x = 9) para una distribución Binomial de parámetros n =20 y p =0.3. Obtener el valor de P(x -1), P(x 1), P(x 2) y P(x >2) para una distribución Normal de parámetros media =2 y desviación típica =3. Obtener los percentiles 90, 5 y 50 de una distribución Normal(0,3).

Práctica 4. Teorema Central del Límite 5 3. Función de Densidad SPSS no permite obtener directamente una función de densidad. En este apartado aplicaremos el cálculo visto en el apartado anterior para obtener una representación gráfica de una función de densidad. Si, por ejemplo, deseamos obtener la representación de la función de densidad de una Normal(2,3) en el intervalo [-10, 10], generaremos primero una serie de valores en dicho intervalo. Veamos como generar 200 valores comenzando por el 9.9 y con incrementos de 0.1. Vamos a trabajar con 200 casos, así que introduciremos un número en la fila 200 para dimensionar el editor de datos. Seleccionamos Transformar/Calcular y aparece la ventana de calcular variables. En el campo Expresión numérica vamos a introducir una expresión para obtener los valores de a para los que queremos calcular la función de densidad. La variable $casenum proporciona para cada caso el número correspondiente; esto es, en la fila primera el 1.00 en la segunda el 2.00 y así sucesivamente. Para obtener los valores deseados en el rango [-10, 10] introduciremos la expresión: $ casenum 10 10 Obtenemos una variable a con los valores 9.90, -9.80,..., 9.90, 10. Entramos de nuevo en Transformar/Calcular e introducimos la siguiente expresión, donde lag(a) proporciona el valor de a en la fila anterior y el cociente sobre 0.1 nos da el promedio sobre la longitud del intervalo: (CDF.NORMAL(a,2,3) - CDF.NORMAL(lag(a),2,3)) / 0.1 Almacenamos el resultado en la variable p. Finalmente, para obtener la representación gráfica seleccionamos Gráficos/Líneas y la opción Valores individuales de los casos. Introducimos las variables a y p tal y como muestra la figura siguiente.

Práctica 4. Teorema Central del Límite 6 Ejercicio 3: Obtener la representación gráfica de la función de densidad de una distribución Normal(1,2). Obtener la representación gráfica de una distribución Binomial de parámetros n=20 y p =0.3 realizando los siguientes pasos: 1. Crear la variable a con los números enteros del 0 al 20 mediante $casenum 1 2. Crear la variable p con las probabilidades de x = a mediante CDF.BIN(a,20,0.3) - CDF.BIN(lag(a),20,0.3) 3. Obtener la representación gráfica mediante Gráficos/Barras 4. Teorema Central del Límite El objetivo de este apartado es ilustrar el teorema central del límite y la aproximación normal a la Binomial. Para ello seguiremos los siguientes pasos: 1. Generaremos 500 muestras de tamaño n = 10. 2. Calcularemos la media de cada muestra y consideraremos la distribución muestral de las 500 medias obtenidas. 3. Comprobaremos que la distribución de las medias se asemeja a una normal cuya media es la media de la población original y cuya desviación típica es la desviación típica de la población original dividida por la raíz cuadrada del tamaño de la muestra. 4.1. Generación de las Muestras Vamos a considerar una distribución Binomial con parámetros n = 20 y π = 0.4. En lugar de generar las 500 muestras de tamaño 10, vamos a generar 10 muestras de tamaño 500 y luego consideraremos las filas (en lugar de las columnas) obtenidas. Siguiendo las instrucciones del apartado 1, genera 10 muestras (m1 a m10) de tamaño 500 de la distribución Bi(20,0.4). La media y desviación típica de esta distribución son, respectivamente: nπ = 8 y nπ(1-π) = 2.1909. Una vez generadas, tendremos en el editor de datos 10 columnas que contienen un total de 5000 valores aleatorios de la distribución Binomial utilizada. Si los consideramos por columnas, tenemos 10 muestras de tamaño 500. Sin embargo los vamos a considerar por filas, por lo que tenemos 500 muestras de tamaño 10 de esa misma distribución. 4.2 Cálculo de las Medias Creamos una nueva variable, con nombre Medias, que calcule la media aritmética de las 10 variables que hemos creado antes (m1 a m10). Para ello seleccionamos

Práctica 4. Teorema Central del Límite 7 Transformar/Calcular, llamamos Medias a la Variable destino e introducimos en Expresión Numérica la siguiente expresión: o alternativamente: (m1+m2+m3+m4+m5+m6+m7+m8+m9+m10) / 10 mean(m1, m2, m3, m4, m5, m6, m7, m8, m9, m10) De esta forma obtenemos una variable Medias que contiene 500 valores, cada uno de los cuales es la media muestral de muestras de tamaño 10 de una población distribuida según la función Bi(20, 0.4). 4.3 Visualización de la Normalidad Con el objetivo de visualizar la normalidad vamos a representar el histograma de la variable Medias. Para ello seleccionamos Gráficos/Histograma con la opción Mostrar curva Normal. Obtenemos un gráfico como el siguiente: 70 60 50 40 30 20 10 0 10,25 10,00 9,75 9,50 9,25 9,00 8,75 8,50 8,25 8,00 7,75 7,50 7,25 7,00 6,75 6,50 6,25 Desv. típ. =,67 Media = 8,00 N = 500,00 MEDIAS Podemos comprobar cómo, aproximadamente, el histograma se ajusta a la curva normal. Podemos ver cómo la media y desviación típica obtenidas son muy similares a las teóricas que indica el teorema central del límite: nπ (1 π ) media = nπ = 8 desviación típica = = 0. 7 n Notar que hemos generado datos aleatorios por lo que los datos que tienes no coinciden exactamente con los de otro compañero y, por lo tanto, las gráficas tampoco serán exactamente iguales. Del mismo modo encontrarás algunas diferencias entre la gráfica que has obtenido y la que aparece en este texto.

Práctica 4. Teorema Central del Límite 8 5. Ejercicios 1. Repite los pasos de la sección 4 sobre 1000 muestras de tamaño 20 de una distribución Binomial(10, 0.8). 2. Análogamente para una Binomial(20, 0.1). 3. Calcular el área de la cola por debajo de x =0.5, 1, 2 y 0.75 de la t-student con 25 grados de libertad. Tiene sentido calcular el área para un valor de x negativo? 4. Calcular los percentiles 3, 10 y 30 de una t de Student con 15 grados de libertad. 5. Calcular P(-1 x 1.5) para la t de Student con 25 grados de libertad. 6. Calcular P(3 x 7) para la Binomial(15, 0.3) 7. Obtener la representación gráfica de una distribución Binomial(100,0.8) y de una función de densidad Normal(10,4). 8. Generar una muestra aleatoria de tamaño 10 de una distribución Normal(0,1). Construir el histograma correspondiente con la curva normal superpuesta. Se ajusta el histograma a la curva? Repetir para una muestra de tamaño 1000 y comentar los resultados. 9. Generar dos muestras de tamaño 10 de una distribución Normal(0,1), calcular y comparar sus medias y desviaciones típicas. Repetir para dos muestras de tamaño 1000 comentando los resultados.