Distribuciones de probabilidad continua

Documentos relacionados
Discretas. Continuas

Capítulo. Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

1. La Distribución Normal

5. DISTRIBUCIOES COTIUAS DE PROBABILIDAD

Técnicas Cuantitativas para el Management y los Negocios I

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Distribuciones Continuas de. Probabilidad. Dr. Víctor Aguirre Torres, ITAM. Guión 7.

Prof. Eliana Guzmán U. Semestre A-2015

VARIABLES ALEATORIAS CONTINUAS

La Distribución Normal. La Distribución Normal. Características de la distribución de probabilidad normal

DISTRIBUCIÓN NORMAL. Modelo matemático: f ( x ) = σ 2 π

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

( x) Distribución normal

Tema 4: Modelos probabilísticos

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

Teorema del límite central

Distribución normal estándar. Juan José Hernández Ocaña

Tema 5 Algunas distribuciones importantes

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Tema 4: Probabilidad y Teoría de Muestras

Modelos de distribuciones discretas y continuas

Teorema Central del Límite. Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso F. San Segundo.

Unidad IV. Una variable aleatoria X es continua si su función de distribución es una función continua.

Tema 6. Variables aleatorias continuas. Distribución Normal

DISTRIBUCION JI-CUADRADA (X 2 )

Estadística para la toma de decisiones

EJERCICIOS DISTRIBUCIONES MUESTRALES

Algunas Distribuciones Estadísticas Teóricas. c) Relación entre la Distribuciones de Poisson y Exponencial.

VARIABLES ALEATORIAS CONTINUAS 1º Bto. CC.SS.

LECTURA 03: DISTRIBUCIÓN T STUDENT Y DISTRIBUCIÓN CHICUADRADO TEMA 6: DISTRIBUCION T STUDENT. MANEJO DE TABLAS ESTADISTICAS.

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

Estadística y Probabilidad

Sección. Aplicaciones de la Distribución de probabilidad normal. Pearson Prentice Hall. All rights reserved

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

Algunas Distribuciones EstadísticasTeóricas. Aproximación de la Distribución Binomial por la Distribución de Poisson

Distribuciones de Probabilidad

Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio

Definición Se dice que una variable aleatoria X es continua si su conjunto de posibles valores es todo un intervalo (finito o infinito) de números

Tema 6: Modelos probabilísticos

Estadísticas Elemental Tema 3: Describir, Explorar, y Comparar Data

PROBABILIDAD Y ESTADÍSTICA. Sesión 6 (A partir de tema 5.9)

TH. DE CHEBYSHEV DISTRIB. NORMAL.

Definición de probabilidad

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

GENERACION DE NUMEROS ALEATORIOS Y VARIABLES ALEATORIAS

Probabilidades: Variables aleatorias continuas. Estadística Prof. Tamara Burdisso

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Tema 6. Variables aleatorias continuas

Análisis de Datos y Métodos Cuantitativos para la Toma de Decisiones 7ma versión MGM

VARIABLES ALEATORIAS CONTINUAS

ESTADÍSTICA INFERENCIAL

Tema 7. Variables Aleatorias Continuas

Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010

Variable Aleatoria Continua. Principales Distribuciones

CAPITULO 6 DISTRIBUCIONES MUESTRALES

ESTADÍSTICA INFERENCIAL. Sesión 6: Distribuciones de probabilidad para variables aleatorias continuas

UNIDAD Nº 4 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

CORPORACION UNIFICADA NACIONAL DE EDUCACION SUPERIOR CUN DEPARTAMENTO DE CIENCIAS BASICAS: MATEMATICAS

CAPÍTULO 6: VARIABLES ALEATORIAS

Cap. Distribuciones de. probabilidad. discreta. Distribuciones de probabilidad. discreta Pearson Prentice Hall. All rights reserved

UNIVERSIDAD DE MANAGUA Al más alto nivel

3 ANALISIS DESCRIPTIVO DE LOS DATOS

MATEMÁTICAS APLICADAS A LAS CC. SS. I

Ms. C. Marco Vinicio Rodríguez

Inferencia con una variable Tema 2

Distribución de la probabilidad normal

Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev

Estadística Clase 2. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

( ) DISTRIBUCIÓN UNIFORME (o rectangular) 1 b a. para x > b DISTRIBUCIÓN DE CAUCHY. x ) DISTRIBUCIÓN EXPONENCIAL. α α 2 DISTRIBUCIÓN DE LAPLACE

Teoría de la decisión

OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 5 Simulación

Examen Final A Total puntos: /100. Buena suerte y éxito! Utilice la siguiente información para responder a las preguntas 1 al 5.

DISTRIBUCION "F" FISHER

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

La distribución de Probabilidad normal, dada por la ecuación:

Curso de Probabilidad y Estadística

Grupo 23 Semestre Segundo examen parcial

8 Resolución de algunos ejemplos y ejercicios del tema 8.

Distribución Normal Curva Normal distribución gaussiana

CM0244. Suficientable

Evaluación económica de proyectos de inversión utilizando simulación

Estadística Aplicada

Análisis de Datos y Probabilidad Grado 9

Distribuciones de probabilidad Discretas

Distribución Muestral.

Cálculo y EstadísTICa. Primer Semestre.

La distribución normal

Distribuciones Continuas

Estadística Inferencial

Cuáles son las características aleatorias de la nueva variable?

METODOS ESTADÍSTICOS

Estadistica II Tema 0. Repaso de conceptos básicos. Curso 2009/10

C L A S E N 5 I N S E M E S T R E O T O Ñ O,

Representación gráfica de esta función de densidad

Transcripción:

CAPÍTULO 6 Distribuciones de probabilidad continua CONTENIDO ESTADÍSTICA EN LA PRÁCTICA: PROCTER & GAMBLE 6.1 DISTRIBUCIÓN DE PROBABILIDAD UNIFORME El área como medida de la probabilidad 6.2 DISTRIBUCIÓN DE PROBABILIDAD NORMAL Curva normal Distribución de probabilidad normal estándar Cálculo de probabilidades para cualquier distribución de probabilidad normal El problema de Grear Tire Company 6.3 APROXIMACIÓN NORMAL DE LAS PROBABILIDADES BINOMIALES 6.4 DISTRIBUCIÓN DE PROBABILIDAD EXPONENCIAL Cálculo de probabilidades para la distribución exponencial Relación entre las distribuciones de Poisson y exponencial

Estadística en la práctica 233 ESTADÍSTICA en LA PRÁCTICA PROCTER & GAMBLE* CINCINNATI, OHIO Procter & Gamble (P&G) produce y comercializa detergentes, pañales desechables, fármacos que no requieren receta médica, dentífricos, jabones de tocador, enjuagues bucales y toallas de papel, entre otros artículos. En todo el mundo, P&G tiene la marca líder en más categorías de productos de consumo que cualquier otra empresa. Desde su fusión con Gillette, también fabrica y comercializa rastrillos, navajas de afeitar y muchos otros artículos para el cuidado personal. Como líder en la aplicación de métodos estadísticos en la toma de decisiones, P&G emplea a personas con diversas formaciones académicas: ingenieros, expertos en estadística, investigadores de operaciones y administradores de empresas. Las principales tecnologías cuantitativas en que estos especialistas aplican sus conocimientos son las decisiones probabilísticas y el análisis de riesgos, la simulación avanzada, la mejora de la calidad y los métodos cuantitativos (por ejemplo, programación lineal, análisis de regresión y análisis de probabilidad). La División de Productos Químicos Industriales de P&G es un proveedor importante de alcoholes grasos derivados de sustancias naturales como el aceite de coco y el petróleo. La división quería conocer los riesgos económicos y las oportunidades de ampliar sus instalaciones de producción de alcoholes grasos, por lo que solicitó la ayuda de los expertos de P&G en decisiones probabilísticas y análisis de riesgos. Después de estructurar y modelar el problema, se determinó que la clave de la rentabilidad radicaba en la diferencia entre los costos de las materias primas derivadas del petróleo y del coco. No era posible determinar los costos futuros, pero los analistas pudieron aproximarlos utilizando las variables aleatorias continuas siguientes. y x precio del aceite de coco por libra de alcoholes grasos y precio de la materia prima derivada del petróleo por libra de alcoholes grasos Como la clave de la rentabilidad radicaba en la diferencia entre estas dos variables aleatorias, se empleó una tercera Algunos de los muchos productos conocidos de Procter & Gamble. Robert Sullivan/AFP/Getty Images. variable, d x y, en el análisis. Se entrevistó a varios expertos para determinar las distribuciones de probabilidad para x y y. A su vez, esta información se utilizó para elaborar una distribución de probabilidad de la diferencia en los precios d. Esta distribución de probabilidad continua mostró una probabilidad de 0.90 de que la diferencia en los precios fuera de $0.0655 o menos y una probabilidad de 0.50 de que esta diferencia fuera de $0.035 o menos. Además, sólo había una probabilidad de 0.10 de que tal diferencia fuera de $0.0045 o menos. La División de Productos Químicos Industriales pensó que para llegar a un consenso era fundamental cuantificar el efecto de las diferencias en los precios de las materias primas. Las probabilidades obtenidas se usaron en un análisis de sensibilidad de tales diferencias. El análisis reveló información suficiente para fundamentar una recomendación a la gerencia. El uso de las variables aleatorias continuas y sus distribuciones de probabilidad ayudó a P&G en el análisis de los riesgos económicos asociados con la producción de alcoholes grasos. Al leer este capítulo, usted comprenderá las variables aleatorias continuas y sus distribuciones de probabilidad, incluida una de las más importantes en la estadística: la distribución normal. * Los autores agradecen a Joel Kahn, de Procter & Gamble, por proporcionar este artículo para Estadística en la práctica. Las diferencias en los precios establecidas aquí se modificaron para proteger los datos confidenciales.

234 Capítulo 6 Distribuciones de probabilidad continua En el capítulo anterior se estudiaron las variables aleatorias discretas y sus distribuciones de probabilidad. Este capítulo se dedica al estudio de las variables aleatorias continuas; en particular, se abordarán tres distribuciones de probabilidad continua: uniforme, normal y exponencial. Una diferencia fundamental entre las variables aleatorias discretas y las continuas radica en la manera de calcular las probabilidades. Para las primeras, la función de probabilidad f (x) proporciona la probabilidad de que la variable aleatoria asuma un valor particular. Con las segundas, el homólogo de la función de probabilidad es la función de densidad de probabilidad, que también se denota por medio de f (x). La diferencia estriba en que la función de densidad de probabilidad no proporciona las probabilidades directamente. Sin embargo, el área bajo la gráfica f (x) que corresponde a un intervalo dado representa la probabilidad de que la variable aleatoria continua x asuma un valor dentro de ese intervalo. De esta manera, cuando se calculan las probabilidades de las variables aleatorias continuas en realidad se está determinando la probabilidad de que la variable aleatoria asuma cualquier valor dentro de un intervalo. Dado que el área bajo la gráfica f (x) en cualquier punto en particular es cero, una de las implicaciones de la definición de probabilidad para las variables aleatorias continuas estriba en que la probabilidad de cualquier valor particular de la variable aleatoria sea cero. En la sección 6.1 se muestran estos conceptos para una variable aleatoria continua con una distribución uniforme. Gran parte del capítulo se dedica a describir y mostrar las aplicaciones de la distribución normal. Ésta es de fundamental importancia debido a que tiene amplias aplicaciones y su uso está muy extendido en la inferencia estadística. El capítulo concluye con un análisis de la distribución exponencial, la cual es útil en las aplicaciones en que intervienen factores como los tiempos de espera y de servicio. 6.1 Distribución de probabilidad uniforme Siempre que la probabilidad sea proporcional a la longitud del intervalo, la variable aleatoria está distribuida de manera uniforme. Considere la variable aleatoria x que representa el tiempo de vuelo de un avión que viaja de Chicago a Nueva York. Suponga que este tiempo puede ser cualquier valor en el intervalo de 120 a 140 minutos. Dado que la variable aleatoria x puede asumir cualquier valor en ese intervalo, x es una variable aleatoria continua más que una variable aleatoria discreta. Suponga además que cuenta con suficientes datos reales sobre los vuelos para concluir que la probabilidad de que el tiempo de vuelo esté dentro de cualquier intervalo de 1 minuto es igual a la probabilidad de que esté dentro de cualquier otro intervalo de 1 minuto contenido dentro del intervalo mayor de 120 a 140 minutos. Como cada intervalo de 1 minuto es igualmente probable, se dice que la variable aleatoria x tiene una probabilidad de distribución uniforme. La función de densidad de probabilidad, que define la distribución uniforme para la variable aleatoria del tiempo de vuelo es f (x) 1/20 para 120 x 140 0 en cualquier otro caso La figura 6.1 es una gráfica de esta función de densidad de probabilidad. En general, la función de densidad de probabilidad uniforme para una variable aleatoria x se define por medio de la fórmula siguiente. FUNCIÓN DE DENSIDAD DE PROBABILIDAD UNIFORME f(x) 1 para a x b b a 0 en cualquier otro caso (6.1) Para la variable aleatoria del tiempo de vuelo, a 120 y b 140.

6.1 Distribución de probabilidad uniforme 235 FIGURA 6.1 Distribución de probabilidad uniforme para el tiempo de vuelo f (x) 1 20 120 125 130 135 140 Tiempo de vuelo en minutos x Como se observó en la introducción, en el caso de una variable aleatoria continua, la probabilidad sólo se considera en términos de la posibilidad de que la variable aleatoria tome un valor dentro de un intervalo determinado. En el ejemplo del tiempo de vuelo, una pregunta de probabilidad aceptable es: cuál es la probabilidad de que el tiempo de vuelo se encuentre entre 120 y 130 minutos? Es decir, cuánto es P(120 x 130)? Debido a que dicho tiempo debe estar entre 120 y 140 minutos y la probabilidad se describe como uniforme a lo largo de este intervalo, es factible decir que P(120 x 130) 0.50. En la subsección siguiente se muestra que esta probabilidad se calcula como el área bajo la gráfica f (x) de 120 a 130 (figura 6.2). El área como medida de la probabilidad Como una observación de la gráfica de la figura 6.2, considere que el área bajo la gráfica f (x) en el intervalo de 120 a 130 es rectangular, y el área de un rectángulo es sencillamente el ancho multiplicado por la altura. Si se considera que el ancho del intervalo es igual a 130 120 10, y la altura es igual al valor de la función de densidad de probabilidad f (x) 1/20, se tiene el área ancho altura 10(1/20) 10/20 0.50. FIGURA 6.2 El área proporciona la probabilidad de que el tiempo de vuelo esté entre 120 y 130 minutos f (x) 1 20 P(120 x 130) área 1/20(10) 10/20 0.50 10 120 125 130 135 140 Tiempo de vuelo en minutos x

236 Capítulo 6 Distribuciones de probabilidad continua Qué observaciones puede hacer sobre el área bajo la gráfica f (x) y la probabilidad? Son idénticas! De hecho, esta observación es válida para todas las variables aleatorias continuas. Una vez que la función de densidad de probabilidad f (x) se identifica, la probabilidad de que x tome un valor entre uno inferior x 1 y uno superior x 2 se obtiene al calcular el área bajo la gráfica f (x) en el intervalo de x 1 a x 2. Dada la distribución uniforme para el tiempo de vuelo y usando la interpretación del área como una medida de probabilidad, es posible responder cualquier cantidad de preguntas de probabilidad sobre los tiempos de vuelo. Por ejemplo, cuál es la probabilidad de un tiempo de vuelo entre 128 y 136 minutos? El ancho del intervalo es 136 128 8. Con la altura uniforme de f (x) 1/20, se ve que P(128 x 136) 8(1/20) 0.40. Observe que P(120 x 140) 20(1/20) 1; es decir, el área total bajo la gráfica f (x) es igual a 1. Esta propiedad es válida para todas las distribuciones de probabilidad continua y es el análogo de la condición que indica que la suma de las probabilidades debe ser igual a 1 para una función de probabilidad discreta. En el caso de una función de densidad de probabilidad continua, se requiere también que f (x) 0 para todos los valores de x. Este requerimiento es el análogo del requisito de f (x) 0 para las funciones de probabilidad discretas. Hay dos diferencias importantes entre el tratamiento de la variable aleatoria continua y el tratamiento de sus homólogas discretas. Para ver que la probabilidad de que cualquier punto individual sea 0, remítase a la figura 6.2 y calcule la probabilidad de un punto individual, es decir, x 125. P(x 125) P(125 x 125) 0(1/20) 0. 1. Ya no se alude a la probabilidad de que una variable aleatoria asuma un valor particular. En su lugar, se habla de la probabilidad de que asuma un valor dentro de cierto intervalo. 2. La probabilidad de que una variable aleatoria continua asuma un valor dentro de un intervalo dado de x l a x 2 se define como el área bajo la gráfica de la función de densidad de probabilidad entre x 1 y x 2. Como cada punto es un intervalo cuyo ancho es igual a cero, esto implica que la probabilidad de que una variable aleatoria continua asuma cualquier valor particular es exactamente cero; también significa que la probabilidad de que asuma un valor en cualquier intervalo es la misma, ya sea que se incluyan o no los puntos finales. El cálculo del valor esperado y de la varianza de una variable aleatoria continua es análogo al de la variable aleatoria discreta. Sin embargo, como el procedimiento para determinarlo requiere cálculo integral, la deducción de las fórmulas apropiadas se deja para libros más avanzados. En el caso de la distribución de probabilidad continua uniforme presentada en esta sección, las fórmulas para el valor esperado y la varianza son E(x) a b 2 Var (x) (b a)2 12 En estas fórmulas, a es el valor menor y b es el valor mayor que la variable aleatoria puede asumir. Al aplicar estas fórmulas a la distribución uniforme de los tiempos de vuelo de Chicago a Nueva York obtenemos E(x) (120 140) 2 130 Var (x) (140 120)2 12 33.33 La desviación estándar de los tiempos de vuelo se obtiene al calcular la raíz cuadrada de la varianza. Por tanto, σ 5.77 minutos.

6.1 Distribución de probabilidad uniforme 237 NOTAS Y COMENTARIOS Para ver con mayor claridad por qué la altura de una función de densidad de probabilidad no es una probabilidad, considere la variable aleatoria con la distribución de probabilidad uniforme siguiente. f (x) 2 para 0 x 0.5 0 en cualquier otro caso La altura de la función de densidad de probabilidad, f (x), es 2 para valores de x entre 0 y 0.5. No obstante, se sabe que las probabilidades nunca pueden ser mayores que 1. Por tanto, se ve que f (x) no se interpreta como la probabilidad de x. Ejercicios Métodos AUTO evaluación 1. Se sabe que la variable aleatoria x está distribuida de manera uniforme entre 1.0 y 1.5. a) Trace la gráfica de la función de densidad de probabilidad. b) Calcule P(x 1.25). c) Determine P(1.0 x 1.25). d) Calcule P(1.20 x 1.5). 2. La variable aleatoria x está distribuida de manera uniforme entre 10 y 20. a) Trace la gráfica de la función de densidad de probabilidad. b) Calcule P(x 15). c) Estime P(12 x 18). d) Calcule E(x). e) Determine Var (x). Aplicaciones AUTO evaluación 3. Delta Airlines ofrece un tiempo de 2 horas, 5 minutos para sus vuelos de Cincinnati a Tampa. Suponga que se piensa que los tiempos de vuelo reales están distribuidos uniformemente entre 2 horas y 2 horas, 20 minutos. a) Trace la gráfica de la función de densidad de probabilidad para el tiempo de vuelo. b) Cuál es la probabilidad de que el vuelo no se retrase más de 5 minutos? c) Cuál es la probabilidad de que se retrase más de 10 minutos? d) Cuál es el tiempo esperado de vuelo? 4. La mayoría de los lenguajes de cómputo incluye una función para generar números aleatorios. En Excel, la función RAND se utiliza para generar números aleatorios entre 0 y 1. Si x denota un número aleatorio generado por medio de RAND, entonces x es una variable aleatoria continua con la función de densidad de probabilidad siguiente. f (x) 1 para 0 x 1 0 en cualquier otro caso a) Trace la gráfica de la función de densidad de probabilidad. b) Cuál es la probabilidad de generar un número aleatorio entre 0.25 y 0.75? c) Cuál es la probabilidad de que el número aleatorio generado tenga un valor menor o igual que 0.30? d) Cuál es la probabilidad de generar un número aleatorio con un valor mayor que 0.60? e) Genere 50 números aleatorios al introducir rand() en 50 celdas de una hoja de trabajo de Excel. f ) Calcule la media y la desviación estándar de los números aleatorios en el inciso e).

238 Capítulo 6 Distribuciones de probabilidad continua 5. La distancia de lanzamiento de los 100 mejores golfistas del tour PGA está entre 284.7 y 310.6 yardas (Golfweek, 29 de marzo de 2003). Suponga que la distancia de lanzamiento de estos deportistas está distribuida de manera uniforme a lo largo de este intervalo. a) Proporcione una expresión matemática para la función de densidad de probabilidad de la distancia de lanzamiento. b) Cuál es la probabilidad de que la distancia de lanzamiento de uno de estos golfistas sea menor de 290 yardas? c) Cuál es la probabilidad de que esta distancia de lanzamiento sea como mínimo de 300 yardas? d) Cuál es la probabilidad de que la distancia de lanzamiento esté entre 290 y 305 yardas? e) Cuántos de estos golfistas lanzan la pelota cuando menos 290 yardas? 6. En promedio, las comedias de 30 minutos que se transmiten por televisión tienen 22 minutos de programación (CNBC, 23 de febrero de 2006). Suponga que la distribución de probabilidad de los minutos de programación se aproxima por medio de una distribución uniforme de 18 a 26 minutos. a) Cuál es la probabilidad de que una comedia tenga 25 o más minutos de programación? b) Cuál es la probabilidad de que tenga entre 21 y 25 minutos de programación? c) Cuál es la probabilidad de que incluya más de 10 minutos de comerciales o de otras interrupciones que no forman parte de la programación? 7. Suponga que le interesa adquirir un terreno y sabe que hay otros compradores interesados en él. 1 El vendedor anuncia que aceptará la oferta más alta mayor de $10 000. Considere que la oferta del competidor x es una variable aleatoria que está distribuida uniformemente entre $10 000 y $15 000. a) Suponga que usted propone $12 000. Cuál es la probabilidad de que su oferta sea aceptada? b) Considere que ofrece $14 000. Cuál es la probabilidad de que se acepte su postura? c) Qué cantidad debe proponer para maximizar la probabilidad de comprar la propiedad? d) Suponga que conoce a alguien que está dispuesto a pagarle $16 000 por la propiedad. Consideraría ofrecer menos de la cantidad del inciso c)? Por qué? 6.2 Distribución de probabilidad normal Abraham de Moivre, matemático francés que publicó La doctrina de las probabilidades en 1733, dedujo la distribución normal. La distribución de probabilidad más importante para describir una variable aleatoria continua es la distribución de probabilidad normal. Ésta se ha utilizado en una amplia variedad de aplicaciones en las cuales las variables aleatorias son la altura y el peso de las personas, las calificaciones de los exámenes, las mediciones científicas, la precipitación pluvial y otros valores parecidos. También tiene un uso muy extendido en la inferencia estadística, la cual es el tema principal del resto de este libro. En estas aplicaciones, la distribución normal describe qué tan probables son los resultados obtenidos de un muestreo. Curva normal La forma de la distribución normal se ilustra por medio una curva con forma de campana que exhibe la figura 6.3. La función de densidad de probabilidad que define la curva de la distribución normal se muestra en seguida. 1 Este ejercicio se basa en un problema sugerido por el profesor Roger Myerson, de la Northwestern University.

6.2 Distribución de probabilidad normal 239 FIGURA 6.3 Curva con forma de campana de la distribución normal Desviación estándar σ μ Media x FUNCIÓN DE DENSIDAD DE PROBABILIDAD NORMAL Donde: 1 f (x) σ 2π e (x μ) 2 2σ 2 μ media σ desviación estándar π 3.14159 e 2.71828 (6.2) Se formulan varias observaciones acerca de las características de la distribución normal. La curva normal tiene dos parámetros, μ y σ, que determinan la ubicación y la forma de la distribución normal. 1. La familia completa de distribuciones normales se diferencia por medio de dos parámetros: la media μ y la desviación estándar σ. 2. El punto más alto de una curva normal se encuentra sobre la media, el cual coincide con la mediana y la moda de la distribución. 3. La media de una distribución normal puede tener cualquier valor numérico: negativo, cero o positivo. A continuación se muestran tres distribuciones normales que tienen la misma desviación estándar pero tres medias diferentes ( 10, 0 y 20). 10 0 20 x

240 Capítulo 6 Distribuciones de probabilidad continua 4. La distribución normal es simétrica: la forma de la curva normal a la izquierda de la media es una imagen de espejo de la forma de la curva a la derecha de la media. Los extremos de la curva normal se extienden hacia el infinito en ambas direcciones y en teoría nunca tocan el eje horizontal. Como son simétricas, las distribuciones normales no están sesgadas; la medida de su sesgo es cero. 5. La desviación estándar determina qué tan plana y ancha es la curva normal. Los valores grandes de la desviación estándar dan como resultado curvas más anchas y planas, mostrando mayor variabilidad en los datos. En seguida se muestran dos distribuciones normales con la misma media, pero con desviaciones estándar diferentes. σ 5 σ 10 μ x Estos porcentajes son la base para la regla empírica que se presentó en la sección 3.3. 6. Las probabilidades para la variable aleatoria normal están representadas por las áreas bajo la curva normal. El área total bajo la curva de una distribución normal es 1. Como la distribución es simétrica, el área bajo la curva a la izquierda de la media es 0.50 y el área a la derecha también es 0.50. 7. Los porcentajes de los valores en algunos intervalos de uso común son los siguientes. a) 68.3% de los valores de una variable aleatoria normal se sitúan más o menos a una desviación estándar de su media. b) 95.4% de los valores de una variable aleatoria normal se encuentran más o menos a dos desviaciones estándar de su media. c) 99.7% de los valores de una variable aleatoria normal están más o menos dentro de tres desviaciones estándar de su media. La figura 6.4 muestra una gráfica de las propiedades a), b) y c). Distribución de probabilidad normal estándar Se dice que una variable aleatoria que muestra una distribución normal con una media de cero y una desviación estándar de uno tiene una distribución de probabilidad normal estándar. La letra z se usa comúnmente para designar esta variable aleatoria normal. La figura 6.5 muestra la gráfica general de la distribución normal estándar, la cual tiene la misma apariencia que otras distribuciones normales, pero con las propiedades especiales de μ 0 y σ 1.

6.2 Distribución de probabilidad normal 241 FIGURA 6.4 Áreas bajo la curva de cualquier distribución normal 99.7% 95.4% 68.3% μ 3σ μ 2σ μ 1σ μ μ 1σ μ 2σ μ 3σ x FIGURA 6.5 Distribución normal estándar σ 1 0 z Como μ 0 y σ 1, la fórmula para la función de densidad de probabilidad normal estándar es una versión más sencilla de la ecuación (6.2). FUNCIÓN DE DENSIDAD NORMAL ESTÁNDAR f (z) 1 2π e z 2 2 Para la función de densidad de probabilidad normal, la altura de la curva normal varía, y se requieren matemáticas más avanzadas para calcular las áreas que representan la probabilidad. Como ocurre con otras variables aleatorias continuas, los cálculos de la probabilidad con cualquier distribución normal se efectúan al obtener las áreas bajo la gráfica de la función de densidad de probabilidad. Por tanto, para encontrar la probabilidad de que una variable aleatoria normal esté dentro de cualquier intervalo específico, debe calcularse el área bajo la curva normal en ese intervalo. Para la distribución normal estándar, las áreas bajo la curva normal ya se han estimado y están disponibles en tablas que se utilizan para el cálculo de probabilidades. Una tabla como éstas aparece en las dos guardas de la cubierta anterior del libro. La de la página izquierda contiene las áreas o probabilidades acumuladas correspondientes a los valores de z menores o iguales a la media de cero. La tabla de la página derecha contiene las áreas o probabilidades acumuladas que corresponden a los valores de z superiores o iguales a la media de cero.

242 Capítulo 6 Distribuciones de probabilidad continua Como la variable aleatoria normal estándar es continua, P(z 1.00) P(z 1.00). Los tres tipos de probabilidades que se necesita calcular incluyen: 1) la probabilidad de que la variable aleatoria normal estándar z sea menor o igual que un valor determinado; 2) la probabilidad de que z esté entre dos valores dados, y 3) la probabilidad de que z sea mayor o igual que un valor determinado. Para conocer cómo se usa la tabla de probabilidad acumulada de la distribución normal estándar con el propósito de calcular estos tres tipos de probabilidades, considere algunos ejemplos. Primero se mostrará cómo calcular la probabilidad de que z sea menor o igual que 1.00, esto es, P(z 1.00). Esta probabilidad acumulada es el área bajo la curva normal a la izquierda de z 1.00 en la gráfica siguiente. P(z 1.00) 0 1 z Revise la tabla de probabilidad normal estándar en la página derecha de las guardas de la cubierta anterior del libro. La probabilidad acumulada que corresponde a z 1.00 es el valor ubicado en la intersección de la fila cuyo encabezado es 1.0 y la columna cuyo encabezado es 0.00. Primero se localiza 1.0 en la columna izquierda de la tabla y luego 0.00 en la fila superior. Al observar el cuerpo de la tabla, encontramos que la fila 1.0 y la columna 0.00 se intersecan en el valor 0.8413; por tanto, P(z 1.00) 0.8413. El extracto siguiente de la tabla de probabilidad muestra estos pasos. z 0.00 0.01 0.02 0.9 0.8159 0.8186 0.8212 1.0 0.8413 0.8438 0.8461 1.1 0.8643 0.8665 0.8686 1.2 0.8849 0.8869 0.8888 P(z 1.00) Para ilustrar el segundo tipo de cálculo de la probabilidad, suponga que se quiere determinar la probabilidad de que z esté en el intervalo entre 0.50 y 1.25; es decir, P( 0.50 z 1.25). La gráfica siguiente muestra esta área, o probabilidad.

6.2 Distribución de probabilidad normal 243 P( 0.50 z 1.25) P(z 0.50) 0.50 0 1.25 z Se requieren tres pasos para calcular esta probabilidad. Primero se encuentra el área bajo la curva normal a la izquierda de z 1.25. Segundo, se obtiene el área bajo la curva normal a la izquierda de z 0.50. Y por último, se resta el área a la izquierda de z 0.50, del área a la izquierda de z 1.25 para obtener P( 0.50 z 1.25). Para calcular el área bajo la curva normal a la izquierda de z 1.25, primero se localiza la fila 1.2 en la tabla de probabilidad normal estándar y luego se avanza hasta la columna 0.05. Como el valor que aparece en la fila 1.2 y en la columna 0.05 es 0.8944, P(z 1.25) 0.8944. De manera similar, cuando se quiere determinar el área bajo la curva a la izquierda de z 0.50, se usa la tabla de la página izquierda para localizar el valor de la fila 0.5 y la columna 0.00; como el valor es 0.3085, P(z 0.50) 0.3085. Por tanto, P( 0.50 z 1.25) P(z 1.25) P(z 0.50) 0.8944 0.3085 0.5859. Considere otro ejemplo del cálculo de la probabilidad de que z esté en el intervalo entre dos valores dados. A menudo se quiere conocer la probabilidad de que una variable aleatoria normal asuma un valor dentro de cierto número de desviaciones estándar de la media. Suponga que queremos calcular la probabilidad de que la variable aleatoria normal estándar esté dentro de una desviación estándar de la media; es decir, P( 1.00 z 1.00). Para ello, primero se obtiene el área bajo la curva entre 1.00 y 1.00. Antes se encontró que P(z 1.00) 0.8413. Si observa de nuevo la tabla de las guardas de la cubierta anterior del libro, se ve que el área bajo la curva a la izquierda de z 1.00 es 0.1587; por tanto P(z 1.00) 0.1587. De ahí que P( 1.00 z 1.00) P(z 1.00) P(z 1.00) 0.8413 0.1587 0.6826. Esta probabilidad se muestra gráficamente en la figura siguiente. P( 1.00 z 1.00) 0.8413 0.1587 0.6826 P(z 1.00) 0.1587 1.00 0 1.00 z

244 Capítulo 6 Distribuciones de probabilidad continua Para explicar cómo se efectúa el tercer tipo de cálculo de probabilidad, suponga que se quiere determinar la probabilidad de obtener un valor z por lo menos igual a 1.58; es decir, P(z 1.58). El valor en la fila z 1.5 y la columna 0.08 de la tabla normal acumulada es 0.9429; por tanto, P(z 1.58) 0.9429. Sin embargo, como el área total bajo la curva normal es 1, P(z 1.58) 1 0.9429 0.0571. Esta probabilidad se muestra en la figura siguiente. P(z 1.58) 0.9429 P(z 1.58) 1.0000 0.9429 0.0571 2 1 0 1 2 z En los ejemplos anteriores se mostró cómo calcular las probabilidades cuando se proporcionan valores de z específicos. En algunas situaciones se da una probabilidad y se quiere trabajar a la inversa para encontrar el valor de z correspondiente. Suponga que quiere determinar un valor de z tal que la probabilidad de obtener un valor de z mayor sea 0.10. La figura siguiente muestra esta situación de manera gráfica. Probabilidad 0.10 2 1 0 1 2 z Cuál es el valor de z? Dada una probabilidad, se puede usar la tabla normal estándar en modo inverso para encontrar el valor de z correspondiente. Este problema es el inverso de las situaciones presentadas en los ejemplos anteriores, en los cuales se especificó el valor de z y luego se calculó la probabilidad, o área, correspondiente. En este ejemplo se proporciona la probabilidad, o área, y luego se pide determinar el valor z respectivo. Para hacerlo, se usa la tabla de probabilidad normal estándar de una manera un poco distinta. Recuerde que esta tabla proporciona el área bajo la curva a la izquierda de un valor de z determinado. Se tiene la información de que el área en el extremo superior de la curva es 0.10. Por consiguiente, el área bajo la curva a la izquierda del valor de z desconocido debe ser igual a 0.9000. Al revisar el cuerpo de la tabla, encontramos que 0.8997 es el valor de probabilidad acumulada más cercano a 0.9000. La sección de la tabla que muestra este resultado se reproduce a continuación.

6.2 Distribución de probabilidad normal 245 z 0.06 0.07 0.08 0.09 1.0 0.8554 0.8577 0.8599 0.8621 1.1 0.8770 0.8790 0.8810 0.8830 1.2 0.8962 0.8980 0.8997 0.9015 1.3 0.9131 0.9147 0.9162 0.9177 1.4 0.9279 0.9292 0.9306 0.9319 Valor de probabilidad acumulada más cercano a 0.9000 Al leer el valor de z en la columna del extremo izquierdo y la fila superior de la tabla, encontramos que es 1.28. Por tanto, un área de aproximadamente 0.9000 (en realidad, 0.8997) estará a la izquierda de z 1.28. 2 Respecto de la pregunta formulada originalmente, hay una probabilidad aproximada de 0.10 de que el valor de z sea mayor que 1.28. Estos ejemplos ilustran que la tabla de probabilidades acumuladas para la distribución de probabilidad normal estándar es útil para encontrar las probabilidades asociadas con los valores de la variable aleatoria normal estándar z. Se pueden plantear dos tipos de preguntas. El primero especifica un valor, o valores, para z y pide usar la tabla para determinar las áreas o probabilidades correspondientes. El segundo proporciona un área, o probabilidad, y pide usar la tabla para determinar el valor de z correspondiente. Por tanto, se requiere flexibilidad en el uso de la tabla de probabilidad normal estándar para responder la pregunta de probabilidad deseada. En la mayoría de los casos el trazo de una gráfica de distribución de probabilidad normal estándar y el sombreado del área apropiada ayudan a visualizar la situación y a encontrar la respuesta correcta. Cálculo de probabilidades para cualquier distribución de probabilidad normal La razón para estudiar la distribución normal estándar de manera exhaustiva estriba en que ésta se utiliza para calcular las probabilidades de todas las distribuciones normales. Es decir, cuando se tiene una distribución normal con cualquier media μ y cualquier desviación estándar σ, las preguntas de probabilidad acerca de la distribución se responden convirtiendo primero a la distribución normal estándar. Luego se usa la tabla de probabilidad normal estándar y los valores de z apropiados para obtener las probabilidades buscadas. La fórmula para convertir cualquier variable aleatoria normal x con media μ y desviación estándar σ a la variable aleatoria normal estándar z se presenta a continuación. La fórmula para la variable aleatoria normal estándar es similar a la fórmula para calcular los valores z de un conjunto de datos, presentada en el capítulo 3. CONVERSIÓN A LA VARIABLE ALEATORIA NORMAL ESTÁNDAR z x μ σ (6.3) 2 Se podría haber hecho una interpolación en el cuerpo de la tabla para obtener una aproximación más exacta del valor de z que corresponde al área de 0.9000. Si se hace esto para obtener una posición decimal más precisa, produciría un valor de z de 1.282. No obstante, en la mayoría de las situaciones prácticas es suficiente con la precisión que se obtiene simplemente utilizando el valor de la tabla más cercano a la probabilidad buscada.

246 Capítulo 6 Distribuciones de probabilidad continua Un valor de x igual a su media μ da como resultado z (μ μ)/σ 0. Por tanto, vemos que un valor de x igual a su media μ corresponde a z 0. Ahora suponga que x está a una desviación estándar por encima de su media; es decir, x μ σ. Al aplicar la ecuación (6.3), vemos que el valor de z correspondiente es z [(μ σ) μ]/σ σ/σ 1. En consecuencia, un valor de x que está a una desviación estándar sobre su media corresponde a z 1. En otras palabras, z puede interpretarse como el número de desviaciones estándar de la media μ a las que está la variable aleatoria normal x. Para ver cómo esta conversión permite calcular las probabilidades de cualquier distribución normal, suponga que se tiene una distribución con μ 10 y σ 2. Cuál es la probabilidad de que la variable aleatoria x esté entre 10 y 14? Aplicando la ecuación (6.3) vemos que en x 10, z (x μ)/σ (10 10)/2 0 y que en x 14, z (14 10)/2 4/2 2. Por tanto, la respuesta a nuestra pregunta sobre la probabilidad de que x esté entre 10 y 14 está dada por la probabilidad equivalente de que z esté entre 0 y 2 para la distribución normal estándar. En otras palabras, la probabilidad que se busca estriba en que la variable aleatoria x esté entre su media y a dos desviaciones estándar sobre la media. Al usar z 2.00 y la tabla de probabilidad normal estándar de las guardas de la cubierta anterior del libro, P(z 2) 0.9772. Como P(z 0) 0.5000, podemos calcular P(0.00 z 2.00) P(z 2) P(z 0) 0.9772 0.5000 0.4772. De ahí que la probabilidad de que x esté entre 10 y 14 sea 0.4772. El problema de Grear Tire Company Ahora veremos una aplicación de la distribución de probabilidad normal. Suponga que Grear Tire Company desarrolló un nuevo neumático radial con cinturón de acero que se vende a través de una cadena nacional de tiendas de descuento. Debido a que el neumático es un nuevo producto, los gerentes de Grear creen que la garantía de millaje ofrecida con la llanta será un factor importante para su aceptación. Antes de que la póliza de garantía de millaje de los neumáticos caduque, los gerentes de Grear quieren información de probabilidad sobre los x número de millas que éstos durarán. A partir de las pruebas de carretera reales con los neumáticos, el grupo de ingeniería estimó que su millaje es μ 36 500 millas y que la desviación estándar es σ 5 000. Además, los datos recabados indican que una distribución normal es una suposición razonable. Qué porcentaje de las llantas se espera que dure más de 40 000 millas? En otras palabras, cuál es la probabilidad de que el millaje de los neumáticos, x, supere la cifra de 40 000? Esta pregunta puede responderse al calcular el área de la región sombreada de la figura 6.6. FIGURA 6.6 Distribución de millaje de Grear Tire Company P(x 40 000) σ 5 000 P(x 40 000)? Nota. z 0 corresponde a x μ 36 500 40 000 μ 36 500 0 0.70 Nota. z 0.70 corresponde a x 40 000 x z

6.2 Distribución de probabilidad normal 247 En x 40 000 tenemos z x μ σ 40 000 36 500 5 000 3500 0.70 5000 Remítase ahora a la parte inferior de la figura 6.6. Vemos que un valor de x 40 000 en la distribución normal de Grear Tire corresponde al valor de z 0.70 en la distribución normal estándar. Consultando la tabla de probabilidad normal estándar, constatamos que el área bajo la curva normal estándar a la izquierda de z 0.70 es 0.7580. Por tanto, 1.000 0.7580 0.2420 es la probabilidad de que z exceda 0.70, y por consiguiente x excederá de 40 000. Podemos concluir que alrededor de 24.2% de los neumáticos superará las 40 000 millas. Ahora suponga que Grear considera una garantía que proporcionará un descuento sobre los neumáticos de remplazo si los originales no proporcionan el millaje garantizado. Cuál debe ser este millaje si Grear quiere que no más de 10% de los neumáticos sean aptos para la garantía de descuento? Esta pregunta se interpreta gráficamente en la figura 6.7. Con base en la figura 6.7, el área bajo la curva a la izquierda del millaje de garantía desconocido debe ser 0.10. Así que primero se debe calcular el valor de z que recorta un área de 0.10 en el extremo izquierdo de una distribución normal estándar. Utilizando la tabla de probabilidad normal estándar vemos que z 1.28 recorta un área de 0.10 en el extremo inferior. Por consiguiente, z 1.28 es el valor de la variable aleatoria normal estándar que corresponde a la garantía de millaje buscada en la distribución normal de Grear Tire. Para encontrar el valor de x que corresponde a z 1.28, tenemos El millaje de garantía que se debe encontrar es 1.28 desviaciones estándar por debajo de la media. Por tanto, x μ 1.28σ. z x μ σ 1.28 x μ 1.28σ x μ 1.28σ Con μ 36 500 y σ 5 000, x 36 500 1.28(5 000) 30 100 Con la garantía establecida en 30 000 millas, el porcentaje real apto para la garantía será 9.68. Por tanto, una garantía de 30 100 millas cumplirá con el requerimiento de que aproximadamente 10% de los neumáticos serán aptos para la promoción. Quizá con esta información la empresa establecerá su garantía de millaje en 30 000 millas. FIGURA 6.7 Garantía de descuento de Grear σ 5000 10% de los neumáticos aptos para la garantía de descuento x Millaje de la garantía? μ 36500

248 Capítulo 6 Distribuciones de probabilidad continua De nuevo, vemos el importante papel que las distribuciones de probabilidad desempeñan en proporcionar información para la toma de decisiones. En concreto, una vez que se establece una distribución de probabilidad para una aplicación en particular, se puede usar para obtener información de probabilidad sobre el problema. La probabilidad no hace directamente una recomendación de decisión, pero proporciona información que ayuda a quien la toma a comprender mejor los riesgos y las incertidumbres asociados con el problema. En definitiva, esta información ayuda a los ejecutivos a llegar a una buena decisión. Ejercicios Métodos AUTO evaluación 8. Utilizando la figura 6.4 como guía, trace una curva normal para la variable aleatoria x que tenga una media de μ 100 y una desviación estándar de σ 10. Marque el eje horizontal con los valores 70, 80, 90, 100, 110, 120 y 130. 9. Una variable aleatoria está normalmente distribuida con una media de μ 50 y una desviación estándar de σ 5. a) Trace una curva normal para la función de densidad de la probabilidad. Marque el eje horizontal con los valores 35, 40, 45, 50, 55, 60 y 65. La figura 6.4 muestra que la curva normal casi toca el eje horizontal en tres desviaciones estándar bajo la media y tres desviaciones estándar sobre la media (en este caso en 35 y 65). b) Cuál es la probabilidad de que la variable aleatoria asuma un valor entre 45 y 55? c) Cuál es la probabilidad de que asuma un valor entre 40 y 60? 10. Trace una gráfica para la distribución normal estándar. Rotule el eje horizontal con los valores 3, 2, 1, 0, 1, 2 y 3. Luego use la tabla de probabilidades para la distribución normal estándar incluida en el libro para calcular las probabilidades siguientes. a) P(z 1.5). b) P(z 1). c) P(1 z 1.5). d) P(0 z 2.5). 11. Dado que z es una variable aleatoria normal estándar, calcule las probabilidades siguientes. a) P(z 1.0). b) P(z 1). c) P(z 1.5). d) P( 2.5 z). e) P( 3 z 0). 12. Puesto que z es una variable aleatoria normal estándar, calcule las probabilidades siguientes. a) P(0 z 0.83). b) P( 1.57 z 0). c) P(z 0.44). d) P(z 0.23). e) P(z 1.20). f ) P(z 0.71). 13. Dado que z es una variable aleatoria normal estándar, calcule las probabilidades siguientes. a) P( 1.98 z 0.49). b) P(0.52 z 1.22). c) P( 1.75 z 1.04). 14. Considerando que z es una variable aleatoria normal estándar, calcule z para cada situación. a) El área a la izquierda de z es 0.9750. b) El área entre 0 y z es 0.4750. c) El área a la izquierda de z es 0.7291. d) El área a la derecha de z es 0.1314. e) El área a la izquierda de z es 0.6700. f ) El área a la derecha de z es 0.3300.

6.2 Distribución de probabilidad normal 249 AUTO evaluación AUTO evaluación 15. Dado que z es una variable aleatoria normal estándar, calcule z para cada situación. a) El área a la izquierda de z es 0.2119. b) El área entre z y z es 0.9030. c) El área entre z y z es 0.2052. d) El área a la izquierda de z es 0.9948. e) El área a la derecha de z es 0.6915. 16. Considerando que z es una variable aleatoria normal estándar, calcule z para cada situación. a) El área a la derecha de z es 0.01. b) El área a la derecha de z es 0.025. c) El área a la derecha de z es 0.05. d) El área a la derecha de z es 0.10. Aplicaciones 17. Para los deudores con buenas calificaciones de crédito, la deuda media de las cuentas revolventes y a plazos es de $15 015 (BusinessWeek, 20 de marzo de 2006). Suponga que la desviación estándar es $3 540 y que los montos de la deuda se distribuyen de manera normal. a) Cuál es la probabilidad de que la deuda para un deudor con un buen crédito sea mayor de $18 000? b) Cuál es la probabilidad de que la deuda para dicho deudor sea menor de $10 000? c) Cuál es la probabilidad de que esta deuda esté entre $12 000 y $18 000? d) Cuál es la probabilidad de que la deuda no sea mayor de $14 000? 18. El precio medio de las acciones de las empresas que forman el S&P 500 es $30, y la desviación estándar es $8.20 (BusinessWeek, publicación anual especial, primavera de 2003). Suponga que los precios de las acciones se distribuyen normalmente. a) Cuál es la probabilidad de que las acciones de una empresa tengan un precio mínimo de $40? b) Cuál es la probabilidad de que el precio de las acciones no supere $20? c) Qué tan alto debe ser el precio de las acciones de una firma para situarla en el 10% de las principales empresas? 19. En un artículo sobre el costo de la asistencia médica, la revista Money informó que una visita a la sala de urgencias de un hospital por algo tan simple como un dolor de garganta tiene un costo medio de $328 (Money, enero de 2009). Suponga que el costo de este tipo de visitas se distribuye normalmente con una desviación estándar de $92. Responda las preguntas siguientes sobre el costo de una visita a la sala de urgencias de un hospital para este servicio médico. a) Cuál es la probabilidad de que el costo sea mayor que $500? b) Cuál es la probabilidad de que sea menor que $250? c) Cuál es la probabilidad de que esté entre $300 y $400? d) Si el costo para un paciente está en el 8% más bajo de cargos para este servicio médico, cuál fue el costo de la visita a la sala de urgencias? 20. En enero de 2003, el empleado estadounidense pasó un promedio de 77 horas conectado a Inter net mientras trabajaba (CNBC, 15 de marzo de 2003). Suponga que la media poblacional es 77 horas, los tiempos están distribuidos normalmente y la desviación estándar es de 20 horas. a) Cuál es la probabilidad de que en enero de 2003 un empleado seleccionado al azar pasara menos de 50 horas conectado a Internet? b) Qué porcentaje de empleados pasó más de 100 horas conectado a Internet en dicha fecha? c) Una persona es clasificada como usuario intensivo si está en el 20% superior de uso. En el mes de referencia, cuántas horas tuvo que conectarse un empleado para que se le considerara un usuario intensivo? 21. Una persona debe estar en el 2% más alto de la población en una prueba de IQ para aspirar a la membresía de Mensa, la sociedad internacional de IQ alto (U.S. Airways Attaché, septiembre de 2000). Si las calificaciones del IQ están normalmente distribuidas con una media de 100 y una desviación estándar de 15, qué puntaje debe tener una persona que desea calificar para Mensa?

250 Capítulo 6 Distribuciones de probabilidad continua 22. La tarifa media de pago por hora para los directores de finanzas en la región central del noreste de Estados Unidos es de $32.62, y la desviación estándar es $2.32 (Bureau of Labor Statistics, septiembre de 2005). Suponga que las tarifas de pago están distribuidas normalmente. a) Cuál es la probabilidad de que un director de finanzas gane entre $30 y $35 por hora? b) Qué tan alta debe ser la tarifa por hora para ubicar a un director de finanzas en el 10% superior con respecto al pago? c) Para un director de finanzas seleccionado al azar, cuál es la probabilidad de que gane menos de $28 por hora? 23. El tiempo necesario para completar un examen final en un curso universitario particular está distribuido normalmente con una media de 80 minutos y una desviación estándar de 10 minutos. Responda las preguntas siguientes. a) Cuál es la probabilidad de completar el examen en una hora o menos? b) Cuál es la probabilidad de que un estudiante termine el examen en más de 60 minutos pero en menos de 75? c) Suponga que la clase tiene 60 estudiantes y el periodo de examen dura 90 minutos. Cuántos estudiantes esperaría usted que lo completaran en el tiempo asignado? WEB archivo Volume 24. El volumen negociado en la Bolsa de Valores de Nueva York es más intenso durante la primera media hora (temprano por la mañana) y en la última media hora (tarde en la tarde) del día de negociación. Los volúmenes negociados temprano en la mañana (millones de acciones) durante 13 días en enero y febrero se muestran enseguida (Barron s, 23 de enero de 2006; 13 y 17 de febrero de 2006). 214 163 265 194 180 202 198 212 201 174 171 211 211 La distribución de probabilidad del volumen negociado es aproximadamente normal. a) Calcule la media y la desviación estándar para usarla como estimaciones de la media poblacional y la desviación estándar. b) Cuál es la probabilidad de que, en un día seleccionado al azar, el volumen negociado por la mañana sea menor de 180 millones de acciones? c) Cuál es la probabilidad de que este volumen exceda los 230 millones de acciones? d) Cuántas acciones deberán negociarse para que el volumen negociado por la mañana en un día determinado esté entre el 5% más ocupado de los días? 25. Según Sleep Foundation, el promedio de sueño nocturno es de 6.8 horas (Fortune, 20 de marzo de 2006). Suponga que la desviación estándar es 0.6 horas y que la distribución de probabilidad es normal. a) Cuál es la probabilidad de que una persona seleccionada al azar duerma más de 8 horas? b) Cuál es la probabilidad de que duerma 6 horas o menos? c) Los médicos sugieren dormir entre 7 y 9 horas cada noche. Qué porcentaje de la población se toma este tiempo? 6.3 Aproximación normal de las probabilidades binomiales En la sección 5.4 se presentó la distribución binomial discreta. Recuerde que un experimento binomial consiste en una secuencia de n ensayos independientes idénticos cada uno con dos resultados posibles: un éxito o un fracaso. La probabilidad de éxito es la misma para todos los ensayos y se denota como p. La variable aleatoria binomial es el número de éxitos en los n ensayos y las preguntas de probabilidad pertenecen a la probabilidad de x éxitos en los n ensayos.

6.3 Aproximación normal de las probabilidades binomiales 251 FIGURA 6.8 Aproximación normal para una distribución de probabilidad normal con n 100 y p 0.10 que muestra la probabilidad de 12 errores σ 3 P(11.5 x 12.5) 11.5 μ 10 12.5 x Cuando el número de ensayos es grande, es difícil evaluar la función de probabilidad binomial a mano o con una calculadora. En los casos en que np 5 y n(1 p) 5, la distribución normal proporciona una aproximación fácil de usar de las probabilidades binomiales. Cuando se usa la aproximación normal a la binomial, se establece μ np y σ np(1 p) en la definición de la curva normal. La aproximación normal a la binomial se explicará mediante el ejemplo de una empresa particular que tiene una historia de cometer errores en 10% de sus facturas. Se tomó una muestra de 100 facturas y se quiere calcular la probabilidad de que 12 contengan errores. Es decir, se desea determinar la probabilidad binomial de 12 éxitos en 100 ensayos. Al aplicar la aproximación normal en este caso, se establece μ np (100)(0.1) 10 y σ np(1 p) (100)(0.1)(0.9) 3. Una distribución normal con μ 10 y σ 3 se muestra en la figura 6.8. Recuerde que, con una distribución de probabilidad continua, las probabilidades se calculan como las áreas bajo la función de densidad de probabilidad. Como resultado, la probabilidad de cualquier valor único para la variable aleatoria es cero. Por tanto, para aproximar la probabilidad binomial de 12 éxitos, se calcula el área bajo la curva normal correspondiente entre 11.5 y 12.5. El 0.5 que se suma y resta de 12 se llama factor de corrección de continuidad. Este concepto se introdujo porque se está utilizando una distribución continua para aproximar una distribución discreta. Por tanto, P(x 12) para la distribución binomial discreta se aproxima por P(11.5 x 12.5) para la distribución normal continua. Al convertir a la distribución normal estándar para calcular P(11.5 x 12.5), tenemos z x μ σ 12.5 10.0 0.83 en x 12.5 3 y z x μ σ 11.5 10.0 0.50 en x 11.5 3

252 Capítulo 6 Distribuciones de probabilidad continua FIGURA 6.9 Aproximación normal a una distribución de probabilidad binomial con n 100 y p 0.10 que muestra la probabilidad de 13 o menos errores La probabilidad de 13 o menos errores es 0.8790 10 13.5 x Al usar la tabla de probabilidad normal estándar, vemos que el área bajo la curva (figura 6.8) a la izquierda de 12.5 es 0.7967. Del mismo modo, el área bajo la curva a la izquierda de 11.5 es 0.6915. Por tanto, el área entre 11.5 y 12.5 es 0.7967 0.6915 0.1052. La aproximación normal a la probabilidad de 12 éxitos en 100 ensayos es 0.1052. En otro ejemplo, suponga que se desea calcular la probabilidad de 13 o menos errores en la muestra de 100 facturas. La figura 6.9 muestra el área bajo la curva normal que se aproxima a esta probabilidad. Tenga en cuenta que el uso del factor de corrección de continuidad da como resultado el valor de 13.5 utilizado para calcular la probabilidad deseada. El valor de z que corresponde a x 13.5 es 13.5 10.0 z 1.17 3.0 La tabla de probabilidad normal estándar muestra que el área bajo la curva normal estándar a la izquierda de z 1.17 es 0.8790. El área bajo la curva normal que se aproxima a la probabilidad de 13 o menos errores está dada por la porción sombreada de la gráfica de la figura 6.9. Ejercicios Métodos AUTO evaluación 26. Una distribución de probabilidad binomial tiene p 0.20 y n 100. a) Cuál es la media y la desviación estándar? b) Esta situación es una en la cual las probabilidades binomiales pueden aproximarse por medio de la distribución de probabilidad normal? Explique por qué. c) Cuál es la probabilidad de exactamente 24 éxitos? d) Cuál es la probabilidad de 18 a 22 éxitos? e) Cuál es la probabilidad de 15 o menos éxitos? 27. Suponga que la distribución de probabilidad binomial tiene p 0.60 y n 200. a) Cuáles son la media y la desviación estándar? b) Esta situación es del tipo en que las probabilidades binomiales pueden aproximarse por medio de la distribución de probabilidad normal? Explique por qué.