Probabilidad y Estadística Tema 13 Inferencia en una población Objetivo de aprendizaje del tema Al finalizar el tema serás capaz de: Explicar el procedimiento de pruebas en la inferencia estadística. Aplicar la inferencia estadística para la media una población. Aplicar la inferencia estadística para una proporción.
Introducción al tema Consideremos por un momento que Pepsi Cola lanza una campaña en el país cuando se sabe que su participación de mercado es, por mencionar un número, de un 15%. Durante algún tiempo se realizan todos los eventos pensados en su campaña y al final de la misma realiza una encuesta en varias partes de la república y obtiene que ahora su participación de mercado ha subido un par de puntos porcentuales para situarse en 17%. Introducción al tema Cómo sabe Pepsi Cola si su campaña realmente ha cambiado las preferencias del consumidor hacia sus productos a partir de una muestra de la población?, cómo comprobar que la nueva participación de mercado es real y no un simple error al tomar una muestra de la población? Te invito a que juntos exploremos las técnicas que nos permiten, si no a tener una certeza clara de lo que ocurre en la población a partir de los resultados de una muestra, si una idea de que las tendencias de una población en estudio han cambiado o bien, se conservan.
Qué es una hipótesis? Es un enunciado acerca del valor de un parámetro poblacional. La razón para establecer una hipótesis es que la población de interés es tan grande que por diversas razones sería prácticamente imposible estudiar a todos los elementos de la población. Algunos ejemplo de hipótesis El ingreso mensual medio para los ciudadanos jubilados es de $9,930 pesos. Se sabe que el 20% de los delincuentes juveniles finalmente son arrestados, se les sentencia y encarcela. El diámetro exterior medio de los cojines de bolas producidos durante una jornada laboral es de 1.000 pulgadas. En general, el 90% de las formas de impuesto federal de ingresos se llenan correctamente. Las resistencias al impacto de los parabrisas que producen dos empresas industriales son iguales.
Prueba de hipótesis Es un procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis en un enunciado razonable y no debe rechazarse, o si es irrazonable y debe ser rechazada. Procedimiento de pruebas Paso 1: Plantear las hipótesis nula y alternativa. Paso 2: Seleccionar el nivel de significación. Paso 3: Identificar el estadístico de prueba. Paso 5: Tomar una muestra y llegar a la decisión. Paso 4: Formular la regla de decisión.
Procedimiento de pruebas La hipótesis nula es una afirmación o enunciado tentativo que se realiza acerca del valor de un parámetro poblacional. La hipótesis alternativa es una afirmación o enunciado que se aceptará si hay evidencia de que la hipótesis nula es falsa. El nivel de significación es el riesgo que se asume acerca de rechazar la hipótesis nula cuando en realidad debe aceptarse por ser verdadera. Error Tipo I: La probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera. Error Tipo II: La probabilidad de aceptar la hipótesis nula cuando en realidad es falsa. Un estadístico de prueba es un valor determinado a partir de la información muestral, que se utiliza para aceptar o rechazar la hipótesis nula. Pruebas de significación de una y dos colas El signo < apunta a la región de rechazo en la cola inferior de la curva normal. rechazo aceptación - 1.645 0 Valor crítico
Pruebas de significación de una y dos colas El signo > apunta a la región de rechazo en la cola superior de la curva normal. aceptación rechazo 0 1.645 Valor crítico Pruebas de significación de una y dos colas Si en la hipótesis alternativa no se especifica una dirección, se aplica una prueba de dos colas o extremidades. rechazo aceptación rechazo - 1.645 Valor crítico 0 1.645 Valor crítico
Se utiliza el estadístico z cuando el tamaño de la muestra es grande (mayores a 30). Donde: = Media muestral = Media poblacional = Desviación estándar poblacional n = Tamaño de la muestra Se sabe que la distribución de las tasas de eficiencia para los trabajadores de una compañía se distribuye normalmente con una media poblacional de 200 y una desviación estándar poblacional de 16. El departamento de investigación cuestiona esta media, afirmando que es diferente de 200. Usar el nivel de significación del 1% y probar la hipótesis de que la media poblacional es de 200. Paso 1: Plantear la hipótesis nula y alternativa. H0: La media poblacional es de 200 H1: La media poblacional no es 200
Paso 2: Seleccionar el nivel de significación. Se utilizará el nivel del 5% Paso 3: Identificar el estadístico de prueba. El estadístico adecuado es z, pues se está analizando la hipótesis sobre una media poblacional cuando el tamaño de la muestra es grande (mayores a 30). La transformación de los datos a unidades estándares (valores z) permite que se usen en un gran número de problemas diferentes. Paso 4: Formular la región de decisión. Puesto que es una prueba de dos colas, se busca la porción de cada cola que determina la mitad del nivel de significación, en este caso la mitad de 0.01 es 0.005. z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 Dado que el valor 0.4950 está entre 2.57 y 2.58, se utiliza un valor de Z de 2.575.
Paso 5: Tomar la muestra y llegar a una decisión. Se analizaron las calificaciones de eficiencia de 100 empleados de producción y se calculó que la media de la muestra es de 203.5. Calculamos el estadístico z para evaluar la hipótesis nula: Dado que 2.19 queda en la región de aceptación, la hipótesis nula que indica que la media poblacional no es diferente de 200, se acepta con un nivel del 0.01 o 1%. La diferencia entre 203.5 y 200 puede atribuirse a una variación aleatoria.
Si se desconoce la desviación estándar poblacional, podemos utilizar la desviación estándar de la muestra: Donde: = Media muestral = Media poblacional s = Desviación estándar muestral n = Tamaño de la muestra Se utiliza el estadístico t cuando el tamaño de la muestra es pequeña (menores a 30). Donde: = Media muestral = Media poblacional = Desviación estándar poblacional n = Tamaño de la muestra
La distribución t-student tiene la siguientes características: Como la distribución normal, es una distribución continua. Como la distribución normal, tiene forma de campana y simétrica. No hay una distribución t, sino una familia de distribuciones t. Todas tiene la misma media igual a cero, pero sus desviaciones estándar difieren de acuerdo al tamaño de la muestra n. Es más extendida y menos aguda en el centro que la distribución normal. Prueba de hipótesis sobre una proporción Se utiliza el estadístico z con la siguiente fórmula. Donde: = Proporción muestral p = Proporción poblacional n = Tamaño de la muestra
Cierre Las pruebas de hipótesis nos permiten, a partir de las muestras de una población y de los estadísticos poblacionales con los que se cuenta, como por ejemplo la media poblacional, investigar un poco más a fondo el comportamiento real de la población en estudio a partir de una nueva evaluación, como por ejemplo de la media de una muestra. Conocimos la teoría acerca de las pruebas de hipótesis y utilizamos el método de cinco pasos para llevar a cabo una prueba de hipótesis. Aprendimos a reconocer si la prueba de hipótesis es de una cola, izquierda o derecha, o de dos colas y determinar el signo < ó > para la hipótesis nula. Cierre Durante el desarrollo de este tema, utilizamos dos estadísticos de prueba: el de la normal estándar para poblaciones grandes, es decir, donde la muestra es mayor a 30 elementos, y también lo utilizamos para realizar pruebas de hipótesis para proporciones. También conocimos y utilizamos en estadístico t, que diluye un poco el error ocasionado por obtener datos muestrales a partir de muestras pequeñas, menores a 30 elementos. Cómo sabemos que dos poblaciones normales o dos proporciones tomadas de distintos grupos muestrales, pertenecen a la misma población? En el próximo tema realizaremos tales comparaciones.
Referencias bibliográficas Devore, J. (2008). Probabilidad y estadística para ingeniería y ciencias. (7a. Ed.). México: Cengage Learning. Capítulo: 7 Wakerly, D., Mendenhall, W. et al. (2002). Estadística matemática con aplicaciones. (6a. Ed). México: Cengage Learning. Spiegel, M. (2004). Probabilidad y estadística (2a. Ed). México: McGraw Hill. Créditos Diseño de contenido: Ing. Armando Calzada Mezura, MA, PMP Coordinador académico: Lic. José de Jesús Romero Álvarez, MC y MED. Edición de contenido: Lic. Verónica Montes de Oca Pinzón. Edición de texto: Lic. Arcelia Ramos Monobe, MEE Diseño Gráfico: Lic. Alejandro Calderas González, MATI