Juan Carlos Colonia INFERENCIA ESTADÍSTICA
PARÁMETROS Y ESTADÍSTICAS Es fundamental entender la diferencia entre parámetros y estadísticos. Los parámetros se refieren a la distribución de la población y los estadísticos a los datos de las muestras. Los parámetros se indican con letras griegas y para los estadísticos se utilizan letras latinas. MEDIA VARIANZA PROPORCIÓN POBLACIÓN 2 MUESTRA x s p 2
PARÁMETROS Y ESTADÍSTICAS Por ejemplo; se tiene que la duración media de los focos fabricados por cierta empresa es de 1,600 horas. En este caso se hace referencia a la población y la duración media se designa por 1,600. Si se toma una muestra aleatoria de 20 focos y se encuentra una duración media de 1,580 horas; en este caso se hace referencia a la muestra y la media se designa por x. Seguidamente se puede tomar una muestra 1 1,580 de 20 focos y obtener una duración media de 1,610 horas; se referencia a la muestra y la media se designa por x2 1,610. Se puede seguir tomando todas las muestras posibles de tamaño 20 y obtener diferentes valores para la media muestral. x La media muestral (media que se obtiene en base a una muestra) es una variable aleatoria mientras que la media poblacional es una constante.
PARÁMETROS Y ESTADÍSTICAS Parámetro Los parámetros son características de una población y son constantes. Son en general, valores poblacionales desconocidos Estadísticas Los estadísticos son características de las muestras y son variables aleatorias Su valor concreto depende de la muestra en la que es calculado
INFERENCIA ESTADÍSTICA La Inferencia Estadística comprende los métodos, basados en conceptos de probabilidad, que son usados para sacar conclusiones acerca de la población en base a los resultados de una muestra extraída de ella. Las conclusiones realizadas están sujetas a error por cuanto los resultados están basados en una muestra y no en toda la población. La Inferencia Estadística no solo provee los métodos para sacar conclusiones acerca de la población, sino también para medir el error de tales conclusiones. Existen dos métodos para realizar inferencia: 1. Estimación de Parámetros 2. Prueba de Hipótesis
INFERENCIA ESTADÍSTICA ESTIMACIÓN DE PARÁMETROS Proceso mediante el cual, a partir de los valores de una variable obtenidos de una muestra aleatoria se obtiene un valor único o un conjunto de valores, con cierto nivel de confianza, para el parámetro de la población bajo estudio. ESTIMACIÓN DE PARÁMETROS Cuál será el promedio de llamadas que ingresan a un Call Center durante un fin de semana? Cuál será la proporción de spam que llegan a un servidor de correo electrónico?
INFERENCIA ESTADÍSTICA PRUEBA DE HIPOTESIS Proceso mediante el cual, a partir de los valores de una variable aleatoria obtenida de una muestra aleatoria se decide si se rechaza o no, con cierta probabilidad de error, el supuesto que se plantea acerca del parámetro de la población bajo estudio. PRUEBA DE HIPOTESIS La proporción de unidades defectuosas producidas por cierto proceso es menor o igual a ocho? Será mayor el nivel de colesterol promedio mayor a 220 en pacientes con problemas cardiacos?
ESTIMACIÓN DE PARÁMETROS
ESTIMACIÓN DE PARÁMETROS Consiste en utilizar datos muestrales para determinar los valores de los parámetros en una población. La estimación de un parámetro puede adoptar la forma de un solo punto, es decir, de un único valor para el parámetro de la población, o un conjunto de valores, es decir, un intervalo de valores posibles en la que esta comprendido el verdadero valor del parámetro. La primera de forma de estimación se llama Estimación Puntual y la segunda Estimación por Intervalo de Confianza.
ESTIMACIÓN PUNTUAL
ESTIMACIÓN PUNTUAL Sea un parámetro cualquiera de una población y su respectivo estimador. ˆ se lee estimado. ˆ Sea X 1, X 2, X 3,..., Xn una muestra aleatoria de tamaño n extraída de una población con función de densidad de probabilidad fx x; discreta o continua. Un estimador puntual del parámetro es una función de las observaciones X, X, X,..., X es decir: 1 2 3 n ˆ h X, X, X,..., X 1 2 3 n
ESTIMACIÓN PUNTUAL Un estimador puntual de un parámetro poblacional es una función de los datos muestrales. Es una fórmula que depende de los valores obtenidos en la muestra. Calcula a partir de una muestra aleatoria de tamaño n extraída de una población, una función de los valores muestrales que proporcione un valor que sustituya al parámetro desconocido de la población. La Estimación Puntual pretende obtener el valor exacto de un parámetro.
ESTIMACIÓN PUNTUAL Por ejemplo, si se pretende estimar la nota media de los alumnos de la FITT de la UTP, puede extraerse una muestra de ellos y ofrecer como estimación puntual la nota media de los alumnos de la muestra. Parámetro: : Nota promedio de los alumnos de la FITT Estimador: : Nota promedio muestral de los alumnos de la FITT ˆ
PRINCIPALES ESTIMADORES PUNTUALES Parámetro Estimador Formula Media ˆ x x 1 n n i 1 x i Varianza 2 ˆ s 2 2 1 n 2 s xi x n 1 i 1 2 Desviación Estándar Proporción ˆ ˆ s p n 1 s xi x n 1 i 1 n 1 1 Exito p xi xi n i 1 0 Fracaso 2
ESTIMACIÓN POR INTERVALOS
ESTIMACIÓN POR INTERVALOS Sea X 1, X 2, X 3,..., Xn una muestra aleatoria de tamaño n extraída de una población con función de densidad de probabilidad fx x; discreta o continua, y sean q1 y q2, dos cantidades que dependen de los valores de la muestra para un cierto estimador ˆ escogido según el parámetro que queremos estimar; q q. Se dice que el intervalo I q 1; q2 es un Intervalo de Confianza para con coeficiente de confianza 1, si se verifica P q q 1 Donde 0 1 1 2, también 1 2 0 1
ESTIMACIÓN POR INTERVALOS
ESTIMACIÓN POR INTERVALOS La estimación por intervalos de un parámetro desconocido proporciona información acerca de los valores de los parámetros que estamos estimando. Proporciona también una indicación del nivel de confianza que se le puede dar a los posibles valores de los parámetros. q1 q2 son variables aleatorias, distintas muestras producen distintos valores de y q. y q1 2 q 1 se denomina limite inferior del intervalo de confianza y limite superior del intervalo. q 2
ESTIMACIÓN POR INTERVALOS 1 es llamado Coeficiente de Confianza, su elección depende del investigador. El intervalo resultante se denomina Intervalo de Confianza del 100 % ó 100 1 % para. La diferencia entre el limite superior e inferior, es decir q2 q1, se denomina la longitud del intervalo de confianza, y es una importante medida de la calidad de la información obtenida de la muestra. La mitad de esta longitud del intervalo de confianza se conoce como precisión.
INTERPRETACIÓN Si se obtuviese un gran número de muestras aleatorias y se construyese con cada una de ellas el correspondiente Intervalo de Confianza para, entonces el 1001 % de estos intervalos contendrán al verdadero valor de. En la practica solo se obtiene una muestra aleatoria, y se calcula solo un intervalo de confianza. Este intervalo puede contener o no al verdadero valor del parámetro, no tiene sentido atribuir una probabilidad al hecho de que contenga al parámetro; se dice que el intervalo contiene a con una confianza de 1001 % y no con una probabilidad de 100 1 %.