Descripción de Datos Arturo Vega González a.vega@ugto.mx Division de Ciencias e Ingenierías Universidad de Guanajuato Campus León Universidad de Guanajuato, DCI, Campus León 1 / 28
Contenido 1 Probabilidad Probabilidad Fenómeno aleatorio Muestras y distribuciones 2 Introducción al muestreo 3 Tipos de muestreo Distribuciones de muestreo Universidad de Guanajuato, DCI, Campus León 2 / 28
Probabilidad probabilidad Si un experimento aleatorio resulta de n formas igualmente probables y mutuamente excluyentes, y si n a de esos resultados tienen una característica A entonces la probabilidad de A es la proporción de n a con respecto a n. Universidad de Guanajuato, DCI, Campus León 3 / 28
Probabilidad Axiomas Probabilidad A todo evento aleatorio A S le corresponde de forma unívoca un número P (A), ( probabilidad de A), y se cumple 0 P (A) 1 Universidad de Guanajuato, DCI, Campus León 4 / 28
Probabilidad Axiomas Probabilidad A todo evento aleatorio A S le corresponde de forma unívoca un número P (A), ( probabilidad de A), y se cumple 0 P (A) 1 La probabilidad del evento seguro es igual a uno: P (S) = 1 axioma de normación Universidad de Guanajuato, DCI, Campus León 4 / 28
Probabilidad Axiomas Probabilidad Dados dos eventos mutuamente excluyentes del espacio muestral, la probabilidad de que ocurra uno de ellos es igual a la suma de las probabilidades de estos eventos: A S, A B = P (A B) = P (A) + P (B) adición Universidad de Guanajuato, DCI, Campus León 5 / 28
Probabilidad Axiomas Probabilidad Dados dos eventos mutuamente excluyentes del espacio muestral, la probabilidad de que ocurra uno de ellos es igual a la suma de las probabilidades de estos eventos: A S, A B = P (A B) = P (A) + P (B) adición Para completar el conjunto de los posibles resultados de un fenómeno aleatorio, la suma total de las probabilidades asignadas debe ser igual a 1. Universidad de Guanajuato, DCI, Campus León 5 / 28
Probabilidad Probabilidad Regla de adición: Sean dos eventos mutuamente excluyentes, la probabilidad de que uno u otro suceda es la suma de sus probabilidades. Universidad de Guanajuato, DCI, Campus León 6 / 28
Probabilidad Probabilidad Regla de adición: Sean dos eventos mutuamente excluyentes, la probabilidad de que uno u otro suceda es la suma de sus probabilidades. Regla de Multiplicación: Sean dos eventos independientes la probabilidad de que ambos ocurran es el producto de sus probabilidades. Universidad de Guanajuato, DCI, Campus León 6 / 28
Fenómeno aleatorio Fenómeno / experimento aleatorio Un fenómeno o experimento aleatorio (circunstancia aleatoria), es aquel donde el resultado es incierto y proporciona diferentes resultados aún cuando se repita de la misma forma. Universidad de Guanajuato, DCI, Campus León 7 / 28
Fenómeno aleatorio Fenómeno / experimento aleatorio Un fenómeno o experimento aleatorio (circunstancia aleatoria), es aquel donde el resultado es incierto y proporciona diferentes resultados aún cuando se repita de la misma forma. Lanzar una moneda: águila o sol Lanzar un dado: cualquier numero entre 1 y 6 Estado del clima: soleado o lluvioso Universidad de Guanajuato, DCI, Campus León 7 / 28
Fenómeno aleatorio Fenómeno / experimento aleatorio El conjunto Ω de todos los posibles resultados de un experimento aleatorio se llama espacio muestral. Los elementos del espacio muestral se llaman puntos muestrales. Universidad de Guanajuato, DCI, Campus León 8 / 28
Fenómeno aleatorio Ejemplos Experimento: lanzamiento de una moneda corriente una vez. Los posibles resultados son dos: cara =C y cruz =Z. Esto es, Ω = {C, Z}. Experimento: Dos monedas no distinguibles son lanzadas simultáneamente. Los posibles resultados son: (C, C), (C, Z), (Z, C), (Z, Z). Pero en este caso (C, Z) = (Z, C) y por lo tanto, Ω = {(C, C), (C, Z), (Z, Z)}. Universidad de Guanajuato, DCI, Campus León 9 / 28
Fenómeno aleatorio Ejemplos Experimento: Se lanza una moneda corriente tantas veces sea necesario hasta obtener por primera vez cara y se cuenta el número de cruz obtenidos antes de resultar cara por primera vez. En este caso: Ω = {0, 1, 2,..., }. Experimento: Se observa la posición de una partícula que se mueve aleatoriamente sobre la recta real. En este caso: Ω = R Universidad de Guanajuato, DCI, Campus León 10 / 28
Fenómeno aleatorio Definiciones Si se cumple que P (A) = 1 (P (A) = 0), entonces se llama al evento A( S) un evento casi seguro (evento casi imposible) Universidad de Guanajuato, DCI, Campus León 11 / 28
Fenómeno aleatorio Definiciones Si se cumple que P (A) = 1 (P (A) = 0), entonces se llama al evento A( S) un evento casi seguro (evento casi imposible) Si S es un espacio muestral y P una probabilidad sobre S, entonces se llama al par [S, P ] una familia de probabilidades Universidad de Guanajuato, DCI, Campus León 11 / 28
Fenómeno aleatorio Definiciones Si se cumple que P (A) = 1 (P (A) = 0), entonces se llama al evento A( S) un evento casi seguro (evento casi imposible) Si S es un espacio muestral y P una probabilidad sobre S, entonces se llama al par [S, P ] una familia de probabilidades Si [X, S] es un espacio medible y P es una medida de probabilidad sobre S, entonces a la terna [X, S, P ] se le llama espacio de probabilidad. Universidad de Guanajuato, DCI, Campus León 11 / 28
Fenómeno aleatorio Distribución y Variable aleatoria Considere un conjunto de eventos mutuamente excluyentes (lanzar una moneda) Universidad de Guanajuato, DCI, Campus León 12 / 28
Fenómeno aleatorio Distribución y Variable aleatoria Considere un conjunto de eventos mutuamente excluyentes (lanzar una moneda) La suma de sus probabilidades es uno El conjunto de estas probabilidades es una distribución de probabilidades Universidad de Guanajuato, DCI, Campus León 12 / 28
Fenómeno aleatorio Distribución y Variable aleatoria Considere un conjunto de eventos mutuamente excluyentes (lanzar una moneda) La suma de sus probabilidades es uno El conjunto de estas probabilidades es una distribución de probabilidades Ahora, definamos la variable X. Para el ejemplo de la moneda tenemos que X = 0 si es sol, y X = 1 si es águila. Entonces X es el numero de águilas en un lanzamiento. Universidad de Guanajuato, DCI, Campus León 12 / 28
Fenómeno aleatorio Distribución y Variable aleatoria Considere un conjunto de eventos mutuamente excluyentes (lanzar una moneda) La suma de sus probabilidades es uno El conjunto de estas probabilidades es una distribución de probabilidades Ahora, definamos la variable X. Para el ejemplo de la moneda tenemos que X = 0 si es sol, y X = 1 si es águila. Entonces X es el numero de águilas en un lanzamiento. X es una variable aleatoria y la distribución de probabilidades también es la distribución de X. Universidad de Guanajuato, DCI, Campus León 12 / 28
Muestras y distribuciones Densidad de probabilidad La función de de distribución de un fenómeno aleatorio se define como: F x (x) = P {x x} Universidad de Guanajuato, DCI, Campus León 13 / 28
Muestras y distribuciones Densidad de probabilidad La función de de distribución de un fenómeno aleatorio se define como: F x (x) = P {x x} La derivada de la función de de distribución df (x) f(x) = dx Se conoce como la función de densidad del fenómeno aleatorio x Universidad de Guanajuato, DCI, Campus León 13 / 28
Muestras y distribuciones Densidad de probabilidad Universidad de Guanajuato, DCI, Campus León 14 / 28
Muestras y distribuciones Distribución de las observaciones Universidad de Guanajuato, DCI, Campus León 15 / 28
Muestras y distribuciones Evaluando normalidad Universidad de Guanajuato, DCI, Campus León 16 / 28
Muestras y distribuciones Evaluando normalidad Asimetría Universidad de Guanajuato, DCI, Campus León 16 / 28
Muestras y distribuciones Evaluando normalidad Asimetría Curtosis Universidad de Guanajuato, DCI, Campus León 16 / 28
Muestras y distribuciones Evaluando normalidad Asimetría Curtosis Prueba estadística Shapiro-Wilk W Shapiro-Francia W Anderson-Darling Kolgomorov Universidad de Guanajuato, DCI, Campus León 16 / 28
Muestras y distribuciones Evaluando normalidad Asimetría Curtosis Prueba estadística Shapiro-Wilk W Shapiro-Francia W Anderson-Darling Kolgomorov Normal Plot Universidad de Guanajuato, DCI, Campus León 16 / 28
Muestras y distribuciones Evaluando normalidad Asimetría Curtosis Prueba estadística Shapiro-Wilk W Shapiro-Francia W Anderson-Darling Kolgomorov Normal Plot Q-Q Plot Universidad de Guanajuato, DCI, Campus León 16 / 28
Muestras y distribuciones Normal Plot Universidad de Guanajuato, DCI, Campus León 17 / 28
Muestras y distribuciones Q-Q Plot Universidad de Guanajuato, DCI, Campus León 18 / 28
Tipos de muestreo Muestreo Muestreo Aleatorio. Se usa cuando a cada elemento de la población se le quiere dar la misma oportunidad de ser elegido en la muestra. Universidad de Guanajuato, DCI, Campus León 19 / 28
Tipos de muestreo Muestreo Muestreo Aleatorio. Se usa cuando a cada elemento de la población se le quiere dar la misma oportunidad de ser elegido en la muestra. Muestreo Estratificado. Se usa cuando se conoce de antemano que la población está dividida en estratos, que son equivalentes a categorías y los cuales por lo general no son de igual tamaño. Luego, de cada estrato se saca una muestra aleatoria, usualmente proporcional al tamaño del estrato. Universidad de Guanajuato, DCI, Campus León 19 / 28
Tipos de muestreo Muestreo y recolección Muestreo por conglomerados (Clusters). En este caso la población se divide en grupos llamados conglomerados. Luego se elige al azar un cierto número de ellos y todos los elementos de los conglomerados elegidos forman la muestra. Universidad de Guanajuato, DCI, Campus León 20 / 28
Tipos de muestreo Muestreo y recolección Muestreo por conglomerados (Clusters). En este caso la población se divide en grupos llamados conglomerados. Luego se elige al azar un cierto número de ellos y todos los elementos de los conglomerados elegidos forman la muestra. Muestreo Sistemático. Se usa cuando los datos de la población están ordenados en forma numérica. La primera observación es elegida al azar de entre los primeros elementos de la población y las siguientes observaciones son elegidas guardando la misma distancia entre si. Universidad de Guanajuato, DCI, Campus León 20 / 28
Tipos de muestreo Muestreo y recolección Recolección de datos. Entrevistas personales Entrevistas por teléfono Cuestionarios por correo Observación directa Simulación Bases de datos Universidad de Guanajuato, DCI, Campus León 21 / 28
Tipos de muestreo Distribuciones de muestreo Estadística La estadística nos proporciona una metodología para recolectar, organizar, resumir, analizar datos y hacer inferencias. Estadística descriptiva: Métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Universidad de Guanajuato, DCI, Campus León 22 / 28
Tipos de muestreo Distribuciones de muestreo Estadística La estadística nos proporciona una metodología para recolectar, organizar, resumir, analizar datos y hacer inferencias. Estadística descriptiva: Métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Estadística inferencial: La generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión. La estadística inferencial utiliza la información de una muestra para hacer algunas inferencias acerca de la población Universidad de Guanajuato, DCI, Campus León 22 / 28
Tipos de muestreo Distribuciones de muestreo Estadística Los resultados del análisis estadístico de la muestra son utilizados como nuestra mejor estimación de lo que es cierto para la población en cuestión Universidad de Guanajuato, DCI, Campus León 23 / 28
Tipos de muestreo Distribuciones de muestreo Estadística Los resultados del análisis estadístico de la muestra son utilizados como nuestra mejor estimación de lo que es cierto para la población en cuestión La muestra debe ser aleatoria y representativa de la población. Universidad de Guanajuato, DCI, Campus León 23 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo La muestra debe ser representativa de la población. Universidad de Guanajuato, DCI, Campus León 24 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo La muestra debe ser representativa de la población. Una muestra pequeña proveniente de una distribución normal, pudiese tener una distribución no normal. La media de la muestra puede diferir de la media de la población Universidad de Guanajuato, DCI, Campus León 24 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo La muestra debe ser representativa de la población. Una muestra pequeña proveniente de una distribución normal, pudiese tener una distribución no normal. La media de la muestra puede diferir de la media de la población Generalmente utilizamos la media de la muestra como la mejor estimación de la media de la población. Que tan buena es la media de una sola muestra como un estimador de la población? Universidad de Guanajuato, DCI, Campus León 24 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo Necesitamos una forma de evaluar la incertidumbre asociada con nuestro estimador. Universidad de Guanajuato, DCI, Campus León 25 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo Necesitamos una forma de evaluar la incertidumbre asociada con nuestro estimador. Una forma es suponer que para una población podemos tomar muchas muestras de un tamaño dado Variabilidad de las medias? Universidad de Guanajuato, DCI, Campus León 25 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo Propiedades de la variabilidad de las medias de las muestras. Será menor entre las medias de muestras grandes que para muestras pequeñas Será menor que la variabilidad de observaciones individuales en la población. Aumentará con una mayor variabilidad entre los valores individuales de la población. Universidad de Guanajuato, DCI, Campus León 26 / 28
Tipos de muestreo Distribuciones de muestreo Distribuciones de muestreo Propiedades de las medias de muestras aleatorias. El valor esperado de la distribución de las medias es igual a la media de la población El valor esperado de la desviación estándar de la media de varias muestras es σ/ n ( σ es la desviación estándar de la variable en la población y n es el tamaño de cada muestra) La distribución de las medias de las muestras tendrá una distribución cercana a la Normal, sin importar la distribución de la variable en la población, siempre y cuando las muestras sean suficientemente grandes. Universidad de Guanajuato, DCI, Campus León 27 / 28
Tipos de muestreo Distribuciones de muestreo Error estándar y desviación estándar El error estándar un indicador de que tan bueno es la estimación de la media El error estándar es entonces un indicador de variación en las mediciones La desviación estándar es un índice descriptivo La desviación estándar es un indicador de variación entre los individuos Universidad de Guanajuato, DCI, Campus León 28 / 28