Cálculo y estimación de la varianza en la aplicación del estimador de rastrillo (Raking)

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Cálculo y estimación de la varianza en la aplicación del estimador de rastrillo (Raking)"

Transcripción

1 Comunicaciones en Estadística Junio 009, Vol., No. Cálculo y estimación de la varianza en la aplicación del estimador de rastrillo (Raking) Variance Computation and Estimation for the Application of the Raking Estimator Luis Alfonso Orjuela a luis.orjuela@millwardbrown.com Resumen La ponderación por calibración es una metodología en la que los pesos muestrales son ajustados de tal forma que cuando se aplican a un determinado conjunto de datos auxiliares, estos reproducen los totales del universo. El presente trabajo muestra el comportamiento que tiene uno de estos estimadores para totales poblacionales: el estimador de rastrillo frente a un estimador clásico como lo es el t yπ en un diseño muestral como el MAS. Palabras clave: calibración, información auxiliar multivariante, rastrillo, estimador de regresión. Abstract Calibration weighting is a methodology under which probability-sample weights are adjusted in such a way that when applied to data they can produce poblation totals. The present work shows the behavior of one of the estimators for total population: the raking estimator compared to a classical estimator as is the t yπ in a sample design as MAS. Key words: calibration, multivariate auxiliary information, raking, regression estimators.. Introducción Se pretende estimar los totales para un grupo de variables de estudio a partir de una muestra probabilística m extraída del universo U. Con base en la probabilidad de inclusión, π k, para cada elemento k de la muestra m, se estima el total a Marketing Sciences Assistant. Millward Brown. 8

2 8 Luis Alfonso Orjuela poblacional de la variable y, t y = U y k, con el estimador de Horvitz-Thompson, t yπ = y k m π k = U y k I k π k con I k = cuando k m y 0 en otro caso. Considerando a I k como variable aleatoria, se puede demostrar que t yπ es estimador insesgado para t y. Otra forma de escribirlo es t yπ = U d ky k = m d ky k se define d k = I k π k como el peso o el factor de expansión del elemento k en la muestra. Deville & Särndal (99) utilizan el término estimación de calibración para describir el estimador t yw = m w ky k, con m w kx k = U x k = t x para algún vector de variables auxiliares x k = ( ) t x k, x k,, x Pk, con tx = ( ) t tx, t x,, t xp, donde txi es conocida para todo i con i =,..., P. Como consecuencia hay una gran cantidad de conjuntos {w k k m} que satisface la ecuación de calibración: w k x k = t x, () k m Entonces se requiere que la diferencia entre {w k k m} y {d k k m} minimice alguna función de pérdida. Los componentes univariados de la ecuación (): w k x pk = x pk para p =,..., P. () k m k U son llamadas frecuentemente ecuaciones de calibración. Cuando y k es una combinación lineal de x k, para todo k U, entonces t yw es exactamente igual a t y. Esta propiedad es una gran fortaleza de la ponderación por calibración y la razón es porque el estimador de calibración es frecuentemente mucho más eficiente que el estimador de Horvitz-Thompson. Ya que t yw estima perfectamente a t y cuando y k = x t k β, es de esperarse que t yw sea un buen estimador cuando y k = x t kβ estén altamente correlacionados. Esto puede ser formalizado si se supone que los y k son variables aleatorias que satisfacen el modelo de predicción lineal. y k = x t k β + ɛ k, () donde E (ɛ k {x g g m}) = 0 para todo k U. Bajo este modelo, t yw es un estimador asintóticamente insesgado para t y. La sección muestra algunas definiciones y una forma de estudiar la sensibilidad del método de rastrillo para una correcta simulación de Monte Carlo. Posteriormente se realiza la simulación para diferentes poblaciones creadas artificialmente y por último, en la sección se hacen algunos análisis y conclusiones. Comunicaciones en Estadística, junio 009, Vol., No.

3 Cálculo y estimación de la varianza en Raking 8. Argumentos.. Método de Monte Carlo Bajo este nombre, se agrupa una serie de procedimientos que analizan distribuciones de variables aleatorias usando simulación de números aleatorios. Éste es un método no determinístico usado para aproximar expresiones matemáticas complejas y costosas de evaluar con exactitud. Debe su nombre al principado de Monte Carlo por ser la capital del juego de azar, al ser la ruleta un generador simple de números aleatorios. El desarrollo sistemático data aproximadamente de 9 y desde entonces ha sido utilizado como herramienta de investigación. El método de Monte Carlo proporciona soluciones aproximadas a una gran variedad de problemas matemáticos posibilitando la realización de experimentos con muestreos de números pseudoaleatorios en una computadora. El método es aplicable a cualquier tipo de problema, ya sea estocástico o determinístico. A diferencia de los métodos numéricos que se basan en evaluaciones en N puntos en un espacio M-dimensional para producir una solución aproximada, el método de Monte Carlo tiene un error absoluto de la estimación que decrece como N en virtud del teorema del límite central.... Algoritmo El algoritmo de simulación Monte Carlo puro, está fundamentado en la generación de números pseudoaleatorios por el método de transformación inversa, el cual se basa en las distribuciones acumuladas de frecuencias: Determinar las V.A. (Variable aleatoria) y sus distribuciones acumuladas (F) Generar un número aleatorio Determinar el valor de la V.A. (Variable aleatoria) para el número aleatorio generado de acuerdo a las clases que tengamos (iterar tantas veces como sea necesario) Calcular media, desviación estándar error Analizar resultados para distintos tamaños de muestra... Desarrollo de la simulación... Estudio de sensibilidad Para obtener resultados confiables y acertados, se optó por aplicar el método descrito anteriormente (simulación por Monte Carlo). Comunicaciones en Estadística, junio 009, Vol., No.

4 8 Luis Alfonso Orjuela Para determinar el número de muestras (Q) que se seleccionarán, se probó con diferentes tamaños, 500, 000, 500 y 000 muestras que se replican 5 veces cada una, mostrando el comportamiento de las estimaciones realizadas mediante un diseño de muestreo (MAS ) y el ajuste por calibración mediante el método de rastrillo, el cual ajusta las celdas de una tabla de dos o más vias mediante los totales conocidos de las celdas marginales. La población que se utiliza tiene una distribución uniforme con respecto a la ocurrencia de las dos variables auxiliares, las cuales tienen tres categorías cada una que se pueden observar con las siguientes tablas de frecuencias, contando con un total de hasta elementos, además cuenta con 600 conglomerados primarios de muestreo, los cuales no tienen menos de 0 elementos cada uno. Las muestras seleccionadas tienen 0 conglomerados de la primera etapa y un % de los registros de cada conglomerado. Cantidad Variable auxiliar C porcentaje Total %.05 %.7 % 6.57 % Variable auxiliar 7. %.7 %. %. % C % 5. %.8 %. % Total %.0 % 0.0 % 00 % Tabla : Cantidad de elementos por celda Suma (en millones) Variable auxiliar C Media Varianza Variable auxiliar C Tabla : Características de y k por celda Al seleccionar las Q muestras y aplicarles estos dos estimadores, se procede a calcular la media y S a todos los Q estimadores resultantes, con lo que se obtiene un estimador de la esperanza del estimador y un estimador de la varianza del estimador respectivamente. A continuación mostramos el comportamiento de estos estimadores con los diferentes tamaños de muestras. Diseño muestral aleatorio simple en dos etapas de muestra. Comunicaciones en Estadística, junio 009, Vol., No.

5 Cálculo y estimación de la varianza en Raking 85 Simulación con Q = 000 En la Tabla y Figura, se muestran el sesgo relativo y el C.V estimados con base en el promedio y la varianza de mil estimaciones con cada uno de quince experimentos. Sesgo relativo C.V Experimento MAS IP F MAS IP F -,7 %,7 %,0 %,8 % 0, %,5 %, %,8 % -,5 % 0,0 % 0, %,9 % -0,5 % -5,0 %,5 %,9 % 5 -, % -, %,7 %,8 % 6, % -, %,5 %,9 % 7 -,5 % -,6 % 0,6 %,9 % 8, % -, %, %,8 % 9 -, % -, %,0 %,9 % 0,7 %,0 %, %,8 %,9 %, %,0 %,7 % -,0 %,9 % 0,7 %,7 % -0,6 %, %,6 %,9 % -, %,7 %,6 %,7 % 5 0,5 % -0, % 0,6 %,9 % Tabla : Sesgo relativo y coeficiente de variación para 000 iteraciones Figura : Sesgo relativo y coeficiente de variación al replicar 000 veces los dos estimadores Comunicaciones en Estadística, junio 009, Vol., No.

6 86 Luis Alfonso Orjuela para Q = 500 el resultado es: Sesgo relativo C.V Experimento MAS IP F MAS IP F -,5 % 5, %,0 %,8 % -0,5 % 0,0 %,7 %,9 %,6 % -,0 %,5 %,8 % 0,9 % 5, %, %,9 % 5, % 0, %,6 %,8 % 6-0,7 % -,6 %,7 %,8 % 7 -,8 %,0 %, %,8 % 8, % -, %,6 %,9 % 9,5 % 6,6 %, %,9 % 0, % -0, %,9 %,8 % -0, %, %,9 %,9 % -,8 %,0 %,9 %,8 % -0, % -0,5 %, %,8 % 5, %,6 %,6 %,8 % 5 -,5 % -0,8 %,6 %,8 % Tabla : Sesgo relativo y coeficiente de variación para 500 iteraciones Figura : Sesgo relativo y coeficiente de variación al replicar 500 veces los dos estimadores Comunicaciones en Estadística, junio 009, Vol., No.

7 Cálculo y estimación de la varianza en Raking 87 para Q = 000 es: Sesgo relativo C.V Experimento MAS IP F MAS IP F -,0 % -0, % 0,8 %,8 % -0, % 0,0 %,5 %,8 %, % -0, %,9 %,9 % 0,5 % 0, % 0,5 %,9 % 5 0,5 % 0, %, %,9 % 6, % 0,0 %,7 %,8 % 7 -,5 % 0,0 %,6 %,8 % 8 -, % 0,0 %,5 %,8 % 9 0,8 % 0, %,6 %,8 % 0 0,5 % 0,0 %,9 %,9 % -, % 0,0 %,8 %,8 % -0, % 0,0 %,7 %,9 % 0,0 % 0,0 % 0,9 %,9 % 0, % -0, %, %,9 % 5 0,7 % 0, %,8 %,8 % Tabla 5: Sesgo relativo y coeficiente de variación para 000 iteraciones Figura : Sesgo relativo y coeficiente de variación al replicar 000 veces los dos estimadores Como se observa, el C.V. es estable desde las 000 muestras, pero se opta por desarrollar el resto de simulaciones con un tamaño de 500 muestras, ya que aunque el sesgo no es estable, los valores en los que ronda no son importantes y puesto que Comunicaciones en Estadística, junio 009, Vol., No.

8 88 Luis Alfonso Orjuela el t yπ es insesgado, el sesgo registrado es causado por el error de la simulación. Por otro lado, el proceso de calcular las 500 réplicas, tarda entre a horas, y realizar un número mayor de réplicas no aportaría mucho con respecto al incremento de tiempo requerido.... Descripción de las poblaciones Para el ejercicio de comparación se consideraron 7 universos construidos así: todos tienen dos variables auxiliares de tres categorías cada una. Tres poblaciones diferentes según la distribución como se generan variables auxiliares y la variable de interés, Uniforme, Normal y Gamma; el segundo factor es la frecuencia en la cantidad de individuos pertenecientes a las diferentes categorías de las variables auxiliares, estas frecuencias están distribuidas de una manera uniforme, con tendencia no definida y con tendencia marcada hacia un extremo de ellas (Figura ). El tercer factor se refiere a los valores de la variable de interés y k, donde al igual que en las frecuencias de individuos, en el primer caso se encuentran valores muy similares en todas las celdas, en el segundo, se encuentran con una tendencia no definida, y en el tercero con tendencia marcada hacia unas celdas específicas, como se muestra en la Figura 5. Figura : Cantidad de individuos por celda (clasificación de acuerdo a las dos variables auxiliares) A cada población se le aplican cuatro formas de selección de muestras. Todas por medio de un diseño MAS pero cambiando los parámetros de selección, en la primera se toman 0 conglomerados primarios de muestreo (CPM) con una selección del % de los elementos dentro de cada conglomerado, la segunda, 0 CPM y una selección del 5 % de los elementos dentro de cada conglomerado, la tercera 70 CPM y % dentro de cada conglomerado, y por último 70 CPM y 5 % dentro de cada conglomerado. Comunicaciones en Estadística, junio 009, Vol., No.

9 Cálculo y estimación de la varianza en Raking 89 Figura 5: Promedio del valor de la variable de interés y k clasificada por medio de las dos variables auxiliares. Resultados Para los tres grupos de escenarios discriminados por el primer factor (distribuciones uniforme, normal y gamma) se obtienen prácticamente los mismos resultados, con lo que se procede a describir el grupo generado por la distribución uniforme y para los restantes se presentan los resultados en los anexos. Para los 6 escenarios generados por medio de la distribución uniforme se nota que el estimador de rastrillo (IPF) tiene una reducción abismal en el coeficiente de variación con respecto al t yπ ya que el CV que se registra al emplear el estimador de Horvitz-Thompson, ronda los valores de % cuando la selección de conglomerados es menor (0CPM) y se reduce al 6 % cuando en la muestra se escogen 70 CPM. Lo anterior era de esperarse, pero los valores que registra el C.V al aplicar el estimador de rastrillo están alrededor del % (ver Figura 7); en cuanto al sesgo relativo, los valores registrados por la simulación arrojan valores entre el ±5% para ambos estimadores que puede ocasionarse por errores que puede generar la simulación y teniendo en cuenta que el t yπ es un estimador insesgado. Para observar mejor el comportamiento del coeficiente de variación para los dos estimadores, se puede apreciar que tanto las frecuencias de registros en las celdas como las tres diferentes formas de distribuir los valores de los y k no afectan en lo mínimo a este valor, sólo se registra una caída cuando se cambian los parámetros de la muestra (mayor número de CPM). Comunicaciones en Estadística, junio 009, Vol., No.

10 90 Luis Alfonso Orjuela 0 CPM Frecuencia y k Sesgo MAS Sesgo IPF Uniforme 0.8 % -0.0 % Uniforme Irregular -0. % -0.0 % Tendencia -0.7 % -0.0 % Uniforme -0.8 % 0.0 % Irregular Irregular.6 % 0.0 % Tendencia -0.8 % 0.00 % Uniforme 0. % 0.0 % Tendencia Irregular 0.6 % -0.0 % Tendencia. % -0.0 % Tabla 6: Estimación de SESGO RELATIVO para poblaciones seleccionadas con 0 CPM 70 CPM Frecuencia y k Sesgo MAS Sesgo IPF Uniforme 0.0 % 0.0 % Uniforme Irregular -0.6 % -0.0 % Tendencia -0. % 0.0 % Uniforme 0.0 % 0.0 % Irregular Irregular -0. % -0.0 % Tendencia -0. % 0.00 % Uniforme -0.8 % 0.00 % Tendencia Irregular 0. % 0.0 % Tendencia 0.6 % 0.00 % Tabla 7: Estimación de SESGO RELATIVO para poblaciones seleccionadas con 70 CPM 0 CPM Frecuencia y k C.V MAS C.V IPF Uniforme %. % Uniforme Irregular 0 % 0.8 % Tendencia % 0.9 % Uniforme %. % Irregular Irregular % 0.8 % Tendencia % 0.9 % Uniforme %. % Tendencia Irregular % 0.8 % Tendencia % 0.9 % Tabla 8: Estimación de C.V para poblaciones seleccionadas con 0 CPM Comunicaciones en Estadística, junio 009, Vol., No.

11 Cálculo y estimación de la varianza en Raking 9 C.V Typi. CV IPF Vs Celdas 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 celdas Figura 6: Gráfico de caja del coeficiente de variación con respecto a las tres formas de distribuir las cantidades de elementos por celda C.V Typi. CV IPF Vs y_k 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 yk Figura 7: Gráfico de caja del coeficiente de variación con respecto a las tres configuraciones del total de y k por celda.. Caso extremo Como para todos los escenarios el método IPF es una buena opción para aplicar, se realiza el ejercicio con un caso extremo donde se configura el universo de la siguiente forma: Para esta configuración se obtienen resultados más favorables para el π-estimador que para el IPF en términos del C.V. Comunicaciones en Estadística, junio 009, Vol., No.

12 9 Luis Alfonso Orjuela C.V Typi. CV IPF Vs MUESTRA 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 muestra Figura 8: Gráfico de caja del coeficiente de variación con respecto a los cuatro diseños de muestra 70 CPM Frecuencia y k C.V MAS C.V IPF Uniforme 7 % 0.6 % Uniforme Irregular 6 % 0. % Tendencia 7 % 0.5 % Uniforme 6 % 0.6 % Irregular Irregular 7 % 0. % Tendencia 7 % 0.5 % Uniforme 6 % 0.6 % Tendencia Irregular 6 % 0. % Tendencia 6 % 0.5 % Tabla 9: Estimación de C.V para poblaciones seleccionadas con 0 CPM Cantidad Variable auxilar C porcentaje Total % % % 5% Variable auxiliar % % % % C % % 58% 6% Total % 6 % 6 % 00 % Tabla 0: Cantidad de elementos por celda Comunicaciones en Estadística, junio 009, Vol., No.

13 Cálculo y estimación de la varianza en Raking 9 SESGO R Typi, SESGO R IPF Vs Celdas 0,075 ses_r_mas ses_r_ipf 0,050 0,05 0,000-0,05-0,050 celdas Figura 9: Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir las cantidades de elementos por celda SESGO R Typi, SESGO R IPF Vs y_k 0,075 ses_r_mas ses_r_ipf 0,050 0,05 0,000-0,05-0,050 yk Figura 0: Gráfico de caja del sesgo relativo con respecto a las tres configuraciones del total de y k por celda. Conclusiones El sesgo producido por IPF crece respecto al π-estimador en una proporción que es de poca importancia. El coeficiente de variación de IPF se pasa de 0 % con el π-estimador al % con IPF estimador para 0 CPM en la muestra de la primera etapa. El coeficiente de variación se reduce del 7 % al % cuando se pasa del π-estimador al IPF-estimador con tamaño de muestra de 70 CPM. Comunicaciones en Estadística, junio 009, Vol., No.

14 9 Luis Alfonso Orjuela SESGO R Typi. SESGO R IPF Vs MUESTRA 0,075 ses_r_mas ses_r_ipf 0,050 0,05 0,000-0,05-0,050 muestra Figura : Gráfico de caja del sesgo relativo con respecto a los cuatro diseños de muestra Suma (en millones) Variable auxilar C Media Varianza Variable auxiliar C Tabla : Características y k por celda π estimador IP F estimador C.V. % 8. % Sesgo relativo 0.0 % 0.05 % Tabla : Valores de y k La ganancia por aplicar IPF-estimador es entonces siempre muy grande frente al π-estimador. Para todos los universos generados, se obtiene la misma ganancia, es decir, la reducción del C.V no depende ni de la cantidad de y k por celda ni del total. También se obtienen resultados muy parecidos cuando se varia el tamaño y la forma de la tabla Comunicaciones en Estadística, junio 009, Vol., No.

15 Cálculo y estimación de la varianza en Raking 95 Las pruebas realizadas con casos extremos de distribución de elementos por celda, fila o columna, son las únicas que arrojan resultados diferentes, en donde resulta que el π-estimador es mejor que el IPF-estimador. Estos resultados son válidos para la estimación de totales, aunque basados en simulaciones particulares, no pueden extrapolarse para la estimación de cocientes. Agradecimientos Gracias al maestro que no sólo me enseñó técnicas estadísticas y de muestreo, sino que se encargó de mostrarme cómo la disciplina y la pasión con que se hace cada labor, entre otras cosas, son herramientas para lograr la felicidad... Ojalá pudiera hacer entender entre éstas pocas líneas la admiración que siento al gran hombre que dedicó su vida a formar excelentes profesionales, Leonardo Bautista. Recibido: 0 de febrero de 008 Aceptado: de abril de 009 Referencias Bautista, J. (998), Diseños de muestreo estadístico, Universidad Nacional de Colombia. Deville, J. & Särndal, C.-E. (99), Calibration estimators in survey sampling, JASA pp Särndal, C.-E. & Lundström, S. (005), Estimation in Surveys with nonresponse, Jhon wiley & Sons, Ltd, Sweden. Särndal, C.-E., Swensson, B. & Wretman, J. (99), Model Assisted Survey Sampling, Springer, New York. SAS (00), Sas onlinedoc 9..., SAS Institute Inc, Cary, NC. Este artículo es resultado del trabajo de grado para optar por el titulo de estadístico titulado Cálculo y estimación de la varianza en la aplicación del estimador de rastrillo, dirigido por el maestro Leonardo Bautista y presentado en la Universidad Nacional de Colombia en 007. Comunicaciones en Estadística, junio 009, Vol., No.

16 96 Luis Alfonso Orjuela A. Resultados Población Normal Resultados para las poblaciones creadas por medio de la distribución NOR- MAL. 0CPM 70 CPM Frecuencia y k Sesgo MAS Sesgo IPF Sesgo MAS Sesgo IPF Uniforme.0 %.7 % 0.8 %.6 % Uniforme Irregular -. %. % 0.6 %.7 % Tendencia -0. %. % 0.7 %. % Uniforme.7 %.7 % 0.8 %.0 % Irregular Irregular -. %. % 0.7 %. % Tendencia -0. %. % 0.7 % 6.6 % Uniforme.0 %.8 % 0.9 % -. % Tendencia Irregular -. %. % 0.7 %.0 % Tendencia -5.0 %.5 % 0.8 % 0. % Tabla : Sesgo relativo para poblaciones generadas a partir de una distribución Normal 0 CPM 70 CPM Frecuencia y k C.V MAS C.V IPF C.V MAS C.V IPF Uniforme. %.7 % 6.9 % -.9 % Uniforme Irregular 0. %. % 6. % 8.8 % Tendencia. %. % 7.5 %. % Uniforme 0.5 %.7 % 5.9 %. % Irregular Irregular.6 %. % 6. %.5 % Tendencia 0.6 %. % 6. % 5. % Uniforme.7 %.8 % 7. % 0. % Tendencia Irregular 9.7 %. % 6.6 %.8 % Tendencia. %.5 % 6.9 % -. % Tabla : C.V para poblaciones generadas a partir de una distribución Normal B. Resultados Población Gamma Resultados para las poblaciones creadas por medio de la distribución GAM- MA. Comunicaciones en Estadística, junio 009, Vol., No.

17 Cálculo y estimación de la varianza en Raking 97 Sesgo r. MAS. Sesgo r. IPF Vs Celdas 0,00 ses_r_mas ses_r_ipf 0,075 0,050 0,05 0,000-0,05-0,050 celdas Figura : Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir las cantidades de elementos por celda Sesgor.MAS.Sesgor.IPFVs yk 0,00 ses_r_mas ses_r_ipf 0,075 0,050 0,05 0,000-0,05-0,050 yk Figura : Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir el valor de y k Sesgo r. MAS. Sesgo r. IPF Vs Muestra 0,00 ses_r_mas ses_r_ipf 0,075 0,050 0,05 0,000-0,05-0,050 muestra Figura : Gráfico de caja del sesgo relativo con respecto a los cuatro parámetros de selección de muestra Comunicaciones en Estadística, junio 009, Vol., No.

18 98 Luis Alfonso Orjuela CV MAS. CV IPF Vs Celdas 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 celdas Figura 5: Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir las cantidades de elementos por celda CV MAS. CV IPF Vs yk 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 yk Figura 6: Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir el valor de y k CV MAS. CV IPF Vs Muestra 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 muestra Figura 7: Gráfico de caja del sesgo relativo con respecto a los cuatro parámetros de selección de muestra Comunicaciones en Estadística, junio 009, Vol., No.

19 Cálculo y estimación de la varianza en Raking 99 0CPM 70 CPM Frecuencia y k Sesgo MAS Sesgo IPF Sesgo MAS Sesgo IPF Uniforme. %. %. % -.0 % Uniforme Irregular.7 %.0 % -0. % -.0 % Tendencia -7. %.9 % -0.9 %.9 % Uniforme -0. % 0. %. %.9 % Irregular Irregular. % -5.5 % -.9 % -9.7 % Tendencia 0.7 % 0. %. %. % Uniforme. %.6 %. % -. % Tendencia Irregular 0.6 % -0.8 % -.7 % -.7 % Tendencia -.0 %.7 % -. %. % Tabla 5: Sesgo relativo para poblaciones generadas a partir de una distribución Normal 0 CPM 70 CPM Frecuencia y k C.V MAS C.V IPF C.V MAS C.V IPF Uniforme 0.8 %.8 % 6. % 0.9 % Uniforme Irregular. % 0. % 6.7 % 0. % Tendencia 0.9 % 0. % 6.5 % 0. % Uniforme. % 0.8 % 6. % 0. % Irregular Irregular.5 % 0. % 5.8 % 0. % Tendencia.5 % 0. % 6.6 % 0. % Uniforme.8 % 0.8 % 7. % 0. % Tendencia Irregular.0 % 0. % 6. % 0. % Tendencia.0 % 0. % 7.0 % 0. % Tabla 6: Sesgo relativo para poblaciones generadas a partir de una distribución Normal Sesgor.MAS.Sesgor.IPFVsceldas ses_r_mas ses_r_ipf 0,050 0,05 0,000-0,05-0,050-0,075-0,00 celdas Figura 8: Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir las cantidades de elementos por celda Comunicaciones en Estadística, junio 009, Vol., No.

20 00 Luis Alfonso Orjuela Sesgor.MAS.Sesgor.IPFVsyk ses_r_mas ses_r_ipf 0,050 0,05 0,000-0,05-0,050-0,075-0,00 yk Figura 9: Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir el valor de y k Sesgo r. MAS. Sesgo r. IPF Vs muestra ses_r_mas ses_r_ipf 0,050 0,05 0,000-0,05-0,050-0,075-0,00 muestra Figura 0: Gráfico de caja del sesgo relativo con respecto a los cuatro parámetros de selección de muestra CV MAS. CV IPF Vs celdas 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 celdas Figura : Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir las cantidades de elementos por celda Comunicaciones en Estadística, junio 009, Vol., No.

21 Cálculo y estimación de la varianza en Raking 0 CV MAS. CV IPF Vs yk 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 yk Figura : Gráfico de caja del sesgo relativo con respecto a las tres formas de distribuir el valor de y k CV MAS. CV IPF Vs muestra 0,5 CV_MAS CV_IPF 0,0 0,5 0,0 0,5 0,0 0,05 0,00 muestra Figura : Gráfico de caja del sesgo relativo con respecto a los cuatro parámetros de selección de muestra Comunicaciones en Estadística, junio 009, Vol., No.

Tema 5. Muestreo y distribuciones muestrales

Tema 5. Muestreo y distribuciones muestrales 1 Tema 5. Muestreo y distribuciones muestrales En este tema: Muestreo y muestras aleatorias simples. Distribución de la media muestral: Esperanza y varianza. Distribución exacta en el caso normal. Distribución

Más detalles

Unidad 1: Espacio de Probabilidad

Unidad 1: Espacio de Probabilidad Unidad 1: Espacio de Probabilidad 1.1 Espacios de Probabilidad. (1) Breve introducción histórica de las probabilidades (2) Diferencial entre modelos matemáticos deterministicos y probabilísticos (3) Identificar

Más detalles

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016 ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una

Más detalles

4. NÚMEROS PSEUDOALEATORIOS.

4. NÚMEROS PSEUDOALEATORIOS. 4. NÚMEROS PSEUDOALEATORIOS. En los experimentos de simulación es necesario generar valores para las variables aleatorias representadas estas por medio de distribuciones de probabilidad. Para poder generar

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA PROBABILIDAD Y ESTADÍSTICA 4 horas a la semana 8 créditos Semestre variable según la carrera Objetivo del curso: Analizar y resolver problemas de naturaleza aleatoria en la ingeniería, aplicando conceptos

Más detalles

MANUAL DE USO PROGRAMA SENSIBAR

MANUAL DE USO PROGRAMA SENSIBAR MANUAL DE USO PROGRAMA SENSIBAR ANALSIS DE SENSIBILIDAD Y SIMULACION DE MONTECARLO JOSE FUENTES VALDES FACEA - UNIVERSIDAD DE CONCEPCION Facultad de Economía Universidad de Concepción 1 SensiBar. ANALSIS

Más detalles

CM0244. Suficientable

CM0244. Suficientable IDENTIFICACIÓN NOMBRE ESCUELA ESCUELA DE CIENCIAS NOMBRE DEPARTAMENTO Ciencias Matemáticas ÁREA DE CONOCIMIENTO MATEMATICAS, ESTADISTICA Y AFINES NOMBRE ASIGNATURA EN ESPAÑOL ESTADÍSTICA GENERAL NOMBRE

Más detalles

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México SECCIÓN DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México Presentan: Dr. Miguel

Más detalles

METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010

METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010 METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010 SIMCE Unidad de Currículum y Evaluación Ministerio de Educación 2011 Índice 1. Antecedentes Generales 1 2. Metodología

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO LICENCIATURA EN TURISMO UNIDAD DE APRENDIZAJE: ESTADISTICA TEMA 1.5 : ESTADISTICA DESCRIPTIVA M. EN C. LUIS ENRIQUE KU MOO FECHA:

Más detalles

Tema 2. Regresión Lineal

Tema 2. Regresión Lineal Tema 2. Regresión Lineal 3.2.1. Definición Mientras que en el apartado anterior se desarrolló una forma de medir la relación existente entre dos variables; en éste, se trata de esta técnica que permite

Más detalles

Facultad de Ciencias Sociales - Universidad de la República

Facultad de Ciencias Sociales - Universidad de la República Facultad de Ciencias Sociales - Universidad de la República Estadística y sus aplicaciones en Ciencias Sociales Edición 2016 Ciclo Avanzado 3er. Semestre (Licenciatura en Ciencia Política/ Licenciatura

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

Distribuciones muestrales. Distribución muestral de Medias

Distribuciones muestrales. Distribución muestral de Medias Distribuciones muestrales. Distribución muestral de Medias TEORIA DEL MUESTREO Uno de los propósitos de la estadística inferencial es estimar las características poblacionales desconocidas, examinando

Más detalles

1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA

1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA 1. VALORES FALTANTES Los valores faltantes son observaciones que en un se tenía la intención de hacerlas, pero por distintas razones no se obtuvieron. Puede ser que no se encuentre a un encuestado, entonces

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

Simulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12

Simulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12 Simulación I Prof. José Niño Mora Investigación Operativa, Grado en Estadística y Empresa, 2011/12 Esquema Modelos de simulación y el método de Montecarlo Ejemplo: estimación de un área Ejemplo: estimación

Más detalles

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis Matemáticas 2.º Bachillerato Intervalos de confianza. Contraste de hipótesis Depto. Matemáticas IES Elaios Tema: Estadística Inferencial 1. MUESTREO ALEATORIO Presentación elaborada por el profesor José

Más detalles

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. 3. ANÁLISIS DE DATOS DE PRECIPITACIÓN. Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de forma totalmente aleatoria, es decir, un evento dado no está influenciado por los demás,

Más detalles

Estadística Descriptiva

Estadística Descriptiva M. en C. Juan Carlos Gutiérrez Matus Instituto Politécnico Nacional 2004 IPN UPIICSA c 2004 Juan C. Gutiérrez Matus Desde la segunda mitad del siglo anterior, el milagro industrial sucedido en Japón, hizo

Más detalles

Conceptos Básicos de Inferencia

Conceptos Básicos de Inferencia Conceptos Básicos de Inferencia Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Inferencia Estadística Cuando obtenemos una muestra, conocemos

Más detalles

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos:

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos: UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA Probabilidad y Estadística 18/01/10 Clave: 214 Semestre: 1 Duración del curso: semanas: 17 horas: 68 de teoría y 17 de práctica, Total: 85 Horas

Más detalles

SILABO DEL CURSO TEORÍA DE MUESTREO

SILABO DEL CURSO TEORÍA DE MUESTREO FACULTAD DE ESTUDIOS DE LA EMPRESA CARRERA DE MARKETING SILABO DEL CURSO TEORÍA DE MUESTREO 1. DATOS GENERALES 1.1. Carrera Profesional : Marketing 1.2. Departamento : Marketing 1.3. Tipo de Curso : Obligatorio

Más detalles

4. Regresión Lineal Simple

4. Regresión Lineal Simple 1 4. Regresión Lineal Simple Introducción Una vez conociendo las medidas que se utilizan para expresar la fuerza y la dirección de la relación lineal entre dos variables, se tienen elementos base para

Más detalles

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

GRAFICOS DE CONTROL DATOS TIPO VARIABLES GRAFICOS DE CONTROL DATOS TIPO VARIABLES OBJETIVO DEL LABORATORIO El objetivo del presente laboratorio es que el estudiante conozca y que sea capaz de seleccionar y utilizar gráficos de control, para realizar

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

CAPÍTULO 4 TÉCNICA PERT

CAPÍTULO 4 TÉCNICA PERT 54 CAPÍTULO 4 TÉCNICA PERT Como ya se mencionó en capítulos anteriores, la técnica CPM considera las duraciones de las actividades como determinísticas, esto es, hay el supuesto de que se realizarán con

Más detalles

UNIVERSIDAD NACIONAL FEDERICO VILLARREAL FACULTAD DE INGENIERIA INDUSTRIAL Y DE SISTEMAS ESCUELA PROFESIONAL DE INGENIERIA AGROINDUSTRIAL

UNIVERSIDAD NACIONAL FEDERICO VILLARREAL FACULTAD DE INGENIERIA INDUSTRIAL Y DE SISTEMAS ESCUELA PROFESIONAL DE INGENIERIA AGROINDUSTRIAL UNIVERSIDAD NACIONAL FEDERICO VILLARREAL FACULTAD DE INGENIERIA INDUSTRIAL Y DE SISTEMAS ESCUELA PROFESIONAL DE INGENIERIA AGROINDUSTRIAL ASIGNATURA: ESTADÍSTICA I CODIGO : 5B0067 I.- DATOS GENERALES SILABO

Más detalles

UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADISTICA

UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADISTICA UNIVERSIDAD AUTÓNOMA DE CHIAPAS FACULTAD DE INGENIERÍA CAMPUS I PROBABILIDAD Y ESTADISTICA NIVEL : LICENCIATURA CRÉDITOS : 7 CLAVE : ICAE13001731 HORAS TEORÍA : 3 SEMESTRE : QUINTO HORAS PRÁCTICA : 1 REQUISITOS

Más detalles

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición... Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................

Más detalles

Tema 8. Análisis de dos variables Ejercicios resueltos 1

Tema 8. Análisis de dos variables Ejercicios resueltos 1 Tema 8. Análisis de dos variables Ejercicios resueltos 1 Ejercicio resuelto 8.1 La siguiente tabla muestra la distribución del gasto mensual en libros y el gasto mensual en audiovisual en euros en los

Más detalles

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento

Más detalles

Econometría II Grado en finanzas y contabilidad

Econometría II Grado en finanzas y contabilidad Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es

Más detalles

PROGRAMA INSTRUCCIONAL ESTADÍSTICA

PROGRAMA INSTRUCCIONAL ESTADÍSTICA UNIVERSIDAD FERMIN TORO VICE RECTORADO ACADEMICO FACULTAD DE INGENIERIA ESCUELA DE MANTENIMIENTO MECÁNICO ESCUELA DE TELECOMUNICACIONES ESCUELA DE COMPUTACIÓN ESCUELA DE ELÉCTRICA PROGRAMA INSTRUCCIONAL

Más detalles

Aplicación del orden de mayorización a un problema de producción-inventario. An aplication of majorization order on a production-inventory problem

Aplicación del orden de mayorización a un problema de producción-inventario. An aplication of majorization order on a production-inventory problem Revista Facultad de Ingeniería N. o 39. pp. 112-117. Marzo, 2007 Aplicación del orden de mayorización a un problema de producción-inventario Henry Laniado Rodas a,*,diego Alejandro Castañeda b, Andrés

Más detalles

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

Prácticas de Ecología Curso 3 Práctica 1: Muestreo PRÁCTICA 1: MUESTREO Introducción La investigación ecológica se basa en la medición de parámetros de los organismos y del medio en el que viven. Este proceso de toma de datos se denomina muestreo. En la

Más detalles

CURSO DE MÉTODOS CUANTITATIVOS I

CURSO DE MÉTODOS CUANTITATIVOS I CURSO DE MÉTODOS CUANTITATIVOS I TEMA VI: INTRODUCCIÓN AL MUESTREO Ing. Francis Ortega, MGC Concepto de Población y Muestra POBLACIÓN (N) Es el conjunto de todos los elementos de interés en un estudio

Más detalles

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith) INTERVALOS DE CONFIANZA La estadística en cómic (L. Gonick y W. Smith) EJEMPLO: Será elegido el senador Astuto? 2 tamaño muestral Estimador de p variable aleatoria poblacional? proporción de personas que

Más detalles

Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev

Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev PROBABILIDAD Y ESTADÍSTICA Sesión MODELOS ANALÍTICOS DE FENÓMENOS ALEATORIOS CONTINUOS. Definición de variable aleatoria continua. Función de densidad y acumulatíva. Valor esperado, varianza y desviación

Más detalles

Teléfono:

Teléfono: Apartado postal 17-01-218 1. DATOS INFORMATIVOS: MATERIA O MÓDULO: ESTADISTICA II CÓDIGO: 15017 CARRERA: Economía NIVEL: Cuarto No. CRÉDITOS: SEMESTRE / AÑO ACADÉMICO: III semestre 2011-2012 PROFESOR:

Más detalles

Unidad IV: Distribuciones muestrales

Unidad IV: Distribuciones muestrales Unidad IV: Distribuciones muestrales 4.1 Función de probabilidad En teoría de la probabilidad, una función de probabilidad (también denominada función de masa de probabilidad) es una función que asocia

Más detalles

Teoría de muestras 2º curso de Bachillerato Ciencias Sociales

Teoría de muestras 2º curso de Bachillerato Ciencias Sociales TEORÍA DE MUESTRAS Índice: 1. Introducción----------------------------------------------------------------------------------------- 2 2. Muestras y población-------------------------------------------------------------------------------

Más detalles

El ejemplo: Una encuesta de opinión

El ejemplo: Una encuesta de opinión El ejemplo: Una encuesta de opinión Objetivos Lo más importante a la hora de planificar una encuesta es fijar los objetivos que queremos lograr. Se tiene un cuestionario ya diseñado y se desean analizar

Más detalles

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill. GLOSARIO ESTADÍSTICO Fuente: Murray R. Spiegel, Estadística, McGraw Hill. CONCEPTOS Y DEFINICIONES ESPECIALES Es el estudio científico de los métodos para recoger, organizar, resumir y analizar los datos

Más detalles

de Operaciones Área Académica: Sistemas Computacionales Tema: Tipos de Modelos en Investigación Profesor: I.S.C. Guadalupe Hernández Coca

de Operaciones Área Académica: Sistemas Computacionales Tema: Tipos de Modelos en Investigación Profesor: I.S.C. Guadalupe Hernández Coca Área Académica: Sistemas Computacionales Tema: Tipos de Modelos en Investigación de Operaciones Profesor: I.S.C. Guadalupe Hernández Coca Periodo: Julio Diciembre 2011 Keywords: investigation of operations,

Más detalles

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS ESCUELA: UPIICSA CARRERA: INGENIERÍA EN TRANSPORTE ESPECIALIDAD: COORDINACIÓN: ACADEMIAS DE MATEMÁTICAS DEPARTAMENTO: CIENCIAS BÁSICAS PROGRAMA DE ESTUDIO ASIGNATURA: ESTADÍSTICA APLICADA CLAVE: TMPE SEMESTRE:

Más detalles

Pronósticos Automáticos

Pronósticos Automáticos Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de

Más detalles

ESTADISTICA DESCRIPTIVA Y PROBABILIDAD

ESTADISTICA DESCRIPTIVA Y PROBABILIDAD ESTADISTICA DESCRIPTIVA Y PROBABILIDAD CODIGO 213543 (COMPUTACION) 223543 (SISTEMAS) 253443 (CONTADURIA) 263443( ADMINISTRACION) 273443 (GRH) HORAS TEORICAS HORAS PRACTICAS UNIDADES CREDITO SEMESTRE PRE

Más detalles

1. La Distribución Normal

1. La Distribución Normal 1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando

Más detalles

DISTRIBUCIÓN N BINOMIAL

DISTRIBUCIÓN N BINOMIAL DISTRIBUCIÓN N BINOMIAL COMBINACIONES En muchos problemas de probabilidad es necesario conocer el número de maneras en que r objetos pueden seleccionarse de un conjunto de n objetos. A esto se le denomina

Más detalles

PROGRAMA ACADEMICO Ingeniería Industrial

PROGRAMA ACADEMICO Ingeniería Industrial 1. IDENTIFICACIÓN DIVISION ACADEMICA Ingenierías DEPARTAMENTO Ingeniería Industrial PROGRAMA ACADEMICO Ingeniería Industrial NOMBRE DEL CURSO Análisis de datos en Ingeniería COMPONENTE CURRICULAR Profesional

Más detalles

Indicaciones para el lector... xv Prólogo... xvii

Indicaciones para el lector... xv Prólogo... xvii ÍNDICE Indicaciones para el lector... xv Prólogo... xvii 1. INTRODUCCIÓN Qué es la estadística?... 3 Por qué estudiar estadística?... 5 Empleo de modelos en estadística... 6 Perspectiva hacia el futuro...

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión Estadís5ca Tema 2. Modelos de regresión María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo Departamento de Matemá.ca Aplicada y Ciencias de la Computación Este tema se publica bajo

Más detalles

UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA. CARÁCTER: Obligatoria DENSIDAD HORARIA HT HP HS UCS THS/SEM

UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA. CARÁCTER: Obligatoria DENSIDAD HORARIA HT HP HS UCS THS/SEM UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA CARÁCTER: Obligatoria PROGRAMA: Ingeniería Civil DEPARTAMENTO: Ciencias Básicas CODIGO SEMESTRE DENSIDAD HORARIA HT

Más detalles

Asignaturas antecedentes y subsecuentes

Asignaturas antecedentes y subsecuentes PROGRAMA DE ESTUDIOS PROBABILIDAD Área a la que pertenece: Área Sustantiva Profesional Horas teóricas: 3 Horas prácticas: 2 Créditos: 8 Clave: F0056 Asignaturas antecedentes y subsecuentes PRESENTACIÓN

Más detalles

Generación de Variables Aleatorias. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Generación de Variables Aleatorias. UCR ECCI CI-1453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides Generación de Variables Aleatorias UCR ECCI CI-453 Investigación de Operaciones Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción Las variables aleatorias se representan por medio de distribuciones

Más detalles

Fundamentos de Estadística y Simulación Básica

Fundamentos de Estadística y Simulación Básica Fundamentos de Estadística y Simulación Básica TEMA 2 Estadística Descriptiva Clasificación de Variables Escalas de Medición Gráficos Tabla de frecuencias Medidas de Tendencia Central Medidas de Dispersión

Más detalles

Métodos Estadísticos Multivariados

Métodos Estadísticos Multivariados Métodos Estadísticos Multivariados Victor Muñiz ITESM Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre 2011 1 / 20 Victor Muñiz (ITESM) Métodos Estadísticos Multivariados Agosto-Diciembre

Más detalles

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza CARACTERÍSTICAS DE LA POBLACIÓN. Una pregunta práctica en gran parte de la investigación de mercado tiene que ver con el tamaño de la muestra. La encuesta, en principio, no puede ser aplicada sin conocer

Más detalles

Distribución Muestral.

Distribución Muestral. Distribución Muestral jujo386@hotmail.com Uno de los objetivos de la Estadística es tratar de inferir el valor real de los parámetros de la población Por ejemplo Cómo podríamos asegurar que una empresa

Más detalles

CÁLCULO DE PROBABILIDADES

CÁLCULO DE PROBABILIDADES CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.

Más detalles

Discretas. Continuas

Discretas. Continuas UNIDAD 0. DISTRIBUCIÓN TEÓRICA DE PROBABILIDAD Discretas Binomial Distribución Teórica de Probabilidad Poisson Normal Continuas Normal Estándar 0.1. Una distribución de probabilidad es un despliegue de

Más detalles

Análisis de Decisiones II. Tema 17 Generación de números al azar. Objetivo de aprendizaje del tema

Análisis de Decisiones II. Tema 17 Generación de números al azar. Objetivo de aprendizaje del tema Tema 17 Generación de números al azar Objetivo de aprendizaje del tema Al finalizar el tema serás capaz de: Obtener números aleatorios a partir de un proceso de generación. Validar las características

Más detalles

PLANES DE ESTUDIO PARA PRIMER CURSO

PLANES DE ESTUDIO PARA PRIMER CURSO 1. Porcentaje e interés Porcentajes Hacer las comparaciones más fáciles Tanto por ciento Valor del porcentaje Valor base Cálculos básicos con porcentajes Interés Interés compuesto Porcentajes en todos

Más detalles

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas JUEGO DE BASKETBALL Repaso de Distribuciones de Probabilidad Discretas y Continuas PREGUNTA #1 Qué es una variable aleatoria uniforme discreta? Cómo es su distribución? Qué es una variable aleatoria uniforme

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN DIVISIÓN DE MATEMÁTICAS E INGENIERÍA LICENCIATURA EN INGENIERÍA CIVIL ACATLÁN PROGRAMA DE ASIGNATURA CLAVE: 1315 SEMESTRE:

Más detalles

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre

Más detalles

5. Regresión Lineal Múltiple

5. Regresión Lineal Múltiple 1 5. Regresión Lineal Múltiple Introducción La regresión lineal simple es en base a una variable independiente y una dependiente; en el caso de la regresión línea múltiple, solamente es una variable dependiente

Más detalles

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL. MODULO VIII Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL Esquema de Proyecto SNIP INDICE INTRODUCCION I. ASPECTOS GENERALES II. IDENTIFICACION III. FORMULACION IV. EVALUACION

Más detalles

Tema 5 Algunas distribuciones importantes

Tema 5 Algunas distribuciones importantes Algunas distribuciones importantes 1 Modelo Bernoulli Distribución Bernoulli Se llama experimento de Bernoulli a un experimento con las siguientes características: 1. Se realiza un experimento con dos

Más detalles

Prueba Integral Lapso /6

Prueba Integral Lapso /6 Prueba Integral Lapso 2 009-2 76 - /6 Universidad Nacional Abierta Probabilidad y Estadística I (76) Vicerrectorado Académico Cód. Carrera: 06-20 - 508 Fecha: 2-2 - 2 009 MODELO DE RESPUESTAS Objetivos,

Más detalles

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Tema 4 Regresión lineal simple ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del

Más detalles

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO 2013-2014. Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. UNIDAD 3: POLINOMIOS Y FRACCIONES ALGEBRAICAS Operaciones

Más detalles

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis Facultad de Ciencias Sociales, UdelaR Índice 1. Introducción: hipótesis estadística, tipos de hipótesis, prueba de hipótesis 2.

Más detalles

FACULTAD DE INGENIERÍA UNAM PROBABILIDAD Y ESTADÍSTICA Irene Patricia Valdez y Alfaro irenev@servidor.unam.m T E M A S DEL CURSO. Análisis Estadístico de datos muestrales.. Fundamentos de la Teoría de

Más detalles

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------

Más detalles

Construcción de Gráficas en forma manual y con programados

Construcción de Gráficas en forma manual y con programados Universidad de Puerto Rico en Aguadilla División de Educación Continua y Estudios Profesionales Proyecto CeCiMaT Segunda Generación Tercer Año Título II-B, Mathematics and Science Partnerships Construcción

Más detalles

CAPITULO 1: PERSPECTIVE GENERAL DE LA

CAPITULO 1: PERSPECTIVE GENERAL DE LA CONTENIDO CAPITULO 1: PERSPECTIVE GENERAL DE LA INVESTIGACION DE OPERACIONES 1 1.1 Modelos matemáticos de investigación de operaciones. 1 1.2 Técnicas de investigación de operaciones 3 1.3 Modelado de

Más detalles

6.- APLICACIÓN DE FEMA-273 Y ANÁLISIS MODAL PUSHOVER.

6.- APLICACIÓN DE FEMA-273 Y ANÁLISIS MODAL PUSHOVER. 6.- APLICACIÓN DE FEMA-73 Y ANÁLISIS MODAL PUSHOVER. (Application of FEMA-73 and Analysis Modal Pushover) INTRODUCCIÓN.- A continuación se presenta una comparativa en el análisis estático no lineal Pushover,

Más detalles

Consideración del Margen de Desvanecimiento con ICS Telecom en Planeación de Redes de Microceldas (NLOS)

Consideración del Margen de Desvanecimiento con ICS Telecom en Planeación de Redes de Microceldas (NLOS) Consideración del Margen de Desvanecimiento con ICS Telecom en Planeación de Redes de Microceldas (NLOS) Agosto 2008 SEAN YUN Traducido por ANDREA MARÍN Modelando RF con Precisión 0 0 ICS Telecom ofrece

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7) TEMA Nº 7 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD OBJETIVOS DE APRENDIZAJE: Conocer las características de la distribución normal como distribución de probabilidad de una variable y la aproximación de

Más detalles

FINANZAS CORPORATIVAS

FINANZAS CORPORATIVAS FINANZAS CORPORATIVAS RIESGO Y RENDIMIENTO JOSÉ IGNACIO A. PÉREZ HIDALGO Licenciado en Ciencias en la Administración de Empresas Universidad de Valparaíso, Chile TOMA DE DECISIONES Certeza: resultado real

Más detalles

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4 PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área

Más detalles

Medidas de tendencia central y dispersión

Medidas de tendencia central y dispersión Estadística Aplicada a la Investigación en Salud Medwave. Año XI, No. 3, Marzo 2011. Open Access, Creative Commons. Medidas de tendencia central y dispersión Autor: Fernando Quevedo Ricardi (1) Filiación:

Más detalles

Método de cuadrados mínimos

Método de cuadrados mínimos REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,

Más detalles

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL. LECTURA 1: LA DISTRIBUCIÓN NORMAL GENERAL LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I) TEMA 1: LA DISTRIBUCION NORMAL GENERAL PROPIEDADES 1 INTRODUCCION La distribución de probabilidad continua más importante

Más detalles

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña CORRELACIÓN Y REGRESIÓN Juan José Hernández Ocaña CORRELACIÓN Muchas veces en Estadística necesitamos saber si existe una relación entre datos apareados y tratamos de buscar una posible relación entre

Más detalles

Conceptos básicos estadísticos

Conceptos básicos estadísticos Conceptos básicos estadísticos Población Población, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. El concepto

Más detalles

Unidad 5 Control Estadístico de la Calidad. Administración de Operaciones III

Unidad 5 Control Estadístico de la Calidad. Administración de Operaciones III Unidad 5 Control Estadístico de la Calidad Administración de Operaciones III 1 Contenido 1. Antecedentes del control estadístico de la calidad 2. Definición 3. Importancia y aplicación 4. Control estadístico

Más detalles

Determinación del tamaño de muestra (para una sola muestra)

Determinación del tamaño de muestra (para una sola muestra) STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto

Más detalles

Carrera: Ingeniería Civil CIM 0531

Carrera: Ingeniería Civil CIM 0531 1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos: Probabilidad y Estadística Ingeniería Civil CIM 0531 3 2 8 2.- HISTORIA DEL PROGRAMA

Más detalles

SESION 12 LA DISTRIBUCIÓN BINOMIAL

SESION 12 LA DISTRIBUCIÓN BINOMIAL SESION LA DISTRIBUCIÓN BINOMIAL I. CONTENIDOS:. La distribución omial.. Variables aleatorias en una distribución omial. 3. Descripciones de la distribución omial. 4. Distribución de Poisson. II. OBJETIVOS:

Más detalles

Área Académica: Gestión Tecnológica. Asignatura (Estadística para el Desarrollo Tecnológico, 3er Semestre) Tema: Muestra y Muestreo

Área Académica: Gestión Tecnológica. Asignatura (Estadística para el Desarrollo Tecnológico, 3er Semestre) Tema: Muestra y Muestreo Área Académica: Gestión Tecnológica. Asignatura (Estadística para el Desarrollo Tecnológico, 3er Semestre) Tema: Muestra y Muestreo Profesor: Dr. Ernesto Bolaños Rodríguez Periodo: Enero-Junio de 01 Tema:Sample

Más detalles

Ejercicio 1(10 puntos)

Ejercicio 1(10 puntos) ESTADISTICA Y SUS APLICACIONES EN CIENCIAS SOCIALES. Segundo Parcial Montevideo, 4 de julio de 2015. Nombre: Horario del grupo: C.I.: Profesor: Ejercicio 1(10 puntos) La tasa de desperdicio en una empresa

Más detalles