MODELOS DE PROBABILIDAD Y MUESTREO ALEATORIO Julián de la Horra Departamento de Matemáticas U.A.M.

Documentos relacionados
MODELOS DE PROBABILIDAD Y MUESTREO ALEATORIO Julián de la Horra Departamento de Matemáticas U.A.M.

2 Algunos conceptos de convergencia de sucesiones de variables aleatorias

Tema 4. Estimación de parámetros

2 Conceptos básicos y planteamiento

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

4 - DESIGUALDAD DE CHEBYSHEV- LEY DE LOS GRANDES NUMEROS

IntroducciónalaInferencia Estadística

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

TEMA 5.-ESTIMACIÓN PUNTUAL.- (16/17) 5.1. Introducción a la Inferencia Estadística Método de los momentos

T1. Distribuciones de probabilidad discretas

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

Estimación de Parámetros

Preguntas más Frecuentes: Tema 2

3. Distribuciones de probabilidad

Distribuciones en el muestreo, EMV

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO

UNIDAD 9. PROBABILIDAD Matemáticas II. Ies do Barral.Curso 2017/ Experimentos aleatorios

CAPÍTULO I. Conceptos Básicos de Estadística

2.2. Estadísticos de tendencia central

Estimadores Puntuales: Propiedades de estimadores Sebastián Court

T ema 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD. x 1. x 2 = 1 = 2. x 3 = 3. x 4. Variable aleatoria: definición y tipos:

Tema 14: Inferencia estadística

Análisis de resultados. Independencia de las muestras

Importancia de las medidas de tendencia central.

ESTADÍSTICA UNIDIMENSIONAL

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS

2 FUNDAMENTOS DE PROBABILIDAD

Qué es la estadística?

Introducción a la Inferencia Estadística. Muestreo en poblaciones normales

8 DESIGUALDAD DE TCHEBYCHEFF LEY DE LOS GRANDES NÚMEROS

Capítulo 4 (Continuación) MÉTODOS ESTADÍSTICOS. Autor: José María García Palanco

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA.

Estadística Aplicada a las ciencias Sociales Examen Febrero de 2008 segunda semana

TEMA 6.- INTERVALOS DE CONFIANZA

1. Intervalos de Conanza

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

DISTRIBUCIONES DE PROBABILIDAD.- DISTRIBUCIÓN BINOMIAL (BERNOULLI) DISTRIBUCIÓN NORMAL (GAUSS)

UNIDAD 3.- INFERENCIA ESTADÍSTICA I

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

1. Propiedades de los estimadores

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

Tema 2. Medidas descriptivas de los datos

1.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

La ley de los grandes números

El método de Monte Carlo

TEMA 6 MUESTRAS ALEATORIAS Y DISTRIBUCIONES EN EL MUESTREO

ANDALUCÍA / JUNIO 04. LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / EXAMEN COMPLETO OPCIÓN A

Sistemas de Ecuaciones Lineales. M. en I. Gerardo Avilés Rosas

1 x 1 0,1666. sabiendo que 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

Convergencia de variables aleatorias

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

Probabilidad FENÓMENOS ALEATORIOS

MINITAB y MODELOS DE REGRESIÓN

Semana 10 [1/24] Sucesiones (II) 2 de mayo de Sucesiones (II)

Series de potencias. Desarrollos en serie de Taylor

Sobre los intervalos de confianza y de predicción

Tasa de Fallo y Variables Aleatorias sin Memoria

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

3.1. Muestreo aleatorio sin reposición Muestreo aleatorio con reposición (muestreo aleatorio simple)

Cálculo y EstadísTICa. Primer Semestre.

Una sucesión es un conjunto infinito de números ordenados de tal forma que se puede decir cuál es el primero, cuál el segundo, el tercero, etc.

UT-4: Distribuciones fundamentales de muestreo y descripción de datos

Series infinitas de números reales. Series convergentes

13.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

Estimación por intervalos

Tema 5. Sucesiones de Variables Aleatorias

Desigualdad de Tchebyshev

Universidad Nacional del Litoral Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingenierías RH-Amb-Ag TEORÍA

Guía 1 Matemática: Estadística NM 4

TEMA 3: INFERENCIA ESTADISTICA

una sucesión de funciones de A. Formemos una nueva sucesión de funciones {S n } n=1 de A de la forma siguiente:

Luis González Abril y Luis M. Sánchez-Reyes {luisgon, - Dpto. Economía Aplicada I Universidad de Sevilla

Capítulo VARIABLES ALEATORIAS

NOTAS SOBRE INFERENCIA ESTADÍSTICA BAYESIANA. José G. Ríos Alejandro. Abril del 2011.

Estadística Descriptiva

Un sistema de m ecuaciones lineales con n incógnitas es un conjunto de m igualdades del tipo:......

En esta tema sentaremos las bases del muestreo estadístico y estudiaremos las distribuciones de algunos estadísticos a partir de una muestra.

Trata de describir y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor.

ESTADÍSTICA. n i Se pide:

Sucesiones I Introducción

Prácticas de Matemáticas I y Matemáticas II con DERIVE 136

9.3. Contrastes de una proporción

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Sobre los intervalos de confianza y de predicción Javier Santibáñez 7 de abril de 2017

Cálculo de límites Criterio de Stolz. Tema 8

Estimación de Parámetros. Estimación de Parámetros

Práctica 2 VARIABLES ALEATORIAS CONTINUAS

Tema 11. Soluciones a los ejercicios adicionales

X X. ... n. Medidas de tendencia Central Estadígrafos de tendencia central.

Objetivo. 1. Intervalos y test (una sola muestra) Práctica 7: Intervalos de conanza y contrastes de hipótesis I. M. Iniesta Universidad de Murcia

Pre-PAES 2016 Media aritmética, moda y mediana.

12 I N F E R E N C I A E S T A D Í S T I C A II (CONTRASTE DE HIPÓTESIS)

Departamento de Matemáticas

TEMA 4- MODELOS CONTINUOS

Transcripción:

MODELOS DE PROBABILIDAD Y MUESTREO ALEATORIO Juliá de la Horra Departameto de Matemáticas U.A.M. 1 Itroducció La Estadística Descriptiva os ofrece ua serie de herramietas muy útiles para resumir gráfica y uméricamete los datos que hemos obteido sobre ua característica o variable de iterés, X, de ua població. Estos resúmees so muy iteresates, pero el objetivo de la Estadística habitualmete va más allá: pretede obteer coclusioes sobre la població a partir de los datos obteidos e la muestra. La obteció de coclusioes será el objetivo de la Iferecia Estadística y para su desarrollo ecesitaremos los modelos de probabilidad. E particular, será ecesario modelizar las variables de iterés, X, como variables aleatorias. E este capítulo, presetaremos el cocepto de variable aleatoria (discreta y cotiua), y los modelos de probabilidad más utilizados e la práctica. Fialmete, itroduciremos las características que debe poseer ua muestra aleatoria, para que podamos obteer coclusioes razoadas sobre toda la població. 2 Variables aleatorias discretas Ua variable aleatoria discreta es ua modelizació de ua característica X de tipo discreto. Recordemos que ua característica X es de tipo discreto cuado puede tomar ua serie de valores claramete separados x 1,..., x k. E ua muestra cocreta de tamaño, cada uo de estos valores aparece 1,..., k veces (frecuecias absolutas). La frecuecia relativa de cada valor es f i = i /. Defiició.- Ua variable aleatoria, X, decimos que es de tipo discreto cuado puede tomar los valores x 1,..., x k co probabilidades P (x 1 ),..., P (x k ). Estas probabilidades recibe el ombre de fució de masa o fució de probabilidad. Las probabilidades so la modelizació e la població de las frecuecias relativas. Igual que las frecuecias relativas, las probabilidades so úmeros etre 0 y 1, y la suma de las probabilidades es 1. 1

Ejemplo.- Cosideremos la variable X= Resultado obteido al lazar u dado corriete co seis caras. Podemos efretaros a esta variable de dos maeras diferetes: 1. Datos muestrales. Lazamos la moeda veces, y aotamos los resultados: obteemos 1 veces el úmero 1,..., 6 veces el úmero 6. La frecuecia relativa co la que hemos obteido el valor i es f i = i /. Si lazamos el dado muchas veces, seguramete las frecuecias relativas será todas ellas bastate parecidas a 1/6, si el dado está equilibrado. 2. Modelo teórico. Cosideramos la variable X= Resultado obteido como ua variable aleatoria discreta que puede tomar los valores 1,...,6, cada uo de ellos co probabilidad 1/6. Cuado trabajábamos co variables discretas e Estadística Descriptiva, podíamos calcular la media muestal y la variaza muestral. Si obteíamos los valores x 1,..., x k, 1,..., k veces, respectivamete, teíamos: Media muestral = x = 1 k k i x i = f i x i i=1 i=1 Variaza muestral = v x = 1 k k i (x i x) 2 = f i (x i x) 2 i=1 i=1 Las defiicioes de media y variaza para ua variable aleatoria discreta sigue la misma filosofía, sustituyedo frecuecias relativas por probabilidades. Defiicioes.- Cosideramos ua variable aleatoria discreta X que puede tomar los valores x 1,..., x k co probabilidades P (x 1 ),..., P (x k ). La media o esperaza de X se defie como: k µ = E[X] = x i P (x i ) i=1 La variaza de X se defie como: k k σ 2 = V (X) = (x i E[X]) 2 P (x i ) =... = x 2 i P (x i ) (E[X]) 2 i=1 i=1 2

3 Variables aleatorias cotiuas Ua variable aleatoria cotiua es ua modelizació de ua característica X de tipo cotiuo. Recordemos que ua característica X es de tipo cotiuo cuado puede tomar cualquier valor e u itervalo de la recta real. E ua muestra cocreta de tamaño, los valores obteidos se puede represetar gráficamete, e u diagrama de tallos y hojas o e u histograma, obteiedo así el perfil de los datos. Defiició.- Ua variable aleatoria, X, decimos que es de tipo cotiuo cuado puede tomar cualquier valor e u itervalo de la recta real co ua fució de desidad f(x) que represeta la idealizació e la població del perfil obteido a partir de los datos e el diagrama de tallos y hojas o e el histograma. Las propiedades básicas de cualquier fució de desidad so las siguietes: 1. f(x) 0 (las frecuecias relativas tampoco podía ser egativas). 2. R f(x)dx = 1 (las frecuecias relativas tambié sumaba uo). 3. P (X I) = I f(x)dx (la fució de desidad sirve para calcular la probabilidad de que la variable aleatoria X tome valores e u itervalo I que os iterese). La media y la variaza de ua variable aleatoria cotiua se defie como e el caso discreto, sustituyedo las probabilidades por la fució de desidad: Defiicioes.- Cosideramos ua variable aleatoria cotiua X co fució de desidad f(x). La media o esperaza de X se defie como: µ = E[X] = R xf(x)dx La variaza de X se defie como: σ 2 = V (X) = (x E[X]) 2 f(x)dx =... = R R x 2 f(x)dx (E[X]) 2 3

La siguiete tabla resume y compara los coceptos que utilizamos, tato cuado dispoemos de datos muestrales, como cuado recurrimos al modelo teórico (e los dos casos, discreto y cotiuo): Muestra Modelo discreto Modelo cotiuo Frec. relativas=f i = i F. de Prob.=P (x i ) F. de desidad=f(x) Media muestral: Media del modelo: Media del modelo: ki=1 f i x ki=1 i x i P (x i ) R xf(x)dx Variaza muestral: Variaza del modelo: Variaza del modelo: ki=1 f i (x i x) 2 ki=1 (x i E[X]) 2 P (x i ) R (x E[X])2 f(x)dx Tambié podemos hablar de la mediaa de ua variable aleatoria X, tato e el caso discreto como e el caso cotiuo. La idea es secilla: la mediaa muestral era el valor que dejaba el 50% de los datos por debajo y el 50% de los datos por ecima. La defiició de mediaa para ua variable aleatoria sigue la misma filosofía: buscamos el valor que deja el 50% de la probabilidad por debajo y el 50% de la probabilidad por ecima. E el caso cotiuo, esta idea se formaliza de maera muy secilla (e el caso discreto, la formalizació es u poco más icómoda): Defiició.- Cosideramos ua variable aleatoria cotiua X co fució de desidad f(x). La mediaa de X se defie como el valor M que verifica: M f(x)dx = 1 2 4 Modelos de probabilidad más importates E esta secció, presetaremos los modelos de probabilidad más iteresates desde el puto de vista de las aplicacioes. Defiició.- Ua prueba de Beroulli es u experimeto aleatorio cuyos posibles resultados so agrupados e dos cojutos excluyetes que llamaremos éxito (E) y fracaso (F ), co P (E) = p y P (F ) = 1 p. Esta divisió e éxito y fracaso puede ser algo que viee dado de maera atural o ua divisió artificial que a osotros os iteresa realizar. Vemos a cotiuació alguos ejemplos secillos: 4

E el lazamieto de ua moeda podemos tomar E = {Cara} y F = {Cruz}. E el lazamieto de u dado podemos tomar, por ejemplo, E = {1, 2} y F = {3, 4, 5, 6}. Al elegir ua persoa al azar e ua població podemos cosiderar, por ejemplo, E = {Altura 180 cm} y F = {Altura < 180 cm}. Al estudiar la duració de uas determiadas piezas podemos cosiderar, por ejemplo, E = {Duracio 1000 horas} y F = {Duracio < 1000 horas}. Las pruebas de Beroulli geera diferetes modelos de probabilidad, alguos de ellos muy iteresates y muy utilizados. Estudiamos alguos de ellos a cotiuació. Defiició.- Realizamos ua prueba de Beroulli co P (E) = p. El modelo de Beroulli de parámetro p, que represetaremos abreviadamete por Ber(p), es el modelo de probabilidad de la variable aleatoria que obteemos al codificar el éxito co uo y el fracaso co cero: { 1 (si obteemos éxito) co probabilidad p X = 0 (si obteemos fracaso) co probabilidad 1 p Sus probabilidades so: P (X = 0) = 1 p ; P (X = 1) = p De maera más compacta y más útil para alguos cálculos, podemos escribir: P (X = x) = p x (1 p) 1 x para x = 0, 1. El modelo de Beroulli es el que utilizaremos cada vez que queremos estudiar la proporció de veces, p, que ocurre u determiado suceso (éxito). Ejemplos: Proporció de veces que obtedríamos cara al lazar ua moeda muchas veces. Proporció de persoas co altura superior a 180 cm e ua població. Proporció de piezas co duració superior a 1000 horas e ua gra remesa. La esperaza y la variaza de ua distribució de Beroulli so imediatas de obteer (simplemete, se aplica las defiicioes): E[X] = p ; V (X) = x 2 i P (x i ) (E[X]) 2 = p p 2 = p(1 p) 5

Defiició.- Realizamos pruebas de Beroulli idepedietes, co P (E) = p e cada prueba. El modelo biomial co parámetros y p, que represetaremos abreviadamete por B(; p), es el modelo de probabilidad de la variable aleatoria X = Número de éxitos obteidos e las pruebas. Sus probabilidades so: P (X = x) = ( x ) p x (1 p) x para x = 0, 1,..., El hecho de que ua variable aleatoria X tega distribució B(; p) lo represetaremos abreviadamete por X B(; p). El mismo tipo de otació se utilizará para otros modelos de probabilidad. La esperaza y la variaza de ua variable aleatoria co distribuió biomial se obtiee fácilmete utilizado las propiedades de las esperazas y las variazas. Para esto, defiimos: X i = { 1 si obteemos éxito e la prueba i-ésima 0 si obteemos fracaso e la prueba i-ésima (i = 1,..., ) De esta forma, teemos que X 1,..., X so variables aleatorias idepedietes co distribució de Beroulli y, además, X = X 1 +... + X. Por lo tato: E[X] = E[X 1 +... + X ] = E[X 1 ] +... + E[X ] = p +... + p = p V (X) = V (X 1 +... + X ) = V (X 1 ) +... + V (X ) = p(1 p) +... + p(1 p) = p(1 p) Calcular probabilidades correspodietes a la distribució biomial o es ada complicado mediate ua calculadora. Puede utilizarse tambié la tabla correspodiete a esta distribució. El modelo de Poisso es otro de los modelos más utilizados e Probabilidad y Estadística. La forma más secilla e ituitiva de presetarlo es como límite de la distribució biomial B(; p), cuado y p 0. Veamos, para esto, cual es el límite de las probabilidades biomiales, cuado, p 0 y p λ (0 < λ < ): lim ( x ) p x (1 p) x = lim ( 1)... ( x + 1) p x (1 p) x x! 6

( 1)... ( x + 1) = lim (p) x (1 p) x x! x = lim 1 ( 1 x!... x + 1 ) x (1 p) (p) (1 p) x = e λ λ x x! Este resultado es el que motiva la siguiete defiició para el modelo de probabilidad de Poisso: Defiició.- El modelo de Poisso de parámetro λ (λ > 0), que represetaremos abreviadamete por Poisso (λ), es el modelo que tiee las siguietes probabilidades: P (X = x) = e λ λ x x! para x = 0, 1,... Es imediato comprobar que, efectivamete, lo aterior es ua fució de masa: e λ λ x P (X = x) = x=0 x=0 x! = e λ x=0 λ x x! = e λ e λ = 1 Ya que hemos presetado el modelo de Poisso como límite del modelo biomial, es fudametal compreder e qué situacioes os ecotraremos, de maera aproximada, co el modelo de Poisso: decir que lo etederemos, ituitivamete, como que es grade, y decir que p 0 lo etederemos como que p es próximo a cero. Por tato, cuado os ecotremos co u modelo biomial co las circustacias idicadas, lo podremos sustituir por el correspodiete modelo de Poisso, tomado λ = p (a título orietativo, digamos que esta sustitució puede resultar acosejable cuado 30, p 0 1 y p 10). Veamos alguos ejemplos e los que surge, de maera atural, la distribució de Poisso como modelo de la variable aleatoria cosiderada: X= Número de erratas por págia e u libro. X= Número de asegurados e ua compañía que ha declarado algú siiestro e u año. E resume, digamos que la distribució de Poisso es u modelo bastate razoable cuado estamos iteresados e estudiar el úmero de éxitos obteidos e u úmero grade de pruebas idepedietes de Beroulli, y la probabilidad de éxito, cada vez que se repite la prueba, es pequeña. 7

Ua maera iformal, pero secilla, de obteer la esperaza y la variaza de ua variable aleatoria X co distribució de Poisso, cosiste e recordar que la distribució de Poisso es límite del modelo biomial; de este modo, teemos: E[X] = lim p = λ ; V (X) = lim(p)(1 p) = λ Como se ha idicado, el procedimieto o es riguroso, pero es cómodo para recordar el valor de la esperaza y de la variaza; aplicado directamete las defiicioes obteemos los mismos resultados, pero co mucho más trabajo. Es secillo calcular probabilidades correspodietes al modelo de Poisso mediate ua calculadora. Tambié se puede utilizar la tabla correspodiete. La distribució Normal es el modelo más importate y más utilizado para variables aleatorias cotiuas. Su importacia proviee de que aparece (por supuesto, de forma aproximada) e muchas situacioes: medidas morfológicas e especies aimales o vegetales (peso, altura, etc), medicioes e experimetos físicos y químicos, etc. E geeral, la distribució Normal surge siempre que los resultados de u experimeto sea debidos a u cojuto muy grade de causas idepedietes que actúa sumado sus efectos, siedo cada efecto idividal de poca importacia respecto al cojuto. Defiició.- El modelo Normal de parámetros µ y σ ( < µ < y σ > 0), que represetaremos abreviadamete por N(µ; σ), es el modelo de probabilidad caracterizado por la fució de desidad: f(x) = 1 [ σ 2π exp 1 ( ) ] x µ 2 para todo x R 2 σ La forma de la fució de desidad es la de ua campaa co su cetro e x = µ. Hay ua serie de propiedades básicas que coviee saber sobre la distribució Normal: a) E[X] = µ. b) V (X) = σ 2. c) Es ua desidad simétrica co respecto a la media µ. 8

Ua cosecuecia de esto es que, por ejemplo, P (X < µ 1) = P (X > µ + 1). d) Si ua variable aleatoria X tiee distribució N(µ; σ), etoces la variable aleatoria Z = X µ σ tiee distribució N(0; 1). Gracias a esta propiedad podremos calcular la probabilidad de u suceso correspodiete a ua variable aleatoria X N(µ; σ) a partir de la tabla de la distribució N(0; 1); ya veremos co u ejemplo como se hace esto. e) La distribució B(; p) tiede a la distribució Normal, cuado (y p está fijo). Por tato, cuado estemos trabajado co u modelo biomial B(; p) co grade, lo podremos sustituir por el correspodiete modelo Normal, tomado µ = p y σ = p(1 p) (a título orietativo, digamos que esta sustitució puede resultar acosejable cuado 30 y 0 1 < p < 0 9). Para darse cueta de la importacia práctica de esta sustitució, podemos cosiderar ua variable aleatoria X B( = 100; p = 0 3) e itetar calcular directamete P (X > 40). f) Si X 1 N(µ 1 ; σ 1 ),..., X N(µ ; σ ) y so idepedietes, etoces: ( ) X 1 +... + X N µ = µ 1 +... + µ ; σ = σ1 2 +... + σ 2 ( ) X 1 X 2 N µ = µ 1 µ 2 ; σ = σ1 2 + σ2 2 Ejemplo.- Vamos a calcular la probabilidad de que la variable aleatoria X tome valores etre -1 y 7, si su distribució es N(µ = 5; σ = 4). Para poder obteer esta probabilidad, vamos a utilizar las propiedades ateriores para trasformar el cálculo de P ( 1 X 7) e algo que podamos obteer utilizado las tablas de la distribució N(0; 1). Estas tablas os da probabilidades del tipo P (Z > z) para z > 0. Teemos: ( 1 5 P ( 1 X 7) = P X 5 7 5 ) 4 4 4 = P ( 1 5 Z 0 5) (por la propiedad d)) = P (Z 1 5) P (Z 0 5) 9

= P (Z 1 5) P (Z 0 5) por la propiedad c)) = 1 P (Z 1 5) P (Z 0 5) = 1 0 0668 0 3085 = 0 6247 (utilizado las tablas) La distribució expoecial es u modelo de probabilidad secillo que se utiliza muy a meudo para modelizar tiempos de vida de seres vivos, tiempos de vida útil de piezas,... Defiició.- El modelo expoecial de parámetro λ (λ > 0), que represetaremos abreviadamete por Exp (λ), es el modelo de probabilidad caracterizado por la fució de desidad: f(x) = { λe λx para x > 0 0 e el resto Utilizado las defiicioes y la itegració por partes, obtedríamos: E[X] = 1 λ ; V (X) = 1 λ 2 5 Muestreo aleatorio y estadísticos El objetivo de la Iferecia Estadística es obteer coclusioes sobre algua característica cuatitativa de ua població a partir de los datos obteidos e ua muestra. Para poder hacer esto de ua forma objetiva y cietífica ecesitamos modelizar, tato la característica que queremos estudiar, como la muestra co los datos que os sumiistrará la iformació. Empezaremos co la modelizació de la característica. Cosideraremos la característica X que os iteresa estudiar e ua població como ua variable aleatoria, discreta o cotiua, segú como sea la característica e cuestió. Como todas las variables aleatorias la distribució de sus posibles valores se podrá modelizar mediate u determiado modelo de probabilidad. Veamos alguos ejemplos: Ejemplo 1.- Cosideramos ua moeda (que o sabemos si está equilibrada o o) y estamos iteresados e estudiar la probabilidad, p, de cara de esa moeda, para lo cual tedremos que lazar la moeda sucesivas veces para ir recopilado iformació. Codificaremos co u uo cada vez que 10

obtegamos cara, y co u cero cada vez que obtegamos cruz. De este modo, estamos iteresados e estudiar la siguiete variable aleatoria: X = { 1 (si sale cara) co probabilidad p 0 (si sale cruz) co probabilidad 1 p } Beroulli (p) Destaquemos que el tipo de modelo de probabilidad que utlizamos para X es coocido, pero os falta por coocer el valor del parámetro p. Este tipo de modelizació será el que utilicemos siempre que queramos estudiar ua probabilidad, ua proporció o u porcetaje. Ejemplo 2.- E ua fábrica, se está esayado ua ueva fibra sitética, y se quiere estudiar la resistecia a la rotura de las cuerdas fabricadas co esta ueva fibra. Para poder abordar este estudio, ecesitaremos datos, para lo cual medimos la resistecia de ua serie de cuerdas y aotamos los resultados. La característica que queremos estudiar e este caso, puede ser modelizada mediate la siguiete variable aleatoria: X = Resistecia a la rotura N(µ; σ) Destaquemos que, uevamete, el tipo de modelo de probabilidad que utlizamos para X es coocido, pero os falta por coocer el valor de los parámetros µ y σ. Estos ejemplos, y otros similares, se puede platear de u modo geeral: Defiició.- Cosideraremos que la característica X, que se quiere estudiar e ua població, es ua variable aleatoria (discreta o cotiua) que viee caracterizada por su fució de probabilidad P θ (x) (caso discreto), o por su fució de desidad f θ (x) (caso cotiuo), dode θ es el ombre geérico que daremos al parámetro o parámetros que idetifica el modelo de probabilidad co el que estamos trabajado. El tipo de modelo de probabilidad es coocido, pero os falta por coocer el valor del parámetro θ. Pasemos ahora a la modelizació de la muestra. Para poder decir algo sesato y objetivo sobre el valor descoocido del parámetro θ, ecesitamos datos procedetes de la població que se está estudiado. Estos datos costituirá ua muestra. Ahora bie, para poder obteer coclusioes sobre la població a partir de los datos, esta muestra tiee que cumplir alguos requisitos. Estos requisitos so los que se defie y explica a cotiuació: 11

Defiició.- Ua muestra aleatoria (o muestra aleatoria simple) de tamaño de ua característica X de ua població (co fució de masa P θ (x) o fució de desidad f θ (x)) es u cojuto de observacioes (X 1,..., X ) dode: 1. El modelo de probabilidad de cada observació X i es el modelo de la característica X que estamos estudiado e la població. Ituitivamete, esto sigifica que cada observació X i es represetativa de la població de procedecia. 2. Las observacioes X 1,..., X so idepedietes. Ituitivamete, esto sigifica ua de las dos siguietes cosas: (a) El muestreo se realiza co reemplazamieto. (b) El muestreo se realiza si reemplazamieto, pero el tamaño muestral es pequeño e comparació co el tamaño de la població, de modo que, e la práctica, es como si fuera co reemplazamieto. Desde u puto de vista técico, todo lo aterior se puede resumir de la siguiete forma: Fució de probabilidad de la muestra (caso discreto): P θ (x 1,..., x ) = P θ (x 1 )...P θ (x ) Fució de desidad de la muestra (caso cotiuo): f θ (x 1,..., x ) = f θ (x 1 )...f θ (x ) Fialmete, idiquemos que hay otros tipos de muestreo, auque aquí vamos a limitaros al muestreo aleatorio. Defiició.- U estadístico es ua fució T de la muestra aleatoria (X 1,..., X ), que utilizaremos como resume de esa muestra. Alguos de los estadísticos más utilizados e todo tipo de situacioes so los siguietes: Media muestral= X = 1 i=1 X i Variaza muestral=v X = 1 i=1 (X i X) [ 2 = 1 i=1 X 2 i X 2] 12

Cuasi-variaza muestral=s 2 = 1 i=1 (X 1 i X) [ 2 = 1 i=1 X 2 1 i X 2] Muchos de estos estadísticos ya apareciero e la Estadística Descriptiva como resúmees de los datos de ua muestra. Sólo hay ua diferecia (de tipo técico): u estadístico puede cosiderarse como ua variable aleatoria y e cosecuecia podemos hablar de su esperaza, de su variaza, etc. Veamos alguas propiedades importates de estos estadísticos: Propiedades.- Sea (X 1,..., X ) ua muestra aleatoria de ua característica X e ua població, co esperaza µ y variaza σ 2. Etoces: 1. E[ X] = µ 2. V ( X) = σ2 3. E[S 2 ] = σ 2 4. E[V X ] = 1 σ2 La comprobació de estas propiedades es secilla. La técicas empleadas e la Iferecia Estadística se agrupa e tres grades bloques, depediedo de la aturaleza del problema que itetemos resolver y del tipo de solució que demos: estimació putual, itervalos de cofiaza y cotraste de hipótesis. Estos tres grades bloques se estudiará e los próximos temas. 13