Repaso para el segundo parcial

Documentos relacionados
Estimación por intervalos

Desigualdad de Tchebyshev

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

TEMA 1. ESTADÍSTICA DESCRIPTIVA

SESIÓN 8 DESCRIPCIONES DE UNA RELACIÓN

Estimación por intervalos

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

PRUEBAS DE HIPÓTESIS.

3. Distribuciones de probabilidad

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Capítulo 3. El modelo de regresión múltiple. Jorge Feregrino Feregrino. Econometría Aplicada Utilizando R

SUMA DE VARIABLES ALEATORIAS

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

Universidad Nacional del Litoral Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingenierías RH-Amb-Ag TEORÍA

ANEXO B. Se define como Regresión al estudio de la fuerza, consistencia o grado de asociación de la

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

Estimación de Parámetros

IntroducciónalaInferencia Estadística

Algunas distribuciones teóricas continuas

Tema 4. Estimación de parámetros

Distribuciones en el muestreo, EMV

DISTRIBUCIONES DE PROBABILIDAD.- DISTRIBUCIÓN BINOMIAL (BERNOULLI) DISTRIBUCIÓN NORMAL (GAUSS)

e i y i y i y i 0 1 x 1i 2 x 2i k x ki

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Tema 14: Inferencia estadística

CAPÍTULO I. Conceptos Básicos de Estadística

1 x 1 0,1666. sabiendo que 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

1.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

Estimación de Parámetros. Estimación de Parámetros

SESION 15 DISTRIBUCIONES DE MUESTREO

TEORÍA DE LA ESTIMACIÓN

INFERENCIA ESTADÍSTICA

Determinación del tamaño de una muestra (para dos o más muestras)

Hacia dónde tienden los datos? Se agrupan en torno a un valor? o, se dispersan? Su distribución se parece a alguna distribución teórica?

Estadística y sus aplicaciones en Ciencias Sociales Práctico 4 - Solución Curso ) Como se trata de muestreo sin reposición, se tiene C 5 3

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Bloque 3 Tema 12 PRUEBAS ESTADÍSTICAS PARA EL CONTRASTE DE HIPÓTESIS: PRUEBAS PARAMÉTRICAS

INTRODUCCION Teoría de la Estimación

MINITAB y MODELOS DE REGRESIÓN

República Bolivariana de Venezuela Universidad Nacional Abierta Vicerrectorado Académico Área de Matemática

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

R-SQUARED RESID. MEAN SQUARE (MSE) σˆ 2 ADJUSTED R-SQUARED STANDARD DEVIATION σ ˆ

Práctica 7 CONTRASTES DE HIPÓTESIS

ANDALUCÍA / JUNIO 04. LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / EXAMEN COMPLETO OPCIÓN A

MAS obtenidas de una población N, son por naturaleza propia impredecibles. No esperamos que dos muestras aleatorias de tamaño n, tomadas de la misma

TEMA 6.- INTERVALOS DE CONFIANZA

PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES.

Estimación de parámetros. Biometría

Estimadores Puntuales: Propiedades de estimadores Sebastián Court

9.3. Contrastes de una proporción

Análisis de resultados. Independencia de las muestras

Práctica 2 VARIABLES ALEATORIAS CONTINUAS

Introducción a la Inferencia Estadística. Muestreo en poblaciones normales

Qué es la estadística?

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

UNIDAD 3.- INFERENCIA ESTADÍSTICA I

Objetivo. 1. Intervalos y test (una sola muestra) Práctica 7: Intervalos de conanza y contrastes de hipótesis I. M. Iniesta Universidad de Murcia

Población Joven Adulta Total A favor En contra Total

1. Propiedades de los estimadores

OPCIÓN A EJERCICIO 1_A

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

MUESTREO Y ESTIMACIÓN ESTADÍSTICA

REPASO DE ESTADÍSTICA

4 - DESIGUALDAD DE CHEBYSHEV- LEY DE LOS GRANDES NUMEROS

Calificación= (0,4 x Aciertos) - (0,2 x Errores) No debe entregar los enunciados. Sexo

a) ( ) ( ) Supóngase que se toma una muestra en una población con distribución N ( ;1. Qué tamaño debe tener esta para que P X µ SOLUCIÓN:

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO

CONTRASTE DE HIPÓTESIS

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

I.T. INDUSTRIAL METODOS ESTADÍSTICOS. FORMULARIO I. ESTADISTICA DESCRIPTIVA Xv.a. Media x = n n i x 2 Varianza poblacional σ 2 i

13.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

Métodos de Análisis Cuantitativo

Test de Hipótesis. Material Preparado por Hugo Delfino

El método de Monte Carlo

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

Introducción a la Inferencia Estadística. Material Preparado por Olga Susana Filippini y Hugo Delfino

Tema 8. Sesiones 15 y 16 Guía de clase 8. CONTRASTE DE HIPOTESIS

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

Figura 10. No se satisface el supuesto de linealidad.

Guía 1 Matemática: Estadística NM 4

TEMA 3: INFERENCIA ESTADISTICA

EJERCICIO 1. , a partir de las frecuencias observadas, nij. , que se dan en la tabla del ejercicio.

Topografía 1. II semestre, José Francisco Valverde Calderón Sitio web:


PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

ESTADÍSTICA. n i Se pide:

IES Fco Ayala de Granada Modelo 5 del 2015 (Soluciones) Germán-Jesús Rubio Luna SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS MODELO 5 DEL 2015 OPCIÓN A

PyE_ EF2_TIPO1_

T5. Contrastes para los parámetros de una población Normal

INFERENCIA ESTADÍSTICA

La Estadística y el Mejoramiento Genético

Explicación de la tarea 10 Felipe Guerra. Para la explicación de esta tarea veamos primeramente que es lo que nos están pidiendo.

2 Conceptos básicos y planteamiento

Análisis estadístico de datos. Análisis estadístico de datos simulados. Elección de una distribución. Análisis estadístico de datos simulados

Transcripción:

Repaso para el segudo parcial Dr. Pastore, Jua Igacio Profesor Adjuto.

Alguas Distribucioes Estadísticas Teóricas Distribució Cotiuas: a) Distribució Uiforme b) Distribució de Expoecial c) Relació etre la Distribucioes de Poisso y Expoecial. d) Distribució Normal

Distribució Uiforme Se dice que la variable aleatoria X se distribuye uiformemete e el itervalo [a,b] si su fució de desidad de probabilidades (f.d.p) está dada por: 1 f( x) b- a 0 si a x b e otro caso f(x) 1 b a fdp Esperaza Variaza E X V X b a 2 b a 2 12 a b x

Distribució Uiforme Si X es ua variable aleatoria distribuida uiformemete e el itervalo [a,b] su fució de distribució acumulativa (FDA) está dada por: 0 si x < a x a F(x)= si a x b b a 1 si x > b a FDA b x

Distribució Uiforme fdp F(x) FDA f(x) 1 b a 1 a b x a b x

Distribució Expoecial Se dice que X, que toma todos los valores o egativos, tiee ua distribució expoecial, co parámetro 0, si su fdp está dada por: - x e si x 0 f(x) 0 si x < 0 2.0 1.8 2.0 1.6 1.4 1.0 1.2 1.0 0.5 0.8 0.6 0.4 0.2 0.0 0 1 2 3 4 5 6 7 8 (e la distribució de Poisso)

Distribució Expoecial Esta distribució: suele ser el modelo de aquellos feómeos aleatorios que mide el tiempo que trascurre etre la ocurrecia de dos sucesos. Demostrar las características uméricas de la fució expoecial: 1 1 Ex ( ) V(x)= 2

Distribució Expoecial Sea X ua v.a distribuida expoecialmete, co parámetro fució de distribució acumulativa (FDA) está dada por: 0, su La FDA está dada por: F(x) x 1 e si x 0 0 si x<0 F(x) 1 x

Propiedad fudametal de la Distribucioes Expoecial La distribució expoecial o tiee memoria : P( x< s + t / x> s ) = P( x< t ) La probabilidad de que el elemeto falle e ua hora (o e u día, o e segudo) o depede del tiempo que lleve fucioado. P( s x s t) F( s t) F( s) P( x s t / x s) P( x s) 1 F( s) ( st) s as t s s t 1 e 1 e e e e e ( e 1) s s s 1 (1 e ) e e t 1 e F( t) P( x t)

Relació etre la Distribucioes de Poisso y Expoecial Sea X ua variable de Poisso que mide el úmero de ocurrecias de u determiado suceso e u período t. Etoces: La probabilidad de que o haya ocurrecias e el período de tiempo t está dado por: P X t 0 t e 0 0! e t La variable T : tiempo trascurrido hasta la primera ocurrecia de Poisso e el período t es ua variable expoecial de parámetro λ. Etoces la probabilidad de que la variable aleatoria T exceda el tiempo t está dada por t 0 P T t e P X La v.a X que es igual a la distacia etre coteos sucesivos de u proceso de Poisso co media 0 tiee ua distribució expoecial co parámetro : 0

Relació etre la Distribucioes de Poisso y Expoecial Sea X el úmero de partículas emitidas por ua fuete radioactiva. Si se sabe que el úmero esperado de demisioes e ua hora es de 30 partículas: Cuál es la probabilidad de que sea emitidas al meos 2 partículas e u lapso de 1 miuto? Solució/ X : º de partìculas e 1mi k. e P( X k) k! 30.1 0.5 P ( X 2)01 P ( X 2) 1 P ( X 0) P ( X 1 60 1 0,91 0,09

Relació etre la Distribucioes de Poisso y Expoecial Sea X el úmero de partículas emitidas por ua fuete radioactiva. Si se sabe que el úmero esperado de demisioes e ua hora es de 30 partículas: Cuál es la probabilidad de que el tiempo etre emisioes sucesivas sea mayor a 3 miutos? Solució/ T : tiempo (mi) hasta que ocurre la prox emisio, 30.3 Y : partìculas emitidas e 3mi, 1.5 60 0 1.5 (1.5). e P( T 3) P( Y 0) 0.22 0!

Distribució Normal Pierre Simo de Laplace (1749-1827) Si duda la distribució de probabilidad cotiua más importate, por la frecuecia co que se ecuetra y por sus aplicacioes teóricas, es la distribució ormal, gaussiaa o de Laplace - Gauss. Fue publicada por primera vez e 1733 por De Moivre. A la misma llegaro, de forma idepediete, Laplace (1812) y Gauss (1809), e relació co la teoría de los errores de observació astroómica y física. Karl F. Gauss (1777-1855)

Distribució Normal Se dice que X que toma todos los valores reales, tiee ua distribució ormal, si su fdp está dada por: 1x 2 1 f(x) e co - < x < 2 2 La fució depede de úicamete de dos parámetros, μ y σ, su media y desviació estádar, respectivamete. Ua vez que se especifica μ y σ, la curva ormal queda determiada por completo. E( x) y V( x) 2

Distribució Normal: Pricipales Características: 1.La fució tiee u máximo e x =. 2.La curva es simétrica alrededor del eje vertical x=μ, dode coicide la mediaa (Me) y la moda (Mo ). 3.Los putos de iflexió tiee como abscisas los valores e x=μ ± σ, es cócava hacia abajo si μ-σ<x< μ+σ, y es cócava hacia arriba e cualquier otro puto. 4.La curva ormal se aproxima al eje horizotal de maera asitótica coforme os alejamos de la media e cualquier direcció, es decir Para x tediedo a, el límite f(x) =0. 5.El área total bajo la curva y sobre el eje horizotal es igual a 1. 6.Los parámetros μ y σ so realmete la media y la desviació estádar de la distribució ormal.

Distribució Normal: Pricipales Características: Putos de iflexió - =Mo=Me + +

Distribució ormal co =0 para varios valores 1.6 1.2 0.25 0.5 1 p(x) 0.8 0.4 0-2.50-1.50-0.50 0.50 1.50 2.50

5 5 10 20 30 40 50 60 70 80 90 100 110 120 Distribució ormal co distitas medias y dispersió

N(μ, σ): Iterpretació geométrica La media se puede iterpretar como u factor de traslació. Y la desviació típica como u factor de escala, grado de dispersió,

Estadarizació de la Distribució Normal Dada la dificultad que se ecuetra al resolver las itegrales de ua fucioes desidades de probabilidades asociada a ua v.a. ormal, es ecesario cotar co ua tabulació de las áreas de la curva ormal para ua referecia rápida. Si embargo, sería ua tarea difícil itetar establecer tablas separadas para cada valor de μ y σ. Afortuadamete, podemos trasformar todas las observacioes de cualquier v.a. ormal X a u uevo cojuto de observacioes de ua variable ormal Z co media 0 y desviació estádar 1. x Si X N, Z=, Z N 0,1 2

Estadarizació de la Distribució Normal Sea X ua v.a está dada por: X N 0,1 su fució de distribució acumulativa (FDA) t 1 z 2 P Z z z e dt 2 2 P(Z<z)

Estadarizació de la Distribució Normal x Si X N, y Z= N 0,1 2 Z Pa x b P a x b P a Z b b a

Cálculo de la probabilidad de desviació prefijada. P x Si X N, 2 x x x P P P 1 2 1

Regla de las tres sigmas Es u caso particular de desviació prefijada. x x x Si = 3 P 3 P 3 3 P 3 3 3 3 3 3 3 1 3 2. 3 1 0,9974 Esto sigifica que el suceso x 3 Es prácticamete u suceso cierto, o que el suceso cotrario es poco probable y puede cosiderarse prácticamete imposible.

Regla de las tres sigmas: Su esecia. Si ua variable aleatoria está distribuida ormalmete, etoces la desviació respecto de la esperaza matemática, e valor absoluto, o es mayor que el triple de la dispersió. P x 3 0,9974

Para ilustrar el uso de las Tablas, calculemos la probabilidad de que Z sea meor que 1.64. Primero localizamos u valor de z igual a 1.6 e la primera columa (izquierda), después os movemos a lo largo de la fila hasta ecotrar la columa correspodiete a 0.04, dode leemos 0.9594. Por lo tato P(Z<1.64)=0.9495.

Para ecotrar u valor de z que correspoda a ua probabilidad dada, el proceso se ivierte. Po ejemplo, el valor de z que deja u área de 0.9 bajo la curva a la izquierda de z es de 1.28.

LEY DE LOS GRANDES NÚMEROS Cuado el úmero de repeticioes de u experimeto aleatorio aumeta, la frecuecia relativa del suceso A coverge e setido probabilístico a la probabilidad teórica. Ley de los grades úmeros f P( A) para A

Desigualdad de Tchebyshev Esta desigualdad brida u medio para eteder cómo la variaza mide la variabilidad alrededor de la esperaza matemática de la variable. Si la esperaza y la variaza de la variable X so fiitas, para cualquier úmero positivo k, la probabilidad de que la variable aleatoria X esté e el itervalo 1 k; k es mayor o igual que 1- es decir 2 k 1 P X k 1-2 k

Teorema de Beroulli Geeralizado E toda sucesió de pruebas de Beroulli, la frecuecia relativa coverge e setido probabilístico a p. lím lim P f A p 1 0 P f A p 0 0

Població y Muestra Ua variable aleatoria X co E(x) = µ y V(x) =σ 2 puede pesarse como cualquier característica medible de los idividuos de ua població. El cojuto de todas las medicioes de dicha variable es la Població o Uiverso. Muestra es u subcojuto de la població al que teemos acceso y sobre el que realmete hacemos las medicioes x1, x2, x3,... x N

Població y Muestra Estas variables forma ua muestra aleatoria de tamaño si: Las Xi so variables aleatorias idepedietes. Cada variable Xi tiee la misma distribució de probabilidad que la distribució de la població co su misma esperaza µ y variaza σ 2., es decir E(xi) = µ y V(xi) = σ 2

Teorema de Beroulli Geeralizado Dada ua m.a.s., es decir: ua sucesió x1, x2, x3,... x dos a dos idepedietes, co ua misma distribució de probabilidad y co esperaza y variaza 2 etoces 0 lím P x 1 ó 0 lím P x El límite, e probabilidad, de la media muestral para es igual a la media de la població de la que se extrajo la muestra

Suma de Variables Aleatorias El teorema afirma que, co ciertas restriccioes leves, la distribució de la suma de u gra úmero de variables aleatorias, tiee aproximadamete ua distribució ormal. El valor de este teorema es que o requiere codicioes para las distribucioes de las variables aleatorias idividuales que se suma para tediedo a ifiito.

Suma de Variables Aleatorias Si X es la suma de u gra úmero de variables aleatorias idepedietes x1, x2, x3,... x etoces, bajo ciertas codicioes, la fució de desidad de probabilidad de la variable aleatoria X se distribuye aproximadamete e forma orma, para tediedo a ifiito. Es decir, X x i1 i etoces z X i 1 i 1 2 i i ~ N 0,1 dode EX ( ) i ( X ) 2 i 1 i 1 i Observació:Esta geeralizació es válida cuado las variables aleatorias idividuales sólo hace ua cotribució relativamete pequeña a la suma total

E particular, si las xi está idéticamete distribuidas, es decir, tiee la misma media y la misma variaza de la població de la que fuero extraídas E x i E( X ) E xi E xi. i1 i1 V x i 2 V( X ) V x i V xi. i1 i1 Etoces el teorema afirma que la fdp de la variable S se distribuye ormalmete Luego Suma de Variables Aleatorias X z ~ N0,1. 2

Parámetros y Estimadores Parámetro: Es ua catidad umérica calculada sobre la població. Estadístico o estimador : Es cualquier operació que se hace co la muestra. Por eso es ua fució de las observacioes coteidas e ua muestra. Ejemplos: la media muestral, la proporció muestral y la variaza muestral. Los estimadores so variables aleatorias, por lo tato tiee su distribució de probabilidades que se cooce como distribucioes de muestreo. Estimació: Es el valor umérico que toma u estimador.

Estimació putual: Es u úmero calculado co los datos de la muestra, del cual se espera que estime u parámetro poblacioal. Si X es ua variable aleatoria co distribució de probabilidades f(x), caracterizada por el parámetro descoocido y si x1, x2,..., x es ua muestra aleatoria de tamaño, etoces Es u estimador putual de Estimació de Parámetros ˆ h( x1, x2,... x )

Propiedad de isesgadura: Propiedad de eficiecia Propiedades de los Estimadores Propiedad de suficiecia: U estimador es suficiete si utiliza toda la iformació de la muestra.

Debemos hallar los estadísticos L y U tales que P( L U) 1 Coeficiete de cofiaza Itervalo de cofiaza para la media poblacioal coociedo la 2 X 2 N, Estimació por itervalo Dada ua m.a.s., extraída de ua població co distribució ormal. X N, 2 x z N0,1 P( z Z z ) 1 /2 /2 x z x z /2 /2

Nivel de cofiaza y precisió de la estimació Cuato más alto es el ivel de cofiaza, mayor amplitud tiee el itervalo y meor es la precisió de la estimació. Elecció del tamaño de la muestra La precisió del itervalo de cofiaza es el radio del itervalo z 2 Esto sigifica que al usar la media muestral para estimar la media poblacioal, el error que se comete es: x z 2

x, x, x,... x Distribució Ji-cuadrado Sea 1 2 3 variables aleatorias distribuidas ormal e idepedietemete co media 0 y variaza 1. Etoces la variable aleatoria: 2 x 2 2 2 2 1 x2 x3... x Tiee distribució Ji-Cuadrado co grados de libertad. Co media y variaza 2 2

Distribució Ji-cuadrado 2 Fució de desidadde v x 1 1 2 2 f 2 ( x). x. e x 0 v v 2.2 2 Es o egativa y asimétrica hacia la derecha. Si aumeta, se aproxima a la ormal

Distribució Ji-cuadrado Los putos porcetuales de la distribució se da e la tabla correspodiete 2 2, P f x dx 2 2,

Distribució muestral de la variaza S 2 Si es la variaza de ua muestra aleatoria de tamaño tomada de ua població ormal que tiee ua variaza 2 Etoces la variable aleatoria defiida por 1 2 2 2 1 2 S 2 Se distribuye como 1

Extremos del itervalo para la variaza poblacioal P 2 2 2 1 /2; 1 /2; 1 1 P 2 2 1 S 2 1 1 /2; 1 2 /2; 1 P 2 2 1 S 2 1 S 1 2 2 /2; 1 1 /2; 1 1 S 1 S 2 2 2 2 2 /2; 1 1 /2; 1

Distribució t de Studet Si Z es ua variable aleatoria co distribució N(0,1), V ua variable aleatoria co distribució Ji-Cuadrado co grados de libertad y además Z y V so variables aleatorias idepedietes, etoces la variable aleatoria defiida por: Z T Tiee ua distribució t de Studet co gradis de libertad co la siguiete fdp: V 1 / 2 1 f ( t). t 1 /2 2. t / 1 2 Los putos porcetuales está dados por la tabla correspodiete

Distribució t de Studet Los putos porcetuales está dados por la tabla correspodiete ; P T t f t dt, t Distribució de la media muestral co variaza poblacioal descoocida Si >30, podemos utilizar la distribució ormal y S e reemplazo de Si <30 y proviee de ua distribució ormal, etoces T x t 1 S/

Itervalo de cofiaza para la media co variaza poblacioal descoocida y <30 Si la població base es ormal, la variaza es descoocida y el tamaño de la muestra meor que 30, la media muestral tiee distribució T co -1 grados de libertad P( t T t ) 1 /2, 1 /2, 1 x P( t t ) 1 /2, 1 /2, 1 S S S P( x t x t ) 1 /2, 1 /2, 1 S x t x t /2, 1 /2, 1 S

Itervalo de cofiaza sobre ua proporció Si se ha tomado ua muestra aleatoria de tamaño de ua gra població (posiblemete ifiita), dode X observacioes e esta muestra perteece a la clase de iterés. X ua v.a. biomial, de parámetros y p pˆ X Es el estimador putual de la proporció poblacioal. ˆp La distribució de muestreo de es aproximadamete ormal co esperaza p y variaza p1 p co p o cerca de 0 y 1.

Prueba de Hipótesis Ua prueba de hipótesis es ua técica de Iferecia Estadística que permite comprobar si la iformació que proporcioa ua muestra observada cocuerda (o o) co la hipótesis estadística formulada y, por lo tato, decidir si se debe rechazar o o rechazar dicha hipótesis.

Hipótesis Estadística es cualquier afirmació o cojetura sobre ua o varias características de iterés de la població. Paramétrica : No Paramétrica Es ua afirmació sobre los valores de los parámetros poblacioales descoocidos. Simple la hipótesis asiga valores úicos a los parámetros Compuesta la hipótesis asiga u rago de valores a los parámetros Es ua afirmació sobre algua característica estadística de la població e estudio. Por ejemplo, las observacioes so idepedietes, la distribució de la variable e estudio es ormal, la distribució es simétrica, etc.

Idetificació de las Hipótesis Estadísticas Paramétricas Hipótesis ula H o Hipótesis Alterativa H 1 Se platea co el parámetro de iterés usado alguo de los símbolos La probabilidad de rechazar Ho es muy baja, y se llama ivel de sigificació porque Ho es la hipótesis que se cosidera cierta. Es cotraria a la hipótesis ula. (Niega a H 0 ). Se platea usado,,, >,< segú el caso respectivo al plateo de Ho. Está muy relacioada co la hipótesis de ivestigació, es coherete co los resultados obteidos e la muestra.

Tipos de error Cualquier decisió estará basada sobre iformació parcial de ua població, coteida e ua muestra, por lo que habrá siempre ua posibilidad de ua decisió icorrecta. La siguiete tabla resume cuatro posibles situacioes que puede surgir e u test de hipótesis. Verdadero estado de la població Decisió posible H 0 es cierta H 1 es cierta Se rechazo H 0 Error de tipo I Decisió correcta No se rechaza H 0 Decisió correcta Error de tipo II

Esquema para realizar ua prueba de hipótesis Etapas: 1) Euciado de la hipótesis ula y alterativa 2) Selecció del estadístico de prueba (Cosiderar el parámetro poblacioal utilizado e 1) y los datos del problema). 3)Gráfico de la distribució del estadístico de prueba para la determiació de la regió crítica co el alfa dado y la búsqueda e tabla del valor crítico. 4) Cálculo del valor observado a partir del estadístico. 5) Comparació de valores. 6) Exposició de las coclusioes

Prueba de hipótesis: uilateral y bilateral La posició de la regió crítica depede de la hipótesis alterativa Bilateral H 1 : 20 20 Uilateral Uilateral H 1 : <20 20 20 H 1 : >20

Prueba para la media poblacioal o se cooce la dispersió poblacioal Si la muestra proviee de ua població ormal Cuado se descooce σ, se observa el tamaño de la muestra Si <30 Si 30 La media muestral tiee distribució T, porque S o es ua buea estimació de σ La media muestral se distribuye ormalmete, porque S es ua mejor estimació de σ T x ~ t 1 S/ z x S

Prueba para la comparació de medias Cuado se cooce las variazas, La diferecia de medias muestrales se distribuye ormalmete. Se usa el estadístico Z z ob x x 1 2 1 2 2 2 1 2 1 2 Si 1 + 2-2 30 Cuado se descooce las variazas pero so iguales, se observa el tamaño de cada muestra idep, que proviee de poblacioes ormales Si 1 + 2-2 <30 La diferecia de medias muestrales se distribuye ormalmete. Se usa el estadístico Z z ob x x 1 2 1 2 S S 2 2 1 2 1 2 t ob La diferecia de medias muestrales se distribuye segú T. Se usa el estadístico T x x 1 2 1 2 2 2 1 1 S1 2 1 S2 1 1 2 1 2 1 2

Aálisis de Regresió y Correlació Lieal Si se trata de predecir o explicar el comportamieto de ua variable Y, a la que se deomia depediete o variable respuesta, e fució de otra variable X deomiada idepediete o regresora, Y =f(x), estamos frete a u problema de aálisis de regresió simple; pero si deseamos ivestigar el grado de asociació etre las variables X e Y estamos frete a u problema de aálisis de correlació. Es decir, Nos va a iteresar estudiar la relació que existe etre ellas y de qué forma se asocia. Para esto aalizaremos dos técicas: la de regresió y la de correlació. Frecuetemete se os formula las siguietes pregutas: El peso de las persoas está relacioado co la estatura? El peso y la presió arterial se relacioa? La presió de ua masa de gas depede de su volume y de su temperatura?, etc.

Tipos de relació etre variables Dos variables puede estar relacioadas por ua depedecia fucioal, por ua depedecia estadística o puede ser idepedietes. Raramete se determia ua depedecia fucioal rigurosa ya que ambas variables o ua de ellas, está expuestas a factores aleatorios, surge etoces ua depedecia estadística. La depedecia se llama estadística cuado la variació de ua de las variables da lugar a la alteració de la distribució de la otra. La depedecia estadística se maifiesta e que, al variar ua de las variables se altera el valor medio de la otra, e este caso se llama depedecia de correlació. Estadísticamete os iteresa aalizar la relació etre dos o más variables, siempre que se tega u idicio de que etre ellas existe por lo meos cierto grado de depedecia o asociació. Lo importate es medir y expresar fucioalmete esta relació mediate ua fució o modelo matemático.

Aálisis de regresió simple etre dos variables X e Y Cosideremos el problema de tratar de hallar la relació fucioal existete etre dos variables aleatorias X e Y. Supogamos que e experimetos las variables asumiero pares de valores {(xi,yi):i=1,,}, podemos iicialmete observar su comportamieto graficado dichos pares de valores sobre u sistema de coordeadas ortogoales. Dicho gráfico, llamado diagrama de dispersió a meudo permite discerir si existe algua tedecia hacia algú tipo de iterrelació etre ambas variables, y, si es posible, la aturaleza de dicho tipo de iterrelació.

Diagrama de Dispersió Correlació positiva Y Correlació egativa Y x XY y 1 32 Y X Y X X No hay correlació X Observació: Solo os ocuparemos del caso lieal e esta uidad.

Ajuste de ua fució de regresió: Método de míimos cuadrados Ajustar ua fució de regresió sigifica ecotrar, la fució que exprese co mayor precisió la relació etre las variables X e Y. Gráficamete será aquella fució que mejor se adecue a la ube de putos. E este setido, es recomedable como primer paso costruir el diagrama de dispersió o diagrama de ube de putos para, luego de aalizar su forma, decidir por el tipo de fució matemática (modelo) o la ecuació de regresió que exprese la relació etre las variables X e Y. Luego, se estima los parámetros del modelo, para lo cual existe varios métodos, siedo el más usado el método de míimos cuadrados. D d d d d 2 2 2 2 1 2 1 El problema queda ahora reducido a ecotrar los coeficietes de u tipo de curva C que haga míimo el valor D. Ua vez determiados estos valores, a la curva correspodiete se la llamará curva de regresió de Y sobre X.

Aálisis de regresió lieal simple Es frecuete supoer que existe etre las variables observadas ua relació proximadamete lieal: y ax b i i La recta y=ax+bxes ua recta de regresió. El parámetro a es la pediete de la recta e idica cómo cambia la variable respuesta o depediete cuado el icremeto de x es ua uidad. El parámetro b es el térmio idepediete de la recta e idica el valor de Y cuado X = 0. Problema estadístico: Estimar los parámetros a y b a partir de los datos, de ua muestra.

Ecuació muestral de regresió de Y e X dode Determiació de las rectas de regresió por el método e míimos cuadrados y ax b a yx * 2 i i D y y i * i i yx i i i 2 2 D y y x b y i, D D 0 2 X b y x 0 y b x D D 0 2 0 b b yx i i i i1 i i 2 xi yi yx xi yx xi yx X i b yi i1 Resolviedo el sistema obteemos: y x b x yx x y x y i i i i i1 i1 i1 xy 2 2 xi xi i1 i1 b y i i1 i1 yx x i

INFERENCIA EN REGRESION La recta de regresió os permite, basádoos e los datos de la muestra, estimar u valor de la variable Y, correspodiete a u valor dado xi de la variable X. Para ello es suficiete reemplazar el valor de xi e la recta de regresió y ecotrar el correspodiete valor estimado. La obteció de los coeficietes de la recta de regresió muestral puede cosiderarse tambié como u proceso de estimació putual de los coeficietes poblacioales.

Ejemplo: Determiar la recta de regresió lieal y x b x yx X: represeta el tiempo de recaletamieto Y: los espesores de óxido de cierta pieza x y x y i i i i i1 i1 i1 xy 2 2 xi xi i1 i1 b i i1 i1 y x i X (mi) Y (Ag) 20 30 40 60 70 90 100 120 150 180 3,5 7,4 7,1 15,6 11,1 14,9 23,5 27,1 22,1 32,9 xy i i 18469 x i 860 y i 165,2 x 2 i 98800 0,17 a 1,76 y 0,17 x 1,76 yx x

Coeficiete de correlació de Pearso LA COVARIANZA COMO MEDIDA DE ASOCIACIÓN LINEAL Defiiremos como covariaza de dos variables X e Y, y deotaremos por S XY, el estadístico que os permite aalizar la variació cojuta de dos variables. Viee dado por la siguiete expresió: Cov X, Y S XY x i x yi y Esto os lleva a utilizar la covariaza como ua medida de la asociació lieal etre las variables, de modo que si ésta es positiva, os idica ua relació directa etre ellas y si es egativa, os idica ua relació iversa. Si las variables so idepedietes, etoces la covariaza es aproximadamete 0.

EL COEFICIENTE DE CORRELACIÓN LINEAL Alguas veces es deseable teer u idicador del grado de itesidad o fuerza de la relació lieal etre dos variables X e Y que sea idepediete de sus respectivas escalas de medició. A este idicador se le deomia coeficiete de correlació lieal etre X e Y. El estadígrafo comúmete utilizado se llama coeficiete de correlació del producto mometo de Pearso. Defiició. Sea (X, Y) ua variable aleatoria bidimesioal, defiimos r el coeficiete de correlació muestral etre X e Y como sigue: r i i i i x x y y Cov X, Y 2 2 2 2 x x y y XY r xy x y Notar que si σx=σy r xy

INTERPRETACIÓN El coeficiete de correlació lieal de Pearso (r): -Está acotado etre -1 y 1. -U valor positivo se iterpreta como idicador de ua relació directa: A medida que aumeta los valores de ua variable aumeta los valores de la otra. -U valor egativo se iterpreta como idicador de ua relació iversa : A medida que aumeta los valores de ua variable dismiuye los valores de la otra. -El valor absoluto se iterpreta como el grado de relació lieal existete etre las variables, que será mayor cuato más cercao sea a 1. -Si el valor del coeficiete de correlació muestral, e valor absoluto, es mayor de 0,93 se cosidera buea la estimació que se realiza co la recta de regresió.

INTERPRETACIÓN