ANEXO B. Se define como Regresión al estudio de la fuerza, consistencia o grado de asociación de la

Documentos relacionados
CAPÍTULO 3 METODOLOGÍA. 3.1 Proyección de la Población Urbana y Rural por Grupos de Edades

Capítulo 3. El modelo de regresión múltiple. Jorge Feregrino Feregrino. Econometría Aplicada Utilizando R

SESIÓN 8 DESCRIPCIONES DE UNA RELACIÓN

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

De esta forma, el problema de encontrar la mejor recta se concentra en calcular los valores de la pendiente (m) y de la ordenada al origen (b)

Figura 10. No se satisface el supuesto de linealidad.

1 x 1 0,1666. sabiendo que 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

Universidad Nacional del Litoral Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingenierías RH-Amb-Ag TEORÍA

PyE_ EF2_TIPO1_

PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES.

e i y i y i y i 0 1 x 1i 2 x 2i k x ki

R-SQUARED RESID. MEAN SQUARE (MSE) σˆ 2 ADJUSTED R-SQUARED STANDARD DEVIATION σ ˆ

TEMA 5: REGRESION LINEAL

2 Conceptos básicos y planteamiento

MINITAB y MODELOS DE REGRESIÓN

TEMA 1. ESTADÍSTICA DESCRIPTIVA

T5. Contrastes para los parámetros de una población Normal

y i 0 1 x i 2 2 y i media 2 Varianza 2 i 1 Para calcular el los valores que maximizan L derivamos e igualamos a cero 2 y i 0 1 x i 0 # i 1

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

DISTRIBUCIONES BIDIMENSIONALES

Bloque 3 Tema 12 PRUEBAS ESTADÍSTICAS PARA EL CONTRASTE DE HIPÓTESIS: PRUEBAS PARAMÉTRICAS

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

9.3. Contrastes de una proporción

TEORÍA DE LA ESTIMACIÓN

Análisis de resultados. Independencia de las muestras

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Tema 8. Sesiones 15 y 16 Guía de clase 8. CONTRASTE DE HIPOTESIS

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

Estimación por intervalos

República Bolivariana de Venezuela Universidad Nacional Abierta Vicerrectorado Académico Área de Matemática

2. Estimación de errores de medidas directas

b) Encontrar: τ o σ ; π o σ ; σ y τ. 2. Usar la definición de determinante para encontrar: 4. Calcular los determinantes de las siguientes matrices:

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

TEMA 4: CONTRASTE DE HIPOTESIS

4.- Aproximación Funcional e Interpolación

Determinación del tamaño de una muestra (para dos o más muestras)

Distribuciones en el muestreo, EMV

Resumen Tema 2: Muestreo aleatorio simple. Muestreo con probabilidades desiguales.

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

Explicación de la tarea 10 Felipe Guerra. Para la explicación de esta tarea veamos primeramente que es lo que nos están pidiendo.

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel


PRUEBAS DE HIPÓTESIS.

FUNCIONES. ( a) IGUALDAD DE FUNCIONES Sí y son dos funciones, diremos que las funciones f y

Parte 1: UNIDADES DIDÁCTICAS 2 Y 3. Probabilidades con Sucesos y Variables Aleatorias.

1. Intervalos de Conanza

12 I N F E R E N C I A E S T A D Í S T I C A II (CONTRASTE DE HIPÓTESIS)

Sistemas de Ecuaciones Lineales. M. en I. Gerardo Avilés Rosas

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

17.3 Intervalos de predicción para el promedio de m observaciones futuras

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Regresión lineal simple

DISEÑO Y ANÁLISIS DE DATOS II. NOVIEMBRE con la variable Y. Disponemos de las puntuaciones observadas en Y y de las puntuaciones residuales.

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO COLEGIO DE CIENCIAS Y HUMANIDADES

PRÁCTICA # 3 PREPARACIÓN DE GRÁFICAS GRÁFICAS LINEALES

PRUEBAS DE HIPOTESIS

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA. Esquema del procedimiento de Prueba de Hipótesis

Estimación de Parámetros. Estimación de Parámetros

Identificación de Sistemas

Estadística Descriptiva

I.T. INDUSTRIAL METODOS ESTADÍSTICOS. FORMULARIO I. ESTADISTICA DESCRIPTIVA Xv.a. Media x = n n i x 2 Varianza poblacional σ 2 i

ESTADÍSTICA. n i Se pide:

Práctica 7 CONTRASTES DE HIPÓTESIS

Estimadores Puntuales: Propiedades de estimadores Sebastián Court

Reserva Primera de 2017 (Modelo 3) Solución Germán-Jesús Rubio Luna OPCIÓN A

Tema 4. Estimación de parámetros

Otro ejemplo es la tasa de cambio del tamaño de una población (N), que puede expresarse como:

Métodos Numéricos (SC 854) Ajuste a curvas. 2. Ajuste a un polinomio mediante mínimos cuadrados

Un sistema de m ecuaciones lineales con n incógnitas es un conjunto de m igualdades del tipo:......

Unidad 2 Diseño de experimentos de un factor

Test de Hipótesis. Material Preparado por Hugo Delfino

1.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

2.2. Estadísticos de tendencia central

IntroducciónalaInferencia Estadística

Guía 1 Matemática: Estadística NM 4

Hacia dónde tienden los datos? Se agrupan en torno a un valor? o, se dispersan? Su distribución se parece a alguna distribución teórica?

EXAMEN DE MATEMÁTICAS APLICADAS I Temas 12 y 13

LAS SUCESIONES Y SU TENDENCIA AL INFINITO

EJERCICIO 1. , a partir de las frecuencias observadas, nij. , que se dan en la tabla del ejercicio.

MUESTREO Y ESTIMACIÓN ESTADÍSTICA

Medidas de Tendencia Central

Qué es la estadística?

ECUACIONES DIFERENCIALES (0256)

ÍNDICE. Índice 1. Introducción 2. Regresión Lineal Simple 3. Método de los mínimos cuadrados 4

θˆ = h(x 1,X 2,...,X n ) θˆ es un estimador puntual de θ

Prueba A = , = [ 7.853, 8.147]

CAPÍTULO I. Conceptos Básicos de Estadística

TEST DE HIPÓTESIS. a la hipótesis que se formula y que se quiere contrastar o rechazar. Llamamos hipótesis alternativa, H

Estadística y sus aplicaciones en Ciencias Sociales Práctico 4 - Solución Curso ) Como se trata de muestreo sin reposición, se tiene C 5 3

INTERÉS SIMPLE COMO FUNCIÓN LINEAL.

Apellidos y Nombre: Aproximación lineal. dy f x dx

CONTRASTE DE HIPÓTESIS

Tema 2: Diagonalización de matrices cuadradas

Paso 2: Elegir un estadístico de contraste. Como queremos hacer un contraste de hipótesis para la media, el estadístico de contraste adecuado es:

Burgos Simón, Clara Cortés López, Juan Carlos; Navarro Quiles, Ana

Algoritmos y Estructuras de Datos II, Segundo del Grado de Ingeniería Informática, Test de Análisis de Algoritmos, marzo Test jueves.

1. Propiedades de los estimadores

Transcripción:

ANEXO B B.. Regresió Se defie como Regresió al estudio de la fuerza, cosistecia o grado de asociació de la correlació de variables idepedietes [6]. B... Regresió Lieal Simple El objeto de u aálisis de regresió es ivestigar la relació estadística que existe etre ua variable depediete (Y) y ua o más variables idepedietes (X, X, X 3,... ) y así realizar la predicció de los futuros valores de la variable depediete. Para poder realizar esta ivestigació, se debe postular ua relació fucioal etre estas variables. La forma fucioal más utilizada es la relació lieal, y se da cuado solo existe ua variable idepediete, reduciedo el problema a resolver a ua líea recta: Y = β 0 + β X + ε (B.) dode los coeficietes β 0 y β so parámetros que defie la posició e icliació de la recta. Y ε es ua variable aleatoria o observable que idica el error aleatorio que se distribuye Normal co E(ε i )=0, Var(ε i )=σ costate. La estimació del modelo queda de la siguiete forma : ˆ = b + b X Y 0 Nótese que se ha usado el símbolo especial ˆ Y para represetar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coicide exactamete co el valor calculado, por lo que es importate hacer esta distició. 48

El parámetro b 0, coocido como la ordeada e el orige o itercepto, os idica cuáto es Y cuado X = 0, y es el estimador de β 0. El parámetro b, coocido como la pediete, os idica cuáto aumeta Y por cada aumeto de ua uidad e X, y es el estimador de β. Es posible obteer u estimador del error aleatorio ε a través de la diferecia etre el valor observado Y y el valor ajustado Yˆ. El problema cosiste e obteer estimacioes de los coeficietes a partir de ua muestra de observacioes sobre las variables Y y X. E el aálisis de regresió, estas estimacioes se obtiee por medio del método de míimos cuadrados. Cuado se asocia u error sustacial a los datos, la iterpolació poliomial es iapropiada y puede llevar a resultados o satisfactorios cuado se usa para predecir valores itermedios. Los datos experimetales a meudo so de ese tipo. Ua estrategia mas apropiada e estos casos es la de obteer ua fució aproximada que ajuste adecuadamete el comportamieto o la tedecia geeral de los datos, si coicidir ecesariamete co cada puto e particular. Ua líea recta puede usarse e la caracterizació de la tedecia de los datos y ua maera de determiar la líea, es ispeccioar los datos graficados y luego trazar la mejor líea a través de los putos. Por lo tato es ecesario cosiderar u criterio que cuatifique la suficiecia del ajuste. Ua forma de hacerlo es obteer ua curva que miimice la diferecia etre los datos y la curva y el método para llevar a cabo este objetivo es al que se le llama regresió co míimos cuadrados. 49

El ejemplo mas simple es el ajuste de ua líea recta a u cojuto de parejas de datos observadas: (x,y ), (x,y ),...,(x,y ). La expresió matemática de ua líea recta es Y = b + b X εˆ e dode b 0 y b so coeficietes que represeta la itersecció co el 0 + eje de las abscisas y la pediete, respectivamete y εˆ es el error o residuo etre el modelo y las observacioes, que se puede represetar reordeado la ecuació (B.) como ( b b X ) ˆ ε = + (B.) Y 0 Por lo tato, el error o residuo es la diferecia etre el valor real de Y y el valor aproximado, b 0 +b X, predicho por la ecuació lieal. B... Criterio de Míimos Cuadrados Ua estrategia que obtiee la mejor líea a través de los putos debe miimizar la suma de los errores residuales, como e: ˆ ε = ( Y b b X ) i i 0 i i= i= Otro criterio seria miimizar la suma de los valores absolutos de las diferecias, esto es: ˆ ε = Y b b X i i 0 i i= i= Ua tercera estrategia e el ajuste de ua líea óptima es el criterio de míimas. E este método, la líea se escoge de tal maera que miimice la distacia máxima a la que se ecuetra u puto de la líea recta. Esta estrategia esta mal codicioada para regresió ya 50

que ifluye de maera idebida sobre u puto extero, aislado, cuyo error es muy grade. Se debe otar que el criterio míimas alguas veces esta bie codicioado para ajustar ua fució simple a ua fució complicada. Ua estrategia que igora las restriccioes ateriores es la de miimizar la suma de los cuadrados de los residuos, S r, de la siguiete maera: ˆ ε ( ) 0 (B.3) S = = Y b b X r i i i i= i= Este criterio tiee muchas vetajas, icluyedo el que ajusta ua líea úica a u cojuto dado de datos. Ates de aalizar estas propiedades, se muestra u método que determia los valores de b 0 y b que miimiza la ecuació (B.3). B..3. Ajuste de ua recta utilizado Míimos Cuadrados Para determiar los valores de las costates b 0 y b, se deriva la ecuació (B.3) co respecto a cada uo de los coeficietes: Sr S = 0 r = i 0 i 0 0 Sr = i 0 ( Y b b X )( ) ( Y b b X ) 0 Sr S = 0 r = i ( Y b b X )( X ) i 0 i i Sr = ( Yi b0 bxi) Xi 5

Nótese que se ha simplificado los símbolos de la sumatoria; a meos que otra cosa se idique, todas las sumatorias va desde i= hasta. Igualado estas derivadas a cero, se geera u míimo S r. Si se hace así, las ecuacioes ateriores se expresara como: 0 = Yi b0 bxi 0 = YXi b0x i bx i Ahora cosiderado que b0 = b 0, las ecuacioes se puede expresar como u cojuto de dos ecuacioes lieales simultaeas co dos icógitas (b 0 y b ): (B.4) b0 + bx i = Yi bx 0 i + bx i = YX i i (B.5) A estas ecuacioes se les cooce como ecuacioes ormales. Se puede resolver simultáeamete y obteer: ( i) X Y X Y i i i i = Xi X b (B.6) Este resultado se puede usar juto co la ecuació (B.4) para obteer: e dode Y y X so la media de Y y X, respectivamete. b0 = Y bx (B.7) Por lo tato, la ecuació de la regresió estimada es: Yˆ = Y + b ( X X ) (B.8) 5

Ua vez obteida la ecuació, es posible calcular la variaza residual σ, siedo su estimador isesgado = ( i o i ) i= s Y b X b Defiiedo el coeficiete de correlació como r = ( Xi X)( Yi Y) ( Xi X) ( Yi Y) (B.9) que sólo toma valores e el itervalo [-, ], os da ua idea de hasta qué puto el ajuste lieal es razoable: Si r es próximo a, etoces el ajuste es aceptablemete bueo, distribuyédose las observacioes (X i, Y i ) alrededor de ua recta de pediete egativa. Si r es próximo a 0 etoces el ajuste o es aceptable, idicado que o existe relació lieal etre las variables. Si r es próximo a +, etoces el ajuste es aceptablemete bueo, distribuyédose las observacioes (X i, Y i ) alrededor de ua recta de pediete positiva. El cotraste de idepedecia etre las variables es más objetivo que la observació del coeficiete de correlació r. Así se platea comprobar si los datos observados corrobora o o la hipótesis ula: H 0 : "la variable explicativa X o ifluye e la respuesta Y", frete a la alterativa: H : "la variable explicativa X ifluye liealmete e la respuesta Y". Mediate el estadístico de cotraste 53

( ) ( Xi X) A= b ( Yi box b ) (B.0) que se distribuye como ua t - de Studet, se puede cotrastar la hipótesis ula H 0 al ivel de sigificació α 3. Y se rechaza H 0 si A t 4 α/(-). Esto es equivalete a decir que P- valor < α, dode P-valor es calculado co la distribució del estadístico. Y decimos que la variable explicativa X ifluye liealmete e la respuesta Y...4. Regresió Múltiple E el caso más geeral de la regresió múltiple, existe dos o más variables idepedietes: Y = b + b X + b X + L + b X + ε 0 i La estimació de los coeficietes de ua regresió múltiple es u cálculo bastate complicado y laborioso, por lo que se requiere del empleo de programas de computació especializados. Si embargo, la iterpretació de los coeficietes es similar al caso de la regresió simple: el coeficiete de cada variable idepediete mide el efecto separado que Ua variable aleatoria se distribuye segú el modelo de probabilidad t de Studet co k grados de libertad, dode k es u etero positivo, si su fució de desidad es la siguiete: ( ) ( k+ ) Γ ( k + ) f() t = + t k π kγ( k ), < t x p <, dode Γ ( p) = e x dx 3 Al realizar ua prueba se puede cometer uo de los dos errores siguietes: Error tipo I, se rechaza la hipótesis ula H 0 cuado es cierta; Error tipo II, se acepta la hipótesis ula H 0 cuado es falsa. Normalmete se desea cotrolar la probabilidad de cometer u error de tipo I. Y el ivel de sigificació es la probabilidad de cometer u error de tipo I. Fijar α lleva a dividir e dos regioes el cojuto de posibles valores del estadístico de cotraste: la regió de rechazo, co probabilidad α, bajo H 0 y la regió de aceptació, co probabilidad -α, bajo H 0. Segú la forma de la regió de rechazo, u cotraste puede ser cotraste uilateral (cotraste de ua cola) o cotraste bilateral como es éste caso (cotraste de dos colas). 4 Que se calcula co la fórmula de Distribució iversa de t co probabilidad α/ y co (-) grados de libertad. 0 54

esta variable tiee sobre la variable depediete. El coeficiete de determiació, por otro lado, mide el porcetaje de la variació total e Y que es explicado por la variació cojuta de las variables idepedietes. Y los supuestos para que se cumpla esta ecuació so: que los ε i sea idepedietes y siga la distribució Normal, que exista relació lieal etre Y y las X i s, E(ε i )=0, Var(ε i )=σ, y que las X i s sea liealmete idepedietes. 55