CONCEPTOS BÁSICOS DE ESTADISTICA INFERENCIAL
Inferenca Etadítca Se ocupa de etudar lo método necearo para etraer, o nferr, concluone válda e nformacón obre una poblacón a partr del etudo epermental de una muetra de dcha poblacón.
Regreón lneal Relacone o dependenca entre la do varable Funconal: Eta una relacón matemátca eacta que lgue amba varable (ej. el rado el área de un círculo). Aleatora: Cuando, aunque no eta entre la varable una relacón eacta, e puede obervar (aunque no empre e el cao) una certa tendenca entre lo comportamento de amba (ej. El peo la altura de un ndvduo). El prmer pao para el etudo de la relacón entre la varable conte en la contruccón obervacón de un dagrama de dperón f ( ) e Fg. Ejemplo de dagrama de dperón. Lo dato correponden a la medda de dperón de velocdade lumnodad en una muetra de 40 galaa elíptca realzada por Schechter (1980). El problema de la regreón e concreta entonce en ajutar una funcón a la nube de punto repreentada en dcho dagrama f ( ) f ( ) Se conoce como línea de regreón a la repreentacón gráfca de la funcón que e ajuta a la nube de punto del dagrama de dperón. Cuando dcha nube e dtrbua apromadamente a lo largo de una línea recta ajutaremo una recta de regreón.
Modelo de Regreón lneal: β, β 0 1 Parámetro del modelo 0 1 β + β + ε Ecuacón de regreón lneal mple ( ) ε Modelo de regreón lneal mple ( ) β + E 0 β1 Varable aleatora (Error) E :E la meda o valor eperado de para un valor dado de. β β e la ntereccón de la recta de regreón con el eje, 1 0 e la pendente EJEMPLOS DE LÍNEAS DE REGRESIÓN EN LA REGRESIÓN LINEAL SIMPLE Regreone otra forma funconale de la regreone a + b + c ab
Ecuacón de regreón etmada Se calculan etadítco muetrale (que e denotan b 0 b 1 ) como etmacone de lo parámetro poblaconale β β 0 1. Suttuendo en la ecuacón de regreón b 0 b por lo valore de lo etadítco muetrale β β 1 0 1 e obtene la ecuacón de regreón etmada. ˆ b0 + b1 A la gráfca de la ecuacón de regreón mple etmada e le llama recta de regreón etmada b 0 e la ntereccón de la recta de regreón con el eje, En general, ŷ b 1 e la pendente e el etmador puntual de E(), el valor medo de la para un valor dado de
PROCESO DE ESTIMACIÓN EN LA REGRESIÓN LINEAL SIMPLE
Ajute de una recta de regreón El método de mínmo cuadrado e un método en el que e uan lo dato muetrale para hallar la ecuacón de regreón etmada. Sea una muetra de tamaño n en que la varable etadítca bdmenonal toma lo valore. ( ), (, ),, (, ). 1, 1 1 n 1 A cada valor de la varable le correponde entonce un valor de la varable, pudendo * ademá aocárele un valor, que ería el dado por la recta que queremo calcular. E decr d ˆ + b0 b1 Sea a la dferenca entre lo do valore, obervado dado por la recta, de la varable en cada punto. d ˆ. Para que la recta a determnar ea la que mejor e ajute a la nube de punto de entre toda la recta poble, dcha dtanca d deberían er lo má pequeña poble. E decr, ha que mnmzar lo d Tomar lo cuadrado de la dtanca, para que aí no e anulen devacone potva negatva.
El problema e reduce a mnmzar la epreón mn ( ˆ ) ŷ valor obervado de la varable dependente en la obervacón valor etmado de la varable ndependente en la obervacón PENDIENTE E INTERSECCIÓN CON EL EJE DE LA ECUACIÓN DE REGRESION ESTIMADA b 0 n ( ) b 1 ( )( ) ( ). valor la varable ndependente en la obervacón valor de la varable dependente en la obervacón meda de la varable ndependente meda de la varable dependente n numero total de obervacone La recta de regreón debe paar por (, ) la ecuacón de regreón etmada e b + 0 b1 b0 b1, e decr, por el centro de la nube de punto. ˆ b0 + b1 El dearrollo anteror puede generalzare para calcular epreone mlare para la regreón parabólca, en general, polnómca.
POBLACIÓN DE ESTUDIANTES Y VENTAS TRIMESTRALES EN 10 RESTAURANTES DE LA CIUDAD DIAGRAMA DE DISPERSIÓN EN EL QUE SE MUESTRA LA POBLACIÓN DE ESTUDIANTES Y LAS VENTAS TRIMESTRALES
N 1 n 140 14 10 N 1 n 1300 130 10 b ( )( ) ( ) 840 568 1 b1 b b0 130 5 14 b0 60 b0 1 5 la ecuacón de regreón etmada e ˆ 60 + 5 ˆ 60 ( 0) 160 ˆ 60 + 5
redual Dferenca que ete, en la obervacón, entre el valor obervado de la varable dependente, el valor etmado de la varable dependente ŷ. Repreenta el error que ete al uar ŷ para etmar. Para la obervacón, el redual e ˆ La uma de lo cuadrado de eto reduale o errore e la cantdad que e mnmza empleando el método de lo mínmo cuadrado. SUMA DE CUADRADOS DEBIDAAL ERROR SCE ( ˆ ) La dferenca proporcona una medda del error que ha al uar para etmar SUMA TOTAL DE CUADRADOS STC uma de cuadrado debda a la regreón SUMA TOTAL DE CUADRADOS RELACIÓN ENTRE STC, SCR Y SCE ( ) ( ˆ ) SCR STC SCR + SCE
COEFICIENTE DE DETERMINACIÓN Se ua para evaluar la bondad de ajute de la ecuacón de regreón etmada Coefcente de Determnacón r SCR STC (0,1) COEFICIENTE DE CORRELACIÓN MUESTRAL b1 r pendente de la ecuacón de regreón etmada ( gno de b1 ) r ˆ b + b 0 1 El gno del coefcente de regreón muetral e potvo la ecuacón de regreón tene pendente potva (b 1 > 0) e negatvo la ecuacón de regreón etmada tene pendente negatva (b 1 < 0). Concluone El método de mínmo cuadrado proporcona una ecuacón de regreón etmada que mnmza la uma de lo cuadrado de la devacone entre lo valore obervado de la varable dependente lo valore etmado de la varable dependente. ( 1, +1) El crtero de mínmo cuadrado permte obtener la. ecuacón de mejor ajute. S e empleara otro crtero, como mnmzar la uma de la devacone aboluta entre e ˆ obtendría una ecuacón dferente. En la práctca el método de mínmo cuadrado e el método má uado.
CÁLCULO DE SCE EN EL EJEMPLO 1300 130 10 STC ( ) STC 15730 SCR STC SCE SCR 15730 1530 SCR 1400 COEFICIENTE DE DETERMINACIÓN r SCR STC r 1400 r 15730 0.907 90.7% de la varabldad en la venta e eplca por la relacón lneal que ete entre el tamaño de la poblacón de etudante la venta. Sería bueno que la ecuacón de regreón tuvera un ajute tan bueno. COEFICIENTE DE CORRELACIÓN MUESTRAL r ( gno de b) r ( + ) 0. 907 r 0. 9501 e conclue que ete una relacón lneal fuerte entre. r
Medda de la aocacón entre do varable Covaranza: E una medda decrptva de la aocacón entre do varable. En una muetra de tamaño n con obervacone ( 1, 1 ), (, ), etc., e defne como gue: covaranza muetral Cov n 1 ( )( ). n 1 Eta fórmula aparea cada con una covaranza poblaconal Cov σ n 1 ( µ )( µ ). N INTERPRETACIÓN DE LA COVARIANZA MUESTRAL S >0 S 0 S <0 ( e lneal potva) (no ha relacón lneal entre ) la relacón entre e lneal negatva) Un valor potvo grande de la varanza ndca una relacón lneal potva fuerte que un valor negatvo grande ndca una relacón lneal negatva fuerte.
Una medda de la relacón entre do varable, a la cual no le afectan la undade de medcón empleada para, e el coefcente de correlacón. Coefcente de correlacón del producto MOMENTO DE PEARSON: Dato muetrale r ( ) n 1 ( ) n 1 r S S S coefcente de correlacón muetral covaranza muetral devacón etándar muetral de devacón etándar muetral de En general, todo lo valore del conjunto de dato caen en una línea recta con pendente potva, el coefcente de correlacón erá 1; e decr, un coefcente de correlacón de 1 correponde a una relacón lneal potva perfecta entre. Por otra parte, lo punto del conjunto de dato caen obre una línea recta con pendente negatva, el coefcente de correlacón muetral erá -1; un coefcente de correlacón de -1 correponde a una relacón lneal negatva perfecta entre
El admntrador de la tenda deea determnar la relacón entre el número de comercale televado en un fn de emana la venta de la tenda durante la emana guente.
Covaranza muetral n10 30 3 10 510 10 51 n 1 ( )( ). n 1 99. 11 10 1 Tracemo una línea vertcal punteada en 3 una línea horzontal punteada en 51. Eta línea dvden a la gráfca en cuatro cuadrante. 11 Correlacón potva
devacón etándar muetral de la do varable. r ( ) n 1 ( ) 0 1.49 566 10 1 7. 93 n 1 9 11 r r 1.49 7.93 + 0.93 e conclue que ete una relacón lneal fuerte entre el número de comercale la venta
debldade Tanto la recta de regreón como el coefcente de correlacón no on robuto, en el entdo de que reultan mu afectado por medda partculare que e alejen mucho de la tendenca general. No ha que olvdar que el coefcente de correlacón no e má que una medda reumen. En nngún cao puede ubttur al dagrama de dperón, que empre habrá que contrur para etraer má nformacón. Forma mu dferente de la nube de punto pueden conducr al mmo coefcente de correlacón. El que en un cao e obtenga un coefcente de correlacón bajo no gnfca que no pueda etr. correlacón entre la varable. De lo únco que no nforma e de que la correlacón no e lneal (no e ajuta a una recta), pero e poble que pueda etr una buena correlacón de otro tpo. Un coefcente de correlacón alto no gnfca que eta una dependenca drecta entre la varable. E decr, no e puede etraer una concluón de caua efecto baándoe úncamente en el coefcente de correlacón. En general ha que tener en cuenta que puede etr una tercera varable econdda que puede producr una correlacón que, en mucho cao, puede no tener entdo.