CAPÍTULO 9 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
|
|
|
- Nieves Miranda Venegas
- hace 9 años
- Vistas:
Transcripción
1 CAPÍTULO 9 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 1 INTERROGANTES CENTRALES DEL CAPÍTULO a) Cuado sobre cada idividuo se observa simultáeamete dos características cuatitativas cómo se orgaiza y represeta gráficamete esos datos bidimesioales? b) Cómo se puede sabersi dos variables estadísticasestá relacioadas de forma lieal, expoecial, potecial o parabólica? c) Se puede predecir el valor de ua variable sabiedo el valor de otra variable que está relacioada co ella de forma lieal, expoecial, potecial o parabólica? 2 CONTENIDOS FUNDAMENTALES DEL CAPÍTULO 21 Tabulació de los datos Cuado sobre cada idividuo de ua població se observa simultáeamete dos características cuatitativas, que uidimesioalmete podríamos represetar separadamete por las variables X e Y, etoces se dice que se está observado ua variable estadística bidimesioal y se represeta por (X, Y ) El cojuto de valores bidimesioales de la variable juto co sus frecuecias asociadas dará lugar a la correspodiete distribució bidimesioal de frecuecias E el caso de variables bidimesioales podemos distiguir dos tipos pricipales de tablas: a) Tabulació e dos columas (o e dos filas) Si el úmero de datos bidimesioales es pequeño, los datos se dispoe e dos columas (o e dos filas) sobre las que se empareja los correspodietes valores uidimesioales de ua misma realizació de la variable bidimesioal, como se expresa e la tabla siguiete: variable X variable Y x 1 y 1 x 2 y 2 x y
2 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 257 X Y B 1 B 2 B j B k suma A 1 f 11 f 12 f 1j f 1k f 1 A 2 f 21 f 22 f 2j f 2k f 2 A i f i1 f i2 f ij f ik f i A r f r1 f r2 f rj f rk f r suma f 1 f 2 f j f k Tabla 91: Tabla de doble etrada o de cotigecia b) Tabla de doble etrada o de cotigecia Si el úmero de observacioes bidimesioales es grade, clasificamos los idividuos de la muestra e r clases (A 1,,A r ) respecto de la variable X, yek clases (B 1,,B k ) respecto de la variable Y Etoces los datos suele orgaizarse e ua tabla como la Tabla 91, que se deomia tabla de doble etrada odecotigecia E la Tabla 91, f ij es el úmero de idividuos que perteece a la clase A i de la variable X y a la clase B j de la variable Y y se llama frecuecia absoluta cojuta de la clase A i B j de la variable bidimesioal (X, Y ) La frecuecia relativa cojuta de la clase bidimesioal A i B j es igual a: h ij = f ij (91) 22 Distribucioes margiales y codicioadas Idepedecia de variables Supogamos que teemos los datos bidimesioales orgaizados e ua tabla de doble etrada como la Tabla 91 La suma de las frecuecias absolutas cojutas de la fila i ésima, f i, es igual al úmero de idividuos e la clase A i de la variable X, idepedietemete del valor de Y, y se llama frecuecia absoluta margial de la clase A i de la variable X: f i = f i1 + f i2 + + f ik La frecuecia relativa margial de la clase uidimesioal A i es igual a: h i = f i (92) Aálogamete, la suma de las frecuecias absolutas cojutas de la columa j ésima, f j, es igual al úmero de idividuos e la categoría B j de la variable Y, y se llama frecuecia absoluta margial de la clase B j de la variable Y : f j = f 1j + f 2j + + f rj La frecuecia relativa margial de la clase uidimesioal B j es igual a: h j = f j (93)
3 258 MATEMÁTICAS Si de la Tabla 91 cosideramos la primera y la última columa obteemos la distribució margial de frecuecias absolutas de la variable X: X A 1 A i A r suma f i f 1 f i f r Aálogamete, si cosideramos la primera y la última fila de la Tabla 91, obteemos la distribució margial de frecuecias absolutas de la variable Y : Y B 1 B j B k suma f j f 1 f j f k Deotaremos por X/y j a la variable X codicioada a que Y tome el valor y j Ladistribució de frecuecias absolutas codicioadas de X/y j se obtiee de la Tabla 91 cosiderado la primera columa y la columa de la clase B j ; es decir: X/y j A 1 A i A r suma f ij f 1j f ij f rj f j Por tato, la frecuecia relativa de X A i codicioada a que Y tome el valor y j es: h i/j = f ij f j (94) Aálogamete, deotaremos por Y/x i a la variable Y codicioada a que X tome el valor x i Ladistribució de frecuecias absolutas codicioadas de Y/x i se obtiee de la Tabla 91 cosiderado la primera fila y la fila de la clase A i ; es decir:
4 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 259 Y/x i B 1 B j B k suma f ij f i1 f ij f ik f i E cosecuecia, la frecuecia relativa de Y B j codicioada a que X tome el valor x i es: h j/i = f ij f i (95) Teiedo e cueta las fórmulas 94 y 95 se obtiee: f ij = h i/j f j = h j/i f i Dividiedo por teemos: f ij = h f j i/j Y teiedo e cueta 91, 92 y 93 se tiee: = h f i j/i h ij = h i/j h j = h j/i h i La variable X es idepediete de la variable Y si las distribucioes de frecuecias relativas de X codicioada a cualquier valor de Y so todas idéticas; es decir, o depede del valor que tome la variable codicioate Y ; es decir: h i/1 = h i/2 = = h i/k i, lo que es equivalete a: f i1 f 1 = f i2 f 2 = = f ij f j = = f ik f k i, y por tato: lo que tambié se puede escribir como: f ij f j = f i1 + f i2 + + f ij + + f ik f 1 + f f j + + f k i, j, f ij = f i f j i, j E cosecuecia, la defiició de idepedecia etre las variables X e Y es equivalete a la siguiete propiedad: f ij = f i f j i, j, o su equivalete: h ij = h i h j, i, j, es decir, las frecuecias relativas cojutas so iguales al producto de las correspodietes frecuecias relativas margiales
5 260 MATEMÁTICAS 23 Represetacioes gráficas Los métodos para determiar la existecia y el grado de relació etre dos variables cuatitativas debe ser capaces tambié de discrimiar etre los tipos geerales de relació que hay: a) Se dice que dos variables cuatitativas X e Y matiee ua relació directa cuado los valores altos e Y tiede a emparejarse co valores altos e X, los valores itermedios e Y tiede a emparejarse co valores itermedios e X, y los valores bajos e Y tiede a emparejarse co valores bajos e X b) Se dice que dos variables cuatitativas X e Y matiee ua relació iversa cuado los valores altos e Y tiede a emparejarse co valores bajos e X, los valores itermedios e Y tiede a emparejarse co valores itermedios e X, y los valores bajos e Y tiede a emparejarse co valores altos e X c) Se dice que o hay relació etre dos variables cuatitativas cuado o existe u emparejamieto sistemático etre ellas e fució de sus valores E ua buea represetació gráfica cojuta de dos variables estadísticas cuatitativas debe apreciarse fácilmete si existe relació etre las variables y de qué tipo es Ua represetació gráfica que cumple esta codició es el diagrama de dispersió, que tambié se puede llamar ube de putos Si los datos o está agrupados e itervalos (como e la tabla siguiete), etoces el diagrama de dispersióse hace como se muestra e la Figura 91 x i y i Y X Figura 91: Diagrama de dispersió para datos o agrupados e itervalos Si los datos está agrupados e itervalos (como e la tabla siguiete), etoces el diagrama de dispersió se hace como se muestra e la Figura 92 X Y (0,10] (10,20] (20,30] (30,40] (40,50] suma (25,75] (75,125] (125,175] (175,225] (225,275] (275,325] suma
6 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL Y X Figura 92: Diagrama de dispersió para datos agrupados e itervalos 24 Covariaza A partir de las distribucioes margiales de X ydey se puede calcular las medidas descriptivas de las variables X e Y De etre las medidas descriptivas bidimesioales, la más utilizada es la Covariaza etre X e Y que se calcula de la siguiete forma: 1) Si los datos se tabula e dos columas (o dos filas), la covariaza etre X e Y es: s xy = (x i x)(y i y) = x i y i x y 2) Si los datos se orgaiza e ua tabla de doble etrada como la Tabla 91, la covariaza etre X e Y es: r j=1 k (x i x)(y j y)f ij s xy = = x y, dode x i es la marca de clase de la clase A i, y j es la marca de clase de la clase B j y f ij es la frecuecia absoluta cojuta de la clase bidimesioal A i B j r j=1 k x i y j f ij Si e lugar de dividir por dividimos por ( 1) teemos la la Cuasicovariaza o Covariaza modificada o corregida etre X e Y ; cuya defiició, por tato, es la siguiete: 1) Si los datos se tabula e dos columas (o dos filas), la cuasicovariaza etre X e Y es: S xy = (x i x)(y i y) 1
7 262 MATEMÁTICAS 2) Si los datos se orgaiza e ua tabla de doble etrada como la Tabla 91, la cuasicovariaza etre X e Y es: r k (x i x)(y j y)f ij j=1 S xy =, 1 dode x i es la marca de clase de la clase A i, y j es la marca de clase de la clase B j y f ij es la frecuecia absoluta cojuta de la clase bidimesioal A i B j E cosecuecia, la covariaza y la cuasicovariaza está relacioadas de la siguiete forma: ( 1)S xy = s xy Por tato, se puede calcular ua de ellas a partir de la otra La covariaza (y, por tato, la cuasicovariaza) es capaz de discrimiar etre los dos tipos de relació lieal pues: a) si s xy > 0 etoces hay relació lieal directa etre X e Y, b) si s xy < 0 etoces hay relació lieal iversa etre X e Y,y c) si s xy =0etoces o hay relació lieal etre X e Y 25 Regresió y correlació Coeficiete de determiació La regresió cosiste e sustituir la ube de putos correspodiete a ua distribució bidimesioal por la fució matemática que mejor se ajuste a la ube de putos La correlació estima la fuerza co que las variables está relacioadas La curva de regresió es la curva ideal hacia la que tiede los putos del diagrama de dispersió El ajuste por el método de míimos cuadrados cosiste e lo siguiete: Si teemos ua ube de putos {(x i,y i ),i = 1, 2,,} y queremos ajustarle ua curva cualquiera y = f(x,a,b,) co parámetros a, b,, la determiació de éstos se hace miimizado la siguiete expresió: D = [y i f(x i,a,b,)] 2 Para saber si la curva y = f(x,a,b,) se ajusta a los putos {(x i,y i ),, 2,,} calculamos el coeficiete de determiació: [y i f(x i )] 2 Este coeficiete verifica: R 2 =1 1) 0 R 2 1 2) Si R 2 =1, etoces el ajuste es perfecto (y i y) 2 3) Si R 2 =0, etoces la fució y = f(x) o se ajusta e absoluto a los putos 4) Cuato más se aproxime R 2 a 1, mejor es el ajuste
8 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL Regresió y correlació lieal 261 Coeficiete de correlació lieal de Pearso La covariaza carece de uos valores máximo y míimo estables, comues a todos los casos, que permita su iterpretació directa La solució a este problema cosiste e dividir la covariaza por el producto de las desviacioes típicas margiales Este ídice se cooce co el ombre de coeficiete de correlació lieal de Pearso, y se deota por la letra r; o sea: r = s xy, (96) s x s y dode s x es la desviació típica de la variable X y s y es la desviació típica de la variable Y Si la tabulació de los datos se ha hecho e dos columas, etoces ua fórmula alterativa equivalete a la expresió 96 es la siguiete: ( )( ) x i y i x i y i r = ( ) 2 ( x 2 i x ) 2 i yi 2 y i La razó pricipal por la que la covariaza o puede cosiderarse u ídice de depedecia lieal etre dos variables es la dificultad de su valoració dado que carece de u máximo y u míimo estables Pero el coeficiete de correlació lieal o tiee esa dificultad ya que este ídice o puede valer más de 1 i meos de 1, es decir: 1 r 1 Además, la iterpretació descriptiva de r es la siguiete: a) Si r =1etoces existe ua depedecia lieal directa exacta etre las variables X e Y Los putos del diagrama de dispersió está sobre ua líea recta de pediete positiva b) Si r = 1 etoces existe depedecia lieal iversa exacta etre X e Y Los putos del diagrama de dispersió está sobre ua líea recta de pediete egativa c) Si r =0etoces o existe depedecia lieal etre X e Y d) Cuato más se aproxime r a 1 oa1, más depedecia lieal existe etre X e Y Cuado esto ocurra, el diagrama de dispersió se aproxima a ua líea recta e) Cuato más se aproxime r a 0, más idepedecia lieal existe etre X e Y Cuado esto ocurra, el diagrama de dispersió o se aproxima a ua recta f) Si r es positivo, etoces al aumetar el valor de la variable X, aumeta el valor de la variable Y g) Si r es egativo, etoces al aumetar el valor de la variable X, dismiuye el valor de la variable Y 262 Recta de regresió míimo cuadrática La recta de regresió míimo cuadrática de Y sobre X es la recta Ŷ = A + BX que mejor se ajusta (por el método de míimos cuadrados) a los putos del diagrama de dispersió {(x i,y i ),, 2,,} Esta recta os permitirá predecir Y a partir de los valores de X
9 264 MATEMÁTICAS Teemos que miimizar la expresió: D(A, B) = [y i (A + Bx i )] 2 (97) Igualado a cero las derivadas parciales de D respecto de A y de B obteemos las siguietes ecuacioes ormales: { yi = B x i + A xi y i = B x 2 i + A x i Si los datos está tabulados e dos columas, las fórmulas de los coeficietes A y B que hace míima la expresió 97 so las siguietes: ( )( ) x i y i x i y i B = ( ) 2, x 2 i x i A = y B x Estas fórmulas so equivaletes a las siguietes: B = s xy s 2 x = r s y s x, A = y B x Estas últimas fórmulas se puede aplicar tato si los datos está orgaizados e ua tabla de dos columas como si lo está e ua tabla de doble etrada Aálogamete, la ecuació de la recta de regresió míimo cuadrática de X sobre Y es: ˆX = A + B Y, dode B = s xy s 2 y = r s x s y, A = x B y 263 Coeficiete de determiació y coeficiete de correlació lieal Predicció E el caso del ajuste lieal (ajuste a ua recta), el coeficiete de determiació es igual a: R 2 = s2 xy s 2 x s 2 y Por tato, (sólo e el caso del ajuste lieal) se cumple que el coeficiete de determiació es igual al cuadrado del coeficiete de correlació lieal (R 2 = r 2 ) Si el coeficiete de correlació lieal estápróximo a 1 o a 1 sabemos que existe bastate relació lieal etre las variables X e Y y por tato los putos del diagrama de dispersió está próximosalarectaderegresió míimo cuadrática E este caso, a partir de la ecuació de la recta de regresió de Y sobre X se puede calcular, de forma aproximada, el valor de la variable Y cuado se cooce el valor de la variable X Esta aproximació se cooce tambié por el ombre de estimació, predicció o proóstico Similarmete, a partir de la ecuació de la recta de regresió de X sobre Y se puede predecir los valores de la variable X cuado se cooce los valores de la variable Y Si el coeficiete de correlació lieal o estápróximo a 1 o a 1, las ecuacioes de las rectas de regresió o os sirve para predecir los valores de ua de las variables cuado se cooce los valores de la otra, pues los putos del diagrama de dispersió o está próximos a la recta de regresió míimo cuadrática
10 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL Regresió expoecial Ajuste a la curva Y = Ae BX por el método de míimos cuadrados Tomado logaritmos eperiaos: l Y = l A + BX Se hace el cambio: Y =ly,a =la Etoces Y = A + BX, co lo que se reduce a u ajuste lieal etre las variables Y y X (se puede utilizar las ecuacioes ormales) La bodad del ajuste os lo da el coeficiete de determiació, que coicide co el cuadrado del coeficiete de correlació lieal etre Y y X 28 Regresió potecial Ajuste a la curva Y = AX B por el método de míimos cuadrados Tomado logaritmos decimales: log Y = loga + B log X Se hace el cambio: Y =logy, A =loga, X =logx Etoces Y = A + BX, co lo que se reduce a u ajuste lieal etre Y y X (se puede utilizar las ecuacioes ormales) La bodad del ajuste os lo da el coeficiete de determiació, que coicide co el cuadrado del coeficiete de correlació lieal etre Y y X 29 Regresió parabólica Ajuste a la curva Y = A + BX + CX 2 por el método de míimos cuadrados Miimizar D(A, B, C) = [y i (A + Bx i + Cx 2 i )]2 Simplificado se obtiee: yi = A + B x i + C x 2 i xi y i = A x i + B x 2 i + C x 3 i x 2 i y i = A x 2 i + B x 3 i + C x 4 i La bodad del ajuste a la curva Y = A + BX + CX 2 os lo da el coeficiete de determiació: R 2 =1 [yi (A + Bx i + Cx 2 i )]2 (yi y) 2 3 ACTIVIDADES DE APLICACIÓN DE LOS CONOCIMIENTOS A91 Se está estudiado la relació existete etre los años de estudios realizados por los padres (X)ylosaños de estudios realizados por los hijos (Y ) E ua muestra de tamaño 7 se obtiee los siguietes resultados:
11 266 MATEMÁTICAS x i y i Dibujar el diagrama de dispersió o ube de putos Hallar la covariaza, s xy, etre las dos variables Hallar el coeficiete de correlació lieal r Hallar la ecuació de la recta de regresió míimo cuadrática de Y sobre X Predecir el úmero de años de estudio de u hijo cuyo padre ha estudiado 14 años Decir si esta predicció es fiable Hallar la ecuació de la recta de regresió míimo cuadrática de X sobre Y Predecir el úmero de años de estudio de u padre cuyo hijo ha estudiado 15 años A92 Determiar el grado de depedecia existete etre los años de estudio completados (X) y las faltas de ortografía cometidas e u dictado (Y ) tal y como se ecotró e la siguiete muestra de 10 etrevistados x i y i Cuátas faltas ortográficas tedría u etrevistado que hubiese completado 13 años de estudio? Es fiable esta predicció? A93 Ua factoría de ua cierta marca de refrescos ha tomado al azar 18 semaas de u año, observado la temperatura media, e grados cetígrados (X) correspodiete a cada ua de ellas y la catidad de refrescos pedidos durate cada uo de dichos períodos, e miles (Y ) La iformació obteida es la siguiete: x i y i Dibujar el diagrama de dispersió Hallar el coeficiete de correlació lieal r Predecir la temperatura media de u semaa e la que se hubiese pedido refrescos Decir si esta predicció es fiable Predecir el úmero de refrescos pedidos e ua semaa e la que la temperatura media fuese de 20 grados cetígrados A94 Se está estudiado la relació existete etre la edad de los hombres (X) y de las mujeres (Y ) a la hora de cotraer matrimoio Se recoge los datos del año 1971 e la tabla siguiete: X Y [10,20] (20,25] (25,30] (30,35] (35,40] (40,50] (50,60] (60,80] [10,20] (20,25] (25,30] (30,35] (35,40] (40,50] (50,60] (60,80] Existe ua depedecia lieal fuerte etre la edad de los hombres y la edad de las mujeres a la hora de cotraer matrimoio? Hacer ua predicció de la edad de la esposa cuyo esposo tiee 25 años Es fiable esta predicció? Hacer el diagrama de dispersió A95 El precio, e pesetas, (X)yelúmero de págias (Y ) de los libros coteidos e u catálogo viee dados por:
12 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 267 x i y i x i y i x i y i x i y i Agrupar los datos de ambas variables e itervalos de clase Determiar la distribució bidimesioal de frecuecias, así como las distribucioes margiales de X y de Y Hallar el coeficiete de correlació lieal Predecir el precio de u libro que tuviera 205 págias Decir si esta predicció es fiable A96 Las calificacioes obteidas por u grupo de alumos e Biología y Física so: Biología Física a) Escribir la tabla de doble etrada de frecuecias absolutas b) Hallar las distribucioes margiales, así como la media y la variaza de dichas distribucioes uidimesioales c) Existe relació lieal etre las calificacioes de Biología y Física? A97 Se ha tomado cico muestras de glucógeo, de ua catidad fija cada ua Se les ha aplicado ua catidad X de glucogesa (e milimoles/litro) aotado e cada caso la velocidad de reacció Y,medidae micromoles/miuto, obteiédose los siguietes datos: X Y a) Se puede deducir que la velocidad de reacció aumeta co la cocetració de glucogesa? Justificar la respuesta b) Si a ua de las muestras le hubiésemos aplicado ua cocetració de glucogesa de 2 5 milimoles/litro cuál hubiese sido la velocidad de reacció? Co qué grado de predicció? A98 U psicólogo afirma e base a los datos obteidos, que a medida que u iño crece, meor es el úmero de respuestas iadecuadas que da Los datos so:
13 268 MATEMÁTICAS X Y dode X represeta la edad e años, e Y represeta el úmero de respuestas iadecuadas a) Determiar la validez de esta coclusió b) Si Alberto, de diez años y medio, participa e el experimeto cuál será elúmero de respuestas iadecuadas que dará? A99 Dada ua variable bidimesioal (X, Y ), cuya tabla de frecuecias relativas es: Calcular: X Y a) Distribucioes margiales de frecuecias absolutas b) Medias y variazas margiales c) Recta de regresió de Y sobre X d) Coeficiete de correlació lieal A910 Los datos de la tabla siguiete represeta el resultado de u experimeto cosistete e expoer bacterias, e períodos de 1 a 15 itervalos de 6 miutos, a la radiació de rayos X a 200 kilovoltios y cotabilizar el úmero de bacterias supervivietes (X represeta el úmero de itervalos de 6 miutos, e Y represeta los cietos de bacterias supervivietes) X Y Ajustar a los datos ua curva expoecial; represetar gráficamete el resultado y comprobar la bodad del ajuste A911 Los datos de la tabla siguiete so el resultado de u estudio del efecto de la temperatura de cristalizació primaria (medida e grados cetígrados) de ua solució, x i, sobre el coteido e fósforo (medido e gramos por litro), y i x i y i a) Represetargráficamete la ube de putos Determiar el modelo de curva adecuado para represetar la relació etre las variables y ecotrar, por el método de míimos cuadrados, los parámetros de la curva
14 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 269 b) El ajuste aterior es bueo? A912 Los datos de la tabla siguiete perteece a la medida de la temperatura (X) y la presió (Y ) e diferetes lugares del Himalaya x i y i x i y i x i y i Explicar la presió e fució de la temperatura mediate ua parábola (por el método de míimos cuadrados) 4 ACTIVIDADES PRÁCTICAS DEL CAPÍTULO 41 Diagrama de dispersió Para ua variable estadística bidimesioal, el gráfico más utilizado es el diagrama de dispersió El programa dibuja estos diagramas si seleccioamos las opcioes Statistics Summary Statistics Scatter Plot Etoces os aparece ua vetaa como e la Figura 93 dode debemos seleccioar las variables implicadas (X-Axis Variable e Y-Axis variable) Si deseamos agrupar los datos e itervalos (de ua variable o de las dos) etoces debemos rellear los recuadros X-Axis (Optioal) o Y-Axis (Optioal), segú la variable que queramos agrupar Ejercicio Dibuja el diagrama de dispersió de la variable estadística bidimesioal (PESO,ALTURA) 42 Covariaza y coeficiete de correlació lieal Para ua variable bidimesioal es iteresate hallar la matriz de variazas y covariazas corregidas Dicha matriz es la siguiete: ( ) S 2 x S xy, S xy dode S 2 x deota la cuasivariaza de X, S 2 y idica la cuasivariaza de Y,yS xy represeta la cuasicovariaza etre X e Y La matriz de variazas y covariazas corregidas se puede obteer seleccioado las opcioes Statistics Liear Models Variace-Covariace Etoces aparece ua vetaa (ver Figura 94) e la que debemos seleccioar las variables estadísticas de las cuales queremos calcular su matriz de covariazas corregidas (e el recuadro Var-Covar Variables) S 2 y
15 270 MATEMÁTICAS Figura 93: Patalla del programa que permite seleccioar las variables para las que vamos a dibujar el diagrama de dispersió Figura 94: Patalla del programa que permite seleccioar las variables para las que vamos a calcular la matriz de covariazas Ejercicio Calcula la matriz de variazas y covariazas corregidas de la variable bidimesioal (PESO, ALTURA) Para calcular el coeficiete de correlació lieal de Pearso etre dos variables estadísticas debemos seleccioar las opcioes Statistics Liear Models Correlatios (Pearso) y os aparece ua vetaa como e la Figura 95 Tras pulsar el botó OK surge la vetaa de resultados, co los coeficietes de correlació lieal etre todas las variables seleccioadas E uestro ejemplo (ver Figura 96) el coeficiete etre las variables PESO y ALTURA es de , lo que sigifica que existe ua depedecia lieal fuerte Ejercicio Determia el coeficiete de correlació lieal de Pearso etre las variables ALTURA y PESO
16 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 271 Figura 95: Patalla del programa que permite calcular el coeficiete de correlació lieal de Pearso Figura 96: Patalla co los resultados para la correlació etre el PESO y la ALTURA 43 Recta de regresió Predicció La recta de regresió permite estimar el valor de ua variable estadística coocido el valor de otra variable, siempre que etre las dos variables estadísticas exista depedecia lieal Cuato mayor sea esta depedecia lieal, mejor será la aproximació que os da la recta de regresió Para calcular la ecuació de la recta de regresió míimo cuadrática debemosseleccioarlasopcioesstatistics Liear Models Liear Regressio y os aparece ua vetaa como e la Figura 97 E el recuadro Depedet Variable debemos poer la variable depediete (la que está represetada e el eje vertical) y e el recuadroidepedet Variables la variable idepediete (la que está represetada e el eje horizotal) Por ejemplo, si e la variable depediete poemos ALTURA y e la variable idepediete colocamos EDAD, etoces se supoe que queremos predecir la altura de u idividuo coociedo su edad La vetaa de resultados se muestra e la Figura 98 E dicha figura aparece muchos valores que o estamos e codicioes de explicar e este mometo, ya que perteece a la parte de Estadística Iferecial Si la ecuació de la recta de regresió de ALTURA sobre EDAD es ALTURA = A + B EDAD, etoces A = y B = Para hacer ua predicció debemos seleccioar las opcioes Results Predictio, escribiedo e el recuadro Predictor Values el valor de la variable idepediete para el cual queremos estimar el correspodiete valor de la variable depediete E la casilla Specificatio Method debemos seleccioar la opció Valued Method (ver Figura 99) Así, para ua edad de 245 años el valor correspodiete de la altura es de metros Ua vez hemos calculado la recta de regresió podemos realizar ua represetació gráfica de la misma Para
17 272 MATEMÁTICAS Figura 97: Patalla del programa que permite seleccioar las variables para las que vamos a calcular la recta de regresió Figura 98: Patalla del programa que muestra la recta de regresió de ALTURA sobre EDAD ello seleccioamos las opcioes Results Plots Simple Regressio Plot Eelgráfico resultate aparece el diagrama de dispersió (co cruces), la recta de regresió (e color azul) y dos curvas (e color rojo), ua por cada lado de la recta de regresió, que delimita ua zoa de cofiaza para los valores de la variable depediete (ver Figura 910) Ejercicio Halla la ecuació de la recta de regresió míimo cuadrática de ALTURA sobre PESO Represétala gráficamete y predice la altura de u alumo que pesa 60 kilogramos 5 BIBLIOGRAFÍA DEL CAPÍTULO CANDEL, J; MARIN, A y RUIZ, JM Estadística aplicada I: Estadística descriptiva Barceloa: DM PPU, 1991 Seccioes 31, 33, 41, 42, 43, 44, 46
18 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 273 Figura 99: Patalla del programa que permite estimar el valor de ALTURA para u valor de EDAD 179 Simple Regressio Plot 174 ALTURA EDAD ALTURA = * EDAD 95% cof ad pred itervals Figura 910: Patalla del programa que represeta la recta de regresió de ALTURA sobre EDAD 6 PREGUNTAS DE EVALUACIÓN E91 E u grupo de alumos de la Uiversidad de Murcia, se estudia el úmero de asigaturas aprobadas e Juio (X) y el úmero de horas semaalesdedicadas al estudio (Y) La iformació obteida es la siguiete: X Y (0, 10] (10, 20] (20, 30] (30, 40]
19 274 MATEMÁTICAS a) Obteer la distribució margial de frecuecias absolutas de Y Cuál es el tiempo medio semaal dedicado al estudio? Cuál es el tiempo semaal de horas de estudio que deja por debajo el 50 por cieto de los tiempos semaales y por ecima el 50 por cieto restate? b) Obteer la distribució margial de frecuecias absolutas de X Cuál es el úmero más habitual de asigaturas aprobadas por los alumos? Cuál es el úmero medio de asigaturas aprobadas? Calcular e iterpretar la variaza de X Dibujar u polígoo acumulativo para la variable X y calcular su recorrido itercuartílico c) Obteer la distribució de frecuecias absolutas de Y codicioada a X= 1 Cuál es el tiempo medio semaal dedicado al estudio por los alumos que ha aprobado ua asigatura? Cuál es el tiempo semaal más habitual e los alumos que ha aprobado ua asigatura? Calcular la mediaa de esta distribució E92 E ua determiada empresa se ha realizado u estudio para determiar si la edad de los empleados está relacioada co el úmero de días de ausecia e el trabajo Estos so los resultados: Edad (X) Días de ausecia (Y ) (20,29] (29,38] (38,47] (47,56] (56,65] (44,50] (50,56] (56,62] (62,68] a) Obteer la distribució margial de frecuecias absolutas y frecuecias acumuladas absolutas de X Hallar la mediaa, la media y la desviació típica de X b) Obteer la distribució margial de frecuecias absolutas de Y Hallar la moda, la media y la desviació típica de Y c) Determiar el coeficiete de correlació lieal etre X e Y Existe ua fuerte depedecia lieal etre X e Y? E93 Ua empresa acioal dedicada a la producció de videojuegos pretede sacar al mercado dos uevos productos: uo para el segmeto de 13 a 15 años y otro para el segmeto de 16 a 18 años Ates de fijar el precio, la empresa cotacta co u cetro de estudios sociológicos para coocer la asigació semaal de los jóvees Para ello, el cetro extrae ua muestra de 10 jóvees y, etre otros datos, se les preguta la edad (X,eaños) y su asigació semaal (Y, e miles de pesetas), obteiedo los siguietes datos: Edad (X) Asigació (Y ) a) Calcular recorrido itercuartílico y coeficiete de variació de la asigació semaal b) Cuál es la asigació semaal estimada para u jove de 16 años? Es fiable dicha predicció? E94 U equipo ivestigador está aalizado el comportamieto de los jóvees españoles respecto del matrimoio Para ello extrae ua muestra de 10 jóvees parejas y les pasa u cuestioario Etre las muchas pregutas del cuestioario figura la edad a la que cotrajero matrimoio, obteiédose los siguietes datos: X: Edad de la mujer Y : Edad del hombre a) Calcular los cuartiles Q 1, Q 2 y Q 3 de la variable X b) Calcular el coeficiete de variació de la variable Y c) Calcular la recta de regresió de Y sobre X Si e ua pareja de jóvees, la mujer teía 28 años cuado cotrajo matrimoio, cuál es la edad estimada del hombre? es fiable esta predicció?
20 ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL 275 E95 Ua editorial está iteresada e coocerlos hábitos de lectura de los españoles y determiar si existe algua relació co otras variables (ivel cultural, ivel ecoómico, edad, etc) Para ello se extrae ua muestra de 10 persoas y, etre otros datos, se les preguta por el úmero de años de estudio (X) y por el úmero de libros que suele comprar cada trimestre (Y ) Los datos so los que recoge la siguiete tabla: X Y a) Calcular la media y la mediaa de Y b) Calcular la desviació media y la desviació mediaa de Y c) Si ua persoa suele comprar 2 libros al trimestre, calcular ua estimació para el úmero de años de estudio Es fiable dicha predicció?
TEMA 1. ESTADÍSTICA DESCRIPTIVA
TEMA. ESTADÍSTICA DESCRIPTIVA. Itroducció: coceptos básicos. Tablas estadísticas y represetacioes gráficas. Características de variables estadísticas uidimesioales.. Características de posició.. Características
MINITAB y MODELOS DE REGRESIÓN
Prácticas de Fudametos Matemáticos para el estudio del Medio Ambiete www.um.es/docecia/jpastor [email protected] MINITAB y MODELOS DE REGRESIÓN 1. Itroducció Ua de las cuestioes de mayor iterés e las Ciecias
Capítulo 3. El modelo de regresión múltiple. Jorge Feregrino Feregrino. Econometría Aplicada Utilizando R
Capítulo 3. El modelo de regresió múltiple. Jorge Feregrio Feregrio Idetificació del modelo La idetificació del objeto de ivestigació permitirá realizar ua búsqueda exhaustiva de los datos para llevar
Estadística Descriptiva
Estadística Descriptiva TEMA 1 Estadística Descriptiva 1. Variables estadísticas uidimesioales a) Itroducció b) Estudio descriptivo de ua variable c) Represetacioes gráficas d) Medidas de tedecia cetral
EVALUACIÓN DE BACHILLERATO PARA EL ACCESO A LA UNIVERSIDAD 207 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. JUNIO 2017
EBAU Juio 07 Matemáticas aplicadas a las ciecias sociales e Murcia EVALUACIÓN DE BACHILLERATO PARA EL ACCESO A LA UNIVERSIDAD 07 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES. JUNIO 07 OBSERVACIONES IMPORTANTES:
Preguntas más Frecuentes: Tema 2
Pregutas más Frecuetes: Tema 2 Pulse sobre la preguta para acceder directamete a la respuesta 1. Se puede calcular la media a partir de las frecuecias absolutas acumuladas? 2. Para calcular la media aritmética,
) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1
ESTIMACIÓN PUNTUAL. ESTIMACIÓN POR INTERVALOS DE CONFIANZA. 1. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA El objetivo básico de la iferecia estadística es hacer iferecias o sacar coclusioes sobre la població
Tema 4. Estimación de parámetros
Estadística y metodología de la ivestigació Curso 2012-2013 Pedro Faraldo, Beatriz Pateiro Tema 4. Estimació de parámetros 1. Estimació putual 1 1.1. Estimació de la proporció e la distribució Bi(m, p).......................
Tema 14: Inferencia estadística
Tema 14: Iferecia estadística La iferecia estadística es el proceso de sacar coclusioes de la població basados e la iformació de ua muestra de esa població. 1. Estimació de parámetros Cuado descoocemos
Práctica 7 CONTRASTES DE HIPÓTESIS
Práctica 7. Cotrastes de hipótesis Práctica 7 CONTRATE DE IPÓTEI Objetivos Utilizar los cotrastes de hipótesis para decidir si u parámetro de la distribució de uos datos objeto de estudio cumple o o ua
Ejercicios Matemáticas I Pendientes 1 BCT
Ejercicios Matemáticas I Pedietes BCT ª Parte Uidad 7 Álgebra. Dado el poliomio P( ) = + k 5, calcula el valor de k para que el valor umérico del poliomio e = sea.. Halla u poliomio de tercer grado cuyo
Prueba Integral Lapso / Área de Matemática Fecha: MODELO DE RESPUESTA (Objetivos del 01 al 11)
Prueba Itegral Lapso 016-1 175-176-177 1/7 Uiversidad Nacioal Abierta Matemática I (Cód 175-176-177) Vicerrectorado Académico Cód Carrera: 16 36 80 508 51 54 610 611 61 613 Fecha: 19 11 016 MODELO DE RESPUESTA
INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS
INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS Població E el cotexto de la estadística, ua població es el cojuto de todos los valores que puede tomar ua característica medible e particular, de u cojuto correspodiete
Pre-PAES 2016 Media aritmética, moda y mediana.
Pre-PAES 016 Media aritmética, moda y mediaa. Nombre: Secció: Las medidas de tedecia cetral (MTC) so ciertos valores alrededor de los cuáles tiede a cocetrarse los datos de ua població, esto se debe a
En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:
TEMA 6. Estimació putual. E muchos casos o será posible determiar el valor de u parámetro poblacioal descoocido, aalizado todos los valores poblacioales, pues el proceso a seguir puede ser destructivo,
CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel
x Estimado alumo: Aquí ecotrarás las claves de correcció, las habilidades y los procedimietos de resolució asociados a cada preguta, o obstate, para reforzar tu apredizaje es fudametal que asistas a la
EJERCICIOS RESUELTOS TEMA 8
EJERCICIOS RESUELTOS TEMA 8 8.. U ivestigador desea coocer la opiió de los madrileños sobre la saidad pública. Para ello, acude a las 8 de la mañaa al hospital público de la capital más cercao a su domicilio
Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20
Técicas Cuatitativas II 2012-2013 Muestra y Estadísticos Muestrales TC II Muestra y Estadísticos Muestrales 1 / 20 Ídice Ídice Cocepto de muestra y Alguos ejemplos de variaza de la media Cocepto de muestra
Ejercicios de intervalos de confianza en las PAAU
Ejercicios de itervalos de cofiaza e las PAAU 2008 1 1.-El úmero de días de permaecia de los efermos e u hospital sigue ua ley Normal de media µ días y desviació típica 3 días. a)determiar u itervalo de
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA DISTRIBUCIÓN DE FRECUENCIAS, HISTOGRAMA, POLIGONO Y ESTADÍSITICOS DE TENDENCIA CENTRAL, DISPERSIÓN, ASIMETRÍA Y CURTOSIS. Prof.: MSc. Julio R. Vargas I. Las calificacioes fiales
Reserva Primera de 2017 (Modelo 3) Solución Germán-Jesús Rubio Luna OPCIÓN A
IES Fco Ayala de Graada Reserva Primera de 017 (Modelo 3) Solució Germá-Jesús Rubio Lua OPCIÓN A 17_mod3_EJERCICIO 1 (A) 4-3 0 Sea las matrices A = y B = 1-1 0 1. (1 puto) Calcule A + B 3. (1 5 putos)
TEMA 1. ESTADÍSTICA DESCRIPTIVA
TEMA. ESTADÍSTICA DESCRIPTIVA. Itroducció: coceptos básicos. Tablas estadísticas y represetacioes gráficas. Características de variables estadísticas uidimesioales.. Características de posició.. Características
De esta forma, el problema de encontrar la mejor recta se concentra en calcular los valores de la pendiente (m) y de la ordenada al origen (b)
MÉTODO DE MÍNIMOS CUADRADOS E muchos de los experimetos que se realiza e Física, se obtiee u cojuto de parejas de úmeros (abscisa, ordeada) por los cuales ecesitamos, para obteer u modelo matemático que
Introducción a las medidas de dispersión.
UNIDAD 8: INTERPRETEMOS LA VARIABILIDAD DE LA INFORMACION. Itroducció a las medidas de dispersió. Como su ombre lo idica, las medidas de dispersió so parámetros que os idica qué ta dispersos está los datos.
PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2013 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS
PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 013 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS Juio, Ejercicio 4, Opció A Juio, Ejercicio 4, Opció B Reserva 1, Ejercicio 4, Opció
La sucesión de Fibonacci y el número Φ Si dividimos cada dos términos consecutivos de la sucesión de Fibonacci, obtenemos:
SUCESIONES Págia 50 PARA EMPEZAR, REFLEXIONA Y RESUELVE Cuátas parejas de coejos? Cuátas parejas de coejos se producirá e u año, comezado co ua pareja úica, si cada mes cualquier pareja egedra otra pareja,
UNIDAD 9. PROBABILIDAD Matemáticas II. Ies do Barral.Curso 2017/ Experimentos aleatorios
1. Experimetos aleatorios U experimeto se llama aleatorio cuado o se puede predecir su resultado; además, si se repitiese el mismo experimeto e codicioes aálogas, los resultados puede diferir. a) El resultado
PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E
PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E CURSO 2.001-2.002 - CONVOCATORIA: Juio MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES - Cada alumo debe elegir sólo ua de las pruebas (A o B) y, detro de ella,
PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2010 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS
PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 010 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS Juio, Ejercicio 4, Opció A Reserva 1, Ejercicio 4, Opció A Reserva, Ejercicio 4,
y i 0 1 x i 2 2 y i media 2 Varianza 2 i 1 Para calcular el los valores que maximizan L derivamos e igualamos a cero 2 y i 0 1 x i 0 # i 1
Demostracioes de Regresió Simple. Estimació La distribució de y es y i N 0 x i, Estimació Máximo Verosímil La fució de verosimilitud, sabiedo que y i es ua variable ormal será L exp y i 0 x i ya que la
Medidas de Tendencia Central
1 Medidas de Tedecia Cetral La Media La media (o promedio) de ua muestra x 1, x,, x de tamaño de ua variable o característica x, se defie como la suma de todos los valores observados e la muestra, dividida
INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO
INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO Objetivos geerales del tema E este tema se itroducirá el cocepto de estadístico como medio para extraer iformació acerca de la ley de
Tema 1 Estadística descriptiva: Medidas de centralización y dispersión
Tema 1 Estadística descriptiva: Medidas de cetralizació y dispersió Curso 2017/18 Grados e biología saitaria Departameto de Física y Matemáticas Marcos Marvá Ruiz A partir de los valores de ua variable
SESION 15 DISTRIBUCIONES DE MUESTREO
SESION 15 DISTRIBUCIONES DE MUESTREO I. CONTENIDOS: 1. Distribució de muestreo. 2. Distribucioes de muestreo de la media 3. Media, mediaa y moda, así como su relació co la desviació estádar de las distribucioes
MUESTREO Y ESTIMACIÓN ESTADÍSTICA
1 MUESTREO Y ESTIMACIÓN ESTADÍSTICA Muestreo. Métodos de muestreo Se llama població al cojuto de idividuos que posee cierta característica. Ua muestra es ua parte de esa població. Muestreo es el proceso
Explicación de la tarea 10 Felipe Guerra. Para la explicación de esta tarea veamos primeramente que es lo que nos están pidiendo.
Explicació de la tarea 0 Felipe Guerra Para la explicació de esta tarea veamos primeramete que es lo que os está pidiedo. Ya hemos visto a lo largo del curso que la variaza es el error cuadrado medio de
R E S O L U C I Ó N. a) La distribución de las medias muestrales es: N, N 8'1, N 8'1, 0'3. Como el nivel de confianza es del 97%, podemos calcular
El úmero de días de permaecia de los efermos e u hospital sigue ua ley Normal de media días y desviació típica 3 días. a) Determie u itervalo de cofiaza para estimar, a u ivel del 97%, co ua muestra aleatoria
ESTADÍSTICA UNIDIMENSIONAL
I.E.S. Virge de la Paz. Alcobedas DEPARTAMETO DE MATEMÁTICAS Itroducció ESTADÍSTICA UIDIMESIOAL El ombre de Estadística alude al eorme iterés de esta rama matemática para los asutos del Estado y su itroducció
Tema 1. Estadística Descriptiva
Estadística y metodología de la ivestigació Curso 2012-2013 Pedro Faraldo, Beatriz Pateiro Tema 1 Estadística Descriptiva 1 Itroducció 1 2 Coceptos geerales 2 3 Distribucioes de frecuecias 3 4 Represetacioes
Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia
M. Iiesta Uiversidad de Murcia INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo Objetivos Tratar co muestras aleatorias y su distribució muestral e ejemplos de tamaño reducido. Tratar co la distribució de la
Distribuciones en el muestreo, EMV
Distribucioes e el muestreo, E Tema 6 Descripció breve del tema. Itroducció y coceptos básicos. Propiedades de los estimadores Sesgo, Variaza, Error Cuadrático Medio y Cosistecia 3. Distribució de u estimador
