DISTRIBUCIÓ BIDIMESIOAL E ete tema e etudia feómeo bidimeioale de carácter aleatorio. El objetivo e doble: 1. Determiar i eite relació etre la variable coiderada(correlació).. Si ea relació eite, idicar el procedimieto para etimar el valor de ua variable a partir de otra(regreió). Ditribucioe bidimeioale Ua ditribució de do variable (bidimeioal) e u cojuto de pareja de valore ( i, y i ), que puede preetare mediate ua tabla. f i (frecuecia) f 1 f... f i i 1... i y i y 1 y... y i Geéricamete, la variable e llama (variable idepediete) e y(variable depediete). Correlació Al etudiar ditribucioe bidimeioale, el objetivo pereguido e determiar i eite relació etadítica etre la do variable coiderada; e decir, ver i lo cambio e ua de la variable ifluye e lo cambio de la otra. Cuado ucede eto, e dice que amba variable etá correlacioada o que hay correlació etre ella. Si la variable crece cojutamete, la correlació e directa. Si, por el cotrario, al aumetar ua de ella dimiuye la otra, la correlació erá ivera. La correlació puede calificare como fuerte cuado el grado de depedecia e alto; y como débil e cao cotrario. Diagrama de diperió El primer pao para determiar el etido y el grado de la correlació etre do variable coite e repreetar gráficamete, e el plao carteiao, lo pare de valore coocido. Eto gráfico, que recibe el ombre de diagrama de diperió, permite viualizar la poició de lo dato e el plao. La forma de la ube de puto aociada a cada diagrama permitirá etablecer cojetura obre la correlació eitete etre la variable etudiada. E la iguiete figura e da alguo diagrama de diperió. Por la forma de la ube de puto, e puede ituir que tipo de correlació ugiere cada uo de ello. I. Eta ube, etrecha y decreciete, idica correlació lieal ivera y fuerte. II. E ete cao, la ube o adopta ua forma defiida: o hay correlació (o e muy débil). III. Eta ube, acha y co tedecia a crecer, ugiere ua correlació lieal directa y débil. IV. La ube preeta ua forma clara, pero o rectilíea. La correlació o e lieal, podría er epoecial o parabólica. E geeral, depediedo de la forma de la ube de puto, puede aegurare: Ua ube de puto alargada idica correlació lieal: lo puto e ditribuye etoro a ua líea recta. La etrechez de la ube eprea que la correlació e fuerte. Si la recta que e ajuta a la ube tiee pediete poitiva, la correlació erá directa: al aumetar, aumeta y, ó vicevera Ua recta co pediete egativa idica que la correlació e ivera, al aumetar, dimiuye y, ó vicevera.
E la iguiete figura e puede obervar todo lo aterior El etudio cuatitativo de eto cocepto e realiza mediate lo parámetro de correlació y de regreió Parámetro de ua ditribució bidimeioal Lo dato de ua ditribució bidimeioal uele dare e forma de tabla. Por ejemplo: i 1... y i y 1 y... y e el cao que la frecuecia de cada pareja ea uo, e otro cao: i 1... y i y 1 y... y f i f 1 f... f Tambié e puede preetar e cuadro de doble etrada 1...... y y 1 f 1.1 f 1....... f 1. y f.1 f....... f........................................... y m f m.1 f m....... f m............. Lo dato correpodiete a cada ua de la variable e llama dato margiale. (E el cao de tabla de doble etrada puede hablare de frecuecia margiale). Eto dato permite el cálculo de lo parámetro margiale de cada ua de la variable. Media La media margiale para cada ua de la variable X e Y vale, repectivamete: i fi yi f i y El puto (, y) e llama cetro medio de la ditribució. E el cetro de gravedad (o cetro de maa) de la ube de puto. Si e coidera la medida poderada e llamaría cetro medio poderado. Variaza margiale La variaza margiale, o: i i i i Para : f f σ ( ) i i i i Para y: y y y y f y f σ y ( ) Deviacioe típica margiale Para : σ ( yi y) fi yi fi Para y: y σ y y ( i ) fi i fi
Covariaza La covariaza e u parámetro etadítico cojuto ya que e u cálculo iterviee la do variable a la vez. Se defie como la media aritmética de lo producto de la diferecia de cada variable repecto de u media margial. Por tato, vale: ( i ) ( yi y) fi i yi fi y σ y ó y σ y y La covariaza permite etimar cocepto relativo a la correlació etre la do variable I. Su igo idica el etido de la correlació etre la variable. Si y >0, la correlació e directa. Si y < 0, la correlació e ivera. II. U valor grade de y advierte que la correlació etre la variable puede er fuerte, pero o lo aegura, o iedo itereate la comparació de do ditribucioe por la covariaza. La covariaza ólo da el etido de la correlació: directa i e poitiva e ivera i e egativo. Coeficiete de correlació lieal El coeficiete de correlació lieal(r) e el criterio que e utiliza para medir la fuerza de la correlació lieal etre do variable, e defie como: y r y E la razó etre la covariaza de la variable e y, y el producto de u deviacioe típica margiale. Su propiedade fudametale o: La propiedade fudametale del coeficiete de correlació o: I. El valor de r o e fució de la ecala de medida. II. El igo de r e el mimo que el de la covariaza, pue la deviacioe iempre o poitiva. Luego: Si r > 0, la correlació e directa; Si r < 0, la correlació e ivera. III. El valor de r etá compredido etre 1 y +1: 1 r 1 IV. Si r toma valore próimo a 1, la correlació e fuerte e ivera. V. Si r toma valore próimo a +1, la correlació e fuerte y directa. VI. Si r 1, la correlació e perfecta deomiádoe correlació fucioal. Hay depedecia lieal etre la variable X e Y. VII. Si r toma valore cercao a 0, la correlació prácticamete o eite. E fució del valor umérico del coeficiete de correlació lieal, e puede claificar la correlació e diferete tipo:
El coeficiete de correlació (r) mide ecluivamete la correlació lieal etre do variable, o iedo capaz de detectar correlacioe de otro tipo(epoecial, Cuadrática,... etc). A r e le deomia coeficiete de determiació, y da ua medida de la fiabilidad de la etimacioe de Y a partir de X. El valor del coeficiete de determiació idica la proporció de la variació e la variable Y que puede er eplicada e la variable X Recta de regreió La recta de regreió e la que mejor e ajuta a la ube de puto, haciedo míima la uma de la ditacia de todo lo puto de la ube a ella. Debe paar por el puto (, y), cetro de gravedad de la ditribució bidimeioal. La recta que mejor e ajuta a eto propóito e la recta de regreió míimo cuadrática. Co eta codicioe, lo valore de la pediete a y de la ordeada e el orige b de ea recta vale: y y a b y - Luego, la ecuació de la recta de regreió e: y y y ( ) Siedo e y la medida de la variable X e Y, la variaza de X y y la covariaza. Eta recta de regreió e llama de Y obre X, pue e utiliza para predecir (etimar) lo valore de Y a partir de lo de X. Si lo que e deea e etimar lo valore de X partiedo de lo de Y, e empleará la ecuació de la recta de regreió de X obre Y, que e: y ( y y) Sy A e le deomia coeficiete de regreió de X obre Y. o e la pediete de la recta, S y io u ivera. La recta de regreió de Y obre X y de X obre Y e corta e el cetro de gravedad de la ditribució (, y). Su poició relativa e fució del coeficiete de correlació, ocilado dede perpediculare cuado r 0, hata coicidete cuado r 1. y
Ejemplo 1. La temperatura media aual, e ºC, de varia ciudade, y el gato medio aual e calefacció por habitate e fue: Temperatura ºC 10 1 15 1 18 Gato 150 10 84 0 48 1 a. Repreetar la ube de puto aociada. Qué tipo de correlació e oberva? b. Hallar el coeficiete de correlació y la recta de regreió del gato obre la temperatura. c. Iterpretar el coeficiete de determiació d. Que gato cabe eperar e ciudade co temperatura media de 8, 17, ºC. e. Que temperatura media hubo e ua ciudad cuyo gato media por habitate fue de 98. f. Repreetar la do recta de regreió. a. (Variable idepediete) Temperatura media e ºC y(variable depediete) Gato medio por habitate e Se puede obervar que lo puto e ajuta bie a ua recta de pediete egativa, por lo tato etre la do variable cabe eperar ua correlació aleatoria fuerte iveramete proporcioal. b. Para el cálculo de lo parámetro de la ditribució e eceario el iguiete cuadro de frecuecia: i y i i y i i y i 10 150 100 500 1500 1 10 144 14400 1440 15 84 5 705 10 1 0 5 300 90 18 48 34 304 84 1 484 144 4 1 93 y i 474 i 1533 50004 Parámetro de la ditribució: y i i yi 88 - Media: y i yi 93 474 15'5 79
- Variaza: y i 1533 15'5 15'5 yi 50004 y 79 093 i 1533 15'5 3'91 - Deviacioe: yi 50004 y y 79 45'75 i yi 88 - Covariaza: Sy y 15'5 79 17' 5 Sy 17'5 - Coeficiete de correlació: r 0' 988 y 3'91 45'75 - Coeficiete de determiació: r (%) 0'988 100 97' y - Recta de regreió de Y obre X: y y ( ) ordeado 17'5 y 79 15'5 ( 15'5) y 58'3 11' c. E la variacioe producida e el gato medio por habitate, el 97 % e fució de la variacioe e la temperatura media, el 8% retate e debe a otro cocepto. d. Para etimar el gato medio coocida la temperatura media e ua la recta de regreió 1 8º C y1 58'3 11' 8 15'5 17º C y 58'3 11' : y 58'3 11' 17 11' 3 º C y3 58'3 11' 43'3 el valor y 3, o tiee etido, pero tampoco e lógico uar calefacció para ua temperatura media de ºC e. Coocido el gato medio e calefacció tambié e puede etimar le temperatura media, mediate la recta de regreió. y 58'3 11' 98 58'3 y 4 98 98 58'3 11 13'8 º C 11' y d. X obre Y: ( y y), 15'5 ( y 79) y 17'5, ordeado: y 8 11 9 093