Capítulo III DITRIBUCIOE BIDIMEIOALE 3 Itroducció Etudiaremo do caracterítica de u mimo elemeto de la població (altura peo, do aigatura, logitud latitud) De forma geeral, i e etudia obre ua mima població e mide por la mima uidade etadítica ua variable X ua variable Y, e obtiee erie etadítica de la variable X e Y Coiderado imultáeamete la do erie, e uele decir que etamo ate ua variable etadítica bidimeioal 3 Tabulació de variable etadítica bidimeioale Vamo a coiderar tipo de tabulacioe: º) Para variable cuatitativa, que recibe el ombre de tabla de correlació º) Para variable cualitativa, que recibe el ombre de tabla de cotigecia 3Tabla de correlació ea ua població etudiada imultaeamete egú do caractere X e Y; que repreetaremo geéricamete como (x i ; j ; ), dode x i ; j, o do valore cualequiera e la frecuecia aboluta cojuta del valor i-éimo de X co el j-éimo de Y Ua forma de dipoer eto reultado e la coocida como tabla de doble etrada o tabla de correlació, la cual podemo repreetar como igue:
Y X j i fi x j k f x j k f x i i i ik i fi x r h h hj hk h f h j j k f j f f f j f k E ete cao, o idica el úmero de vece que aparece x cojutamete co ;, o idica la frecuecia cojuta de x co, etc Tipo de ditribucioe Cuado e etudia cojutamete do variable, urge tre tipo de ditribucioe: Ditribucioe cojuta, ditribucioe margiale ditribucioe codicioada a) Ditribució cojuta - La frecuecia aboluta cojuta, viee determiada por el úmero de vece que aparece el par ordeado ( x i, j ), e repreeta por
- La frecuecia relativa cojuta, del par ( x i, j ) e el cociete etre la frecuecia aboluta cojuta el úmero total de obervacioe e trata de f e cumple la iguiete relacioe etre la frecuecia de ditribució cojuta: ª) La uma de la frecuecia aboluta cojuta, extedida a todo lo pare e igual al total de obervacioe r i j ª) La uma de toda la frecuecia relativa cojuta extedida a todo lo pare e igual a la uidad r i j f b) Ditribucioe margiale Cuado trabajamo co má de ua variable queremo calcular la ditribucioe de frecuecia de cada ua de maera idepediete, o ecotramo co la ditribucioe margiale Variable X Variable Y x i i f i j j f j x f f x f f x 3 3 f 3 3 3 f 3 x 4 4 f 4 4 4 f 4 - Frecuecia aboluta margial: el valor i Repreeta el úmero de vece que aparece el valor x i de X, i teer e cueta cual e el valor de la variable Y A i e le deomia frecuecia aboluta margial del valor x i de X, de forma que: - + + + i i i i
De la mima maera, la frecuecia aboluta margial del valor j de Y e deotará por j + + + j j j rj - Frecuecia relativa margial La frecuecia relativa margial de x i de X, viee dada por: f i i La frecuecia relativa margial de j de Y, viee dada por: f j j - e cumple la iguiete relacioe etre la frecuecia de ditribució margiale: ª) La uma de frecuecia aboluta margiale de la variable X, e igual al úmero de obervacioe que compoe la muetra ª) La uma de la frecuecia relativa margiale de la variable X, e igual a 3ª) La do propiedade ateriore e cumple tambié para la variable Y c) Ditribucioe codicioada Coideremo a lo j idividuo de la població que repreeta la modalidad j de la variable Y, obérvee la columa j-eima de la tabla u j elemeto cotitue ua població, que e u ubcojuto de la població total obre ete ubcojuto e defie la ditribució de X codicioada por j, que e repreeta por X / j ;u frecuecia aboluta e repreeta por i / j, u frecuecia relativa por f i / j, para i,, 3,, r iedo f i / j j El razoamieto e aálogo cuado codicioamo la variable Y a u determiado valor de X, e decir Y /x i Ejemplo: ea X alario e um ea Y atigüedad e la emprea (año) X / Y 3 5 7 9 i fi 90 0 0 5 0,053 0 4 4 5 8 0,89 30 7 3 0 4 0,47 50 4 6 6 4 3 0 3 0,4 70 3 4 6 4 0 0,
90 0 0 5 5 3 5 0,58 j 0 0 6 5 95 fj 0,05 0,3 0, 0,3 0,68 0,053 Cuál e la ditribució de la retribució, pero úicamete de lo empleado co ua atigüedad de 5 año?, e decir cual e la ditribució codicioada de la variable X codicioada a que Y ea igual a 5? X / Y i/ 5 fi/ 5 90 /0 0 4 4/0 30 3 3/0 50 6 6/0 70 4 4/0 90 /0 j 0 Covariaza La covariaza mide la forma e que varía cojutamete do variable X e Y E el etudio cojuto de do variable, lo que o iterea pricipalmete e aber i exite algú tipo de relació etre ella Veremo ahora ua medida decriptiva que irve para medir o cuatificar eta relació: r ( xi x)( j ) x i j i x >0 ha depedecia directa (poitiva), e decir la variacioe de la variable tiee el mimo etido i x 0 la variable etá icorrelada, e decir o ha relació lieal, pero podría exitir otro tipo de relació
i x < 0 ha depedecia ivera o egativa, e decir la variacioe de la variable tiee etido opueto Gráficamete, idicaría la Covariaza, que lo dato, e ajuta a ua recta, e lo iguiete cao: x >0 x <0 i j i j - Otra forma de calcular la Covariaza ería: m x x r erá la que utilizaremo e la práctica - La covariaza o e u parámetro acotado, puede tomar cualquier valor real, por lo que u magitud o e importate; lo igificativo e el igo que adopte la mima x Ejemplo: ea X el tiempo de vida de u iecto ( año ) e Y la logitud del mimo, podría deducir i exite relació etre la edad del iecto u tamaño X / Y 3 4 i 3 0 4 3 5 3 0 3 4 j 4 5 4 3 x r i j x i i * 4 + *5 + 3* 4 año 3 j j cm * 4 + 3 * 5 + 4 * 4 3 3 **3+ *3*+ *4*0+ **+ *3*3+ *4*+ 3**0+ 3*3*+ 3*4*3 x *3 046 3
Al teer la covariaza etre amba variable igo poitivo, podemo deducir que exite ua relació directa o poitiva etre amba variable, e decir, cuado aumeta la edad del iecto tambié aumeta u tamaño 3Tabla de cotigecia Cuado teemo la iformació de variable de tipo cualitativo o de ua variable cualitativa otra cuatitativa, e dipoe de ua tabla de cotigecia o limitaremo al cao de variable E ua tabla de doble etrada e la que e la fila e ubica la modalidade de ua de la variable ( atributo ) e la columa la del otro; e la celda reultate del cruce de la fila la columa e iclue el úmero de elemeto de la ditribució que preeta amba modalidade i e tiee iformació de elemeto acerca de la variable A B de tal forma que preeta r modalidade repectivamete, la tabla de cotigecia ería de la forma: B B B B j B i fi A A j f A j f A i i i i i fi A r r r rj r r f r j f f f f j f tabla de cotigecia r x
úmero de elemeto de la ditribució que preeta la modalidad i éima del atributo A la modalidad j eima del atributo B i i+ i+ + i -- úmero de elemeto de la ditribució co la i éima modalidad del atributo A Como a la variable cualitativa o e le puede ometer a operacioe de uma, reta diviioe, al veir expreada e ecala omiale u ordiale o tiee etido hablar de media margiale, codicioada, variaza, etc; i podríamo calcular la moda e el cao de que e empleara ua ecala omial de la mediaa i utilizamo ecala ordiale 33 Depedecia e idepedecia 33Idepedecia Cuado o e da igú tipo de relació etre variable o atributo, diremo que o idepediete Do variable X e Y, o idepediete etre i, cuado ua de ella o iflue e la ditribució de la otra codicioada por el valor que adopte la primera Por el cotrario exitirá depedecia cuado lo valore de ua ditribució codicioa a lo de la otra Dada do variable etadítica X e Y, la codició ecearia uficiete para que ea idepediete e: i j i, j Propiedade: ª) i X e idepediete de Y, la ditribucioe codicioada de X/Y j o idética a la ditribució margial de X ª) i X e idepediete de Y, Y e idepediete de X 3ª) i X e Y o variable etadíticamete idepediete, u covariaza e cero La recíproca de eta propiedad o e cierta, e decir, la covariaza de variable puede tomar valor cero, o er idepediete 33Depedecia fucioal exacta etre amba variable ) ( exite ua relació matemática El carácter X depede del carácter Y, i a cada modalidad j de Y correpode ua úica modalidad poible de X Por lo tato cualquiera que ea j, la frecuecia aboluta vale cero alvo para u valor de i correpodiete a ua columa j tal que j Cada columa de la tabla de frecuecia tedrá, por coiguiete, u úico térmio ditito de cero i a cada modalidad x i de X correpode ua úica
modalidad poible de Y, erá Y depediete de X La depedecia de X repecto de Y o implica que Y depeda de X Para que la depedecia ea recíproca, lo caractere X e Y debe preetar el mimo úmero de modalidade ( debe er m) e cada fila como e cada columa de la tabla debe haber uo olo u térmio diferete de cero ea X el alario de u empleado e Y la atigüedad del mimo e la emprea X \ 3 5 7 9 Y 00 5 0 0 0 0 0 0 0 0 0 0 40 0 0 30 0 0 60 0 0 0 5 0 80 0 0 0 0 0 Depedecia fucioal recíproca: X depede de Y e X Y depede de X \ 3 5 7 9 0 Y 00 5 0 0 0 0 0 0 0 0 0 0 0 0 40 0 0 30 0 0 60 0 0 0 5 0 0 80 0 0 0 0 0 9 Y depede de X pero X o depede de Y 333Depedecia etadítica ( exite ua relació aproximada ) Exite caractere que i o idepediete, i e da etre ello ua relació de depedecia fucioal, pero i e percibe ua cierta relació de depedecia etre ambo; e trata de ua depedecia etadítica Cuado lo caractere o de tipo cuatitativo, el etudio de la depedecia etadítica e cooce como el problema de regreió, el aálii del grado de depedecia que exite etre la variable e cooce como el problema de correlació 34Regreió correlació lieal imple
34Itroducció a la regreió lieal imple Cuado e etudia do caracterítica imultáeamete obre ua muetra, e puede coiderar que ua de ella iflue obre la otra de algua maera El objetivo pricipal de la regreió e decubrir el modo e que e relacioa Por ejemplo, e ua tabla de peo altura de 0 peroa Altura Peo 7 5 8 0 6 5 7 8 0 7 3 7 6 8 6 5 6 5 80 8 57 63 78 65 66 67 6 58 e puede upoer que la variable Altura iflue obre la variable Peo e el etido de que peo grade viee explicado por valore grade de altura (e geeral) De la do variable a etudiar, que vamo a deotar co X e Y, vamo a llamar a la X VARIABLE IDEPEDIETE o EXPLICATIVA, a la otra, Y, le llamaremo VARIABLE DEPEDIETE o EXPLICADA E la maoría de lo cao la relació etre la variable e mutua, e difícil aber qué variable iflue obre la otra E el ejemplo aterior, a ua peroa que mide meo le upodremo meor altura a ua peroa de poca altura le upodremo u peo má bajo E decir, e puede admitir que cada variable iflue obre la otra de forma atural por igual U ejemplo má claro dode ditiguir etre variable explicativa explicada e aquel dode e aota, de cada alumo de ua clae, u tiempo de etudio (e hora) u ota de exame E ete cao u pequeño tiempo de etudio tederá a obteer ua ota má baja, ua ota buea o idicará que tal vez el alumo ha etudiado mucho i embargo, a la hora de determiar qué variable explica a la otra, etá claro que el tiempo de etudio explica la ota de exame o al cotrario, pue el alumo primero etudia u tiempo que puede decidir libremete, luego obtiee ua ota que a o decide arbitrariamete Por tato, X Tiempo de etudio Y ota de exame (variable explicativa o idepediete) (variable explicada o depediete) El problema de ecotrar ua relació fucioal etre do variable e mu complejo, a que exite ifiidad de fucioe de forma ditita El cao má ecillo de relació etre do variable e la relació LIEAL, e decir que Y a + b X (e la ecuació de ua recta) dode a b o úmero, que e el cao al que o vamo a limitar Cualquier ejemplo de ditribució bidimeioal o muetra que la relació etre variable O e EXACTA (bata co que u dato de la X
tega do dato ditito de Y aociado, como e el ejemplo de la Altura Peo, que a 80 cm de altura le correpodía u idividuo de 8 kg otro de 78 kg) Diagrama de diperió o ube de puto E u problema de ete tipo, e oberva lo valore ( x i, j ) e repreeta e u itema de eje coordeado, obteiedo u cojuto de puto obre el plao, llamado diagrama de diperió o ube de puto Y Y X X E lo diagrama de arriba e puede obervar cómo e el de la izquierda, ua líea recta icliada puede aproximare a cai todo lo puto, mietra que e el otro, cualquier recta deja a mucho puto alejado de ella Aí pue, el hacer u aálii de regreió lieal ólo etaría jutificado e el ejemplo de la izquierda Como e puede ver e ambo diagrama, igua recta e capaz de paar por todo lo puto, eguir iedo recta De toda la recta poible, la RECTA DE REGREIÓ DE Y OBRE X e aquella que miimiza u cierto error, coiderado a X como variable explicativa o idepediete a Y como la explicada o depediete Recta de míimo cuadrado o recta de regreió de Y obre X ( * a + b x) ea a + b x ua recta arbitraria Para cada dato de X, e decir, para cada x i de la tabla teemo emparejado u dato de Y llamada i, pero tambié teemo el valor de utituir la x i e la ecuació de la recta, al que llamaremo * i i xi a + b xi * i
Cuado e toma el dato x i, el error que vamo a coiderar e el que e comete al elegir * i e lugar del verdadero i e deota co e i vale e i i - * i Eo errore puede er poitivo o egativo, lo que e hace e ecoger la recta que miimice la uma de lo cuadrado de todo eo errore, que e la mima que la que miimiza la variaza de lo errore Uado técica de derivació e llega a que, de toda la recta a + b x, co a b úmero arbitrario, aquella que miimiza el error elegido e aquella que cumple a x x x x x b por lo tato a bx Aí pue, utituedo e a + b x, la ecuació de la recta de regreió de Y obre X e x x * x + x x e decir a + bx x recolocado lo térmio e puede ecribir de la forma x x ( x x ) Recta de regreió de X obre Y i e hubiee tomado Y como variable idepediete o explicativa, X como depediete o explicada, la recta de regreió que e eceita e la que miimiza errore de la X e llama RECTA DE REGREIÓ DE X OBRE Y e calcula fácilmete permutado lo pueto de x e, obteiédoe x * x x ( ) e decir x a + b x abiedo que : b que a x b
PROPIEDADE: - Amba recta de regreió paa por el puto ( x, ) - La pediete de la recta de regreió de Y obre X e b la de X obre Y e b Dado que la variaza o poitiva por defiició, el igo de la pediete erá el mimo que el de la covariaza, aí, la recta erá amba creciete o decreciete, depediedo de i la covariaza e poitiva o egativa, repectivamete, e decir b b tedrá el mimo igo - Lo térmio de la recta a a cotitue lo orígee de la recta, e decir, o lo valore que adopta repectivamete * ó x* cuado x o toma el valor cero e u correpodiete recta de regreió - La recta de regreió la emplearemo para realizar prediccioe acerca de lo valore que adoptara la variable - Puede dare el cao, de o exitecia de correlació lieal etre la variable, lo cual o implica que o exita otro tipo de relacioe etre la variable etudiada: relació expoecial, relació parabólica, etc 34Correlació lieal imple ( r ó R ) Para ver i exite relació lieal etre do variable X e Y, emplearemo u parámetro que o mida la fuerza de aociació lieal etre amba variable La medida de aociació lieal ma frecuetemete utilizada etre do variable e r o coeficiete de correlació lieal de Pearo; ete parámetro e mide e térmio de covariaza de X e Y x R R x i R, exite ua correlació poitiva perfecta etre X e Y i R -, exite ua correlació egativa perfecta etre X e Y i R 0, o exite correlació lieal, pudiedo exitir otro tipo de relació i p R p 0, exite correlació egativa depedecia ivera, maor cuato má e aproxime a - i 0 p R p, exite correlació poitiva, depedecia directa, maor cuato má e aproxime a - Variaza reidual variaza explicada por la regreió Coeficiete de determiació lieal (R ) i teemo do variable X e Y relacioada liealmete, parte de la variabilidad de la variable Y, vedrá explicada por variacioe de X ( variabilidad explicada por el modelo), mietra que el reto repoderá a variacioe de feómeo relacioado co la variable Y o co el azar ( variabilidad o explicada por el modelo) Por tato o coviee dipoer de ua medida que idique el porcetaje de la variabilidad de la variable explicada que e debe a la variabilidad de la variable explicativa Eta medida e el coeficiete de determiació lieal (R ), i u valor e alto o idicará que el ajute lieal efectuado e bueo
E la regreió lieal de Y obre X, la variaza de la variable Y, puede decompoere e la uma de variaza: r + e dode: e la variaza total de la variable Y r e la variaza explicada o variabilidad de Y explicada por la regreió b r x e e la variaza reidual (e) o variabilidad de Y o explicada por la regreió b e x R 0 R r e x R x tambié podemo afirmar que R b b E ua medida de la bodad del ajute lieal efectuado i lo expreamo e porcetaje, dicho coeficiete o idica el % de la variaza de la variable explicada ( Y) que e ha coeguido explicar mediate la regreió lieal i R, exite depedecia fucioal; la totalidad de la variabilidad de Y e explicada por la regreió i R 0, depedecia ula; la variable explicativa o aporta iformació válida para la etimació de la variable explicada i R 0 75, e acepta el modelo ajutado Relació exitete etre lo coeficiete de determiació correlació lieal: R ± R El igo del coeficiete de correlació lieal erá el mimo que el de la covariaza 35 Etudio de la aociació etre variable cualitativa E el etudio vito de regreió correlació e ha tratado olo el cao de variable cuatitativa ( igreo, alario, precio, etc) Co variable de tipo cualitativo e puede cotruir tabla de cotigecia, a travé de la
cuale e puede etudiar la idepedecia etadítica etre lo ditito atributo i do atributo o depediete, e puede cotruir ua erie de coeficiete que o mida el grado aociació o depedecia etre lo mimo Partimo de la tabla de cotigecia e la que exite r modalidade del atributo A del atributo B El total de obervacioe erá: r i j i j La idepedecia etadítica e dará etre lo atributo i : para todo i, j ; i eta expreió o e cumple, e dirá que exite u grado de aociació o depedecia etre lo atributo i j ---- ' i j El valor ' e la frecuecia aboluta cojuta teórica que exitiría i lo atributo fuee idepediete El valor e la frecuecia aboluta cojuta obervada El coeficiete de aociació o cotigecia e el llamado Cuadrado de Cotigecia, que e u idicador del grado de aociació: χ i ( ' ) j ' iedo ' i j El campo de variació va dede cero ( cuado exite idepedecia ' ), hata determiado valore poitivo, que depederá de la magitude de la frecuecia aboluta que lo compoe Ete icoveiete de lo límite variable e elimiará co el empleo del Coeficiete de cotigecia de Pearo: C χ + χ Varía etre cero uo El valor cero e dará e el cao de idepedecia ( ' ) Cuato má e aproxime a má fuerte erá el grado de aociació etre lo do atributo
Etudio de la aociació etre do atributo - Para tabla de cotigecia x ea A B do variable cualitativa o atributo tale que preeta modalidade cada ua La tabla de cotigecia correpodiete e la iguiete: A \ B B B A A,, A B o idepediete i: i j A la expreioe e le deomia frecuecia eperada e deota por o por E i fialmete podemo cocluir que lo do atributo etá aociado, e puede platear do preguta: ª) Cual e la iteidad de la aociació etre lo do atributo? ª) Cual e la direcció de la aociació detectada? Aociació perfecta etre do atributo Ocurre cuado, al meo, ua de la modalidade de uo de lo atributo queda determiada por ua de la modalidade del otro atributo Eto ocurre cuado exite algú cero e la tabla x La aociació perfecta puede er: a) Aociació perfecta etricta Ocurre cuado dada modalidad de uo de lo atributo queda imediatamete determiada la modalidad del otro E decir, cuado 0 ó 0 Ejemplo: A tipo de trabajo ( temporal ó idefiido ) B exo ( hombre ó mujer ) exo \ Tipo Temporal Idefiido trabajo Hombre 0 0 Mujer 0 80 Co eto dato abemo que i u idividuo e hombre el tipo de trabajo era temporal i e mujer u cotrato erá idefiido
Aociació perfecta e implicita de tipo Ocurre cuado: º) i e toma la modalidad de u atributo queda determiada la modalidad del otro atributo al que perteece la obervació º) i e toma la otra modalidad, o queda determiada la modalidad del otro atributo al que perteece la obervació E decir, eta aociació e produce cuado algua de la frecuecia obervada e cero Ejemplo: A tipo de trabajo ( temporal ó idefiido ) B exo ( hombre ó mujer ) exo \ Tipo Temporal Idefiido trabajo Hombre 5 5 Mujer 0 80 - i la peroa obervada e mujer abremo que u cotrato e idefiido; i e varó puede er idefiido o temporal - i el cotrato aalizado e temporal perteecerá a u hombre; i e u cotrato idefiido, podrá er de u hombre o ua mujer Tambié podemo delimitar i la aociació e poitiva o egativa: - Aociació poitiva Cuado e verifica que : a) La modalidad del atributo A etá aociada a la modalidad del atributo B b) La modalidad del atributo A etá aociada a la modalidad del atributo B - Aociació egativa: Cuado e verifica que: a) La modalidad del atributo A etá aociada a la modalidad del atributo B b) La modalidad del atributo A eta aociada a la modalidad del atributo A Para medir el etido de la aociació etre do atributo emplearemo el idicador Q de Yule: Q + Q i Q 0, etoce exite idepedecia i Q > 0, etoce exite aociació poitiva
i Q < 0, etoce exite aociació egativa Tabla de cotigecia R x Para determiar la iteidad de dicha aociació, calculamo la V de Cramer, que e defie como: V r i j ( m E ) E m mi ( r-, - ) V (0,) i j E Exitirá ua maor iteidad e la aociació etre variable a medida que el idicador adopte valore próximo a