TEMA. ESTADÍSTICA DESCRIPTIVA. Itroducció: coceptos básicos. Tablas estadísticas y represetacioes gráficas. Características de variables estadísticas uidimesioales.. Características de posició.. Características de dispersió.. Características de forma.4 Cocepto de v.e. bidimesioal.5 Distribucioes margiales y codicioadas.6 Covariaza.7 Depedecia e idepedecia estadística.8 Regresió y correlació. Itroducció.9 Rectas de regresió. Coeficiete de determiació y coeficiete de correlació lieal. Otros tipos de ajuste
.. Itroducció : coceptos básicos ¾ ESTADÍSTICA: Estudio de los métodos de recogida y descripció de datos, así como del aálisis de esta iformació Etapas de u estudio estadístico Recogida de datos Ordeació, tabulació y gráficos* Descripció de características* 4 Aálisis formal * Estadística descriptiva: parte de la estadística que se ocupa de las etapas y Idividuo, Població, Muestra ¾ Població: Cojuto de elemetos a los que se les estudia ua característica ¾ Idividuo: Cada uo de los elemetos de la població ¾ Muestra: Subcojuto represetativo de la població
Variables estadísticas. Modalidades ¾ Variable estadística (v.e.): Característica propia del idividuo objeto del estudio estadístico Ejemplos: - Estatura - Peso - Color del pelo - Nivel de colesterol - Nº de hijos de ua familia ¾ Modalidad: Cada ua de las posibilidades o estados diferetes de ua variable estadística ¾ Exhaustivas e icompatibles Ejemplo: color del pelo: - castaño - rubio - egro
Tipos de variables estadísticas ¾ Cualitativas: Las características o so cuatificables Ejemplos: Profesió Color del pelo ¾ Cuatitativas: Características cuatificables o uméricas 9 Discretas: Numéricas umerables Ejemplos: Nº de hijos Nº de viviedas 9 Cotiuas: Numéricas o umerables Ejemplos: Talla Peso Nivel de colesterol 4
.. Tablas estadísticas y represetacioes gráficas ¾ Variables discretas 9 Frecuecias Absolutas, (º idividuos modalidad i) i Absolutas acumuladas, N = + +... + Relativas, f (proporcio idiv. modalidad i) i Relativas acumuladas, F = f + f +... + f i i i i x i i N i f i F i Absolutas, i x...... N... f... F... Absolutas acumuladas, N i x i... x k i... k N i... N k f i... f k F i... F k Relativas f i = i / Relativas acumuladas F i = Ni / 5
¾ Variables cotiuas: Itervalos Itervalo I i x i i N i f i F i e o -e... x...... N... f... F... e i- -e i... x i... i... N i... f i... F i... e k- -e k x k k N k f k F k ¾ Marca de clase x i (puto medio de cada itervalo) ¾ Amplitud a i (distacia etre los extremos) ¾ Extremos [... ) 6
Gráficos estadísticos ¾ V. e. Cualitativas: Gráfico rectagular Color Plumaje Negro Gris Blaco Rojo Violeta Nº de Aves ( i ) 4 6 4 Negro Gris Blaco Rojo Violeta 7
¾ V. e. Cualitativas: Gráfico de sectores Color Plumaje Negro Gris Blaco Rojo Violeta Nº de Aves ( i ) 4 6 4 Grados de cada sector = 6º f i violeta rojo egro blaco gris 8
¾ V. e. Discretas: Gráfico de barras Nº de crías Nº aimales: i f i F i....5 4 5.5.75 5 5.5.9 6. = 5 5 5 5 4 5 6 9
¾ V. e. Discretas: Curva acumulativa de distribució Nº de crías Nº aimales: i f i F i....5 4 5.5.75 5 5.5.9 6. =.9.75.5. 4 5 6
¾ V. e. Cotiuas: Histograma Estatura 4-6 6-7 7-8 8-9 9- i 8 h i = i / a i.5..8 h i..8 ¾ El área de cada rectágulo es proporcioal a la frecuecia.5 4 6 7 8 9
¾ V. e. Cotiuas: Curva acumulativa de distribució Talla 4-6 6-7 7-8 8-9 9- i 8 f i....8. F i..5.7.9.9.7.5. 4 6 7 8 9
.. Características de variables estadísticas uidimesioales.. Características de Posició Media aritmética k k x = fx i= i i = i= x i i Estatura Nº Persoas i M. Clase x i i x i 4-5 45 9 5-6 55 55 6-8 8 7 6 8-9 9 = 9 Media : k x i= x i i = = 9 = 6.4
Moda Valor de la variable más frecuete 9 Puede haber más de ua moda : Plurimodal ¾ Variables discretas ƒ Datos e serie,,,,,, 5, 6, 7 Mo = ƒ Datos e tabla Ejemplo x i 4 5 i 4 6 45 7 Mo = 4
¾ Variables cotiuas hi hi Mo= ei + ai ( h ) ( ) i hi + hi hi+ Ejemplo x i 4-6 6-7 7-8 8-9 9- i 8 h i = i / a i.5..8 (..5) (..5) + (. ) Mo = 6 + = 67.777 ¾ Observacioes:. Puede utilizarse la frecuecia relativa. Si las amplitudes so iguales se puede proceder directamete co las frecuecias 5
Mediaa Valor de la variable que ocupa el lugar cetral e ua serie de datos ordeados. ƒ El 5% de los elemetos de la població tiee u valor de la variable meor de la mediaa. El 5% de los elemetos de la població tiee u valor de la variable mayor. ¾ Variables discretas ƒ Datos e serie Ejemplos ƒ Nº impar de observacioes:,,,, 5, 6, 7, 7, 8 : Me = 5 ƒ Nº par de observacioes: 4, 6, 6, 6, 7, 8, 8, 9 : Me = 6 7 Idetermiado etre 6 y 7 6
¾ Variables discretas ƒ Datos e tabla Ejemplo x i i 4 N i 4 f i.4 F i.4 / =4 F i = / 6.4.57.57.74 4 5 5 8.78.7.89 Me = 8 ¾ Observació: Si / coicide co u N i la mediaa está idetermiada etre x i y x i+ 7
¾ Variables cotiuas N F Me= e + a = e + a i i i i i i i fi Ejemplo Tallas 4-5 i 5 N i 5 f i.5 F i.5 / = 5 F i = / 5-6 45..45 6-7 5 7.5.7 7-8 9..9 8-..5.45 Me = 6 + = 6 + = 6.5 ¾ Observació: Si / coicide co u N i la mediaa es el extremo superior del itervalo que le correspode 8
Percetiles Defiició: P k, k:,,...,99, percetil k, valor de la variable que deja por debajo, el k% de los valores de la variable Q = P 5 Cuartil º Q = P 5 Cuartil º = Me Q = P 75 Cuartil º Cuatiles, aú más geeral D = P Decil º D = P Decil º. D 9 = P 9 Decil 9º ƒ Cálculo para v.e. discretas: Igual que la mediaa, cambiado / por k/ ƒ Cálculo para v.e. cotiuas: k k Ni Fi P = e + a = e + a k i i i i i fi 9
Ejemplos percetiles v.e. discreta x i i N i k/ = 5 4x4/ = 49.6 4 5 6 44 4 94 4 4 k/ = 4x95/ = 7.8 Percetil 4, P 4 = Percetil 95, P 95 = 6 k/ = 4x5/ = k/ = 4x5/ = 6 k/ = 4x75/ = 9 Percetil 5, P 5 = = Q Percetil 5, P 5 = 4 = Me = Q Percetil 75, P 75 = 4 = Q
Ejemplos percetiles v.e. cotiua Tallas i N i f i F i 4-5 5-6 5 5 45.5..5.45 P 4 6-7 7-8 5 7 9.5..7.9 P 75 8-. P k N i i k = ei + ai = ei + ai i fi P 4 k F 4 5.4.5 = 5 + = 5 + = 58.. 75 7.75.7. P 75 = 7 + = 7 + = 7.5 = Q
... Características de Dispersió 9 Mide la Homogeeidad de las observacioes Rago o recorrido ¾ Valor máximo meos valor míimo de la variable Recorrido itercuartílico ¾ Q Q
Variaza k k i σ i= i= ( ) i i i x x x = = x Desviació típica σ = σ Coeficiete de variació C. V. = σ x
Ejemplo x i i i x i i x i 4 8 6 4 4 44 8 44 5 86 6 6 6 64 68 6 96 44 k x i i σ [ ] i 44 96 = Var X = = x = = 6 6 6. σ = σ = 6. =.455 4
Mometos o cetrales (Respecto al orige) k k x i m r i r = fx = i i = i= i r k i= i= r = m = fixi = = x k x i i i= i= r = m = f x = k i i k x i i k σ i= x i i ( ) = x = m m 5
Mometos cetrales (Respecto a la media) k i x x µ i= r = ( ) i r r k µ i= ( ) i x x = = = i r k i= ( ) i x x = µ = = σ i 6
.. Características de forma Coeficiete de Sesgo (Asimetría) γ = µ σ y Si γ = Distribució simétrica y Si γ > Distribució sesgada a la derecha y Si γ < Distribució sesgada a la izquierda 7
Coeficiete de Curtosis (Aplastamieto) µ 4 γ = 4 σ y Si γ = Distribució igual de aplastada que la distribució Normal y Si γ > Distribució meos aplastada que la distribució Normal y Si γ < Distribució más aplastada que la distribució Normal 8
.4 Cocepto de variable estadística bidimesioal Ejemplo. X: Peso, Y: Estatura X\Y 4-6 6-8 8- > Margial X 4-6 6 8 6-8 8 6 8 8-8 6 5 Margial 9 6 8 8 7 Y 9 Frecuecias Margiales Frecuecias Margiales de X Frecuecias Margiales de Y 9 Frecuecias Codicioadas Frecuecias Codicioadas de X Frecuecias Codicioadas de Y 9
.5 Distribucioes margiales y codicioadas ¾ Distribució margial de X Distribució de la variable X: Peso X \ Y 4-6 4-6 6-8 6 8- > Margial X 8 6-8 8 6 8 8-8 6 5 Margial Y 9 6 8 8 7
¾ Distribució margial de X Distribució de la variable X: Peso X 4-6 6-8 8- Frecuecias Margiales 8 8 5 7 9 Media Margial de X 9 Mediaa Margial de X 9 Moda Margial de X 9 Variaza Margial de X
¾ Distribució margial de Y Distribució de la variable Y: Estatura X \ Y 4-6 6-8 8- > Margial X 4-6 6 8 6-8 8 6 8 8-8 6 5 Margial 9 6 8 8 7 Y
¾ Distribució margial de Y Distribució de la variable Y: Estatura Y 4-6 6-8 8- > Frecuecias Margiales 9 6 8 8 7 9 Media Margial de Y 9 Mediaa Margial de Y 9 Moda Margial de Y 9 Variaza Margial de Y
¾ Distribucioes de X codicioadas a valores de Y Ejemplo. Distribució de X codicioada a 6 < Y < 8 X\Y 4-6 4-6 6-8 6 8- > Margial X 8 6-8 8 6 8 8-8 6 5 Margial Y 9 6 8 8 7 4
Ejemplo. Distribució de X codicioada a 6 < Y < 8 X 4-6 6-8 8- Frecuecias codicioadas 6 8 6 9 Medias codicioadas de X 9 Variazas codicioadas de X 5
¾ Distribucioes de Y codicioadas a valores de X Ejemplo. Distribució de Y codicioada a 6 < X < 8 X\Y 4-6 6-8 8- > Margial X 4-6 6 8 6-8 8 6 8 8-8 6 5 Margial 9 6 8 8 7 Y 6
Ejemplo. Distribució de Y codicioada a 6 < X < 8 Y 4-6 6-8 8- > Frecuecias codicioadas 8 6 8 9 Medias codicioadas de Y 9 Variazas codicioadas de Y 7
.6 Covariaza [, ] Cov X Y i j ( )( ) x x y y ij i j = σxy = = i j x y ij i = x y j 8
.7 Depedecia e idepedecia estadística ¾ Idepedecia estadística ƒ No hay relació etre las variables Si ij i.. j = i, j ¾ Depedecia estadística ƒ Hay relació etre las variables El grado de relació se mide mediate u coeficiete de asociació 9
Ejemplo. Variables X e Y idepedietes X\Y Y i Y Y Y 4 X 4 = = 6 = 4 = 8 = X = = 9 = 6 4 = = X = = = 4 = 4 = j = 6 = 8 = 4 = 4 = 6 Idepedecia estadística.. = = = 6 6.. 6 = = = 6 Si ij.. i j = i, j 4
Ejemplo. Variables X e Y o idepedietes X\Y Y Y Y Y 4 i X = = 6 = 4 4 = 8 = X = = = 6 4 = = X = = = 4 = 4 = j = 7 = 9 = 4 = 4 = 6 Idepedecia estadística.. = = = 6 6.. Si 7 = =.9 6 ij.. i j = i, j 4
.- Dadas las siguietes distribucioes bidimesioales:. So idepedietes las variables X e Y?. Depede fucioalmete las variables X e Y? a. Ejemplo. Depedecia Fucioal X \ Y 4 5 5 b. X \ Y 5 5 4 c. X \ Y 5 5 d. X \ Y 5 4
a. b.. So idepedietes las variables X e Y? X \ Y 5 5 5 4 Margial Y X \ Y Margial Y.. Margial X 4 5 4 = =. Las variables X e Y o so idepedietes.. 5 5 Margial X 4 7 4 = =. Las variables X e Y o so idepedietes 4
. So idepedietes las variables X e Y? c. X \ Y 5 Margial X 5 5 Margial Y 5.. 5 = =.5 Las variables X e Y o so idepedietes d. X \ Y Margial Y 5 5 4.. 4 = =. Margial X Las variables X e Y o so idepedietes 44
. Depede fucioalmete las variables X e Y? a. X \ Y 5 5 4 Y Depede fucioalmete de X X No Depede fucioalmete de Y b. X \ Y 5 5 4 Y No Depede fucioalmete de X X Depede fucioalmete de Y 45
. Depede fucioalmete las variables X e Y? c. X \ Y 5 5 X Depede fucioalmete de Y Y Depede fucioalmete de X d. X \ Y 5 X No Depede fucioalmete de Y Y No Depede fucioalmete de X 46
.8 Regresió y correlació. Itroducció Regresió ¾ Búsqueda de ua fució que relacioe ambas variables y sirva para predecir ua variable a partir de la otra y = f(x) Correlació ¾ Estudio del ivel de relació etre las variables 9 Nube de putos (diagrama de dispersió): gráfico de las observacioes (datos bidimesioales) 9 Líea o fució de regresió: tipo de fució que mejor se ajuste a la ube de putos: Lieal ; Cuadrática; Expoecial 47
.9 Rectas de regresió Recta de míimos cuadrados de Y / X y j * Y * * * (x i, y j * ) y = a + bx y j * * * * e ij * (x i, y j ) x i X ( ) Residuos = e = y a+ bx ij j i mi ( *) ij = mi j j e y y = i j i j ( y ( a bx )) = mi j + i i j Ecuacioes ormales 48
Recta de míimos cuadrados de Y / X y = f( x) = a+ bx [, ] σ xy [ ] x Cov X Y b = = = Var X σ a = y bx x x y i i i i i x y x y y = b( x x) b = coeficiete de regresió de Y / X Variació de Y si X aumeta e ua uidad 49
Recta de míimos cuadrados de X / Y x= f( y) = c+ dy d [, ] σ xy [ ] y Cov X Y = = = Var Y σ c = x d y y x y i i i i i y xy x x= d( y y) d = coeficiete de regresió de X / Y Variació de X si Y aumeta e ua uidad 5
. Coeficiete de determiació y coeficiete de correlació lieal Coeficiete de determiació ¾ Proporció de la variaza explicada por la regresió r σ xy = ; r σ σ x y Coeficiete de correlació lieal de Pearso r σ xy = ; r σ σ x y r r r r = > < =± Idepedecia Depedecia directa Depedecia iversa Depedecia fucioal lieal 5
Ejemplo. X= Estatura, Y= Peso x i y i x i y i x i y i 6 5 8 56 74 7 64 8 9584 496 74 65 76 45 76 7 67 976 584 8 78 44 4 684 Σ=86 Σ= Σ= 575 Σ= 4886 Σ= 9 xy 86 x= = 7.4 ; y = = 66. 5 5 xy i i i 575 = xy= 7.4 66. = 57. 5 σ x i i 4886 7.4 σ x = x = = 45.44 5 y i i 9 66. σ y = y = = 76.6 5 5
y = a+ bx b [ ] σ xy [ ] Cov X, Y 57. = = = =.57 Var X σ 45.44 x a = y bx= 66..57 7.4 = 5.568 y = a+ bx= 5.568 +.57 x Para x = 7 y = a+ bx = 5.568 +.57 7 = 6.8 r σ xy 57. = = = σ σ 45.44 76.6 x y.978 5
. Otros tipos de ajuste ¾ Parabólico y ax bx c = + + ¾ Expoecial y = x ab ¾ Potecial y = b ax ¾ Hiperbólico y = a x 54