Estadística Descriptiva
TEMA 1 Estadística Descriptiva 1. Variables estadísticas uidimesioales a) Itroducció b) Estudio descriptivo de ua variable c) Represetacioes gráficas d) Medidas de tedecia cetral e) Medidas de posició f) Medidas de dispersió g) Medidas de comparació. Estudio cojuto de dos variables a) Diagramas de dispersió b) Covariaza, coeficiete de correlació c) Rectas de regresió
Medidas de Tedecia Cetral
ҧ Medidas de Tedecia Cetral Cosideraremos Variables Estadísticas Cuatitativas El objetivo de estudiar las Medidas de Tedecia Cetral, es dar ua idea del valor alrededor del cual se reparte los valores de la muestra obteida. Defiició: Se llama Media Aritmética de u cojuto de datos muestrales, x 1, x,, x, y se represeta por x a: x ҧ = x 1 +x + + x Si la frecuecia absoluta de cada dato x i o fuera 1, se puede expresar la media aritmética como: x ҧ = x 1 1 +x + + x j j Medida de Tedecia Para datos agrupados e clases, se toma como valor de cada itervalo a su marca de clase.
Medida de Tedecia Medidas de Tedecia Cetral ; Defiició: Se llama Mediaa de u cojuto de datos muestrales, x 1, x,, x, y se represeta por M al valor que ocupa la posició cetral, ua vez ordeados los datos e orde creciete. Se llama Moda de u cojuto de datos muestrales, x 1, x,, x, al valor o valores de mayor frecuecia absoluta. Se represeta por Mo. x i i Ni x i i 1 6 6 6 11 17 3 6 3 18 4 7 30 8 5 9 39 45 6 11 50 66 50 185 x Mo y 6 1 x 1 x x M 50 i 1 i x i 5 185 50 3,7
Medidas de Posició
Medidas Posició Percetiles y Cuartiles Se deomia Percetil α de u cojuto de datos ordeados x 1, x,, x y se represeta por P a u valor que es mayor o igual que el α% de los datos y meor o igual que el (1-α)% de los datos restates. Supogamos que los datos está ordeados de meor a mayor. Para calcular el percetil P procedemos de la siguiete forma: Hallamos el α% de los datos: α = E + D dode E es la parte etera y D la 100 parte decimal del resultado. Si D 0, etoces P es el dato que ocupa la posició E + 1 Si D = 0, etoces P es la media aritmética de los datos que ocupa las posicioes E y E + 1
Percetiles y Cuartiles Ejemplo: Calcular los percetiles 1 y 40 de los siguietes datos 5 6 7 7 9 10 1 15 15 0 1 5 7 8 3 34 34 35 40 41 48 51 56 57 65 75 76 78 80 81 84 88 88 89 90 91 9 93 97 Hay 40 datos. El percetil 1 es el dato que tal que el 1% de los datos es meor que el. Calculamos cuatos datos so el 1% de 40: 1 100 1 es el dato que ocupa la posició 9 P 1 = 15 De igual forma: 40 40 = 16 100 Medidas Posició 40 = 8,4 Por tato el percetil El percetil 40 es la media aritmética de los datos que ocupa las posicioes 16 y 17 P 40 = 3+34 = 33
Medidas Posició Percetiles y Cuartiles Los percetiles 5, 50 y 75 se deomia, respectivamete, Primer, Segudo y Tercer cuartil y se represeta por Q 1, Q, Q 3. Los cuartiles divide el cojuto de datos e cuatro itervalos, cada uo de los cuales cotiee el 5% de los datos.
Medidas de Dispersió
Medidas de Dispersió Las medidas de tedecia cetral por sí solas so isuficietes para resumir toda la iformació de ua muestra. Daremos medidas de la dispersió de los datos co respecto a los valores cetrales. Defiició: Se llama Recorrido o Rago de u cojuto de datos muestrales, x 1, x,, x, a la diferecia etre el máximo y el míimo de los datos. Se llama Variaza de u cojuto de datos muestrales, x 1, x,, x, y se represeta por s, a: s = (x 1 x) ҧ +(x x) ҧ + + (x x) ҧ = σ i=1 (x i x) ҧ Si la frecuecia absoluta de cada dato x i o fuera 1, se puede expresar la variaza como: s = (x 1 x) ҧ 1 + (x x) ҧ + + (x j x) ҧ j Desarrollado: s = σ j i=1 x i i Medida de Dispersió xҧ = σ j i=1(x i x) ҧ i
Medida de Dispersió Medidas de Dispersió Defiició: Se llama Cuasi Variaza de u cojuto de datos muestrales, x 1, x,, x, y se represeta por s, a: s = (x 1 x) ҧ +(x x) ҧ + + (x x) ҧ = σ i=1 (x i x) ҧ 1 1 Se puede obteer la variaza a partir de la cuasi variaza o viceversa: s = 1 s y s = 1 s Se llama Desviació Típica de u cojuto de datos muestrales, x 1, x,, x, y se represeta por s, a la raíz cuadrada de la variaza. x i i x i i x i i 1 6 6 6 11 44 3 6 18 54 4 7 8 11 5 9 45 5 6 11 66 396 50 185 837 x s = 3,7 6 + 44 + 54 + 11 + 5 + 396 50 s = s = 4,09 3,7 = 16,74
Medidas de Comparació
Medidas Comparació Medidas de comparació E ocasioes es ecesario comparar datos de diferetes muestras o poblacioes pero es algo que o puede hacerse directamete, hay que teer e cueta la variabilidad de ambos cojutos. Dada ua variable estadística X que toma valores x 1, x,, x co ua media xҧ y desviació típica s, llamaremos Valores Tipificados de la variable a z 1 = x 1 xҧ s, z = x xҧ Se suele deomiar Z a la variable Tipificada. s, z = x xҧ s
Medidas Comparació Medidas de comparació Ejemplo: U alumo que se preseta al exame de Matemáticas I y al de Matemáticas II. La ota que saca e el primero es u 7 y e el segudo u 5,5. No es sigificativo comparar directamete estas otas si o se tiee e cueta las otas de los demás alumos e cada exame. Sabemos que e el exame de Matemáticas I la ota media es de 5 y la desviació típica es,5, mietras que e el exame de Matemáticas II la ota media es de 4,5 y la desviació típica es 0,5. Matemáticas I Matemáticas II Media exame 5 4,5 Desv. tip. exame,5 0,5 Nota alumo 7 5,5 7 5 Notas tipificadas,5 = 0,8 5,5 4,5 = 0,5
Medidas Comparació Trasformació lieal de los datos Además de la Tipificació se puede hacer otro tipo de trasformacioes e los datos de ua variable estadística. Ua Trasformació Lieal de los datos x 1, x,, x es aplicar ua homotecia de razó a y ua traslació de b uidades, es decir aplicar la ecuació y = ax + b co lo que se obtiee los datos y i = ax i + b, co i = 1,, Se puede comprobar que തy = ax ҧ + b s y = a s x