Temas 4, 5 y 6: Parámetros o Medidas Estadísticas. Complementos. José Antonio Mayor Gallego. Departamento de Estadística e Investigación Operativa

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Temas 4, 5 y 6: Parámetros o Medidas Estadísticas. Complementos. José Antonio Mayor Gallego. Departamento de Estadística e Investigación Operativa"

Transcripción

1 Temas 4, 5 y 6: Parámetros o Medidas Estadísticas. Complementos José Antonio Mayor Gallego Departamento de Estadística e Investigación Operativa Universidad de Sevilla. Facultad de Matemáticas José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 1/113

2 Contenidos 1 TEMA 4. Parámetros centrales o de tendencia central. Media aritmética Media geométrica Mediana Los cuartiles Los percentiles La moda 2 TEMA 5. Parámetros de dispersión Varianza y desviación típica Coeficiente de variación de Pearson El recorrido intercuartílico Coeficiente x 3 TEMA 6. Medidas de forma. Otras medidas Medidas o parámetros de forma Coeficiente de asimetría de Pearson Coeficiente de asimetría de Fisher Coeficiente de curtosis o aplastamiento Medidas de concentración. Curva de Lorenz. Índice de Gini 4 Complementos: Detección de valores singulares. Diagramas de caja Introducción Detección de valores singulares Diagrama de caja o Box-Plot José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 2/113

3 Parámetros o Medidas Estadísticas Las medidas estadísticas o parámetros estadísticos como ciertos valores representativos de una masa de datos, en el sentido de condensar en ellos la información contenida en dichos datos, en relación a sus valores más característicos o a la forma en la que se reparten. Estas medidas estadísticas nos darán información sobre la situación, dispersión y otros patrones de comportamiento de los datos, de manera que sea posible captar rápidamente la estructura de los mismos y también la comparación entre distintos conjuntos de datos. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 3/113

4 Clases de parámetros estadísticos a) Parámetros centrales o de tendencia central. Están destinados a definir valores centrales o característicos de la serie de datos. Por ejemplo, la serie de datos ordenada, 1, 3, 3, 3, 4, 5, 5, 5, 7 se reparte alrededor del valor central 4. b) Parámetros de dispersión. Sirven para caracterizar la forma en que se reparten los datos, unos con respecto a los otros, o todos con respecto a un valor central. Por ejemplo, dadas las dos series siguientes, 6, 6, 7, 7, 8, 9, 9, 10, 10 1, 2, 4, 6, 8, 10, 12, 14, 15 Ambas se reparten en torno al valor central 8, sin embargo la primera está menos dispersa alrededor de dicho valor que la segunda. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 4/113

5 Clases de parámetros estadísticos a) Parámetros centrales o de tendencia central. Están destinados a definir valores centrales o característicos de la serie de datos. Por ejemplo, la serie de datos ordenada, 1, 3, 3, 3, 4, 5, 5, 5, 7 se reparte alrededor del valor central 4. b) Parámetros de dispersión. Sirven para caracterizar la forma en que se reparten los datos, unos con respecto a los otros, o todos con respecto a un valor central. Por ejemplo, dadas las dos series siguientes, 6, 6, 7, 7, 8, 9, 9, 10, 10 1, 2, 4, 6, 8, 10, 12, 14, 15 Ambas se reparten en torno al valor central 8, sin embargo la primera está menos dispersa alrededor de dicho valor que la segunda. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 4/113

6 Clases de parámetros estadísticos c) Parámetros de forma. Recogen la existencia de ciertos patrones de tipo geométrico en la distribución de frecuencias, como son el grado de simetría o el mayor o menor aplanamiento. d) Otros parámetros. Parámetros de diversidad y concentración. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 5/113

7 Clases de parámetros estadísticos c) Parámetros de forma. Recogen la existencia de ciertos patrones de tipo geométrico en la distribución de frecuencias, como son el grado de simetría o el mayor o menor aplanamiento. d) Otros parámetros. Parámetros de diversidad y concentración. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 5/113

8 Terminología empleada Distribución Tipo I. Los datos brutos X 1, X 2,, X n José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 6/113

9 Terminología empleada Distribución Tipo II. Pocas modalidades. Sin intervalos. x i n i f i N i F i José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 7/113

10 Terminología empleada Distribución Tipo III. Datos agrupados en intervalos. (e i 1, e i ] x i n i N i f i F i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 8/113

11 Media aritmética. Parámetro muy popular. Se define como la suma de todas las observaciones dividida por el número total de las mismas. Simbólicamente, si tenemos n observaciones, X 1, X 2,..., X n se suele denotar la media aritmética como X y se define como, X = 1 n n i=1 X i Por ejemplo, los datos 1, 2, 4, 5, 7, 8, 9, 10, 11, 13, tienen como media aritmética, X = = = 7 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 9/113

12 1 La media aritmética sólo es aplicable a valores numéricos. 2 Es un parámetro único. Un conjunto de datos numéricos sólo tiene una media aritmética. 3 La media aritmética generalmente no es un valor observado. Por ejemplo, = La media aritmética no depende del orden en el que estén los datos José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 10/113

13 Sensibilidad de la media aritmética La media aritmética es un parámetro sensible a la presencia de valores muy separados de la masa principal de datos. Por ejemplo, la serie de valores, 1, 1, 2, 2, 2, 4, 4, 4, 70 posee un valor fuertemente diferente del resto, el 70. La media aritmética calculada con los 8 primeros valores es 2 5, lo que constituye un valor central razonable. Por el contrario, si se considera también el último valor, la media aritmética resulta ser 10, que es un valor muy poco significativo. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 11/113

14 Propiedades de linealidad ax = ax, siendo a un número real cualquiera. Por ejemplo, la media de 1, 2 y 3 es 2, y la media de 3, 6 y 9 es 3 2 = 6. X + Y = X + Y. Por ejemplo, la media de 1, 2 y 3 es 2, y la media de 3, 4 y 5 es 4. Entonces la media de 1+3, 2+4 y 3+5 es 2+4=6. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 12/113

15 Propiedades de linealidad ax = ax, siendo a un número real cualquiera. Por ejemplo, la media de 1, 2 y 3 es 2, y la media de 3, 6 y 9 es 3 2 = 6. X + Y = X + Y. Por ejemplo, la media de 1, 2 y 3 es 2, y la media de 3, 4 y 5 es 4. Entonces la media de 1+3, 2+4 y 3+5 es 2+4=6. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 12/113

16 Media aritmética. Distribución Tipo I. X = 1 n n i=1 Media aritmética de hijos. 150 familias. X = ( ) = Media aritmética de puntuaciones. 175 alumnos. X i X = ( ) = 75 5 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 13/113

17 Media aritmética. Distribución Tipo II. X = 1 n x i son las modalidades Hijos de 150 familias k n i x i i=1 X = 1 ( ) = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 14/113

18 Media aritmética. Distribución Tipo III. x i son las marcas de clase X = 1 n Puntuaciones de 175 estudiantes Observación k n i x i i=1 X = 1 ( ) = 75 6 Este valor no es exactamente la media aritmética de los datos originales o brutos pues la agrupación en intervalo, como sabemos, produce pérdida de información, sin embargo es un valor bastante aproximado. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 15/113

19 Media geométrica. Dados los n valores, X 1, X 2,...,X n, de una variable X, que supondremos que sólo asume valores mayores que cero, su media geométrica es la raíz n-ésima del producto de dichos valores. Ejemplo, dados los valores 3, 6, 11, su media geométrica es, X G = = = Y la media geométrica de 1 y 9 es, X G = = 3 Las fórmulas para distribuciones Tipo I, Tipo II y Tipo III, son, X G = n n X i = k n i=1 NOTA: Se verifica X G X, es decir, la media geométrica es siempre menor o igual que la media artimética. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 16/113 i=1 x n i i

20 Media geométrica. Aplicación económica Pequeña clase de Economía Si un artículo sube de precio de un año a otro, por ejemplo pasa de costar 100 euros a 120, llamamos índice de subida al número que multiplicado por 100 nos da 120. En este caso, dicho índice sería 1 2 ya que, = 120 NÓTESE que la subida ha sido del 20 %. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 17/113

21 Media geométrica. Aplicación económica Supongamos que un producto tiene un valor inicial de 10 euros, y durante tres años consecutivos sube de precio según los índices 1 05, 1 03 y 1 06 respectivamente. Queremos calcular el índice medio de incremento anual. El que el primer año el índice sea 1 05 quiere decir que al final del año, el precio pasa de 10 a = 10 5 euros, es decir, sube medio euro. El segundo año el precio pasa a ser = Finalmente, al cabo del tercer año, el precio será Precio final = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 18/113

22 Media geométrica. Aplicación económica Ahora queremos calcular un índice anual medio que aplicado dé lugar a la subida anterior. Vamos a llamarle I a ese índice que buscamos. El precio al final sería, Precio final = 10 I I I = 10 I 3 Y como el precio final es el mismo, tendremos, 10 I 3 = o sea, y por consiguiente, I 3 = I = es decir, la media geométrica de los tres índices. El cálculo de esta cantidad se deja al alumno como pequeño ejercicio. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 19/113

23 Mediana Si tenemos una distribución de Tipo I con n observaciones numéricas, X 1, X 2,..., X n la mediana es, básicamente, en la serie de valores ordenados de menor a mayor, el valor central, el que está en el medio. Cuando n es impar, hay siempre un valor central, y no hay problema. Pero si n es par hay dos valores centrales Qué hacer en tal caso? José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 20/113

24 Mediana. Regla práctica para distribuciones Tipo I. 1 En primer lugar se ordenan los valores de menor a mayor. 2 A continuación se aplica la siguiente regla, si n es impar. La mediana es el valor central de las observaciones ordenadas. si n es par. La mediana es la suma de los dos valores centrales, dividida por 2. Para representar la mediana usaremos la notación Me. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 21/113

25 Mediana Ejemplo Dados los siete datos 7, 3, 1, 9, 17, 15, 8, primero se ordenan, 1, 3, 7, 8, 9, 15, 17 y por consiguiente tienen como mediana el valor Me = 8. Y los seis datos, 15, 7, 3, 1, 9, 8, primero se ordenan, 1, 3, 7, 8, 9, 15 por lo que tienen como mediana el valor Me = (7 + 8)/2 = 7 5. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 22/113

26 Mediana. Distribuciones Tipo II. Ejemplo. Hijos de 150 familias. x i n i N i Dividiendo el número total de observaciones por 2, obtenemos 150/2 = 75, y entonces, en la tabla, buscamos la primera observación cuya frecuencia acumulada supere dicho valor. En este caso, dicha observación es 2, que es la mediana. Es decir, Me = 2. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 23/113

27 Mediana. Distribuciones Tipo II. Caso especial. En algunos casos puede ocurrir que una frecuencia acumulada coincida exactamente con el número de observaciones dividido por dos. Por ejemplo, en la siguiente tabla, x i n i N i la mitad del número de observaciones es 88/2 = 44 que coincide con la frecuencia acumulada de la modalidad x 3 = 4. Para hallar la mediana en esta situación, se tomará dicho valor y el siguiente y se calculará la media aritmética de los dos valores. La mediana será pues Me = (4 + 7)/2 = 5 5. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 24/113

28 Mediana. Distribuciones Tipo III. Ejemplo. Puntuaciones de 175 alumnos. (e i 1, e i ] x i n i N i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] Se buscará el primer intervalo cuya frecuencia acumulada supere la mitad de las observaciones, es decir, 175/2 = En este caso, dicho intervalo es (73 5, 82 5]. Este intervalo se denomina intervalo mediano y su marca de clase, 78. Entonces José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 25/113

29 Mediana. Distribuciones Tipo III. Fórmula de cálculo La mediana se calcula empleando la fórmula siguiente, Me = e i 1 + n/2 N i 1 n i a i e i 1 es el extremo inferior del intervalo mediano. a i es la amplitud del intervalo mediano, o sea, a i = e i e i 1. N i 1 es la frecuencia acumulada del intervalo anterior o previo al mediano. n i es el número de observaciones en el intervalo mediano. En nuestro caso, tendremos, Me = / = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 26/113

30 Mediana IMPORTANTE: Robustez de la mediana Observemos que la mediana es el valor que divide una serie de observaciones ordenadas, en dos partes iguales. Por depender de los valores a través de su orden, la mediana es poco sensible a la existencia de valores muy separados de la masa principal de datos, por ellos, si nuestros datos contienen valores de este tipo, será preferible usar la mediana en vez de la media aritmética como parámetro central. Por ejemplo, dada la serie de valores 1, 1, 2, 2, 2, 4, 4, 4, 70, ya considerada cuando se estudió la media aritmética, la mediana es 2 y este valor es más indicativo que la media aritmética, 10, pues al contrario que esta, no se ve influenciado por el valor 70. En este sentido, se dice que la mediana es un parámetro resistente o robusto, y que la media aritmética no lo es. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 27/113

31 Cuartiles Observación Estos parámetros son parientes cercanos de la mediana, y realmente no todos son parámetros de tendencia central. No obstante los explicamos aquí debido a su estrecha relación con la mediana. Los cuartiles dividen la serie de datos en cuartos Ya hemos visto que la mediana, en la serie ordenada de datos, divide la masa de datos en dos partes iguales, es decir, deja a derecha e izquierda el 50 % de los mismos. Podemos considerar también valores que dividen el conjunto de los datos en cuatro partes iguales, es decir, dejan a su izquierda el 25 %, el 50 % y el 75 % de las observaciones. Dichos valores se denominan cuartiles y se denotan como Q 1, Q 2 y Q 3, respectivamente. Es claro que Q 2 = Me por definición. Veamos cómo se calcula Q 1. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 28/113

32 Cuartiles Observación Estos parámetros son parientes cercanos de la mediana, y realmente no todos son parámetros de tendencia central. No obstante los explicamos aquí debido a su estrecha relación con la mediana. Los cuartiles dividen la serie de datos en cuartos Ya hemos visto que la mediana, en la serie ordenada de datos, divide la masa de datos en dos partes iguales, es decir, deja a derecha e izquierda el 50 % de los mismos. Podemos considerar también valores que dividen el conjunto de los datos en cuatro partes iguales, es decir, dejan a su izquierda el 25 %, el 50 % y el 75 % de las observaciones. Dichos valores se denominan cuartiles y se denotan como Q 1, Q 2 y Q 3, respectivamente. Es claro que Q 2 = Me por definición. Veamos cómo se calcula Q 1. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 28/113

33 Cuartiles. Distribución Tipo I. Cálculo de Q 1 Si tenemos una distribución de Tipo I con n observaciones numéricas, X 1, X 2,..., X n, para hallar el primer cuartil, se ordenan los valores de menor a mayor y a continuación se busca en dicha serie ordenada el primer valor cuyo número de orden supere n/4 Así, los siete datos 7, 3, 1, 9, 17, 15, 8, primero se ordenan, 1, 3, 7, 8, 9, 15, 17 y al ser n/4 = 7/4 = 1 75, Q 1 será la observación que en la serie ordenada ocupa el lugar 2, es decir, Q 1 = 3. Cálculo de Q 3 Para hallar Q 3, el procedimiento es análogo pero considerando 3n/4 en vez de n/4. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 29/113

34 Cuartiles. Distribución Tipo I. Cálculo de Q 1 Si tenemos una distribución de Tipo I con n observaciones numéricas, X 1, X 2,..., X n, para hallar el primer cuartil, se ordenan los valores de menor a mayor y a continuación se busca en dicha serie ordenada el primer valor cuyo número de orden supere n/4 Así, los siete datos 7, 3, 1, 9, 17, 15, 8, primero se ordenan, 1, 3, 7, 8, 9, 15, 17 y al ser n/4 = 7/4 = 1 75, Q 1 será la observación que en la serie ordenada ocupa el lugar 2, es decir, Q 1 = 3. Cálculo de Q 3 Para hallar Q 3, el procedimiento es análogo pero considerando 3n/4 en vez de n/4. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 29/113

35 Cuartiles. Distribución Tipo I. Cálculo de Q 1. Caso especial. Puede ocurrir que el orden de la observación coincida exactamente con n/4 (sucede cuando n es múltiplo de 4), en tal caso, el primer cuartil se obtiene tomando dicha observación y la siguiente, y calculando su media aritmética. Por ejemplo si tenemos los doce datos, 1, 3, 7, 8, 9, 9, 10, 12, 13, 13, 14, 15 n/4 = 3, luego el primer cuartil es la media aritmética entre el tercer y cuarto valor de la serie de observaciones, Q 1 = (7 + 8)/2 = 7 5 IMPORTANTE: La misma consideración se hace para el cálculo del tercer cuartil, Q 3. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 30/113

36 Cuartiles. Distribuciones Tipo II. Ejemplo. Hijos de 150 familias. x i n i N i Se divide el número de observaciones, n, por 4, n/4 = 150/4 = 37 5, y en la tabla, se busca la primera modalidad cuya frecuencia acumulada supere dicho valor. En este caso es 1, que es el primer cuartil Q 1. Para calcular el tercer cuartil, Q 3, buscaremos la primera modalidad cuya frecuencia acumulada supere 3n/4 = 450/4 = 112 5, dicha modalidad es Q 3 = 2. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 31/113

37 Cuartiles. Distribuciones Tipo II. Caso especial. En algunos casos puede ocurrir que una frecuencia acumulada coincida exactamente con el número de observaciones dividido por cuatro. Por ejemplo, x i n i N i Ahora la cuarta parte del número de observaciones es 22 que coincide con la frecuencia acumulada de 3. Para hallar Q 1 se tomará dicho valor y el siguiente y se calculará la media aritmética de ambos. En este casó será Q 1 = (3 + 4)/2 = 3 5. Una situación similar se puede presentar en el cálculo de Q 3 siendo análogo el procedimiento a seguir. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 32/113

38 Cuartiles. Distribuciones Tipo III. Ejemplo. Puntuaciones de 175 alumnos. (e i 1, e i ] x i n i N i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] Para hallar Q 1 se buscará el primer intervalo cuya frecuencia acumulada supere la cuarta parte de las observaciones, es decir, 175/4 = En este caso, dicho intervalo es (64 5, 73 5]. Entonces José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 33/113

39 Cuartiles. Distribuciones Tipo III. Q 1. Fórmula de cálculo El primer cuartil se calcula empleando la fórmula siguiente, Q 1 = e i 1 + n/4 N i 1 n i a i e i 1 es el extremo inferior del intervalo hallado. a i es la amplitud de dicho intervalo, es decir, a i = e i e i 1 N i 1 es la frecuencia acumulada del intervalo previo o precedente al considerado. n i es el número de observaciones en el intervalo considerado. En nuestro caso, tendremos, Q 1 = / = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 34/113

40 Cuartiles. Distribuciones Tipo III. Q 3. Fórmula de cálculo Para hallar Q 3, se buscará el primer intervalo cuya frecuencia acumulada supere las tres cuartas partes de las observaciones, esto es, (3 175)/4 = En este caso, dicho intervalo es (82 5, 91 5]. Q 3 se calculará aplicando la siguiente fórmula, Q 3 = e i 1 + 3n/4 N i 1 n i a i e i 1 es el extremo inferior del intervalo hallado. a i es la amplitud de dicho intervalo, es decir, a i = e i e i 1 N i 1 es la frecuencia acumulada del intervalo previo o precedente al considerado. n i es el número de observaciones en el intervalo considerado. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 35/113

41 Cuartiles. Distribuciones Tipo III. Q 3. Fórmula de cálculo En nuestro caso, aplicanfo la fórmula anterior ontendremos, Q 3 = / = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 36/113

42 Cuartiles. Observaciones IMPORTANTE: Robustez de los cuartiles Al igual que la mediana, los cuartiles tienen la propiedad de ser resistentes o robustos frente a la existencia de observaciones muy separadas de la masa principal de datos. IMPORTANTE: Parámetros de posición Es necesario notar, como hicimos al principio de este apartado, que los cuartiles, salvo Q 2 que coincide con la mediana, no son realmente parámetros de tendencia central. Los denominaremos parámetros de posición ya que determinan la posición o punto que separa determinados porcentajes del total de las observaciones. No obstante, por su similitud con la mediana los hemos explicado aquí. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 37/113

43 Cuartiles. Observaciones IMPORTANTE: Robustez de los cuartiles Al igual que la mediana, los cuartiles tienen la propiedad de ser resistentes o robustos frente a la existencia de observaciones muy separadas de la masa principal de datos. IMPORTANTE: Parámetros de posición Es necesario notar, como hicimos al principio de este apartado, que los cuartiles, salvo Q 2 que coincide con la mediana, no son realmente parámetros de tendencia central. Los denominaremos parámetros de posición ya que determinan la posición o punto que separa determinados porcentajes del total de las observaciones. No obstante, por su similitud con la mediana los hemos explicado aquí. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 37/113

44 Percentiles Delimitan por su izquierda el 1 %, el 2 %, el 3 %, etc, y así hasta el 100 % de las observaciones. Hay pues 100 percentiles que denotamos como Pc 1, Pc 2, Pc 3,..., Pc 100. Realmente ya conocemos algunos percentiles, por ejemplo, Pc 25 = Q 1, Pc 50 = Me = Q 2 y Pc 75 = Q 3. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 38/113

45 Percentiles. Distribución de Tipo I. Dadas n observaciones numéricas, X 1, X 2,..., X n para hallar el percentil k-ésimo, es decir, Pc k, se ordenan los valores de menor a mayor y a continuación se busca en dicha serie ordenada el primer valor cuyo número de orden supere k n/100. Calculemos por ejemplo Pc 40 para los siete datos 7, 3, 1, 9, 17, 15, 8. Primeramente se ordenan, 1, 3, 7, 8, 9, 15, 17 y al ser 40 7/100 = 2 8, Pc 40 será la observación que en la serie ordenada ocupa el lugar 3, o sea, la tercera observación, es decir, Pc 40 = 7. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 39/113

46 Percentiles. Distribuciones de Tipo II. x i n i N i Hallemos por ejemplo el percentil 60. Primero calculamos k n/100 = /100 = 90. Y ahora buscamos la modalidad cuya frecuencia acumulada supere esta cantidad. La frecuencia acumulada correspondiente es 117, y por consiguiente el percentil buscado es Pc 60 = 2. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 40/113

47 Percentiles. Distribuciones de Tipo III. (e i 1, e i ] x i n i N i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] Hallemos por ejemplo el percentil Pc 70. Primeramente se buscará el primer intervalo cuya frecuencia acumulada supere k n/100 = /100 = En este caso, dicho intervalo es (73 5, 82 5] pues su frecuencia acumulada es 129 que es la primera de la lista que supera José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 41/113

48 Percentiles. Distribuciones de Tipo III. (e i 1, e i ] x i n i N i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] Hallemos por ejemplo el percentil Pc 70. Primeramente se buscará el primer intervalo cuya frecuencia acumulada supere k n/100 = /100 = En este caso, dicho intervalo es (73 5, 82 5] pues su frecuencia acumulada es 129 que es la primera de la lista que supera José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 41/113

49 Percentiles. Distribuciones de Tipo III. Seguidamente Pc 70 se calculará aplicando la siguiente fórmula, Pc k = e i 1 + k n/100 N i 1 n i donde k es el número del percentil, en este caso 70, y, e i 1 es el extremo inferior del intervalo hallado. a i es la amplitud de dicho intervalo, es decir, a i = e i e i 1 N i 1 es la frecuencia acumulada del intervalo previo o precedente al considerado. n i es el número de observaciones en el intervalo considerado. En nuestro caso, tendremos, Pc 70 = / a i 9 = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 42/113

50 Percentiles OBSERVACIÓN Al igual que la mediana y los cuartiles, los percentiles también tienen la propiedad de ser resistentes o robustos frente a la existencia de observaciones muy separadas de la masa principal de datos. OBSERVACIÓN Como en el apartado anterior, es necesario notar que los percentiles no son en general parámetros de tendencia central. Como antes, podrían denominarse parámetros de posición ya que determinan la posición o punto que separa determinados porcentajes del total de las observaciones. No obstante, por su similitud, se explican en esta sección. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 43/113

51 Percentiles OBSERVACIÓN Al igual que la mediana y los cuartiles, los percentiles también tienen la propiedad de ser resistentes o robustos frente a la existencia de observaciones muy separadas de la masa principal de datos. OBSERVACIÓN Como en el apartado anterior, es necesario notar que los percentiles no son en general parámetros de tendencia central. Como antes, podrían denominarse parámetros de posición ya que determinan la posición o punto que separa determinados porcentajes del total de las observaciones. No obstante, por su similitud, se explican en esta sección. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 43/113

52 Percentiles OBSERVACIÓN: Los percentiles informan sobre la posición Los percentiles son cantidades que proporcionan información relevante sobre la situación de una unidad estadística en relación al conjunto de todas. Por ejemplo, si en un estudio de las estaturas de un conjunto de personas se verifica que Pc 95 = 176 cm., esto significa que una persona de 176 cm. o más pertenece al 5 % de individuos más altos. Y si en un estudio de los salarios de los trabajadores de una gran empresa, fuera Pc 10 = 1200 EUROS, un trabajador que gane 970 EUROS pertenece al grupo formado por el 10 % que menos gana. Y si al corregir las notas de un examen un profesor observa que un alumno tiene una calificación superior al percentil 98, ello no significa que el alumno haya obtenido una gran calificación. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 44/113

53 Percentiles OBSERVACIÓN: Los percentiles informan sobre la posición Los percentiles son cantidades que proporcionan información relevante sobre la situación de una unidad estadística en relación al conjunto de todas. Por ejemplo, si en un estudio de las estaturas de un conjunto de personas se verifica que Pc 95 = 176 cm., esto significa que una persona de 176 cm. o más pertenece al 5 % de individuos más altos. Y si en un estudio de los salarios de los trabajadores de una gran empresa, fuera Pc 10 = 1200 EUROS, un trabajador que gane 970 EUROS pertenece al grupo formado por el 10 % que menos gana. Y si al corregir las notas de un examen un profesor observa que un alumno tiene una calificación superior al percentil 98, ello no significa que el alumno haya obtenido una gran calificación. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 44/113

54 Percentiles OBSERVACIÓN: Los percentiles informan sobre la posición Los percentiles son cantidades que proporcionan información relevante sobre la situación de una unidad estadística en relación al conjunto de todas. Por ejemplo, si en un estudio de las estaturas de un conjunto de personas se verifica que Pc 95 = 176 cm., esto significa que una persona de 176 cm. o más pertenece al 5 % de individuos más altos. Y si en un estudio de los salarios de los trabajadores de una gran empresa, fuera Pc 10 = 1200 EUROS, un trabajador que gane 970 EUROS pertenece al grupo formado por el 10 % que menos gana. Y si al corregir las notas de un examen un profesor observa que un alumno tiene una calificación superior al percentil 98, ello no significa que el alumno haya obtenido una gran calificación. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 44/113

55 Moda La moda es la observación más frecuente, esto es, la más observada. Al contrario de las medidas estudiadas hasta ahora, puede ser hallada tanto para datos cualitativos como cuantitativos. Se denota por Mo. Por ejemplo, consideremos las observaciones cuantitativas, 3, 4, 3, 5, 6, 7, 6, 5, 4, 3, 4, 5, 6, 2, 6, 7, 8, 4, 5, 4, 6, 4, 7 la moda será Mo = 4 por ser el valor más observado. Puede ocurrir que halla dos valores que sean los más observados, en tal caso ambos son moda, es decir, hay dos modas. Por ejemplo, 1, 2, 3, 4, 3, 4, 3, 4, 3, 4, 5, 6, 7, 3, 4, 10 tiene dos modas, Mo 1 = 3 y Mo 2 = 4. En este caso se dice que la serie de observaciones es bimodal. Análogamente puede haber tres modas, cuatro, etc. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 45/113

56 Moda Si las observaciones son cualitativas, el cálculo de la moda se hace igualmente hallando la que más se repite. Por ejemplo, si observamos el estado civil de 15 personas y obtenemos los valores, C, S, C, C, C, D, C, S, C, C, C, C, D, S, S siendo S :sin pareja, C :casado o con pareja, D :divorciado. La moda será Mo = C, que es el valor más frecuente. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 46/113

57 Moda. Distribución Tipo II. x i n i N i En este caso, la moda será Mo = 2 pues es la modalidad que presenta mayor frecuencia absoluta. Recuérdese que podría darse el caso de que hubiera más de una moda. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 47/113

58 Moda. Distribución Tipo III. (e i 1, e i ] x i n i N i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] Buscaremos el intervalo que tenga asociado el rectángulo de mayor altura en el histograma. Recordemos [véase Tema 3.] que las alturas se calculan mediante la fórmula h i = n i /a i. Este intervalo se denomina intervalo modal Notemos que si todos los intervalos tienen la misma amplitud o anchura, dicho intervalo de mayor altura asociada será también el de mayor frecuencia, siendo esta situación la de nuestro ejemplo. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 48/113

59 Moda. Distribución Tipo III. En nuestro ejemplo, el intervalo modal será (73 5, 82 5]. Para calcular entonces la moda emplearemos la siguiente fórmula, Mo = e i 1 + δ 1 δ 1 + δ 2 a i siendo, e i 1 es el extremo inferior de la clase o intervalo modal. δ 1 = h i h i 1 δ 2 = h i h i+1 h i es la altura del intervalo modal, h i 1 la altura del intervalo previo y h i+1 la altura del intervalo posterior. a i es la amplitud o anchura del intervalo modal. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 49/113

60 Moda. Distribución Tipo III. Para nuestros datos, los cálculos son, e i 1 = 73 5 δ 1 = 63/9 39/9 = 24/9 δ 2 = 63/9 35/9 = 28/9 a i = 9 Y por consiguiente, Mo = e i 1 + δ 1 a i = 73 24/9 5 + δ 1 + δ 2 24/9 + 28/9 9 = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 50/113

61 PARÁMETROS DE DISPERSIÓN José A. Mayor. Universidad de Sevilla. Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 51/113

62 Varianza La varianza es una medida de dispersión que se basa en la desviación de las observaciones con respecto a su media aritmética, y se denota por σ 2 x (a veces se emplea la notación más simple σ 2 por sobreentenderse que hace mención a la variable X). S Veamos la fórmula. Si tenemos las observaciones numéricas, la varianza vendrá dada por, X 1, X 2,..., X n σ 2 x = 1 n n (X i X) 2 i=1 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 52/113

63 Varianza Ejemplo Consideremos las dos series de observaciones 6, 6, 7, 7, 8, 9, 9, 10, 10 ý 1, 2, 4, 6, 8, 10, 12, 14, 15, que provienen de observar una misma variable sobre dos poblaciones. Ambas tienen como media aritmética el valor 8. Sus varianzas son, para la primera serie, σ 2 x = 1 9 ((6 8)2 + (6 8) 2 + (7 8) 2 + (7 8) 2 + (8 8) 2 + +(9 8) 2 + (9 8) 2 + (10 8) 2 + (10 8) 2 ) = y para la segunda, σ 2 x = 1 9 ((1 8)2 + (2 8) 2 + (4 8) 2 + (6 8) 2 + (8 8) 2 + +(10 8) 2 + (12 8) 2 + (14 8) 2 + (15 8) 2 ) = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 53/113

64 Varianza Es obvio que la segunda serie tiene una varianza muy superior a la primera. Observemos que para la primera serie, a pesar de que la media es la misma, es decir, 8, las cantidades están más cercanas entre si. En este caso, como las series tienen similar media y provienen de la misma variable, podemos pues decir que la segunda serie está más dispersa que la primera. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 54/113

65 Desviación típica Desviación típica Es la raíz cuadrada de la varianza. Se denota por σ x. Es decir, σ x = + σx 2 = + 1 n (X i X) n 2 i=1 Así, para las anteriores series de observaciones, 6, 6, 7, 7, 8, 9, 9, 10, 10 ý 1, 2, 4, 6, 8, 10, 12, 14, 15 las desviaciones típicas son, respectivamente, = y = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 55/113

66 Fórmula práctica para la varianza Fórmula práctica σ 2 x = 1 n n i=1 X 2 i X 2 que simbólicamente se puede expresar como X 2 X 2. Regla nemotécnica σ 2 x = X 2 X 2 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 56/113

67 Fórmula práctica para la varianza Ejemplo Para los datos 1, 2, 4, 6, 8, 10, 12, 14, 15, la media aritmética es X = 1 ( ) = 8 9 y la media de los cuadrados, X 2 = 1 n n i=1 X 2 i = 1 9 ( ) = = siendo pues la varianza, σ 2 x = X 2 X 2 = = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 57/113

68 Fórmula práctica de la varianza OBSERVACIÓN Con la fórmula práctica, el cálculo de la varianza se reduce básicamente al cálculo de dos medias aritméticas, la de las observaciones, y la de los cuadrados de las observaciones. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 58/113

69 Varianza. Distribución Tipo II. σ 2 x = 1 n k i=1 siendo x i las distintas modalidades. Varianza de hijos de 150 familias x i n i xi n i x 2 i X 2 NOTA: Se crea una columna con las modalidades al cuadrado. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 59/113

70 Varianza. Distribución Tipo II. Varianza de hijos de 150 familias. Continuación. X = ) 150 = n k i=1 n i x 2 i = ( ) = 4 6 σ 2 x = 4 6 (1 813) 2 = hijos 2 ý σ x = = hijos José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 60/113

71 Varianza. Distribución Tipo III Se aplica la misma fórmula que para distribuciones de Tipo II, es decir, σx 2 = 1 k n i xi 2 X 2 n siendo ahora x i las marcas de clase de los intervalos. i=1 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 61/113

72 Varianza. Distribución Tipo III. Varianza de las puntuaciones de 175 estudiantes (e i 1, e i ] x i n i xi 2 (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] X = ( ) = k n i xi 2 = 1 n 175 ( ) i=1 = σ 2 x = (75 6..) 2 = puntos 2 σ x = = puntos José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 62/113

73 Observaciones finales sobre la varianza OBSERVACIÓN Resaltemos que, al igual que ocurría con la media aritmética, cuando los datos se agrupan en intervalos, no vamos a obtener exactamente el mismo valor que si aplicáramos la fórmula directamente a los datos iniciales aunque sí un valor aproximado. OBSERVACIÓN Es importante observar que, en forma análoga a como ocurre con la media aritmética, la varianza tiene el inconveniente de ser sensible a la presencia de valores marcadamente separados de la masa principal de los datos, por ello sería conveniente disponer de una medida de dispersión que no se viera muy afectada por tales valores. En un apartado siguiente veremos una con dicha propiedad. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 63/113

74 Observaciones finales sobre la varianza OBSERVACIÓN Resaltemos que, al igual que ocurría con la media aritmética, cuando los datos se agrupan en intervalos, no vamos a obtener exactamente el mismo valor que si aplicáramos la fórmula directamente a los datos iniciales aunque sí un valor aproximado. OBSERVACIÓN Es importante observar que, en forma análoga a como ocurre con la media aritmética, la varianza tiene el inconveniente de ser sensible a la presencia de valores marcadamente separados de la masa principal de los datos, por ello sería conveniente disponer de una medida de dispersión que no se viera muy afectada por tales valores. En un apartado siguiente veremos una con dicha propiedad. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 63/113

75 Coeficiente de variación Limitaciones de la varianza La varianza está afectada por la magnitud media de las cantidades así como por las unidades en las que estén medidas. Ejemplo Las estaturas, en centímetros, de cinco alumnos de Primero de Enseñanza Secundaria Obligatoria son 145, 139, 135, 143 ý 135. Y las de seis alumnos de Cuarto de Enseñanza Secundaria Obligatoria son 163, 174, 175, 169, 171 ý 178. La varianza de las estaturas de los alumnos de Primero es σ 2 x = Y la de los de Cuarto σ 2 x = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 64/113

76 Coeficiente de variación Ejemplo La varianza de las estaturas de los alumnos de Primero es σ 2 x = Y la de los de Cuarto σ 2 x = Aparentemente los de cuarto presentan más dispersión, no obstante podemos plantearnos que el hecho de que los de Cuarto sean globalmente más altos hace que los valores numéricos se separen más entre sí a pesar de que, intrínsecamente las estaturas de los de Cuarto estén menos dispersas que las de los de Primero. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 65/113

77 Coeficiente de variación Coeficiente de variación de Pearson Para dilucidar esta cuestión los estadísticos han ideado el siguiente coeficiente denominado coeficiente de variación de Pearson, Cv x = σ x X Al dividir la desviación típica por la media aritmética compensamos el efecto o influencia de la magnitud global o media. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 66/113

78 Coeficiente de variación Si en el ejemplo anterior calculamos este coeficiente en cada grupo, Alumnos de Primero de E.S.O. X = 1 5 ( ) = σ x = = Cv x = σ x X = = Alumnos de Cuarto de E.S.O. X = 1 6 ( ) = σ x = = Cv x = σ x X = = Por lo que las estaturas de los alumnos de Cuartos están menos dispersas, en relación a su magnitud media, que las de los de Primero, a pesar de que estás últimas presenten menos varianza. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 67/113

79 Coeficiente de variación Otro problema que se presenta a veces es la influencia de las unidades. Ejemplo Un ingeniero mide las longitudes de tres piezas en centímetros, obteniendo 1, 1 5 ý 1 2. Otro ingeniero emplea milímetros, siendo pues las longitudes 10, 15 ý 12. La varianza de 1, 1 5 ý 1 2 es σ 2 x = , mientras que la varianza de 10, 15 ý 12 es σ 2 x = Resulta obvio que comparar las dispersiones simplemente por medio de las varianzas parece un poco ilógico pues las medidas son las mismas y lo que ha cambiado es la unidad de medición. En esta situación no podemos pues emplear la varianza para comparar la dispersión real. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 68/113

80 Coeficiente de variación Solución: emplear el coeficiente de variación Datos en centímetros. 1, 1 2 ý 1 5. X = 1 3 ( ) = σ x = = Cv x = σ x X = = Datos en milímetros. 10, 12 ý 15. X = 1 3 ( ) = σ x = = Cv x = σ x X = = Los coeficientes de variación son iguales por lo que la dispersión real es la misma. Es decir, el coeficiente de variación no está influenciado por la unidad de medida empleada. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 69/113

81 Coeficiente de variación Conclusiones El coeficiente de variación es una medida de dispersión adimensional y además compensada del efecto que produce la mayor o menor magnitud global de las cantidades. Se ha de emplear cuando se quiere comparar la dispersión de dos o mas conjuntos de observaciones medidas en unidades distintas y/o con valores promedio distintos. El coeficiente de variación no es un parámetro robusto, por no serlo ni la media aritmética ni la desviación típica. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 70/113

82 Recorrido intercuartílico Sabemos que el primer cuartil, Q 1 deja a su izquierda el 25 % de las observaciones, y que el tercer cuartil Q 3 deja a su izquierda el 75 %. Esto significa que entre Q 1 y Q 3 se encuentran el 50 % central de las observaciones. El intervalo [Q 1, Q 3 ] se denomina intervalo intercuartílico La longitud del intervalo intercuartílico, puede ser considerada como una medida de dispersión que se denomina recorrido intercuartílico y se denota IQR, es decir, IQR = Q 3 Q 1 Esta medida de dispersión es robusta por serlo también los cuartiles, es decir, está poco influenciada por la presencia de valores muy extremos. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 71/113

83 Recorrido intercuartílico Para los datos, 1, 3, 7, 8, 9, 9, 10, 12, 13, 13, 14, 15 se tiene que, luego, Q 1 = 7 5 Q 3 = 13 IQR = = 5 5 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 72/113

84 Recorrido intercuartílico Si tenemos los datos siguientes, entonces, x i n i N i Q 1 = 3 Q 3 = 7 IQR = Q 3 Q 1 = 7 3 = 4 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 73/113

85 Recorrido intercuartílico Y para los datos, se tendrá, (e i 1, e i ] x i n i N i (46 5, 55 5] (55 5, 64 5] (64 5, 73 5] (73 5, 82 5] (82 5, 91 5] (91 5, 100 5] Q 1 = Q 3 = IQR = Q 3 Q 1 = = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 74/113

86 Coeficiente x Cuando se trata de comparar las dispersiones de dos conjuntos de datos nos encontramos con el mismo problema que para la varianza, es decir, la influencia tanto de la unidad de medición como de la magnitud media de las cantidades. Por esta razón, de la misma forma que en aquel caso se definió en coeficiente de variación de Pearson, ahora podemos definir un coeficiente similar dividiendo IQR por el valor absoluto de la mediana. Obtenemos así el siguiente parámetro que denominaremos coeficiente x, x = IQR Me = Q 3 Q 1 Me Como en el caso del coeficiente de variación de Pearson, este nuevo coeficiente es adimensional y está liberado de la influencia de la mayor o menor magnitud media de las observaciones. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 75/113

87 Coeficiente x Ejemplo Las estaturas, en centímetros, de cinco alumnos de Primero de Enseñanza Secundaria Obligatoria, son 145, 139, 135, 143 ý 135. Y las de seis alumnos de Cuarto de Enseñanza Secundaria Obligatoria son 163, 174, 175, 169, 171 ý 178. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 76/113

88 Coeficiente x Calculemos el coeficiente x para cada caso Primero de E.S.O. 145, 139, 135, 143, 135. Ordenadas son 135, 135, 139, 143, 145. Q 1 = 135 Q 3 = 143 Me = 139 IQR = Q 3 Q 1 = 8 x = IQR Me = = Cuarto de E.S.O. 163, 174, 175, 169, 171, 178. Ordenadas son 163, 169, 171, 174, 175, 178. Q 1 = 169 Q 3 = 175 Me = IQR = Q 3 Q 1 = 6 x = IQR Me = = Por consiguiente, las estaturas de los alumnos de Cuarto presentan menos dispersión que las de los alumnos de Primero. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 77/113

89 Coeficiente x Conclusiones El coeficiente x es una medida de dispersión adimensional y además compensada del efecto que produce la mayor o menor magnitud global de las cantidades. Se ha de emplear cuando se quiere comparar la dispersión de dos o mas conjuntos de observaciones medidas en unidades distintas y/o con valores promedio distintos. Tiene la ventaja sobre coeficiente de variación de ser un parámetro robusto, por lo que debería ser preferido cuando existan valores extremos anómalos. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 78/113

90 PARÁMETROS O MEDIDAS DE FORMA. OTRAS MEDIDAS José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 79/113

91 Patrones de simetría de una distribución de frecuencias José A. Mayor. Universidad de Sevilla. Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 80/113

92 Coeficiente de asimetría de Pearson A s = X Mo σ x A s = 0, distribución simétrica. A s < 0, distribución asimétrica o sesgada a la izquierda. A s > 0, distribución asimétrica o sesgada a la derecha. Aunque a veces puede ser útil, es un coeficiente poco preciso y sólo tiene utilidad cuando la distribución es unimodal y campaniforme. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 81/113

93 Coeficiente de asimetría de Fisher Distribución Tipo I. γ 1 = 1 n σ 3 x n (X i X) 3 i=1 Distribuciones Tipo II y Tipo III. γ 1 = 1 n σ 3 x k n i (x i X) 3 i=1 γ 1 = 0, distribución simétrica. γ 1 < 0, distribución asimétrica o sesgada a la izquierda. γ 1 > 0, distribución asimétrica o sesgada a la derecha. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 82/113

94 Coeficiente de curtosis o aplastamiento Distribución Tipo I. ( 1 γ 2 = n σx 4 ) n (X i X) 4 3 i=1 Distribuciones Tipo II y Tipo III. ( 1 γ 2 = n σx 4 ) k n i (x i X) 4 3 i=1 γ 2 = 0, distribución mesocúrtica. Ni muy aplastada ni muy apuntada. γ 2 > 0, distribución leptocúrtica. Distribución apuntada. γ 2 < 0, distribución platicúrtica. Distribución aplastada. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 83/113

95 Patrones de aplastamiento de una distribución de frecuencias José A. Mayor. Universidad de Sevilla. Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 84/113

96 Concentración El concepto de concentración hace referencia al grado de uniformidad en el reparto del total de la variable sobre cada uno de los individuos o elementos. El estudio de la concentración es de gran interés en el ámbito económico, cuando se trata de estudiar el grado de equidad en el reparto de la riqueza, los salarios, o bienes en general. De hecho, este concepto se emplea frecuentemente en estudios sobre el reparto de bienes como riqueza o salario, en empresas, clases sociales, países o regiones geográficas en general. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 85/113

97 Concentración Ejemplo Los cinco trabajadores de la empresa A ganan, mensualmente, 1400, 1500, 1390, 1600, 1550 Euros. Los cuatro empleados de la empresa B ganan, mensualmente, 1300, 1400, 1350, 5000 Euros. Los sueldos de la empresa A presentan menos concentración que los de la empresa B pues el total está más uniformemente repartido en A que en B. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 86/113

98 Estudio de la concentración. Distribuciones de Tipo II. Lo veremos con el ejemplo del numero de hijos de 150 familias. Construimos la tabla usual, ampliándola con otras cantidades que se ven a continuación, x i n i f i F i s i S i P i % T i % José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 87/113

99 Concentración. Distribuciones de Tipo II. Cantidades importantes s i. Es la suma de las observaciones en cada modalidad. En nuestro caso se obtiene multiplicando el valor de la modalidad por la frecuencia absoluta, es decir, s i = n i x i. Por ejemplo, s 3 = 2 62 = 124, o sea, las familias con 2 hijos reúnen en total 124 hijos. S i. Es la cantidad anterior, acumulada, es decir, S i = s 1 + s s i. P i. Representa el porcentaje de observaciones menores o iguales que x i, es decir, P i = 100 F i. Observemos que siempre se verificará P k = 100. T i. Es el porcentaje que representa S i con respecto a la suma total S k, es decir, T i = 100 S i /S k. Observemos que siempre se verificará T k = 100. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 88/113

100 Concentración. Distribuciones de Tipo II. Observación La modalidad 1, es decir, CERO hijos, representa un porcentaje igual a P 1 del número total de elementos, familias en este caso, pero su valor asociado de la variable, número de hijos en este caso, representa un porcentaje igual a T 1. Las modalidades primera y segunda representan un porcentaje igual a P 2 del número total de elementos, familias en este caso, pero su valor asociado de la variable, número de hijos en este caso, representa un porcentaje igual a T 2, y así sucesivamente. Importante Observando la evolución conjunta de las columnas P y T podemos estudiar la concentración. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 89/113

101 Curva de Lorenz Importante Observando la evolución conjunta de las columnas P y T podemos estudiar la concentración. Para ello, dibujamos un cuadrado de lado 100 y representamos los puntos (0, 0), (T 1, P 1 ), (T 2, P 2 ),...,(T k, P k ) = (100, 100). Uniéndolos por segmentos obtendremos una línea que se mantiene siempre por encima de la bisectriz, como puede verse en la gráfica adjunta, en la que hemos representado dicha poligonal y también la bisectriz. Esta poligonal se denomina curva de Lorenz ó curva de concentración. La mínima concentración corresponde a un reparto uniforme del total, y la curva de Lorenz coincide con la bisectriz. Por contra, si este reparto es menos equitativo, es decir, el total tiende a concentrarse más en uno o varios valores, la curva tiende a alejarse de la bisectriz. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 90/113

102 Curva de Lorenz P 2 P 1 (100, 100) δ (0, 0) T 1 T 2 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 91/113

103 Queremos un parámetro para cuantificar la concentración A mayor concentración, mayor superficie entre la curva de Lorenz y la bisectriz. A menor concentración, menor superficie. Entonces, para medir la concentración podemos emplear dicha superficie. Vamos a llamarle δ. Este valor está comprendido entre CERO que sería su valor mínimo, y 5000 que sería su valor máximo. El estadístico italiano Gini inventó el índice que lleva su nombre dividiendo δ por su valor máximo, y de esta forma, I G = δ I G 1 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 92/113

104 Índice de Gini Interpretación Cuanto más próximo esté I G a UNO, hay más concentración. Cuanto más próximo esté I G a CERO, hay menos concentración. Fórmula para su cálculo I G = k (P i 1 T i P i T i 1 ) i=2 José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 93/113

105 Ejemplo: número de hijos x i n i f i F i s i S i P i % T i % I G = (( ) +( ) , )) = Este resultado nos indica la presencia de cierto grado de concentración, aunque no excesivo. Nótese que para el cálculo anterior se van multiplicando de forma cruzada las P i por las T i. estos productos se restan, y los resultados se suman. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 94/113

106 Concentración. Distribuciones de Tipo III. Para este tipo de distribución, se procede de forma similar pero empleando las marcas de clase, x i. Veamos un ejemplo. Tenemos una variable ya agrupada en intervalos. Intervalo x i n i F i s i S i P i T i (0 5, 1 5] 1 5 5/50 = (1 5, 2 5] /50 = (2 5, 3 5] /50 = (3 5, 4 5] /50 = (4 5, 5 5] /50 = (5 5, 6 5] /50 = (6 5, 7 5] /50 = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 95/113

107 Concentración. Distribuciones de Tipo III. Cantidades importantes s i. Es la suma de las observaciones en cada intervalo. Usualmente no se dispone de estas observaciones, empleándose entonces como aproximación la suma de las marcas de clase, es decir, s i = n i x i. S i. Es la cantidad anterior, acumulada, es decir, S i = s 1 + s s i. P i. Representa el porcentaje de observaciones menores o iguales que X i, es decir, P i = 100 F i. Observemos que siempre se verificará P k = 100. T i. Es el porcentaje que representa S i con respecto a la suma total S k, es decir, T i = 100 S i /S k. Observemos que siempre se verificará T k = 100. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 96/113

108 Curva de Lorenz. Índice de Gini Como en el caso de las distribuciones de Tipo II, ahora se procede de la misma forma, representando los puntos (0, 0), (T 1, P 1 ), (T 2, P 2 ),...,(T k, P k ) = (100, 100), que darán lugar a la curva de Lorenz ó curva de concentración, y calculando el índice de Gini, I G = k (P i 1 T i P i T i 1 ) i=2 que aplicada a los datos de nuestro ejemplo, proporciona, I G = ( , ) = es decir, poca concentración. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 97/113

109 Concentración. Distribuciones de Tipo I. Finalmente veremos cómo calcular el índice de Gini para distribuciones Tipo I. Lo haremos con un ejemplo pequeño, pero suficiente para mostrar el método. Supongamos cinco sueldos, en miles de Euros, 4, 3, 2, 2, 1. Primero se ordenan de menor a mayor, y se construye la siguiente tabla, que es análoga a las calculadas para las distribuciones Tipos II y III. X i n i f i F i s i S i P i % T i % 1 1 1/5 = 0 2 1/5 = /12 = /5 = 0 2 2/5 = /12 = /5 = 0 2 3/5 = /12 = /5 = 0 2 4/5 = /12 = /5 = 0 2 5/5 = /12 = José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 98/113

110 Concentración. Distribuciones de Tipo I. X i n i f i F i s i S i P i % T i % 1 1 1/5 = 0 2 1/5 = /12 = /5 = 0 2 2/5 = /12 = /5 = 0 2 3/5 = /12 = /5 = 0 2 4/5 = /12 = /5 = 0 2 5/5 = /12 = I G = k (P i 1 T i P i T i 1 ) i=2 que aplicada a los datos de nuestro ejemplo, proporciona, I G = (( ) +( ) , )) = Hay concentración pero poca. De forma similar se dibuja la curva de Lorenz a partir de las P i y las T i. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 99/113

111 Detección de valores singulares y/o anómalos Consideremos los siguientes datos numéricos, relativos a las tallas de 20 alumnos de Tercero de Enseñanza Secundaria Obligatoria, en centímetros, Existe un valor singular, 190, que se puede considerar como atípico o anómalo. Es posible que dicho valor provenga de la misma fuente o población? Estará afectado de algún error? En caso afirmativo, Qué tipo de error? José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 100/113

112 Clasificación de observaciones singulares Observaciones singulares Observación ATÍPICA. Es aquel valor que presenta una gran variabilidad de tipo inherente. Observación ERRÓNEA. Es aquel valor que se encuentra afectado de algún tipo de error. Definición Se llamará OUTLIER a aquella observación que siendo atípica y/o errónea, tiene un comportamiento muy diferente respecto al resto de los datos, en relación al análisis que se desea realizar sobre las observaciones. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 101/113

113 Detección de outliers. Método IQR. 1 Calcular Q 1, Q 3 é IQR 2 Calcular las vallas interiores. f 1 = Q IQR f 2 = Q IQR 3 Calcular las vallas exteriores. F 1 = Q 1 3 IQR F 2 = Q IQR Toda observación que quede fuera de las vallas interiores será considerada como OUTLIER, y se conceptúa como valor anómalo. Los OUTLIERS que además estén fuera de las vallas exteriores se conceptúan como valores muy anómalos. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 102/113

114 Ejemplo. Estaturas de los alumnos Cuartiles y recorrido intercuartílico. 2 Vallas interiores. Q 1 = 147 Q 3 = 154 IQR = 7 f 1 = = f 2 = = Vallas exteriores. F 1 = = 126 F 2 = = 175 Conclusión Luego el valor 190 es un valor muy anómalo, que requiere un estudio pormenorizado. Puede ser un error en las observaciones, o que realmente existe un alumno de elevada estatura. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 103/113

115 Diagrama de caja o Box-Plot Utilidad Este tipo de diagramas expresa muy claramente la distribución de los datos: su valor central, simetría, concentración y observaciones anómalas. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 104/113

116 Diagrama de caja o Box-Plot. Construción 1 Fijar la escala según los valores mínimo y máximo. 2 Localizar la mediana y los cuartiles, Q 1 y Q 3, y dibujar un rectángulo o caja que conecte estos últimos. Dentro del mismo, marcar la mediana con un segmento. La amplitud de la caja será el recorrido intercuartílico, IQR. 3 Detectar valores anómalos. Las observaciones fuera de las vallas interiores pero dentro de las exteriores se representan como pequeños cuadrados o círculos, y las que queden fuera de las vallas exteriores con asteriscos o cruces. Esta regla puede varíar. 4 A cada lado de la caja se trazan segmentos que terminan en las observaciones más extremas dentro de las vallas interiores, que se denominan valores adyacentes. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 105/113

117 Diagrama de caja o Box-Plot F 1 f 1 Q 1 Me Q 3 f 2 F 2 Observaciones Los valores que queden fuera de las vallas interiores pero dentro de las exteriores se han representado con, y las que queden fuera de las vallas exteriores con. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 106/113

118 Comparación de datos con diagramas de caja Es interesante emplear este diagrama para comparar varios conjuntos de datos, suponiendo por supuesto que dicha comparación tenga sentido. Ejemplo Compararemos dos conjuntos de datos relativos a las puntuaciones de 175 alumnos por una parte, y de 120 por otra. Construiremos los correspondientes diagramas de caja, y los ubicaremos en un mismo gráfico, con una escala común. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 107/113

119 Puntuaciones de 175 estudiantes José A. Mayor. Universidad de Sevilla. Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 108/113

120 Puntuaciones de 175 estudiantes. Resultados. Mediante el programa EXCEL, hemos calculado los parámetros, Q 1 = 69 Q 2 = Me = 76 Q 3 = 83 a partir de los cuales tenemos, IQR = Q 3 Q 1 = 14 f 1 = Q IQR = 48 f 2 = Q IQR = 104 F 1 = Q 1 3 IQR = 27 F 2 = Q IQR = 125 La puntuación mínima es 50, y la máxima 98. Así pues, todas las observaciones quedan dentro de las vallas interiores, y no detectamos outliers. Los valores adyacentes son pues 50 y 98. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 109/113

121 Puntuaciones de 120 estudiantes José A. Mayor. Universidad de Sevilla. Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 110/113

122 Puntuaciones de 120 estudiantes. Resultados. Mediante el programa EXCEL, hemos calculado los parámetros, Q 1 = 52 Q 2 = Me = 55 Q 3 = 58 5 a partir de los cuales tenemos, IQR = Q 3 Q 1 = 6 5 f 1 = Q IQR = f 2 = Q IQR = F 1 = Q 1 3 IQR = 32 5 F 2 = Q IQR = 78 La puntuación mínima es 34, y la máxima 62. Así pues, existen observaciones por debajo de la valla interior inferior, en concreto, 34, 39 y 41, que son consideradas como outliers. Por encima de la valla interior superior no hay observaciones. Los valores adyacentes son las observaciones 43 y 62. No hay observaciones fuera de las vallas exteriores, es decir, muy anómalas. José A. Mayor. Universidad de Sevilla. jmayor.doc@gmail.com Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 111/113

123 Diagramas de caja José A. Mayor. Universidad de Sevilla. Estadística Adva TEMAS 4, 5 y 6. D.G.A.P. 112/113

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación 04-06-06-COMP. RESUELTO. Parámetros y complementos José A. Mayor Gallego Departamento de Estadística

Más detalles

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación 04-06-06-COMP. Parámetros y complementos José A. Mayor Gallego Departamento de Estadística e Investigación

Más detalles

Estadística ESTADÍSTICA

Estadística ESTADÍSTICA ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta

Más detalles

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos Descripción numérica de datos: medidas descriptivas Centro Posición Variación Forma media cuartiles rango coef. asimetría

Más detalles

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- Estadística variable unidimensional 1. Conceptos de Estadística 2. Distribución de frecuencias 2.1. Tablas de valores con variables continuas 3. Parámetros

Más detalles

ESTADÍSTICA UNIDIMENSIONAL

ESTADÍSTICA UNIDIMENSIONAL ESTADÍSTICA UNIDIMENSIONAL DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. TIPOS DE VARIABLE ESTADÍSTICAS Ø Variable

Más detalles

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA Definición de Estadística: La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer

Más detalles

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Estadística para el análisis de los Mercados S2_A1.1_LECV1 5. Parámetros estadísticos. 5.1. Parámetros de centralización. Estos parámetros nos indican en torno a que puntos se encuentran los valores de la variable cuantitativa en estudio. Es la forma de representar

Más detalles

Estadística Inferencial. Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva INTRODUCCIÓN Estadística: Ciencia que trata sobre la teoría y aplicación de métodos para coleccionar, representar, resumir y analizar datos, así como realizar inferencias a partir de ellos. Recogida y

Más detalles

Estadística Descriptiva 2da parte

Estadística Descriptiva 2da parte Universidad Nacional de Mar del Plata Facultad de Ingeniería Estadística Descriptiva 2da parte 2 Cuatrimestre 2018 COMISIÓN :1. Prof. Dr. Juan Ignacio Pastore. Qué es la estadística? El contenido de la

Más detalles

Estadística. Análisis de datos.

Estadística. Análisis de datos. Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un

Más detalles

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes

Más detalles

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud. 1. TABLAS Y GRÁFICOS ESTADÍSTICOS Estadística Es la ciencia que estudia conjunto de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros tales como

Más detalles

ESTADÍSTICA. 1. Introducción. 2. Frecuencias

ESTADÍSTICA. 1. Introducción. 2. Frecuencias ESTADÍSTICA Jesús García de Jalón de la Fuente 1. Introducción La Estadística trata de describir colectividades formadas por un gran número de objetos. El conjunto de los objetos que se estudian se denomina

Más detalles

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados ESTADÍSTICA INTRODUCCIÓN Qué es la estadística?. - Es la rama de las matemáticas que estudia la recolección, análisis e interpretación de datos. Por qué estudiamos estadística? - Aprender sobre fenómenos

Más detalles

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo U.D.1: Análisis estadístico de una variable Consideraciones iniciales: - Población: Es el conjunto de todos los elementos que cumplen una determinada característica. Ej.: Alumnos del colegio. - Individuo:

Más detalles

UNIDAD 8. ESTADÍSTICA

UNIDAD 8. ESTADÍSTICA UNIDAD 8. ESTADÍSTICA La Estadística es la rama de las Matemáticas que se ocupa de la recopilación y ordenación de datos para su posterior análisis. 1. Población y muestra. Población. Es el conjunto de

Más detalles

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los datos (si hay pocos distintos) o los intervalos (si

Más detalles

Técnicas Cuantitativas para el Management y los Negocios

Técnicas Cuantitativas para el Management y los Negocios Técnicas Cuantitativas para el Management y los Negocios Contador Público Módulo I: ESTADÍSTICA DESCRIPTIVA Contenidos Módulo I Unidad 1. Introducción y conceptos básicos Conceptos básicos de Estadística.

Más detalles

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i OCIOES de ESTADÍSTICA En las tablas estadísticas se pueden tabular, entre otros, los siguientes aspectos: La frecuencia absoluta ( f i ), es decir, el número de veces que aparece un determinado valor en

Más detalles

Apuntes de Estadística

Apuntes de Estadística Apuntes de Estadística La Estadística es la ciencia que se encarga de recoger, organizar, describir e interpretar datos referidos a distintos fenómenos para, posteriormente, analizarlos e interpretarlos.

Más detalles

Estadística I Tema 2: Análisis de datos univariantes

Estadística I Tema 2: Análisis de datos univariantes Estadística I Tema 2: Análisis de datos univariantes Tema 2: Análisis de datos univariantes Contenidos Gráficas para datos categóricos (diagrama de barras, diagrama de sectores). Gráficas para datos numéricos

Más detalles

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com) ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS... 1 DEFINICIONES BÁSICAS... 1 Estadística... 1 Estadística descriptiva... 1 Estadística inferencial...

Más detalles

Medidas de dispersión

Medidas de dispersión Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son: Rango o recorrido El rango es la diferencia

Más detalles

IMADIL /10/2014

IMADIL /10/2014 TEMA 3: Características estadísticas fundamentales (Segunda parte: Dispersión y forma) Ignacio Martín y José Luis Padilla IMADIL 2014-2015 2 POSICIÓN DISPERSIÓN ESTADÍSTICOS SIMETRÍA APUNTAMIENTO 3. ESTADÍSTICOS

Más detalles

Tema 3: Estadística Descriptiva

Tema 3: Estadística Descriptiva Tema 3: Estadística Descriptiva Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 3: Estadística Descriptiva Curso 2008-2009 1 / 27 Índice

Más detalles

MEDIDAS DE CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN. Matemáticas PAI 5 (4ºESO)

MEDIDAS DE CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN. Matemáticas PAI 5 (4ºESO) CENTRALIZACIÓN, POSICIÓN Y DISPERSIÓN Matemáticas PAI 5 (4ºESO) Ejercicio 2 Actividad de aula 3 Medidas estadísticas Recupera la tabla de frecuencias que realizaste en el ejercicio 2 de la actividad de

Más detalles

Estadística aplicada al Periodismo

Estadística aplicada al Periodismo Estadística aplicada al Periodismo Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad y Modelos probabilísticos.

Más detalles

Medidas de centralización

Medidas de centralización 1 1. Medidas de centralización Medidas de centralización Hemos visto cómo el estudio del conjunto de los datos mediante la estadística permite realizar representaciones gráficas, que informan sobre ese

Más detalles

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS UNIVERSIDAD INTERAMERICANA PARA EL DESARROLLO ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS Contenido II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS II. Tablas de frecuencia II. Gráficos: histograma, ojiva, columna,

Más detalles

DESCRIPCIÓN DE DATOS. Medidas Numéricas

DESCRIPCIÓN DE DATOS. Medidas Numéricas DESCRIPCIÓN DE DATOS Medidas Numéricas MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN MEDIA ARITMÉTICA O PROMEDIO Media poblacional Cualquier característica medible de una población recibe el nombre de parámetro

Más detalles

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central nos proporcionan la descripción significativa de un conjunto de observaciones. Como su nombre lo indica, son datos de una variable que tienden

Más detalles

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, DECANA DE AMERICA) MEDIDAS DE TENDENCIA CENTRAL 20/05/2008 Ing. SEMS 2.1 INTRODUCCIÓN En el capítulo anterior estudiamos de qué manera los

Más detalles

Medidas de variabilidad (dispersión)

Medidas de variabilidad (dispersión) Medidas de posición Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos. Las

Más detalles

ESTADÍSTICA 1.- NOCIONES GENERALES

ESTADÍSTICA 1.- NOCIONES GENERALES ESTADÍSTICA 1.- NOCIONES GENERALES : Conjunto de elementos cuyo conocimiento es objeto de estudio. Ejemplo: Jóvenes de Laguna de Duero. : Parte de la población cuyo estudio sirve para inferir características

Más detalles

PROBABILIDAD. Unidad I Ordenamiento de la Información

PROBABILIDAD. Unidad I Ordenamiento de la Información 1 PROBABILIDAD Unidad I Ordenamiento de la Información 2 Captura de datos muestrales Conceptos básicos de la estadística 3 Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra:

Más detalles

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha: Guía de actividad Independiente No 5. NOMBRE DE LA ASIGNATURA: Estadística Descriptiva TUTOR: Deivis Galván Cabrera Nombre del estudiante: Fecha: 1. Al comenzar el curso se pasó una encuesta a los alumnos

Más detalles

Estadística I. Finanzas y contabilidad

Estadística I. Finanzas y contabilidad Estadística I. Finanzas y contabilidad Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad. Modelos probabilísticos.

Más detalles

Estadística Básica 1er Cuatrimestre 2012

Estadística Básica 1er Cuatrimestre 2012 Estadística Básica 1er Cuatrimestre 2012 En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptivas que representan las propiedades de tendencia central, dispersión y forma, para

Más detalles

Estadística unidimensional

Estadística unidimensional Estadística unidimensional Población y muestra Población Se llama población al conjunto bien delimitado de unidades (elementos), ya sean individuos u objetos, del que se interesa observar o medir alguna

Más detalles

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN Licenciatura en Gestión Ambiental 2015 Estimación de estadísticos descriptivos Una descripción cuantitativa de datos incluye:

Más detalles

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión Inicio Aritmética Álgebra Geometría Cálculo Estadística Trigonometría A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Medidas de dispersión Las medidas de dispersión nos informan sobre cuánto se alejan

Más detalles

REPASO DE ESTADÍSTICA DESCRIPTIVA

REPASO DE ESTADÍSTICA DESCRIPTIVA ÍNDICE: 1.- Tipos de variables 2.- Tablas de frecuencias 3.- Gráficos estadísticos 4.- Medidas de centralización 5.- Medidas de dispersión REPASO DE ESTADÍSTICA DESCRIPTIVA 1.- Tipos de variables La estadística

Más detalles

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Estadística Descriptiva en R: Parámetros y estadísticos José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016) Parámetros y Estadísticos Parámetro: Es una cantidad numérica calculada

Más detalles

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2 Preg. 1. Para comparar la variabilidad relativa de la tensión arterial diastólica y el nivel de colesterol en sangre de una serie de individuos, utilizamos

Más detalles

Conceptos de Estadística

Conceptos de Estadística Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos de Estadística

Más detalles

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O. Repasa de cursos anteriores: Estadística. Población. Muestra. Carácter estadístico: cualitativo (modalidad) y cuantitativo (variable estadística), que puede ser (discreta y continua] Frecuencias: absolutas

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central y de dispersión Giorgina Piani Zuleika Ferre 1. Tendencia Central Son un conjunto de medidas estadísticas que determinan un único valor que define el

Más detalles

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k 1. Estadística Definición: La estadística es un ciencia inductiva que permite inferir características cualitativas y cuantitativas de un conjunto mediante los datos contenidos en un subconjunto del mismo.

Más detalles

Tema 1. Estadística Unidimensional

Tema 1. Estadística Unidimensional Tema 1. Estadística Unidimensional 1. Conceptos Básicos. Gráfcas estadísticas 3. Medidas de centralización y dispersión: media, rango, desviación típica, coefciente de variación 4. Medidas de posición:

Más detalles

2º GES T.5 - ESTADÍSTICA TEMA 5. ESTADÍSTICA

2º GES T.5 - ESTADÍSTICA TEMA 5. ESTADÍSTICA TEMA 5. ESTADÍSTICA La estadística, a nivel primario, es una actividad que todo el mundo hace desde muy pequeño. El mero hecho de contar y/o clasificar tus juguetes (tus coches, muñecas/os, canicas, videojuegos,

Más detalles

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra. TEMA 7. ESTADÍSTICA ACCESO CICLO SUPERIOR En esta sociedad resulta imprescindible disponer de técnicas que permitan obtener, de forma sencilla y fiable, información de los diferentes conjuntos de datos

Más detalles

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias. Part I Descripción estadística de una variable El objeto de cualquier investigación estadística es la toma de información acerca de los individuos de cierto colectivo llamado población estadística. Cada

Más detalles

Estadística. 1. Conceptos de Estadística. 2. Variable estadística. 3. Tablas de estadística. 4. Diagrama de barras y polígonos de frecuencias.

Estadística. 1. Conceptos de Estadística. 2. Variable estadística. 3. Tablas de estadística. 4. Diagrama de barras y polígonos de frecuencias. Estadística 1. Conceptos de Estadística. 2. Variable estadística. 3. Tablas de estadística. 4. Diagrama de barras y polígonos de frecuencias. 5. Diagrama de sectores. 6. Histograma. 7. Parámetros estadísticos.

Más detalles

2.2: Resumen numérico

2.2: Resumen numérico 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas: Capítulos 2 a 6 del libro de Peña y Romo (1997) Capítulos 3 a 7 del libro de Portilla (2004)

Más detalles

Julio Deride Silva. 18 de agosto de 2010

Julio Deride Silva. 18 de agosto de 2010 Estadística Descriptiva Julio Deride Silva Área de Matemática Facultad de Ciencias Químicas y Farmcéuticas Universidad de Chile 18 de agosto de 2010 Tabla de Contenidos Estadística Descriptiva Julio Deride

Más detalles

Tema 9: Estadística descriptiva

Tema 9: Estadística descriptiva Tema 9: Estadística descriptiva Matemáticas específicas para maestros Grado en Educación Primaria Matemáticas específicas para maestros Tema 9: Estadística descriptiva Grado en Educación Primaria 1 / 47

Más detalles

Estadística Descriptiva o deductiva Inferencial o inductiva Población: Variable: Variable cualitativa: Variable cuantitativa: Variable discreta

Estadística Descriptiva o deductiva Inferencial o inductiva Población: Variable: Variable cualitativa: Variable cuantitativa: Variable discreta Estadística La Estadística es la ciencia que trata de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar datos, así como de realizar inferencias a partir de

Más detalles

CLASIFICACIÓN DE LA ESTADÍSTICA

CLASIFICACIÓN DE LA ESTADÍSTICA Estadística aplicada a la Investigación Docente: BC. Aníbal Espínola Cano CLASIFICACIÓN DE LA ESTADÍSTICA 1 ESTADÍSTICA DESCRIPTIVA Ordenando la Información Al ordenar datos muy numerosos, es usual agruparlos

Más detalles

Análisis Exploratorio de Datos Resumen gráfico y numérico

Análisis Exploratorio de Datos Resumen gráfico y numérico INSTITUTO DE MATEMÁTICA Y FIsiCA Análisis Exploratorio de Datos Resumen gráfico y numérico DOCENTE Gloria Correa Beltrán Etapas del Método Científico Pasos a seguir en el Análisis Exploratorio de Datos

Más detalles

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1 Bioestadística Tema 2: Estadísticos Tema 2: Estadísticos 1 Parámetros y estadísticos Parámetro: Es una cantidad numérica calculada sobre una población La altura media de los individuos de un país La idea

Más detalles

TEMA: 13 y 14 ESTADÍSTICA 3º ESO

TEMA: 13 y 14 ESTADÍSTICA 3º ESO TEMA: 13 y 1 ESTADÍSTICA 3º ESO 1. POBLACIÓN Y MUESTRA POBLACIÓN o Es el conjunto de todos los elementos que son objeto de nuestro estudio. MUESTRA o Es un subconjunto, extraído de la población, cuyo estudio

Más detalles

Instrumentos y matriz de datos

Instrumentos y matriz de datos Curso: Estadística Instrumentos y matriz de datos Medidas descriptivas de Tendencia Central y Posición Estadística Descriptiva Profesor: Gonzalo Fernández Fecha: 19/09/2017 LOGRO DE LA SESIÓN Al finalizar

Más detalles

TEMA 11. ESTADÍSTICA

TEMA 11. ESTADÍSTICA TEMA 11. ESTADÍSTICA ACCESO UNIVERSIDAD En esta sociedad resulta imprescindible disponer de técnicas que permitan obtener, de forma sencilla y fiable, información de los diferentes conjuntos de datos con

Más detalles

Tema 1: Análisis de datos univariantes

Tema 1: Análisis de datos univariantes Tema 1: Análisis de datos univariantes 1 En este tema: Conceptos fundamentales: muestra y población, variables estadísticas. Variables cualitativas o cuantitativas discretas: Distribución de frecuencias

Más detalles

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados.

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados. TEMA 8: ESTADÍSTICA 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados. 8.1 Elementos de la Estadística. Es la parte de las Matemáticas que estudia

Más detalles

ESTADÍSTICA. Rincón del Maestro:

ESTADÍSTICA. Rincón del Maestro: ESTADÍSTICA Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Conceptos

Más detalles

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1

1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1 8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable

Más detalles

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas Datos no agrupados: x 1, x 2,...,x n x= x 1 +x 2 +... x n n n i=1 = n Ejemplo: dados los valores: X = 1, 4, 16, 11, 3, 6, su media es

Más detalles

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS www.cedicaped.com MEDIDAS DE DISPERSIÓN En clases anteriores se definieron algunas medidas de centralización, entre ellas, la más utilizada:

Más detalles

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

Muestra Una muestra es una parte de la población que elegimos para estudiar la población. 1.- TERMINOLOGÍA ESTADÍSTICA. TÉCNICAS DE SELECCIÓN DE MUESTRAS Estadística descriptiva Es la ciencia que estudia conjuntos de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas,

Más detalles

MEDIDAS DE POSICIÓN de una distribución de frecuencias. 1er semestre 2012 UDE Fac. CC. Agrarias Celina 1 Gutiérrez

MEDIDAS DE POSICIÓN de una distribución de frecuencias. 1er semestre 2012 UDE Fac. CC. Agrarias Celina 1 Gutiérrez MEDIDAS DE POSICIÓN de una distribución de frecuencias er semestre 202 UDE Fac. CC. Agrarias Celina Gutiérrez Medidas Descriptivas Medidas de posición: - central Numéricas: - no central Medidas de dispersión

Más detalles

TEMA 5 Estadística descriptiva. Análisis de datos

TEMA 5 Estadística descriptiva. Análisis de datos TEMA 5 Estadística descriptiva. Análisis de datos Florence Nightingale (1820-1910) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales 3.

Más detalles

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va Jesús Fernández Fernández Carmen María Sordo García DEPARTAMENTO DE MATEMÁTICA APLICADA Y CIENCIAS DE LA COMPUTACIÓN UNIVERSIDAD DE CANTABRIA

Más detalles

Guía de Matemática Cuarto Medio

Guía de Matemática Cuarto Medio Guía de Matemática Cuarto Medio Aprendizaje Esperado: 1. Conocen distintas maneras de organizar y presentar información incluyendo el cálculo de algunos indicadores estadísticos, la elaboración de tablas

Más detalles

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS 1. CONCEPTOS ESTADÍSTICOS TEMA 14: ESTADÍSTICA Población: conjunto formado por todos los individuos sobre los que se realiza un estudio. (ejercicio 1 cuestionario) Muestra: subconjunto de la población

Más detalles

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados: MEDIDAS O Para describir los datos, se necesita de ciertas medidas (números) representativas que puedan resumirlos. O Sirven para caracterizar las distribuciones de frecuencias de datos univariados: O1-

Más detalles

Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.

Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas. Diana Cobos del Angel Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas. 1 Sus fines son describir al conjunto de datos obtenidos y tomar

Más detalles

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:

Más detalles

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado. Objetivos / Criterios de evaluación TEMA 14 ESTADÍSTICA O.15.1 Conocer el significado y saber calcular los parámetros de centralización y dispersión O.15.2 Interpretar y utilizar los parámetros de dispersión.

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Medidas de Tendencia Central y Variabilidad

Más detalles

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41 Resumenes numéricas de una muestra de datos M. Wiper Análisis Estadístico del Delito 1 / 41 M. Wiper Análisis Estadístico del Delito 2 / 41 Objetivo Introducir medidas de localización, dispersión y asimetría

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA 2)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA 2) OBJETIVOS DE APRENDIZAJE: TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN Conocer las características de las principales medidas de tendencia central (media aritmética, mediana y moda) y de posición

Más detalles

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO MEDIDAS DE POSICIÓN Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión, son otras medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones en las que

Más detalles

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios. ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS Ejemplos y ejercicios de Estadística Descriptiva yanálisis de Datos Diplomatura en Estadística Curso 007/08 Descripción estadística de una variable. Ejemplos

Más detalles

9.1. Nociones básicas.

9.1. Nociones básicas. TEMA 9. ESTADÍSTICA 9.1. ociones básicas. Población y muestra. Fases y tareas de un estudio estadístico. Tipos de muestreo. Representatividad de las muestras. 9.2. Variable discreta y continua. Tablas

Más detalles

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: Medidas de Tendencia Central y Variabilidad

Más detalles

Nombre: Curso: Fecha:

Nombre: Curso: Fecha: REPASO Y APOYO RECONOCER Y DIFERENCIAR LOS CONCEPTOS DE POBLACIÓN Y MUESTRA OBJETIVO 1 La Estadística es la ciencia encargada de recoger, analizar e interpretar los datos relativos a un conjunto de elementos.

Más detalles

PRESENTACIÓN N DEL AED

PRESENTACIÓN N DEL AED PRESENTACIÓN N DEL AED Inicio del AED: John Tukey (1977) Nuevas técnicas t gráficas y analísticas Perspectiva exploratoria EDC frente al AED EDC Recoge, Ordena, representa Tabla: agrupa Datos. Gráficos

Más detalles

ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA Universidad Técnica de Babahoyo ESTADÍSTICA DESCRIPTIVA MEDIDAS DE POSICIÓN Y DE TENDENCIA CENTRAL OBJETIVO Analizar y Describir las Características de una Muestra a través de sus estadísticos ó estadígrafos

Más detalles

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz Análisis de datos y gestión n veterinaria Tema 1 Estadística descriptiva Prof. Dr. José Manuel Perea Muñoz Departamento de Producción Animal Facultad de Veterinaria Universidad de Córdoba Córdoba, de Septiembre

Más detalles

COLEGIO INTERNACIONAL SEK ALBORÁN. Middle Years Programme [PROGRAMA DE AÑOS INTERMEDIOS] CURSO ACADÉMICO

COLEGIO INTERNACIONAL SEK ALBORÁN. Middle Years Programme [PROGRAMA DE AÑOS INTERMEDIOS] CURSO ACADÉMICO COLEGIO INTERNACIONAL SEK ALBORÁN Departamento de MATEMÁTICAS Middle Years Programme [PROGRAMA DE AÑOS INTERMEDIOS] CURSO ACADÉMICO 2012-2013 2º ESO Apuntes de estadística y probabilidad 3. ESTADÍSTICA.

Más detalles

Curso de Estadística Aplicada a las Ciencias Sociales

Curso de Estadística Aplicada a las Ciencias Sociales Curso de Estadística Aplicada a las Ciencias Sociales Tema 6. Descripción numérica (2) Capítulo 5 del manual Tema 6 Descripción numérica (2) Introducción 1. La mediana 2. Los cuartiles 3. El rango y el

Más detalles

Temas de Estadística Práctica

Temas de Estadística Práctica Temas de Estadística Práctica Antonio Roldán Martínez Proyecto http://www.hojamat.es/ Tema 2: Medidas de tipo paramétrico Resumen teórico Medidas de tipo paramétrico Medidas de tendencia central Medidas

Más detalles

Estadística aplicada a la comunicación

Estadística aplicada a la comunicación Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva a. Análisis univariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2

Más detalles

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. CONTENIDO: MEDIDAS DE DISPERSIÓN INDICADOR DE LOGRO: Determinarás y aplicarás, con perseverancia las medidas de dispersión para datos no agrupados y agrupados Guía de trabajo: Las medidas de dispersión

Más detalles

Tema 1: Variables estadı sticas unidimensionales. Te cnicas cuantitativas I

Tema 1: Variables estadı sticas unidimensionales. Te cnicas cuantitativas I Tema 1: Variables estadı sticas unidimensionales Te cnicas Cuantitativas I 2013-2014 I ndice del tema 1 Introduccio n 2 Variables estadı sticas. Tablas estadı sticas. Representaciones gra ficas. 3 Momentos

Más detalles

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez. Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez. Si se desea examinar o comparar dos variables, una tabla de contingencia resulta de mucha utilidad.

Más detalles

Medidas Descriptivas Numéricas

Medidas Descriptivas Numéricas 2. Mediana La mediana de una colección de datos, que previamente han sido ordenados, es aquél valor más central o que está más en medio en el conjunto de datos. En otras palabras, la mediana es mayor que

Más detalles