4. Medidas de tendencia central



Documentos relacionados
2.5. Asimetría y apuntamiento

Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA

Medidas de Dispersión

2.4. Medidas de variabilidad o dispersión

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

b) Haz otra distribución en 12 intervalos de la amplitud que creas conveniente.

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Estadística descriptiva. Representación de datos descriptivos

Tema 2: Estadísticos

MEDIDAS DE ASIMETRÍA Y CURTOSIS EMPLEANDO EXCEL

Estadística Descriptiva. SESIÓN 12 Medidas de dispersión

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

3. VARIABLES ALEATORIAS

CONCEPTOS BÁSICOS DE ESTADÍSTICA

Tema 3. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DE LOCALIZACIÓN

EJERCICIOS RESUELTOS TEMA 7

Estadística. Estadística

Definiciones generales

Estadística Avanzada y Análisis de Datos

Estadística para el análisis de los Mercados S2_A1.1_LECV1

TEMAS SELECTOS DE MATEMÁTICAS II

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

ESTADÍSTICA BÁSICA Dirección Redes en Salud Pública

TEMA 3. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Julio Deride Silva. 18 de agosto de 2010

Tema 5: Principales Distribuciones de Probabilidad

1º BACH CCSS - MATEMÁTICAS - PROBLEMAS DE ANÁLISIS ESTADÍSTICO DE UNA VARIABLE ˆ EJERCICIO 25

7. Distribución normal

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

UNIDAD Nº2 MEDIDAS DE TENDENCIA CENTRAL

Análisis Exploratorio de Datos Resumen gráfico y numérico

ANÁLISIS ESTADÍSTICO. Estadística descriptivos: Tablas, gráficos, estadísticos descriptivos. Jorge Fallas

SESIÓN 5 RELACIÓN ENTRE LOS VALORES NUMÉRICOS

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

DISTRIBUCIONES DE PROBABILIDAD

Matemáticas y Estadística para Finanzas Prof.: H. Ernesto Sheriff, PhD(c) M.Sc.

Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad

Estadística I. Finanzas y contabilidad

MODELO DE RESPUESTAS Objetivos del 1 al 9

Estadística ESTADÍSTICA

BASES ESTADÍSTICAS APLICADAS A LA PREVENCIÓN

Estadística aplicada al Periodismo

3. Análisis univariable y bivariable

IMADIL /10/2014

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

Guía de Matemática Cuarto Medio

Tema 1 ESTADÍSTICA DESCRIPTIVA

P (X 5) = P (x = 5) + P (X = 6) + P (X = 7) + P (X = 8) = =

CATEDRA DE EPIDEMIOLOGÍA

Estadística descriptiva

Julio Deride Silva. 27 de agosto de 2010

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Estadística Manual de teoría y problemas

Teoría de la decisión Estadística

REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD BICENTENARIA DE ARAGUA VICERRECTORADO ACADÉMICO ARAGUA VENEZUELA

Medidas de Variabilidad

Unidad III Variables Aleatorias Unidimensionales

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Tema 5. Muestreo y distribuciones muestrales

Tema 3. Introducción a la estadística descriptiva: Ejercicios

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

Estadística aplicada a la comunicación

ESTADÍSTICA UNIDIMENSIONAL

a).- Si el número de los valores en un conjunto de datos no agrupados es impar, La mediana es determinada de la siguiente manera:

Tema 11: Intervalos de confianza.

Estadística descriptiva: problemas resueltos

EJERCICIOS PARA PREPARAR EL CONTROL DE MATEMÁTICAS. a) Agrupa los datos en cuatro clases y escribe la tabla de frecuencias.

2. FRECUENCIAS Distribución de Frecuencias.

Unidad Didáctica VII: Estadística Descriptiva Unidimensional

UNIVERSIDAD DEL CARIBE UNICARIBE. Escuela de Educación. Programa de Asignatura

Capítulo 1. El caso del Método de Pesada

2.3. Estadísticos de posición

Selectividad Junio 2007 JUNIO 2007

Probabilidad y Estadística

Estadística Empresarial. Cuaderno de Ejercicios. Temas 2. Análisis estadístico de una variable: medidas de posición y medidas de dispersión

LA DISTRIBUCIÓN NORMAL

Tema 3: Estadística Descriptiva

Sucesiones. Se llama sucesión a un conjunto de números dispuestos uno a continuación de otro.

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA. A su vez, las variables pueden ser :

RELACIÓN DE EJERCICIOS DE REPASO DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I

PRÁCTICA 1. Mediciones

Ámbito Científico-Tecnológico Módulo III Bloque 3 Unidad 2 Cuanto más, mejor y viceversa

Polinomios. 1.- Funciones cuadráticas

Práctica 1: Introducción a SPSS 1

Yenny Bayona Sambrano, Edwin Cerna Figueroa, Kelva Llanos Miranda, Luis Montesinos Ruiz, Silvia Pajuelo Rojas

La distribución Normal

José A. Jiménez Nieto

Estadística. Análisis de datos.

CAPITULO CAPITUL 2 MEDIDA MEDID S

TEMA 11. ESTADÍSTICA

Documento elaborado por: Francisco Javier Rodríguez Cortés Matemático Facultad de Ciencias Exactas - Universidad de Antioquia INTRODUCCIÓN

Práctica 2 Estadística Descriptiva

Parte I. Estadística Descriptiva

PROFESORADO EN EDUCACIÓN SECUNDARIA DE LA MODALIDAD TÉCNICO PROFESIONAL EN CONCURRENCIA CON EL TÍTULO DE BASE.

NOMBRE: CURSO: Iº. Muestra: Es un subconjunto de la población, que debe ser representativa y aleatoria.

Datos de tipo cuantitativo

Transcripción:

4. Medidas de tendencia central A veces es conveniente reducir la información obtenida a un solo valor o a un número pequeño de valores, las denominadas medidas de tendencia central. Sea X una variable estadística con valores x 1, x 2,..., x k y frecuencias n 1, n 2,..., n k. Media aritmética (x) x = x 1n 1 + x 2 n 2 +... + x k n k = k i=1 x in i = k x i f i La media es muy sensible a los valores extremos de la variable, por lo que no es conveniente usar la media aritmética como medida central en distribuciones muy asimétricas. El valor de la media aritmética puede no pertenecer al conjunto de valores que puede tomar una variable aleatoria discreta. Por ejemplo, el número medio de hijos en las familias españolas es x = 1,2. i=1 Media geométrica (x G ) Esto implica que: x G = x n 1 1 x n 2 2... x n k k log x G = 1 k n i log x i Observamos que si i t.q. x i = 0 x G = 0. Media cuadrática (x Q ) 1 x Q = x 2 1 n 1 + x 2 2n 2 +... + x 2 k n k = k 1 x2 i n i 10

Media armónica (x A ) x A = k i=1 n i x i Esta media no tiene sentido si i t.q. x i = 0. Prop. x A x G x x Q Mediana (Me).- Es la medida central que, supuestos los valores de la variable ordenados en forma creciente, deja igual número de observaciones inferiores que superiores a ella. Veamos cómo calcularla: En caso de que la frecuencia de cada valor es 1. - n o impar de valores: la mediana es el valor central. Ej. {1, 3, 7, 10, 15}, Me=7. - n o par de valores: la mediana es la media aritmética de las dos centrales. Ej. X = {1, 3, 5, 10, 21, 27, 36, 42}, Me= 10+21 2 =15.5 Mediana de una variable discreta. 1. Dividimos el número de observaciones entre 2, /2. 2. Comprobamos si /2 está en la tabla de frecuencias absolutas acumuladas. 11

3. Si no está, estará comprendido entre dos. La mediana es el valor de la variable que corresponde al mayor. 4. Si está, la mediana vendrá dada por: Me= x k+x k+1 2. Mediana de una variable agrupada. 1. Dividimos el número de observaciones entre 2, /2. 2. Comprobamos si /2 está en la tabla de frecuencias absolutas acumuladas. 3. Si no está, /2 estará entre k y k+1. Para conocer la posición exacta de la mediana hay que interpolar: a k+1 a k k+1 k = x /2 k Me = a k + x 4. Si está, /2 será la frecuencia absoluta acumulada de un cierto intervalo, y la mediana será el extremo superior del mismo. 12

Moda (Md).- Es el valor de la variable que tiene más frecuencia. o tiene por qué ser única. Si hay dos modas, la distribución se llama bimodal. Si hay tres, trimodal, etc. Cuando la variable viene agrupada en intervalos de clase se habla de intervalo modal, que es el intervalo tal que en su histograma es el intervalo al que le corresponde al rectángulo de mayor área por unidad de base. La situación puntual viene dada por: δ 1 Md = a + (b a) δ 1 + δ 2 Cuartiles.- Son tres valores de la variable que dividen las observaciones en cuatro partes iguales. 1. Primer cuartil (P 1 ): es el valor de la variable que deja la cuarta 4 parte de las observaciones menores o iguales a él y las tres cuartas partes superiores a él. Se calcula de manera análoga a la mediana. 2. Segundo cuartil (P 2 ): es la mediana. 4 3. Tercer cuartil (P 3 ): deja inferiores o iguales a él las tres cuartas partes de las observaciones, y la cuarta parte restante es 4 superior a él. Se calcula de manera análoga a la mediana. 13

Deciles.- El decil k ésimo (D k ) es el valor de la variable que deja inferiores o iguales a él las k partes de las observaciones. Es decir, 10 el 10 k por 100, donde k = 1, 2,..., 9. Se calcula de forma análoga a la mediana. Centiles o percentiles.- El percentil k ésimo (P k ) es el valor de la variable que deja inferiores o iguales a él las k partes de las 100 observaciones, es decir, el k por 100, donde k = 1, 2,..., 99. Su cálculo se realiza como el de la mediana, los cuartiles y deciles. 5. Medidas de dispersión o concentración Las medidas de tendencia central reducen la información de la muestra a un solo valor, pero este valor a veces estará más próximo a la realidad y a veces menos. Por ejemplo, consideremos la variable estadística X que toma los valores 0, 100, 200, cada uno de ellos con frecuencia absoluta 1. La media aritmética será: x = 0 + 100 + 200 3 = 100. Si tomamos ahora otra variable Y que toma los valores 99, 101, cada una de ellas una sola vez. En este caso la media aritmética será: y = 99 + 101 2 = 100. Vemos que la media aritmética de las dos variables es 100. Sin embargo, la variable X está mucho más dispersa que la Y, por lo que la representatividad de y es mayor que la de x. Las medidas de dispersión o concentración nos van a cuantificar la representatividad de los valores centrales. otemos que los términos concentración y dispersión pueden ser utilizados indistintamente, pues alta dispersión es equivalente a baja concentración y baja dispersión equivale a alta concentración. 14

Varianza y desviación típica Varianza.- Viene dada por σ 2 = k i=1 (x i x) 2 n i La varianza toma siempre valores positivos. En caso de ser σ 2 = 0, todos los x i coinciden con la media aritmética, es decir, todas las observaciones están concentradas en un mismo punto, por lo que la dispersión es nula. Como sus unidades son las del cuadrado de la variable, se suele usar su raíz cuadrada, como vemos a continuación. Desviación típica.- Se define como la raíz cuadrada positiva de la varianza: k σ = σ 2 = i=1 (x i x) 2 n i Propiedades: 1. La varianza y la desviación típica son sensibles a la variación de cada uno de los valores que toma la variable. Es decir, si una puntuación cambia, también ellas cambiarán. La razón es que la varianza es función de cada uno de los valores x i de la variable. 2. La desviación típica tiene la propiedad de que en el intervalo (x 2σ, x + 2σ) se encuentra, al menos, el 75 % de las observaciones. 3. o es recomendable el uso de ninguno de ellas cuando tampoco lo sea el de la media como medida de tendencia central. 15

Coeficiente de variación Estas medidas de dispersión vienen dadas por números concretos (unidades en las que viene medida la variable), por tanto no son útiles para comparar las dispersiones de dos muestras expresadas en unidades diferentes. Por ejemplo, si medimos la masa de dos poblaciones, pero una de ellas la medimos en kilogramos (para una población de felinos) y otra en miligramos (para una población de hormigas) se tiene que habrá una diferencia enorme entre las medias de ambas poblaciones. También puede ocurrir que queramos comparar dos variables distintas, como el peso y la altura de una población de elefantes. Para esos casos utilizaremos medidas de dispersión dadas por números abstractos. Coeficiente de variación de Pearson.- Elimina la dimensionalidad de las variables, y tiene en cuenta la proporción existente entre medias y desviación típica. Viene dado por Propiedades: C.V. = σ x 1. Sólo se debe calcular para variables con todos los valores positivos. Todo índice de variabilidad debe ser no negativo. Sólo trabajamos con variables positivas para tener la seguridad de que x > 0. 2. Este coeficiente no puede hallarse si x = 0. 3. Este coeficiente a veces aparece multiplicado por 100. 4. o es invariante frente a cambios de origen. Es decir, si a los resultados de una medida le sumamos una cantidad positiva, b > 0, para tener Y = X + b, entonces C.V. Y < C.V. X. 5. Es invariante a cambios de escala. Así por ejemplo el coeficiente de variación de una variable medida en kilogramos es una cantidad adimensional, que no cambiará si la medición se realiza en miligramos. 16

Tipificación.- Este proceso consiste en restar la media x y dividir por su desviación típica σ a una variable dada X. Así se obtiene una nueva variable Z = X x σ de media z = 0 y desviación típica σ Z = 1 denominada variable tipificada. La variable tipificada Z carece de unidades, y permite comparar medidas que no son directamente comparables. Por ejemplo, nos podemos preguntar si un elefante es más grueso que una hormiga determinada, cada uno en relación a su población. Los coeficientes de variación sirven para comparar las variabilidades de dos conjuntos de valores (muestras o poblaciones), mientras que si queremos comparar dos individuos de cada uno de estos conjuntos, es necesario usar los valores tipificados. 6. Medidas de asimetría y apuntamiento Estudiamos ahora cómo saber si los datos que tenemos están distribuidos de forma simétrica son respecto a un valor central, o bien si la gráfica que representa la distribución de frecuencias no es simétrica. En caso de tener una distribución simétrica, cabe preguntarnos si la distribución es más o menos apuntada (larga y estrecha). Este apuntamiento lo mediremos comparando con cierta distribución de frecuencias que se considera normal. 1. Asimetría Distribuciones simétricas.- Una distribución de frecuencias es simétrica cuando valores equidistantes de un valor central tienen las mismas frecuencias. Un buen candidato para ese valor central es la mediana, ya que para variables continuas divide al histograma de frecuencias en dos partes de igual área. 17