Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA



Documentos relacionados
4. Medidas de tendencia central

Medidas de Dispersión

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

2.5. Asimetría y apuntamiento

Nociones de Estadística Descriptiva. Medidas de tendencia central y de variabilidad

EJERCICIOS RESUELTOS TEMA 7

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

Estadística descriptiva. Representación de datos descriptivos

1º BACH CCSS - MATEMÁTICAS - PROBLEMAS DE ANÁLISIS ESTADÍSTICO DE UNA VARIABLE ˆ EJERCICIO 25

Estadística Descriptiva. SESIÓN 12 Medidas de dispersión

Tema 2: Estadísticos

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

b) Haz otra distribución en 12 intervalos de la amplitud que creas conveniente.

TEMA 3. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

Medidas de Variabilidad

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

MEDIDAS DE ASIMETRÍA Y CURTOSIS EMPLEANDO EXCEL

CUADERNO DE EJERCICIOS

TEMAS SELECTOS DE MATEMÁTICAS II

Estadística. Estadística

IMADIL /10/2014

SESIÓN 5 RELACIÓN ENTRE LOS VALORES NUMÉRICOS

7. Distribución normal

Tema 3. Introducción a la estadística descriptiva: Ejercicios

MEDIDAS DE DISPERSIÓN

Selectividad Junio 2007 JUNIO 2007

Estadística: Medidas de dispersión: varianza, desviación media y estándar

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

Estadística para el análisis de los Mercados S2_A1.1_LECV1

Medidas de dispersión

3. Análisis univariable y bivariable

Tema 3. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DE LOCALIZACIÓN

Práctica 2 Estadística Descriptiva

Definiciones generales

Estadística Empresarial. Cuaderno de Ejercicios. Temas 2. Análisis estadístico de una variable: medidas de posición y medidas de dispersión

Datos de tipo cuantitativo

Distribuciones bidimensionales. Regresión.

TEMA 3 MEDIDAS DE DISPERSIÓN Y VARIABILIDAD

Estadística Avanzada y Análisis de Datos

a).- Si el número de los valores en un conjunto de datos no agrupados es impar, La mediana es determinada de la siguiente manera:

2. FRECUENCIAS Distribución de Frecuencias.

CONCEPTOS BÁSICOS DE ESTADÍSTICA

UNIDAD IV MEDIDAS DE DISPERSIÓN

Estadística Descriptiva 2da parte

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

5 Relaciones entre variables.

LA DISTRIBUCIÓN NORMAL

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Documento elaborado por: Francisco Javier Rodríguez Cortés Matemático Facultad de Ciencias Exactas - Universidad de Antioquia INTRODUCCIÓN

3. VARIABLES ALEATORIAS

Estadística Descriptiva 2da parte

Preguntas más Frecuentes: Tema 3

Capítulo 1. El caso del Método de Pesada

UNIDAD I. ESTADISTICA

Tema 1 ESTADÍSTICA DESCRIPTIVA

Unidad Didáctica VII: Estadística Descriptiva Unidimensional

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Tema 5: Principales Distribuciones de Probabilidad

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

Estadística Básica 1er Cuatrimestre 2012

ANÁLISIS ESTADÍSTICO. Estadística descriptivos: Tablas, gráficos, estadísticos descriptivos. Jorge Fallas

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Matemáticas y Estadística para Finanzas Prof.: H. Ernesto Sheriff, PhD(c) M.Sc.

Polinomios. 1.- Funciones cuadráticas

Guía de Matemática Cuarto Medio

Introducción. NOMBRE DEL COLEGIO (6º E. PRIMARIA) Página: 1

RELACIÒN ENTRE LOS PROMEDIOS

ESTADÍSTICA DESCRIPTIVA

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

BASES ESTADÍSTICAS APLICADAS A LA PREVENCIÓN

UNIDAD 2 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN. Germán E. Rincón

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Propiedades de la distribución «Normal»

Tema 3: Estadística Descriptiva

DISTRIBUCIONES DE PROBABILIDAD

ESTADÍSTICA BÁSICA Dirección Redes en Salud Pública

Estadística ESTADÍSTICA

Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual.

UNIDAD Nº2 MEDIDAS DE TENDENCIA CENTRAL

La distribución Normal

CATEDRA DE EPIDEMIOLOGÍA

Distribución Normal Curva Normal distribución gaussiana

FRECUENCIA. x = f i x i f i = = 4, Me = 4

Probabilidad y Estadística

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Anexo C. Introducción a las series de potencias. Series de potencias

SEGUNDA UNIDAD ESTADÍSTICA Y PROBABILIDADES MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

ESTADISTICA POR REGLA DE TRES

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Teoría de la decisión Estadística

Unidad III Variables Aleatorias Unidimensionales

CAPÍTULO V DEFINICIÓN DE LOS SISTEMAS DE MEDICIÓN

Sucesiones. Se llama sucesión a un conjunto de números dispuestos uno a continuación de otro.

Estadística Manual de teoría y problemas

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Transcripción:

1. INTRODUCCIÓN En el tema 1 veíamos que la distribución de frecuencias tiene tres propiedades: tendencia central, variabilidad y asimetría. Las medidas de tendencia central las hemos visto en el tema 2, ahora vamos a ver las medidas de las otras dos propiedades (variabilidad y asimetría). 2. MEDIDAS DE VARIABILIDAD La variabilidad o dispersión hace referencia al grado de variación que hay en un conjunto de puntuaciones (ejemplo de gráficos con más y menos dispersión Pág. 92) Cuanto menor es la variabilidad en una distribución, más homogénea es la muestra de sujetos en la variable que estamos midiendo. El caso extremo de máxima homogeneidad es que todos los valores serían iguales entre sí y no habría variabilidad. Para cuantificar la dispersión de los datos se distinguen 2 tipos de índices: - Los que miden el grado en que las puntuaciones se asemejan o diferencian entre sí: Amplitud total o rango y amplitud semi-intercuartil - Los que la dispersión de mide con respecto a alguna medida de tendencia central como la media aritmética: Varianza y desviación típica. Amplitud total o rango La amplitud total, (A T ) de un conjunto de puntuaciones es la distancia que hay en una escala numérica entre los valores que representan la puntuación máxima y la puntuación mínima. (ejemplo en página 94, muy fácil. Hay que tener en cuenta lo que eran los límites exactos, superior e inferior, que vimos en el primer tema) A T = X max X min Sin embargo esta medida sólo aporta datos de los valores extremos, pero no nos dice la poca o mucha dispersión que pueda existir en el resto de valores. Varianza y desviación típica La medida de variabilidad también se puede basar en la distancia observada entre las puntuaciones y la media aritmética. Por lo tanto: - Una distribución con poca variabilidad es aquella en la que la mayoría de las puntuaciones están muy próximas a la media. - Una distribución con mucha variabilidad tiene sus puntuaciones muy alejadas del valor medio de la variable.

Aquí utilizaremos un índice llamado desviación media: DM = Σ IX i - XI / n El libro dice que este índice se utiliza muy poco en la actualidad y que apenas existen técnicas estadísticas basadas en este índice. Sin embargo conviene que lo estudiemos en profundidad no vaya a ser que en los próximos años se convierta en una herramienta completamente fundamental y necesaria para desarrollar la profesión de psicólogo. La varianza de un conjunto n de puntuaciones en una variable X denotada por S 2 x, se define como el promedio de los cuadrados de las desviaciones de las puntuaciones con respecto a la media. S 2 x = Σ (X i - X) 2 / n Esta otra fórmula sirve para lo mismo: S 2 x = (ΣX 2 i / n) X 2 Aunque supongo que a estas alturas todo el mundo lo sabrá, pero estas fórmulas están en la Addenda y nos dejan tenerla con nosotros durante el examen. Cuando los datos se presentan en tablas de distribución de frecuencias, agrupados o sin agrupar en intervalos, la varianza se puede calcular con las siguientes fórmulas. S 2 x = Σn i (X i - X) 2 / n (para frecuencias absolutas) S 2 x = Σn i X 2 i / n) X 2 (para frecuencias absolutas) n = número total de observaciones (como siempre) X i = es el valor i de la variable X o el punto medio del intervalo N i = es la frecuencia absoluta del valor o intervalo i Otra fórmula más: S 2 x = Σp i X 2 i - X 2 (para frecuencias relativas) p i = Frecuencia relativa o proporción de observaciones del valor o del intervalo i Ejercicios de ejemplo en la página 98 y 99. - La varianza es un número positivo que se expresa en las unidades de la variable al cuadrado. Si la variable X se mide en metros, la varianza vendrá expresada en metros al cuadrado. Por lo tanto para encontrar una medida de dispersión que tenga las mismas unidades que la variable, debemos hacer la raíz cuadrada de la varianza (para quitarle el cuadrado) y obtener un índice llamado desviación típica.

La desviación típica de un conjunto de n puntuaciones, que se representa pos S X, es la raíz cuadrada de la varianza. Sx = (X i X) 2 n Propiedades de la varianza y la desviación típica - Para calcularlas las dos requieren la utilización de todas las puntuaciones de la distribución. - Las dos miden la variabilidad de los datos con respecto a la media aritmética, por lo que sólo deben aplicarse si estamos utilizando la media como medida central - Siempre son iguales o mayores que 0. - Si a una variable X se le suma o resta una constante a, la varianza y desviación típica de la variable original no se ven afectadas y siguen siendo las mismas. En cambio, cuando multiplicamos los valores de X por una constante b, la varianza queda multiplicada por la constante al cuadrado y la desviación típica por el valor absoluto de dicha constante. Un primo hermano de la varianza y que se utiliza en inferencia estadística es la cuasivarianza: S 2 n-1 = Σ (X i - X) 2 / n - 1 Al igual que ocurría con la varianza normal, en la cuasivarianza también podemos medir la cuasidesviación típica que es la raiz cuadrada de la cuasivarianza (fórmula en 101) 2 S n 1 = (X i X) 2 n 1 Coeficiente de variación Se trata de un índice de variabilidad relativa que no depende de las unidades de medida. CV = (S X /X) 100 Cuando comparamos dos conjuntos de puntuaciones obtenidas de la misma variable, también es necesario el coeficiente de variación para comparar la dispersión de ambas distribuciones Cuidado con el ejemplo 3.5 de la página 102, ya que hay una errata que me ha hecho perder unos cuantos minutos de más (como si me sobraran) En concreto en el enunciado dice y una varianza de 17,3, esto está mal, la varianza es de 16.

Amplitud semi-intercuartil (Q o rango semi-intercuartil) Como hemos dicho antes, este índice se utiliza cuando la distribución es muy asimétrica. Se define como la distancia media entre el tercer y el primer cuartil. No informa de la variabilidad del conjunto de puntuaciones sino del 50% de las mismas comprendidas entre el percentil 25 y el 75 de la distribución. El ejercicio de la página 104-105 que ejemplifica este índice es muy fácil, lo dificil es calcular los percentiles que ya lo vimos en el tema 2. Q = Q Q 1 / 2 = P 75 P 25 / 2 3. INDICE DE ASIMETRÍA DE PEARSON La asimetría es una propiedad de la distribución de frecuencias que nos indica el grado en el que las puntuaciones de los sujetos se reparten por debajo y por encima de la medida de tendencia central. El índice de Pearson es un índice numérico que cuantifica el grado de asimetría de una distribución. A S = X - Mo / S x - Este índice es adimensional (no tiene unidades de medida) y se aplica a distrobuciones unimodales. - Cuando la distrubición es simétrica, la media y la moda coinciden, por lo que el numerador se anula y el valor del índice (A s ) es = 0. - En distribuciones con asimetría positiva, la media es mayor que la moda, por lo tanto A S será mayor que 0. (recordamos que asimetría positiva se produce cuando la mayor cantidad de puntuaciones se concentran en la parte baja de la tabla) - En distribuciones con asimetría negativa, la media es menor que la moda, por lo tanto A S será menor que 0. (la asimetría negativa se produce cuando la mayor cantidad de puntuaciones se sitúa en la parte alta de la tabla) Ejemplo 3.7 en la página 106. Debemos recordar cómo se obteníamos la moda, (Mo), cuando los datos están agrupados en intervalos, la moda es el punto medio del intervalo modal. Y el intervalo modal es el intervalo con la frecuencia máxima, es decir, aquel donde n i es mayor. 4. PUNTUACIONES TÍPICAS Hasta ahora hemos visto puntuaciones directas (nota de un sujeto en un test), sin embargo estas puntuaciones nos dan poca información ya que no sabemos si se trata de un valor alto o bajo, ya que esto depende del promedio del grupo. Si a una puntuación directa X i puntuación diferencial (x i ) le restamos la media de su grupo obtenemos una x i = X i X

Propiedades de las puntuaciones diferenciales - Su media es cero: x = 0 - La varianza de las puntuaciones diferenciales es igual a la varianza de las puntuaciones directas: S 2 x = S 2 x Sin embargo, dos puntuaciones diferenciales idénticas pueden tener un significado muy diferente en función de la media y de la varianza de las distribuciones de las que proceden. Para solucionar este problema tenemos las puntuaciones típicas que nos permiten no sólo comparar las puntuaciones de un sujeto en dos variables distintas sino también comparar dos sujetos distintos en dos pruebas o variables distintas. z x = x / S x = X X / S x Al proceso de obtener puntuaciones típicas se llama tipificación. Por ello estas puntuaciones también se llaman puntuaciones tipificadas. Propiedades de las puntuaciones típicas - Su media es cero: z x = 0/ns x = 0 - Su varianza es igual a 1 S 2 zx = 1 Ejercicio en el ejemplo 3.8 para comprobar estas propiedades.