Módulo de Estadística

Documentos relacionados
ESTADÍSTICA DESCRIPTIVA

Estadística Aplicada. Tema 2: Estadísticos. Universidad Autónoma de Cd. Juarez Tema 2: Estadísticos 1

Estadística Descriptiva. Tema 1: Estadísticos 1

Estadística. Tema 2: Estadísticos. Dagoberto Salgado Horta Tema 2: Estadísticos 1

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

ESTADÍSTICA Camerina Laura Ramírez Gallegos

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

CLASIFICACIÓN DE LA ESTADÍSTICA

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

LECCIÓN PÚBLICA. Tema 2 Medidas de Tendencia Central, Posición y Variabilidad. Profa. María Fátima Dos Santos

Análisis Exploratorio de Datos Resumen gráfico y numérico

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

Técnicas Cuantitativas para el Management y los Negocios

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Tema 2: Estadísticos

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

Estadística Descriptiva 2da parte

Estadística Descriptiva

Análisis descriptivo y exploratorio de datos

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

Tema 3: Estadística Descriptiva

Estadística Básica 1er Cuatrimestre 2012

Estadística Descriptiva en SPSS

Estadística aplicada a la comunicación

CLASE 2 INTRODUCCION A LA ESTADISTICA

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Julio Deride Silva. 18 de agosto de 2010

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Análisis descriptivo y exploratorio de datos

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

Estadísitica. Dagoberto Salgado Horta Estadístico

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Estadística I Tema 2: Análisis de datos univariantes

Medidas Descriptivas Numéricas

Universidad Nacional Autónoma de Nicaragua UNAN-Managua. Curso de Estadística. UNIDAD I Estadística Descriptiva

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2011

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Parámetros y estadísticos

Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Estadística aplicada al Periodismo

Guía de Matemática Cuarto Medio

Estadística con R. Nivel Básico

Tema 1 Estadística descriptiva: Medidas de posición

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

ESTADÍSTICA DESCRIPTIVA

Unidad 4 Análisis y aplicación de las medidas de tendencia central, variabilidad, ubicación y forma.

Estadística Descriptiva 2da parte

Estadística Aplicada

Instrumentos y matriz de datos

UNIDAD 8. ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS CON LA HOJA DE CÁLCULO EXCEL

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

ANÁLISIS DE DATOS UNIDIMENSIONALES

LABORATORIO DE REFUERZO PRIMER PARCIAL (2015) GANARE MI PRIMER PARCIAL (UNIREFORZANDO)

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

ESTADÍSTICA 1.- NOCIONES GENERALES

Bioestadística: Estadística Descriptiva

Recordando las medidas de tendencia central, de dispersión y de la forma

DESCRIPCIÓN DE DATOS. Medidas Numéricas

Estadística UNIDAD DOS ESTADÍSTICA

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

ESTADÍSTICA DESCRIPTIVA

Probabilidad y Estadística, EIC 311

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

TEMA 5 Estadística descriptiva. Análisis de datos

RELACIÒN ENTRE LOS PROMEDIOS

2.2: Resumen numérico

UNIDAD 7 Medidas de dispersión

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

Estadísticas aplicadas a la. Javier Toro, Ph.D. Psicólogo Clínico

RELACIÓN 1. DESCRIPTIVA

Estadística Descriptiva

Dr. Abner A. Fonseca Livias

3.2. Desviación Media

Metodología de la Investigación. Conceptos Básicos de Estadística

Estudios estadísticos. a) Crea la tabla de frecuencias absolutas y acumuladas correspondiente. Ten en cuenta

Transcripción:

Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1

Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen o resuman las distribuciones de frecuencias Las medidas de dispersión. Estudian lo concretada que está la distribución de datos entorno a algún promedio. Las medidas de asimetría tienen como finalidad el elaborar un indicador que permita establecer el grado de simetría (o asimetría) que presenta una distribución sin necesidad de una representación gráfica. Tema 2: Estadísticos 2

Un brevísimo resumen sobre medidas Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Centralización Cuantiles, percentiles, cuartiles, deciles,... Indican valores con respecto a los que los datos parecen agruparse. Dispersión Media (promedio), mediana y moda Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Forma Asimetría Desviación típica, coeficiente de variación, rango, varianza Apuntamiento o curtosis Tema 2: Estadísticos 3

Medidas de posición Se define el cuantil de orden como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada Casos particulares son los percentiles, cuartiles, deciles, quintiles,... Tema 2: Estadísticos 4

Medidas de posición Percentil de orden k = cuantil de orden k/100 La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85% Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75 Tema 2: Estadísticos 5

Ejemplos El 5% de los recién nacidos tiene un peso demasiado bajo. Qué peso se considera demasiado bajo? Percentil 5 o cuantil 0,05 Percentil 5 del peso frecuencia 0 5 10 15 20 25 1 2 3 4 5 Peso al nacer (Kg) de 100 niños Tema 2: Estadísticos 6

Ejemplos Qué peso es superado sólo por el 25% de los individuos? Percentil 75 o tercer cuartil Percentil 75 del peso frecuencia 0 5 10 15 20 25 30 50 55 60 65 70 75 80 85 Peso (Kg) de 100 deportistas Tema 2: Estadísticos 7

Ejemplos El colesterol ( mg/100ml) se distribuye simétricamente en la población. Supongamos que se consideran patológicos los valores extremos. El 90% de los individuos son normales Entre qué valores se encuentran los individuos normales? Percentiles 5 y 95 frecuencia 0 5 10 15 20 180 200 220 240 260 Colesterol en 100 personas Tema 2: Estadísticos 8

Ejemplos Entre qué valores se encuentran la mitad de los individuos más normales de una población? Entre el cuartil 1º y 3º Percentiles 25 y 75 frecuencia 0 5 10 15 20 150 160 170 180 190 Altura (cm) en 100 varones Tema 2: Estadísticos 9

Diagramas de Tukey (1997) Resumen con 5 números: Mínimo, cuartiles y máximo. Suelen dar una buena idea de la distribución. La zona central, caja, contiene al 50% central de las observaciones. Su tamaño se llama rango intercuartílico (R.I.) densidad 0.00 0.02 0.04 0.06 0.08 Diagrama de cajas de Tukey: Resumen en 5 números Mín. P 25 P 50 P 75 Máx. 40 45 50 55 60 65 Velocidad (Km/h) de 200 vehículos en ciudad Diagrama de cajas de Tukey: Resumen en 5 números Es costumbre que los bigotes, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I. Más allá de esa distancia se consideran anómalas, y así se marcan. densidad 0.00 0.01 0.02 0.03 0.04 Mín. P 25 P 50 P 75 Máx. 80 90 100 110 120 130 140 Velocidad (Km/h) de 200 vehículos en autovía Tema 2: Estadísticos 10

Medidas de centralización Media ( mean ) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral. Media de 2,2,3,7 es (2+2+3+7)/4=3,5 Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos. Centro de gravedad de los datos Mediana ( median ) Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales. Mediana de 1,2,4,5,6,6,8 es 5 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5 Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7! Moda ( mode ) Es el/los valor/es donde la distribución de frecuencia alcanza un máximo. El valor que mas se repite Tema 2: Estadísticos 11

Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa. Medidas de dispersión Amplitud o Rango ( range ): Diferencia entre observaciónes extremas. 2,1,4,3,8,4. El rango es 8-1=7 Es muy sensible a los valores extremos. Rango intercuartílico ( interquartile range ): Es la distancia entre primer y tercer cuartil. Rango intercuartílico = P 75 - P 25 Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores. 0.00 0.01 0.02 0.03 0.04 0.05 Mín. P 25 P 50 P 75 Máx. 25% 25% 25% 25% Rango intercuartílico Rango 150 160 170 180 190 No es tan sensible a valores extremos. Tema 2: Estadísticos 12

Varianza S 2 ( Variance ): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. S 2 1 ( x i x) n i 2 Es sensible a valores extremos (alejados de la media). Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un principiante. Desviación típica ( standard deviation ) Es la raíz cuadrada de la varianza S S 2 Tiene las misma dimensionalidad (unidades) que la variable. Versión estética de la varianza Tema 2: Estadísticos 13

Coeficiente de variación Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. CV s x (x100 ) Tema 2: Estadísticos 14

Apuntamiento o curtosis La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional. Platicúrtica (aplanada): curtosis < 0 Mesocúrtica (como la normal): curtosis = 0 Son de especial interés las mesocúrticas y simétricas (parecidas a la normal). Leptocúrtica (apuntada): curtosis > 0 Aplanada Apuntada como la normal Apuntada 0.0 0.5 1.0 1.5 2.0 xs 57 % 0.0 0.1 0.2 0.3 x s 68 % 0.0 0.2 0.4 0.6 0.8 x s 82 % 0.0 0.2 0.4 0.6 0.8 1.0-3 -2-1 0 1 2 3-2 -1 0 1 2 Tema 2: Estadísticos 15

Asimetría o Sesgo Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha. En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución. La media tiende a desplazarse hacia las valores extremos (colas). Las discrepancias entre las medidas de centralización son indicación de asimetría. Tema 2: Estadísticos 16

Asimetría o Sesgo Asimétrica negativa izquierda asimetría (As) < 0 Simétrica (como la normal): asimetría (As) = 0 Asimétrica positiva derecha asimetría (As) > 0 Tema 2: Estadísticos 17