Estadística Descriptiva

Documentos relacionados
INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Estadística Descriptiva 2da parte

Estadística Inferencial. Estadística Descriptiva

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Módulo de Estadística

ESTADÍSTICA DESCRIPTIVA

El Método Científico. Metodología de Investigación. Te sifón Parrón

Tema 1: Análisis de datos univariantes

Estadística. Análisis de datos.

Tema 3: Estadística Descriptiva

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

Estadística ESTADÍSTICA

Julio Deride Silva. 18 de agosto de 2010

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Conceptos de Estadística

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

CLASIFICACIÓN DE LA ESTADÍSTICA

Estadística I Tema 2: Análisis de datos univariantes

Técnicas Cuantitativas para el Management y los Negocios

ESTADÍSTICA UNIDIMENSIONAL

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

2 Pasos en un estudio estadístico.

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

Estadística aplicada a la comunicación

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

1 POBLACIÓN Y MUESTRA

ESTADÍSTICA. Rincón del Maestro:

Una vez que tenga la información de la muestra ordenada, se pueden emitir conclusiones finales.

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ESTADÍSTICA Camerina Laura Ramírez Gallegos

Estadística. Tema 2: Estadísticos. Dagoberto Salgado Horta Tema 2: Estadísticos 1

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Estadística Básica 1er Cuatrimestre 2012

Estadística unidimensional

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Bioestadística: Estadística Descriptiva

ESTADÍSTICA. A su vez, las variables pueden ser :

Apuntes de Estadística

Variables y Elementos medibles en Estadísticas

Estadística. Conceptos de Estadística Descriptiva

ESTADÍSTICA 1.- NOCIONES GENERALES

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

Estadística Descriptiva. Tema 1: Estadísticos 1

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

UNIDAD 8. ESTADÍSTICA

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Estadística Descriptiva

Estadística Aplicada. Tema 2: Estadísticos. Universidad Autónoma de Cd. Juarez Tema 2: Estadísticos 1

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Tema 9: Estadística descriptiva

ESTADÍSTICA. 1. Introducción. 2. Frecuencias

REPASO DE ESTADÍSTICA DESCRIPTIVA

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Tabla de frecuencias agrupando los datos Cuando hay muchos valores distintos, los agruparemos en intervalos (llamados clases) de la misma amplitud.

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

Tema 1. Estadística Unidimensional

Análisis descriptivo y exploratorio de datos

Análisis Exploratorio de Datos Resumen gráfico y numérico

ESTADÍSTICA CON EXCEL

Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas.

Fundamentos de Estadística y Simulación Básica

ESTADÍSTICA DESCRIPTIVA

Análisis descriptivo y exploratorio de datos

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

ÁREAS DE LA ESTADÍSTICA

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

Estadística. 1. Conceptos de Estadística. 2. Variable estadística. 3. Tablas de estadística. 4. Diagrama de barras y polígonos de frecuencias.

Estadística Descriptiva en SPSS

Unidad I: Descripción y gráficos estadísticos

Metodología de la Investigación. Conceptos Básicos de Estadística

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

TEMA 11. ESTADÍSTICA

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados.

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

Estadística para el análisis de los Mercados S2_A1.1_LECV1

ESTADÍSTICA I. Dr. Favio Murillo García

+ f 2. + f 3. p i. =h i 100. F i. = f i. H i. = h i. P i. = p i

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Clase 2. Tema 2. Medidas de posición

TEMA 5 Estadística descriptiva. Análisis de datos

Exploración de datos

Estadística Aplicada a la Educación

2.3. Estadísticos de posición

Fase 2. Estudio de mercado: ESTADÍSTICA

TEMA 7. ESTADÍSTICA. INDIVÍDUO: Es cada uno de los elementos que forman la población o la muestra.

Capítulo 1 Probabilidades y Estadística

Estadística. Introducción a la Estadística Descriptiva. Área de Matemática Cerp Florida Reforma de Ed. Inicial y Primaria,

Transcripción:

Estadística Descriptiva 1

Qué veremos 1. OBJECTIVOS DEL CURSO. DEFINICIONES IMPORTANTES 2. TIPOS DE VARIABLES 3 5 1. Estadísticos de tendencia central 2. Estadísticos de posición 3. Estadísticos de variabilidad/dispersión 4. Estadísticos de forma 3. RESUMENES DE VARIABLES 1. Numéricos 2. Gráficos 4. Ejemplos y ejercicios 2

OBJETIVOS Hacer una aproximación a conceptos clave de la Estadística. Explicar los diferentes tipos de análisis, variables y otros conceptos importantes. Aprender a hacer un resumen estadístico descriptivo de un conjunto de datos. Aprender a implementar los estadísticos descriptivos con R i R- Commander. 3

DEFINICIONES IMPORTANTES Población: La población representa el conjunto grande de individuos que se quiere estudiar y que generalmente suele ser inaccesible. Muestra: Es un subconjunto de la población al que se tiene acceso y sobre el que se hacen las observaciones. Esta muestra debería ser representativa de la población original (cualquier individuo tiene las mismas oportunidades de ser seleccionado). Individuo: Cada uno de los componentes de la población y de la muestra. Variables: Son una característica observable que varía entre los diferentes individuos de una población. Es lo que se estudia de cada individuo (altura, pes, sexo, ). Datos: Los valores que toman les variables en cada caso. 4

PASOS A SEGUIR EN UN ESTUDIO ESTADÍSTICO 1. Plantear hipótesis sobre una población Los hombres tienen más problemas con el colesterol que las mujeres. 2. Decidir que datos recoger (diseño de experimentos) Que individuos formarán parte del estudio (muestras) Hombres y mujeres de 30-40 años Que datos recoger de los individuos (variables) Sexo? Sector laboral? Actividad física? 3. Recoger los datos 4. Describir (resumir) los datos obtenidos Nivel medio de colesterol en sangre (estadísticos) % de hombres con problemas de arterioesclerosis (frecuencias-gráficos) 5. Realizar una inferencia sobre la población Los hombres tienen un 10% más de colesterol de media que las mujeres 6. Cuantificar la confianza en la inferencia Nivel de confianza del 95% 5

TIPOS DE VARIABLES Variables Cuantitativas: Son las variables que pueden medirse, cuantificarse o expresarse numéricamente. Tiene sentido hacer operaciones algebraicas con ellas. Variables cuantitativas continuas: pueden tomar cualquier valor dentro de un rango numérico determinado (edad, peso, altura, ) Variables cuantitativas discretas: no pueden tomar cualquier valor dentro de un rango. Normalmente suelen ser valores sin decimales. (nº de hijos, nº de partes, nº de hermanos ) Variables cualitativas: representan una cualidad o un atributo que clasifica cada caso en una de varias categorías. No tiene sentido hacer operaciones algebraicas con ellas. dos grupos : hombre/mujer, enfermo/sano, Con más categorías (color de los ojos, grupo sanguíneo,..). Se pueden utilizar dos escalas: Nominales: categorías que no mantienen una relación de orden entre ellas Ordinales: Existe orden o jerarquía entre cada categoría 6

MEDIDAS DESCRIPTIVAS. En las variables numéricas nos podemos encontrar con un elevado número de valores observados diferentes Se ha de definir un método de análisis que responda a: Alrededor de que valor se agrupan los datos? Como se agrupan? Muy concentrados? Muy dispersos? Que forma tiene la población? Medidas de tendencia central: responden a la primera pregunta (media) Medidas de posición y dispersión: responden a la segunda pregunta (varianza) Medidas de forma: responden a la tercera pregunta (coeficiente de asimetría) 7

MEDIDAS DESCRIPTIVAS. MEDIDAS DE TENDENCIA CENTRAL Son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse. MEDIA. Es la media aritmética de los valores de una variable. Se calcula realizando la suma de los valores y dividiendo por el tamaño muestral. Propiedades: Muy influenciada por los valores extremos (pueden hacer desplazar la media). No recomendable utilizarla en el caso de distribuciones asimétricas. Muy útil cuando los valores se concentran simétricamente con respecto a este valor. 8

MEDIDAS DESCRIPTIVAS. MEDIDAS DE TENDENCIA CENTRAL Otros tipos de medias que se pueden encontrar: Media geométrica: Media harmónica: Media cuadrática: 9

MEDIDAS DESCRIPTIVAS. MEDIDAS DE TENDENCIA CENTRAL MEDIANA: Es la observación que divide los valores en dos, una vez ordenados, dejando el 50% por debajo suyo y el 50% por encima. Propiedades : No está afectada por las observaciones extremas. Depende del orden, no de los valores Útil en distribuciones asimétricas Relación entre media y mediana: 10

MEDIDAS DESCRIPTIVAS. MEDIDAS DE TENDENCIA CENTRAL MODA(S): Es/Son aquellos valores que presentan una mayor frecuencia. Propiedades: Fácil de calcular Puede no ser única Ejemplo: 62 75 11 20 75 44 5 Media = 41.7 Moda = 75 Mediana = 44 11

MEDIDAS DESCRIPTIVAS. MEDIDAS DE POSICIÓN Son valores de la variable caracterizados por superar un determinado tanto per ciento de observaciones en la población (o muestra). Según las unidades en que agrupamos los %s encontramos percentiles (1%) deciles (10%) o cuartiles (25%). PERCENTIL: Por variable discreta se define el percentil de orden K como la observación, P k que deja por debajo suyo el K% de la población. Propiedades : Mediana = P 50 Peso 12

MEDIDAS DESCRIPTIVAS. MEDIDAS DE POSICIÓN CUARTILES: Dividen la muestra en cuatro grupos con frecuencias similares. Son un caso particular de los percentiles. Propiedades : Primer cuartil (Q 1 ) = P 25 Segundo cuartil (Q 2 ) = P 50 = Mediana Tercer cuartil (Q 3 ) = P 75 DECILES: Dividen las observaciones en 10 grupos del mismo tamaño. Propiedades : Se define: D 1, D 2,. D 9 como: D 1 = P 10, donde i = 1, 9 13

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN Miden el grado de dispersión (variabilidad) de los datos independientemente de su origen. RANGO: Se obtiene restando el valor más pequeño de un conjunto de observaciones del valor más alto. Propiedades : Es fácil de calcular. Solo utiliza dos observaciones para su cálculo Puede estar muy afectado por observaciones extremas El rango aumenta con el número de observaciones o se puede Ejemplo: quedar igual, pero nunca disminuye 2,1,4,3,8,4 El rango es 8-1=7 14

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN VARIANZA: Mide el promedio de las desviaciones de cada observación respecto a la media, al cuadrado. Propiedades : Siempre es positiva Sensible a valores extremos. Ejemplo: 15, 21, 32, 59, 60,60, 61, 64, 71, 80 S 2 = (15-52.3) 2 +(21-53.2) 2 + + (80-52.3) 2 = 427.61 10 15

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN DESVIACIÓN TÍPICA O ESTANDAR: Es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en les mismas unidades que la media de la variable. Ejemplo: 15, 21, 32, 59, 60,60, 61, 64, 71, 80 S 2 = 427.61 S = 20.68 16

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN Algunas características de la varianza y de la desviación estandar: Cuando los datos estén muy alejados de la media, el numerador será muy grande la varianza y la desviación también lo serán. Al aumentar el tamaño de la muestra varianza y desviación Cuando todos los valores son iguales, la varianza y la desviación = 0 Para su cálculo se utilizan todos los datos de la distribución Cualquier cambio de valor será detectado 17

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN COEFICIENTE DE VARIACIÓN: Es una variable adimensional que resulta muy útil para comparar dos variables. Un valor elevado indica menor homogeneidad, mayor dispersión o variabilidad. Propiedades : Solamente se puede calcular con variables con valores positivos. Todo índice de variabilidad es esencialmente no negativo. Es invariante a cambios de escala Normalmente se expresa en % 18

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN Ejemplo: Peso de 5 pacientes (70,60,56,83,79 Kg) X = 69.6 Kg s = 10.44 Tensión arterial de 5 pacientes (150,170,135,180,195 mmhg) X = 166 mmhg s = 21.3 Que distribución es más dispersa? Peso o tensión arterial? s PES < s TA No correcto porque tienen escalas de medida diferentes Calculamos CV CV PES = 15% CV TA = 12.8% 19

MEDIDAS DESCRIPTIVAS. MEDIDAS DE VARIABILIDAD O DISPERSIÓN TIPIFICACIÓN: Es una transformación de una variable que consiste en restar a cada valor la media y dividirlo por su desviación típica. La nueva variable obtenida se llama z-score Propiedades : Permite hacer comparables dos medias que en principio no lo son. A diferencia de los CV (que permiten comparar variabilidades de dos poblaciones) les variables tipificadas, sirven para comparar a dos individuos de cada uno de los dos conjuntos. 20

MEDIDAS DESCRIPTIVAS. MEDIDAS DE ASIMETRIA/FORMA Nos permiten saber si los datos se distribuyen de forma simétrica respecto a un valor central o si la gráfica de la distribución de les frecuencias es de una forma diferente por el lado derecho que por el lado izquierdo. ASIMETRIA: Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha. Propiedades: En las distribuciones simétricas, media y mediana coinciden. La asimetría es positiva o negativa en función de hacia que lado se encuentra la cola de la distribución. Positiva : Si les frecuencias más altas se encuentran en el lado izquierdo de la media. En el lado derecho hay frecuencias más bajas. Negativa: Cuando la cola está en el lado izquierdo. La discrepancia entre las medidas de centralización son indicación de asimetría. 21

MEDIDAS DESCRIPTIVAS. MEDIDAS DE ASIMETRIA/FORMA 22

MEDIDAS DESCRIPTIVAS. MEDIDAS DE ASIMETRIA/FORMA CURTOSIS: Medida del grado de aplastamiento de una distribución respecto a la distribución normal o gaussiana. 23

RESUMENES ESTADISTICOS. Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Les dos exponen de manera ordenada la información recogida de una muestra. Género Hombre 4 Frec. 7 6 5 4 3 Mujer 6 2 1 0 Hombre Mujer 24

RESUMENES ESTADISTICOS. NUMERICOS: TABLAS DE FRECUENCIAS TABLAS DE FRECUENCIAS: Exponen la información recogida de la muestra, de manera que no se pierda nada de información. Frecuencias absolutas: contabilizan el número total de individuos de cada modalidad. Frecuencias relativas: frecuencias absolutas divididas por el total de individuos Frecuencias acumuladas absolutas: se calculan sobre variables cuantitativas. Frecuencias acumuladas relativas: se calculan sobre variables cuantitativas 25

RESUMENES ESTADISTICOS. NUMERICOS: TABLAS DE FRECUENCIAS Tabla estadística: 26

frecuencias RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUALITATIVAS. DIAGRAMA DE BARRAS: En el eje de ordenadas se representan las modalidades y en el eje abscisas las frecuencias absolutas o las relativas. A B C D 27

RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUALITATIVAS. Cuando intentamos comparar dos poblaciones: (si el tamaño es diferente es mejor utilizar frecuencias relativas) Frecuencias relativas Solteros casados divorciados viudos 28

RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUALITATIVAS. DIAGRAMA DE SECTORES: Se divide un círculo en tantas porciones como clases existan, de manera que a cada clase le corresponda una porción del círculo proporcional a su frecuencia absoluta o relativa. s s s s 29

RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUALITATIVAS. PICTOGRAMAS: Se expresan con dibujos alusivos al tema de estudio les frecuencias de las modalidades de la variable. La escala de cada dibujo ha de ser tal que el área de cada uno de ellos ha de ser proporcional a la frecuencia de la modalidad que representa. Utilizados por los medios de comunicación porque pueden ser rápidamente entendidos per un público no especializado. Botellas de cerveza recogidas Ciudad A Ciudad B 30

frecuencias RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUANTITATIVAS. DISCRETAS. DIAGRAMA DE BARRAS. Las barras son estrechas y están separadas para indicar que la variable solo puede tomar unos valores definidos. Frec. absolutas / relativas Frec. acumuladas 31

frecuencias RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUANTITATIVAS. CONTINUAS. HISTOGRAMAS. El histograma se construye a partir de una tabla estadística, representando sobre cada intervalo un rectángulo que tiene este segmento como base. El criterio para calcular la altura de cada intervalo es el de mantener la proporcionalidad entre les frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos. PESO de 20 individuos PESO 32

RESUMENES ESTADISTICOS. GRAFICOS. VARIABLES CUANTITATIVAS. CONTINUAS. DIAGRAMA DE TALLO Y HOJAS. Los números que se ponen a la izquierda del carácter son los dígitos más significativos de cada intervalo, y a la derecha se ponen los dígitos particulares de cada dato. 22,22,23,24 31,31,32,33,34 45,45,45,47,48 33

Edad (años) RESUMENES ESTADISTICOS. GRAFICOS. VALORES ATÍPICOS DIAGRAMA DE CAJAS O BOXPLOT. Es la forma gráfica de representar los cinco números : la caja son percentiles 25 i 75, la línea que está en la mitad es la mediana (percentil 50) y los extremos son los valores mínimo y máximo. percentil 75 media mínimo percentil 25 34

RESUMENES ESTADISTICOS. GRAFICOS. VALORES ATÍPICOS El diagrama de cajas es una forma rápida de identificar los valores atípicos de la muestra (pueden no ser outliers ) energía calcio Proteínas Hierro Vit C Nutrientes 35