Estadística Descriptiva



Documentos relacionados
1 Comida Favorita.Cualitativa. 2 Profesión que te gusta.cualitativa. 3 Número de goles marcados por tu equipo favorito en la última

GRADO TURISMO TEMA 2: ANÁLISIS DE DATOS TURÍSTICOS UNIDIMENSIONALES

Otras medidas descriptivas usuales

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

ESTADÍSTICA SEMANA 4

INSTITUCION EDUCATIVA LUIS PATRON ROSANO DOCUMENTO PARA ESTUDIAR LOGROS PENDIENTES DE ESTADISTICA DE 10º

Aplicaciones de Estadística Descriptiva

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

Parámetros y estadísticos

Estadística: conceptos básicos y definiciones.

2 Resolución de algunos ejemplos y ejercicios del tema 2.

Medidas de tendencia Central

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

DIAGRAMAS DE CAJA. Apuntes de Métodos Estadísticos I Prof. Gudberto J. León R. I- 79

Tema 3. Medidas de tendencia central Introducción. Contenido

I. Estadística Descriptiva de una variable

ESTADÍSTICA DESCRIPTIVA CON SPSS

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

15 PARÁMETROS ESTADÍSTICOS

ANÁLISIS DESCRIPTIVO CON SPSS

Población, muestra y variable estadística

Clase 2: Estadística

1. MEDIDAS DE TENDENCIA CENTRAL

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Medidas de tendencia central o de posición: situación de los valores alrededor

Análisis e Interpretación de Datos Unidad XI. Prof. Yanilda Rodríguez MSN Prof. Madeline Fonseca MSN Prof. Reina del C.Rivera MSN

Clase 2: Estadística

Estadística Descriptiva

ESTADÍSTICA DESCRIPTIVA CON MINITAB

1 VARIABLES ESTADÍSTICAS UNIDIMENSIONALES

2. Seleccionar Insertar función:

Análisis estadístico con Microsoft Excel

CUESTIONES DE AUTOEVALUACIÓN (TEMA 1)

Distribución de frecuencias gráficas y tablas

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Medidas de la tendencia central y las gráficas de caja

Estadística descriptiva con Excel (Cálculo de medidas)

UNIDAD III MEDIDAS DE TENDENCIA CENTRAL

Estadística I Ejercicios Tema 3 Curso 2015/16

Tema 2 Estadística Descriptiva

HUMANIDADES Y CIENCIAS SOCIALES BLOQUE III ESTADÍSTICA Y PROBABILIDAD

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Probabilidad y Estadística Fundamental Tarea # 2 Tema: Medidas descriptivas de resumen

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

ESTADISTICA GENERAL INTRODUCCIÓN CONCEPTOS BASICOS ORGANIZACIÓN DE DE DATOS

GUIA DE MANEJO DE EXCEL PARA LA ASIGNATURA ESTADÍSTICA DESCRIPTIVA

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.

CURSO DIPLOMATURA EN CIENCIAS EMPRESARIALES Primer curso. Primer semestre. ANALISIS DESCRIPTIVO DE DATOS ECONOMICOS PROGRAMA:

I1.1 Estudios observacionales IISESIÓN DISEÑO O DE ESTUDIOS EN INVESTIGACIÓN N MÉDICA DESCRIPTIVA CURSO DE. 1.2 Estudios experimentales

Práctica 2. Estadística Descriptiva

CONTENIDOS MÍNIMOS BLOQUE III: ÁLGEBRA

Introducción a MINITAB 15. David R. González Barreto. Ofrecido en Wyeth, Carolina, Puerto Rico

Práctica 2 ESTADÍSTICA DESCRIPTIVA

Tema 7: Estadística y probabilidad

Segunda sesión de contenidos: El cuestionario Vida Académica: Desde las hipótesis al análisis informatizado de los datos.

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

PRESENTACIÓN GRÁFICA DE LOS DATOS

Departamento de Economía Aplicada I ESCUELA UNIVERSITARIA DE ESTUDIOS EMPRESARIALES DIPLOMATURA EN CIENCIAS EMPRESARIALES ESTADÍSTICA

Una forma rápida de ordenar datos numéricos (Diagrama de Tallo y Hoja)

Tema 9: Estadística Descriptiva. Distribuciones estadísticas. Representaciones

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Ejercicio de estadística para 3º de la ESO

Manipulación de vectores en R

Análisis de componentes principales

Tema 4 : Tabulación de datos

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR FACULTAD DE CIENCIAS HUMANAS ESCUELA DE SOCIOLOGÍA Y CIENCIAS POLÍTICAS. Estadística.

Covarianza y coeficiente de correlación

ESTADISTICA DESCRIPTIVA Tablas de frecuencias y gráficos representativos

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

TEMA 7: Análisis de la Capacidad del Proceso

Pruebas de. Hipótesis

CURSO DE ANALISIS DE RIESGOS EN INDUSTRIAS DE PETROLEO Y GAS (OIL & GAS)

Introducción a la Estadística Descriptiva a través de casos reales

1. Análisis de variables cuantitativas (2 a parte)

Muestreo estadístico. Relación 2 Curso

Procesamiento de información para la investigación utilizando el programado Excel recopilados. Los participantes rán en

15 PARÁMETROS ESTADÍSTICOS

USAC FACULTAD DE INGENIERÍA ÁREA DE ESTADÍSTICA Coordinación

Síntesis Numérica de una Variable

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

PRESENTACIÓN, DISCUSIÓN Y ANALISIS DE LOS RESULTADOS

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO MANUAL DE STATGRAPHICS I. INTRODUCCIÓN Y MANEJO DE DATOS

1.1. Introducción y conceptos básicos

Desarrollar y aplicar estrategias para resolver problemas Determinar si un gráfico es lineal dibujando puntos en una situación dada

DISTRIBUCIÓN DE FRECUENCIAS

Datos estadísticos PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS

Anexo 4. Herramientas Estadísticas

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Estadística I. Finanzas y Contabilidad

14 ESTADÍSTICA UNIDIMENSIONAL

Contenido: CARTAS DE CONTROL. Cartas de control C Cartas de control U Cartas de control P Cartas de control NP DIAGRAMA DE PARETTO HISTOGRAMAS

Análisis técnico de una acción: Rentabilidad, riesgo y correlación

MEDIDAS DE POSICIÓN. Cuartiles.

Examen de Matemáticas 2 o de Bachillerato Mayo 2003

15 ESTADÍSTICA BIDIMENSIONAL

todas especialidades Soluciones de las hojas de problemas

SELECCIÓ D ACTIVITATS RESOLTES 4RT ESO MATEMÁTIQUES B

ANÁLISIS ESTADÍSTICO DE DATOS USANDO MINITAB

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

ANALISIS DE DATOS EN PSICOLOGIA I (Grupos 12, 13, 14, 16 y 17) Programa de la asignatura; curso 2006/07

Transcripción:

Estadística Descriptiva 1. El porcentaje de algodón en una tela utilizada para elaborar camisas para hombre se presenta en la siguiente tabla. Calcular los estadísticos más importantes y realícese el histograma de frecuencias. porcentaje de algodón 32.1 32.5 32.6 32.7 32.8 32. 33.1 33.1 33.4 33.5 33.6 33.6 33.6 33.6 33.6 33.8 33.8 34 34.1 34.1 34.1 34.2 34.3 34.3 34.4 34.5 34.5 34.6 34.6 34.6 34.6 34.6 34.7 34.7 34.7 34.7 34.7 34.7 34. 35 35 35.1 35.1 35.1 35.2 35.3 35.4 35.4 35.5 35.6 35.7 35.8 35. 36.2 36.4 36.6 36.8 36.8 36.8 37.1 37.3 37.6 37.8 37. (a) Diseñar la distribución de frecuencias con un cambio de variable. (b) Calcular los estadísticos: media, moda, mediana, Q 1, Q 3, c 0.6, varianza y desviación típica. (c) A partir del diagrama anterior determinar la mediana, el primer cuartil y el tercer cuartil y compárese los resultados con los obtenidos a partir de la distribución de frecuencias. (d) Representar los histogramas de frecuencias absolutas y acumuladas. (e) Representar el diagrama de caja y determinar los valores extremos. 2. La siguiente tabla registra en diferentes horas la temperatura (T) del agua de un río y su contenido en oxígeno disuelto (DO): T DO T DO T DO T DO T DO 2,57,88 2,48 6,67 28,43 2,0 31,68 13,80 28,51 2,58 2, 12,14 2,06 5,2 28,64 3,4 31,34 12,32 28,30 2,41 30,58 13,66 28,81 4,23 2,02 5,52 31,00 11,00 28,0 2,51 31,00 14,1 28,60 3,56 2,52 7,83 30,7 10,00 28,00 2,71 31,34 14,50 28,51 2,8 30,07 10,68 30,45 8,45 28,13 3,48 31,26 13,72 28,51 2,58 30,67 12,8 30,07 6,48 28,30 4,36 31,17 12,54 28,43 2,32 31,17 14,26 2,6 4,1 28,72 5,71 30,6 11,48 28,34 2,14 31,55 14,3 2,36 3,8 2,14 7,1 30,50,2 28,34 2,0 31,76 14,1 2,02 3,21 2,74 10,61 2, 8,32 28,26 2,27 31,81 14,61 28,76 2,83 30,37 12,66 Se pide: (a) Construir una distribución conjunta de frecuencias para las dos variables T y DO tomando 5 intervalos. (b) Dibujar un diagrama de dispersión conjunto de las dos variables. (c) Hacer un estudio de las distribuciones marginales. (d) Calcular la matriz de varianzas-covarianzas. 1

Estadística Descriptiva 3. En diferentes dias se ha observado el número de veces que ha sonado la alarma en un servicio de bomberos, obteniéndose los siguientes datos: {5, 3, 1, 5, 3, 6, 4, 2, 5, 6, 3, 6, 5, 2, 6, 7, 3} Se pide: (a) Obtener la moda, la mediana, Q 1, Q 3 y el cuantil 0.40. (b) Obtener la media y la desviación típica. (c) Efectuar un diagrama apropiado. Solución (a) Para las medidas de posición conviene ordenar los datos {1, 2, 2, 3, 3, 3, 3, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, } La moda corresponde al valor mas repetido, este caso corresponde a los tres valores M o = 3, 5, 6. Decimos que es multimodal. La mediana acumula el 50% de los datos N = 17. Como 0.5 (N + 1) = Me = 5 El primer cuartile Q 1 acumula el 25% de los datos N = 17. Como 0.25 (N + 1) = 4.5 Q 1 = 3 + 0.5(3 3) = 3 El tercer cuartile Q 3 acumula el 75% de los datos N = 17. Como 0.75 (N + 1) = 13.5 Q 3 = 6 + 0.5(6 6) = 6 El cuantil c 0.40 acumula el 40% de los datos N = 17. Como 0.40 (N + 1) = 7.2 c 0.40 = 3 + 0.2(4 3) = 3.2 (b) Cálculo de la media, varianza y la desviación típica. n i=1 x = x if i = 72 N 17 = 4.235 Para el cáculo de la varianza se aconseja el método abreviado n Sx 2 i=1 = x2 i f i x 2 = 354 N 17 4.2352 = 2.8 (c) Efectuar un diagrama apropiado. S x = S 2 x = 2.8 = 1.70 2

4 Número de avisos 3 2 1 0 1 2 3 4 avisos 5 6 7 3

4. El porcentaje de algodón en una tela utilizada para elaborar camisas para hombre se presenta en la siguiente tabla. Calcular los estadísticos más importantes y realícese el histograma de frecuencias. porcentaje de algodón 32.1 32.5 32.6 32.7 32.8 32. 33.1 33.1 33.4 33.5 33.6 33.6 33.6 33.6 33.6 33.8 33.8 34 34.1 34.1 34.1 34.2 34.3 34.3 34.4 34.5 34.5 34.6 34.6 34.6 34.6 34.6 34.7 34.7 34.7 34.7 34.7 34.7 34. 35 35 35.1 35.1 35.1 35.2 35.3 35.4 35.4 35.5 35.6 35.7 35.8 35. 36.2 36.4 36.6 36.8 36.8 36.8 37.1 37.3 37.6 37.8 37. (a) Diseñar la distribución de frecuencias con un cambio de variable. (b) Calcular los estadísticos: media, moda, mediana, Q 1, Q 3, c 0.6, varianza y desviación típica. (c) Representar el diagrama de tallo y hojas. (d) A partir del diagrama anterior determinar la mediana, el primer cuartil y el tercer cuartil y compárese los resultados con los obtenidos a partir de la distribución de frecuencias. (e) Representar los histogramas de frecuencias absolutas y acumuladas. (f) Representar el diagrama de caja y determinar los valores extremos. Solución (a) Tomamos 7 intervalos de longitud 1. Como x max x min = 37. 32.1 = 5.8 y 7-5.8=1.2, desplazamos el extremo inferior a 32.1-0.6=31.5 y el extremo superior a 37.+0.6=38.5. Efectuamos el cambio de variable y i = x i 35 para realizar los cálculos con la variable y. Algodón x i f i F i y i y i f i yi 2 f i [31.5, 32.5) 32 1 2-3 -3 [32.5, 33.5) 33 8 10-2 -16 32 [33.5, 34.5) 34 16 27-1 -16 16 [34.5, 35.5) 35 23 4 0 0 0 [35.5, 36.5) 36 7 55 1 7 7 [36.5, 37.5) 37 6 61 2 12 24 [37.5, 38.5) 38 3 64 3 27 64-7 113 Tabla 1: Distribución de frecuencias (b) Cálculo de los estadísticos: yi f i ȳ = N = 7 64 = 0.11 y Sy 2 2 = i f i N ȳ2 = 115 64 0.112 = 1.78 4

x = ȳ + 35 = 34.8 y S x = S y = 1.78 = 1.336 A continuación se explica cómo calcular la Moda, y los cuartiles Q 1 y Q 3. Con el mismo método se hallan los deciles y los cuantiles. Aunque hay fórmulas explícitas para ello, dichas expresiones se obtienen por interpolación de los histogramas de frecuencias. Dicha interpolación se basa en la comparación de triángulos semejantes. 23 23 16 7 x 34.5 35.5 La Moda Mo, se calcula por interpolación en el intervalo modal. Por semejanza de triángulos se tiene x 23 16 = 1 x 23 7 x = 7 23 Luego y M o = 34.5 + x = 34.8 Figure 1: Cáculo de la Moda 25 El primer cuartil Q 1 acumula N/4 = 16, luego 34.5 33.5 = 1 16 Q 1 33.5 = x 7 16 x Q 1 = 33.5 + 7 16 = 33.4 33.5 Q 1 34.5 (c) Gráfico de tallo y hojas. Obsérvese el diagrama de este tipo que se obtiene a partir del paquete estadístico Minitab. Es interesante y fácil de calcular a partir del mismo la Mediana y los cuartiles Q 1 y Q 3. Comparar los resultados, con los obtenidos por interpolación de la distribución de frecuencias en el apartado anterior. Diagrama de árbol 5

48 38,4 25 x El tercer cuartil Q 3 acumula 48, luego Q 3 = 35.5. El cuantil c 0.60 acumula 0.6 N = 38.4, por interpolación de los triángulos semejantes de la figura se tiene 34.5 c 0.6 35.5 35.5 34.5 = 1 23 c 0.60 34.5 = x 13.4 c 0.60 = 34.5 + 13.4 23 = 35.08 32 1 5 6 7 8 6 33 1 1 4 5 6 5 33 6 6 6 6 8 8 6 34 0 1 1 1 2 2 3 3 5 5 6 6 6 6 6 7 7 7 7 7 7 22 35 0 0 1 1 1 2 3 4 4 5 6 7 8 14 36 2 4 6 8 8 8 6 37 1 3 6 8 5 (d) Con el gráfico de tallos y hojas, donde los datos están ordenados y sin agrupar determinamos: La mediana acumula el 50% de los datos N = 64. Como 0.5 (N + 1) = 32.5 Me = 34.6 + 0.5(34.7 34.6) = 34.65 El primer cuartile Q 1 acumula el 25% de los datos N = 64. Como 0.25 (N + 1) = 16.25 Q 1 = 33.8 + 0.25(0) = 33.8 El tercer cuartile Q 3 acumula el 75% de los datos N = 64. Como 0.75 (N + 1) = 48.75 Q 3 = 35.4 + 0.75(0.1) = 35.475 (e) A continuación se muestran los Histogramas de frecuencias absolutas y acumuladas. El lector puede detallar sobre los mismos, los poligonos de frecuencias, tanto para las frecuencias absolutas como las acumuladas. (f) Salida de estadísticos con Minitab. Variable N Mean Median TrMean StDev SE Mean Algodon 64 34,770 34,650 34,738 1,351 0,16 Minimum Maximum Q1 Q3 2,100 37,00 33,800 35,47 (g) Mostramos el diagrama de caja (Boxplot) para el cálculo del rango intercuartil. La medida de variabilidad amplitud intercuartil AIC = Q 3 Q 1 = 1.67. Si queremos detectar valores extremos en un sentido u otro, se calculan los valores de referencia dados por Q 1 1.5 AIC = 31.25 Q 3 + 1.5 AIC = 37.75 6

70 Frecuencias absolutas 20 10 0 Frecuencias acumuladas 60 50 40 30 20 10 0 32 33 34 35 Algodón 36 37 38 31,5 32,5 33,5 34,5 35,5 Algodón 36,5 37,5 38,5 Figure 2: Histogramas de frecuencias absolutas y acumuladas y apreciamos que en nuestra distribución no hay valores extremos en ninguno de los sentidos. La siguiente tabla registra en diferentes horas la temperatura (T) del agua de un río y su contenido en oxígeno disuelto (DO): Se pide: T DO T DO T DO T DO T DO 2,57,88 2,48 6,67 28,43 2,0 31,68 13,80 28,51 2,58 2, 12,14 2,06 5,2 28,64 3,4 31,34 12,32 28,30 2,41 30,58 13,66 28,81 4,23 2,02 5,52 31,00 11,00 28,0 2,51 31,00 14,1 28,60 3,56 2,52 7,83 30,7 10,00 28,00 2,71 31,34 14,50 28,51 2,8 30,07 10,68 30,45 8,45 28,13 3,48 31,26 13,72 28,51 2,58 30,67 12,8 30,07 6,48 28,30 4,36 31,17 12,54 28,43 2,32 31,17 14,26 2,6 4,1 28,72 5,71 30,6 11,48 28,34 2,14 31,55 14,3 2,36 3,8 2,14 7,1 30,50,2 28,34 2,0 31,76 14,1 2,02 3,21 2,74 10,61 2, 8,32 28,26 2,27 31,81 14,61 28,76 2,83 30,37 12,66 (a) Construir una distribución conjunta de frecuencias para las dos variables T y DO tomando 5 intervalos. (b) Dibujar un diagrama de dispersión conjunto de las dos variables. (c) Hacer un estudio de las distribuciones marginales. (d) Calcular la matriz de varianzas-covarianzas. 7

38 Figure 3: Diagrama de Caja. Es un artificio que muestra la mediana, los cuartiles y la amplitud, todo en el mismo gráfico. Muestra que la mayor parte de los datos es menor que 35.47, y que el 50% de los datos estan comprendidos entre 33.8 y 35.47 Algodón 37 36 35 34 33 Q3=35.47 Me=34.65 Q1=33.8 32 T DO 2.00-4.5 4.60-7.1 7.20-.7.80-12.3 12.40-15 27.0-28.70 15 0 0 0 0 15 28.71-2.50 4 4 1 0 0 2.51-30.30 0 2 2 4 0 8 30.31-31.10 0 0 1 4 4 31.11-31.0 0 0 0 1 8 1 6 4 12 50 T f i 27.0-28.70 15 28.71-2.50 2.51-30.30 8 30.31-31.10 31.11-31.0 50 Estadísticos de T T 2.70 Me T 2.55 Ŝ T 1.20 Q 1 28.00 Q 3 30.83 DO g i 2.00-4.5 1 4.60-7.1 6 7.20-.7 4.80-12.3 12.40-15.00 12 50 Estadísticos de DO DO 7.78 Me DO 7.25 Ŝ DO 4.57 Q 1 3.15 Q 3 12.37 Se tiene que x i y i = 11806. La matriz de varianzas-covarianzas y coeficiente de correlación: 8

1 6 4 12 31, Figure 4: Diagrama bivariado. En la parte superior aparece el histograma de la variable DO y en la parte lateral el histograma de la variable temperatura T Temperatura 31,1 30,3 2,5 28,7 8 15 27, 2,0 4,6 7,2,8 12,4 15,0 Contenido en oxígeno La matriz de varianzas-covarianzas y coeficiente de correlación: ( ST 2 ) ( ) Cov(T, DO) 1.43 5.16 = Cov(T, DO) 5.16 20.85 S 2 DO r T,DO = Cov(T, DO) S T S DO = 0.44