Práctica 4 de Estadística

Documentos relacionados
EJERCICIOS TEMA 1. Clasifica los siguientes caracteres estadísticos según sean cualitativos, variables discretas o variables continuas:

Módulo de Estadística

Estadística Inferencial. Estadística Descriptiva

INSTITUCION EDUCATIVA LA PRESENTACION NOMBRE ALUMNA:

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Estadísticas Elemental Cuartiles y los diagramas de caja 3.1-1

Grafico de Cajas y Bigotes

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Transformaciones de variables

Medidas de Posición n y. Boxplot Lección n 11 Secc Prof. Pedro A. Torres ESMA febrero de Prof. Pedro A. Torres, ESMA 3015 UPRM

2.1. Introducción Análisis exploratorio Análisis exploratorio para variables con muchas modalidades

Estadística. Análisis de datos.

RELACIÓN DE EJERCICIOS TEMA 2

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Y accedemos al cuadro de diálogo Descriptivos

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Estadísticas por Filas

Fundamentos de Estadística y Simulación Básica

INTRODUCCIÓN AL ANÁLISIS DE DATOS

Código: ESA-343. Horas Semanales: 4. Prelaciones: CAL-265

Estadística Descriptiva. SESIÓN 7 Medidas de centralización

ESCUELA PREPARATORIA OFICIAL NÚM. 11 PROGRAMA DEL ESTUDIANTE POR MATERIA PRIMER PERIODO DE TRABAJO DEL SEGUNDO SEMESTRE DEL CICLO ESCOLAR

Medidas de Tendencia Central.

ANALISIS E INTERPRETACION DE DATOS SOBRE PERMANENCIA Y GASTOS DE LOS ALUMNOS EN LA UNIVERSIDAD NACIONAL DE INGENIERIA

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Julio Deride Silva. 27 de agosto de 2010

Medidas de dispersión

Percentil q (p q ) Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

Fase 2. Estudio de mercado: ESTADÍSTICA

LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL

UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Tema 2 Estadística Descriptiva

PROBLEMAS ESTADÍSTICA I

1.- Diagrama de barras

La medición de la desigualdad económica

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

Ministerio de Educación Pública Dirección de Gestión y Evaluación de la Calidad Departamento de Evaluación Académica y Certificación.

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

I. Estadística Descriptiva de una variable

Planificación didáctica de MATEMÁTICAS 3º E.S.O.

Datos estadísticos. UNIDAD I. ESTADÍSTICA APLICADA A LOS NEGOCIOS

Hoja 6: Estadística descriptiva

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Estadísticos Descriptivos

Medidas de centralización

DIAGRAMAS DE CAJAS Y BIGOTES Abel MARTÍN. Profesor de Matemáticas del IES de Llanera (Asturias)

Medidas de tendencia central y dispersión

Z i

UNIDAD 6 Medidas de tendencia central

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

1. Dado el siguiente volumen de ventas de una empresa y su gasto en I+D en miles. Prediga las ventas de este empresario para un gasto en I+D de 7.

CUARTILES, DIAGRAMA DE CAJA Y BIGOTES, DECILES Y PERCENTILES CON EXCEL Y CON GEOGEBRA

Título. Nota introductoria AQUÍ VA EL GRÁFICO. Notas al pie o al calce Fuente

Identificación de valores atípicos.

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

2. DESCRIPCION DE UN CONJUNTO DE DATOS

TEMA 1. ORGANIZACION Y REPRESENTACION DE LOS DATOS DE UNA MUESTRA Métodos para datos cualitativos.

Medidas de Tendencia Central

MEDIDAS DE TENDENCIA CENTRAL

MATEMÁTICA DE CUARTO 207

Repaso Estadística Descriptiva

Análisis de Datos. Liza V. Rodríguez INTER CAMMC Matemática 4-6. Profa. Liza V. Rodríguez

Bioestadística: Estadística Descriptiva

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL y Ejemplo 2

UNIDAD 7 Medidas de dispersión

Teoría de errores -Hitogramas

2 Pasos en un estudio estadístico.

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

1. Cómo introducir datos en SPSS/PC? - Recordatorio

Guía de Matemática Tercero Medio

Colegio Universitario Boston

ANÁLISIS DE DATOS UNIDIMENSIONALES

Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Bloque 1. Contenidos comunes. (Total: 3 sesiones)

Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016

5.2 Representaciones gráficas

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Unidad 1. Obtención, Medición y Representación de Datos. Estadística E.S.O.

Análisis de Datos y Probabilidad Grado 9-12

UNIVERSIDAD ABIERTA PARA ADULTOS UAPA CARRERA LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS PROGRAMA DE LA ASIGNATURA ESTADÍSTICA I

Descripción simultánea de varias variables con STATGRAPHICS

Probabilidad y Estadística, EIC 311

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

TEMA III. REPRESENTACION GRAFlCA

RANGO Y DISTRIBUCIÓN DE FRECUENCIAS

Transcripción:

Práctica 4 de Estadística Análisis de una variable medible. Gráficos caja. El gráfico caja es una representación gráfica que proporciona información sobre una distribución muestral complementaria a la dada por los histogramas. Este gráfico presta especial interés sobre las colas de la distribución, indicando qué valores pueden considerarse atípicos. Pero también se representan en este gráfico la mediana y los cuartiles, con lo que el gráfico proporciona información tanto de localización como de dispersión. El método está basado en comparar la distribución de frecuencias muestral con aquella que debería corresponder a una distribución normal con recorrido intercuartílico igual al de la muestra. Está basado en el Principio de Windsor, el cual establece que, en la práctica, todas las distribuciones de frecuencia son normales en el centro. 4.1 Construcción del gráfico caja La información necesaria para construir el gráfico caja de una muestra puede organizarse de forma conveniente utilizando una caja resumen, que contiene información sobre la mediana y los cuartiles, y añadiendo una segunda caja como se muestra a continuación: n M Q 1 Q e Inteligencia Artificial 1

v.a. f F Así, si consideramos la variable edad de los alumnos de una clase de 50: Edad 17 18 19 20 21 22 2 24 29 Alumnos 2 5 18 9 5 5 2 1 Necesitamos conocer la mediana M = 19.5 y los cuartiles Q 1 = 19 y Q = 21. El intervalo intercuartílico es IQR = 2. 50 19.5 19 21 Ahora procederemos a llenar la caja inferior. La caja superior contendrá un factor de escala 1.5 x IQR. Así, para este ejemplo: 1.5 x 2 = Este valor es restado de Q 1 = 19 para obtener la valla inferior, f = 19 - = 16, y de nuevo restamos de este valor (f) para obtener la valla exterior inferior, F = 16 - = 1. Las vallas interior y exterior superiores se obtienen añadiendo el factor de escala a Q = 21 obteniéndose f = 24 y F = 27. Estos valores se colocan en el diagrama como sigue: e Inteligencia Artificial 2

v.a. Una vez establecidas estas fronteras, el resto de la información procede de los datos de la variable (es preferible tenerlos ordenados de mayor a menor). Los valores adyacentes (v.a.) son los valores más extremos de la región comprendida entre los cuartiles respectivos y las vallas interiores (incluidas). Así, 17 es el valor mínimo entre 16 y 19, mientras que el valor máximo entre 21 y 24 es 24. v.a. 17 24 Todas las observaciones pertenecientes a las regiones comprendidas entre la valla interior y exterior serán llamadas atípicas o medianamente atípicas. El hecho de que no haya observaciones entre 1 (incluido) y 16 se indica en el diagrama siguiente. Tampoco hay observaciones mayores que 24 y menores o iguales que 27. e Inteligencia Artificial

v.a. 17 24 Las observaciones fuera de la vallas exteriores F son llamadas extremas o extremadamente atípicas. No hay datos menores que 1 y tenemos un dato mayor que 27, en concreto 29. v.a. 17 24 uno 29 A partir de aquí se construye el gráfico caja. Se requiere para ello una escala que englobe el rango total de los datos. La caja termina en Q 1 y Q con una recta interior trazada en la mediana. A continuación se unen los valores adyacentes a la caja mediante rectas. Finalmente se marcan los valores atípicos y extremos. 4.2 Interpretación del gráfico caja El centro (posición central) de la distribución se representa por la recta mediana. La dispersión central de la distribución viene medida por la longitud de la caja, la cual contiene el 50% de las observaciones, 25% a cada lado de la mediana, la cual informa por tanto de la forma de la parte central. La longitud de los bigotes informan sobre la simetría de las colas; los valores atípicos alargan esas colas. e Inteligencia Artificial 4

4. Ejercicios 1. En tres computadores con dispositivo de cinta DAT, se ha medido durante ocho días el tiempo (en minutos) de realización de la copia de seguridad, obteniéndose los siguientes resultados: Computador 1 Computador 2 Computador 20,5 21,88 19,45 22,59 22,60 20,05 25,90 22,99 2,54 24,1 22,67 21,17 24,44 21,69 20,9 21,97 21,5 20,87 24,47 2,24 21,79 24,0 22,7 21,04 a) Obtener el gráfico caja para los resultados de cada computador. b) Comentar el gráfico. Hay simetría? c) Son parecidos los resultados? d) Cuál de ellos tiene más dispersión? Hay algún valor atípico o extremo? 2. Los datos de la variable del problema 2 de la práctica anterior son: Horas de asistencia al aula de prácticas libres a la semana Individuos Menos de 5 horas 24 5 10 15 10 15 12 15 20 18 Más de 20 horas a) Construir el gráfico caja. b) Comentar el gráfico.. Se ha realizado un estudio sobre el uso de una determinada configuración de computador en empresas. Se estableció una clasificación de empresas de 6 a 7 en función de aspectos sectoriales, económicos y plantilla; se hizo una encuesta con el objeto de determinar, en función del tipo de empresa, cuántas utilizaban la citada configuración, con los resultados siguientes: e Inteligencia Artificial 5

Tipo Casos Tipo Casos Tipo Casos Tipo Casos 6 2 14 47 22 10 0 6 7 8 15 56 2 61 1 8 8 4 16 59 24 41 2 5 9 14 17 101 25 2 10 16 18 122 26 2 4 7 11 2 19 145 27 12 5 1 12 56 20 202 28 19 6 2 1 4 21 164 29 7 1 a) Construir el gráfico caja, dando los valores atípicos y extremos. e Inteligencia Artificial 6