MEDIDAS DE DISPERSIÓN

Documentos relacionados
Fundamentos de Estadística y Simulación Básica

Medidas de dispersión

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

ESTADÍSTICA DESCRIPTIVA

A qué nos referimos con medidas de dispersión?

Curso de Estadística Básica

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

El rango de un conjunto de números es la diferencia entre el número mayor y el menor del conjunto.

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Estadística Inferencial. Estadística Descriptiva

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Medidas de tendencia central

La desviación típica y otras medidas de dispersión

Medidas descriptivas I. Medidas de tendencia central A. La moda

Y accedemos al cuadro de diálogo Descriptivos

GRUPO A GRUPO B Total = 225 Total = 250. Medidas de tendencia central.

Medidas de Tendencia Central.

2.- Tablas de frecuencias

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

MEDIDAS DE TENDENCIA CENTRAL

Unidad Nº 3. Medidas de Dispersión

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

Método de cuadrados mínimos

Medidas de tendencia central y dispersión

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

MEDIDAS DE VARIABILIDAD

Medidas de centralización

Tema 1.- Correlación Lineal

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Medidas de Tendencia Central

Unidad IV: Distribuciones muestrales

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

LOS ESTADÍGRAFOS BÁSICOS Y SU INTERPRETACIÓN, M TENDENCIA CENTRAL

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

Conceptos básicos de la estadística

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

Conceptos básicos estadísticos

Puntuación Z ESTADÍSTICA APLICADA A LA EDUCACIÓN I. L.A. y M.C.E. Emma Linda Diez Knoth

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Probabilidad y Estadística, EIC 311

13. Utilizar la fórmula del término general y de la suma de n términos consecutivos

RESUMEN DE CONCEPTOS TEÓRICOS MATEMÁTICAS 1º ESO. CURSO

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

Z i

UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE

Estadística. Análisis de datos.

Fase 2. Estudio de mercado: ESTADÍSTICA

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

M i. Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana.

UNIDAD 4: MEDIDAS DESCRIPTIVAS: Medidas de dispersión

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

Tutorial MT-b11. Matemática Tutorial Nivel Básico. Inecuaciones e intervalos

Ecuaciones Cuadráticas Las ecuaciones cuadráticas se pueden resolver por el método de factorización o utilizando la fórmula cuadrática.

Distribuciones de probabilidad discretas

NOCIONES DE ESTADÍSTICA CURSO PRÁCTICO DE CLIMATOLOGÍA 2012

UNIDAD 7 Medidas de dispersión

ƒ : {(1, 4), (2, 5), (3, 6), (4, 7)}.

UNIDAD 8 INECUACIONES. Objetivo general.

Distancia focal de una lente convergente (método del desplazamiento) Fundamento

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

MEDIDAS DE DISPERSIÓN EN DATOS NO AGRUPADOS

GUION TÉCNICO AUDIO. El Conjunto De Los Números Reales. realidad, es una ciencia resultado de más de 4 mil años de

2. Recolección de información - Medidas de posición: moda, media aritmética, mínimo, máximo - Frecuencia absoluta, relativa y porcentual

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

COEFICIENTE DE VARIACIÓN Y PUNTAJES TÍPICOS (Guía de clase) FICHA Nº 19

RESUMEN DE CONCEPTOS

INTRODUCCIÓN. Para las siguientes dos actividades necesitaras: regla, lápiz, tijeras, calculadora.

Números. 1. Definir e identificar números primos y números compuestos.

Teorema Central del Límite (1)

II. ORGANIZACIÓN N Y PRESENTACIÓN N DE DATOS

CAPÍTULO 4: VARIABLES Y RAZONES

UNIDAD 8: SUCESIONES Y SERIES

NIVEL: 6º ÁREA: MATEMÁTICAS 1º TRIMESTRE CONCRECIÓN DE LOS OBJETIVOS AL CURSO

Tema 2. Descripción Conjunta de Varias Variables

ESTADÍSTICA CON EXCEL

Tema 2 Estadística Descriptiva

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

1. NUMEROS REALES a. Los Números Reales

MEDIDAS DE TENDENCIA CENTRAL

4º E.S.O. Matemáticas A

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

3. Ecuaciones, parte I

Distribuciones de Probabilidad

Indicaciones para el lector... xv Prólogo... xvii

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

CORRELACIÓN Y REGRESIÓN. Raúl David Katz

Ámbito Científico-Tecnológico Módulo III Bloque 3 Unidad 3 Las letras y los números: un cóctel perfecto

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Capítulo 4. Lógica matemática. Continuar

MEDIDAS DE TENDENCIA CENTRAL (MEDIDAS DE POSICIÓN)

Figura Trabajo de las fuerzas eléctricas al desplazar en Δ la carga q.

Criterios para evaluar la siembra de precisión

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Módulo de Estadística

EL PAPEL DE LA ESTADISTICA EN O Y M. Objetivo: Identificar índices estadísticos, y métodos más convenientes, para aplicarlos en el estudio de O y M.

EJERCICIOS Tema 5 La información que recibimos

Transcripción:

MEDIDAS DE DISPERSIÓN Contenido: Población y muestra Amplitud o recorrido Desviación media. desviación estándard y varianza Coeficiente de variación Cálculo de la varianza en una tabla de frecuencias POBLACIÓN Y MUESTRA Si un conjunto de datos consta de todas las observaciones concebibles (o hipotéticamente posibles) de cierto fenómeno, se denomina población; si un conjunto de datos consta solamente de una parte de estas observaciones se conoce como muestra por lo que una muestra debe ser un subconjunto de la población. Por ejemplo: Un periódico local imprime un artículo político para todos sus lectores. El periódico desea considerar las actitudes de 200 lectores hacia el artículo y conocer sus puntos de vista. De acuerdo a lo planteado en el ejemplo el total de los lectores representaría la población a la que le llega el artículo y los 200 lectores seleccionados representarían la muestra para conocer su punto de vista. Se utilizará la palabra "muestra" solo con relación a datos que se puedan utilizar en forma razonable para hacer generalizaciones acerca de la población de la cual provinieron. En este sentido más técnico, no son aceptables muchos conjuntos de datos que por lo común se denominan muestras. Como el término estadística(o) se introdujo con relación a los datos de muestra, se agregará que también existe un nombre para las descripciones estadísticas de poblaciones llamadas parámetros. Como se observará, la distinción entre estadística y parámetros servirá para simplificar nuestro lenguaje. En realidad, hasta se usarán símbolos diferentes de medidas estadísticas, según se utilicen para describir muestras o poblaciones. Para poblaciones se utilizarán letras griegas y para muestras, latinas. Por ejemplo para representar la media o el promedio de una muestra se utilizó la fórmula: La media de una población de N elementos se define en la misma forma. Es la suma de los N elementos,

dividida entre el tamaño de la población N. En las fórmulas anteriores se representa a la media de la muestra por para identificarlas entre sí. y la media de la población por MEDIDAS DE DISPERSIÓN En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribución, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones. Con el propósito de medir la dispersión o variabilidad, se discutirán en este apartado las medidas de: Amplitud (llamada también rango o recorrido), Desviación media, Varianza, Desviación Estándar (también llamada desviación típica) y Coeficiente de Variación. Amplitud o recorrido La medida de dispersión más simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su única ventaja es la sencillez con que se calcula. Es común que se use también el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numérico en el mismo. Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres veces al día y que cierto día los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cuál es la Amplitud en pulsaciones para cada paciente?

Para calcular la amplitud de los datos necesario identificar el valor más grande y el valor más pequeño del conjunto de datos de cada uno de los pacientes. Para el Paciente 1: A = 77-73 = 4 Para el Paciente 2: A = 90-64 = 26 La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas: En su cálculo sólo intervienen dos elementos del conjunto. Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que éstos sean del mismo tamaño. Desviación media, desviación estándar y varianza Para presentar la desviación estándar, que es por mucho la medida generalmente más útil de la dispersión, obsérvese que la dispersión de un conjunto de datos es pequeña si los valores se agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente en torno a su media. Por tanto, parecería razonable medir la dispersión de un conjunto de datos en términos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene un conjunto de números: que constituyen una población con una media, las diferencias entre:

se denominan las desviaciones de la media y esto sugiere que se podría usar el promedio de estas desviaciones como medida de dispersión en la población. A menos que las X sean todas iguales, algunas de las desviaciones serán positivas y otras negativas, la suma de todas las desviaciones de la media y en consecuencia también su promedio es siempre cero. Como realmente se está interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variación en términos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiéramos entre N, se obtendría la media estadística que se denomina desviación media y se representa por: Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades teóricas en problemas de inferencia y rara vez se usa. Un método alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que también esto eliminará el efecto de los signos. Los cuadrados de números reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raíz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviación estándar de la población. Ésta medida de variación se representa por medio de sigma minúscula ( ) y al expresar literalmente lo que se ha hecho aquí de manera matemática, también se conoce como la raíz de la desviación cuadrada media. A su cuadrado de se le llama Varianza de la población. Quizá parezca lógico utilizar la misma fórmula con n y sustituidas por N y, para la desviación estándar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviación estándar de la muestra, que se denota con s como

Su cuadrado s 2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razón. Si se dividiera entre n y se utilizara s 2 como estimación de es decir, se utilizaría la varianza de una muestra para determinar la varianza de la población de la cual provino, el resultado sería demasiado pequeño y esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es práctico para definir s como se hizo. Coeficiente de variación Las medidas de dispersión anteriores son todas medidas de variación absolutas. Una medida de dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por el coeficiente de variación. El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa como para una muestra y para la población. Los coeficientes de variación tienen las siguientes características: Puesto que tanto la desviación estándar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medición. Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la variabilidad de dos conjuntos de datos. En áreas de investigación donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisión de un experimento, comparando en CV del experimento en cuestión con los valores del mismo en experiencias anteriores. Ejemplo: En seis sábados consecutivos un operador de taxis recibió 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule: a. Amplitud.

b. Media. c. Desviación media. d. Desviación estándar. e. Varianza. f. Coeficiente de variación. a) Para calcular la amplitud. Valor máximo 13 Valor mínimo 7 A = 13-7 = 6 b) Para calcular la media. c) Para calcular la desviación media d) Para calcular la desviación estándar Se puede utilizar la siguiente tabla:

9-0.5 0.25 7-2.5 6.25 11 1.5 2.25 10 0.5 0.25 13 3.5 12.25 7-2.5 6.25 0.0 27.50 Al sustituir los valores se obtiene: e) Para calcular la varianza: f) Para calcular el coeficiente de variación: Cálculo de la varianza en una tabla de frecuencias Para calcular la varianza de una tabla de frecuencias se utiliza la siguiente fórmula:

Donde: k es el número de intervalos de clase X i es el valor medio de cada clase f i es el valor de la frecuencia absoluta Al retomar el ejemplo de la tabla de distribución de frecuencias de Precipitación pluvial promedio anual en Baja California 1905 a 1994 en pulgadas. intervalos Punto medio de clase (m i ) Conteo f i fa i FR i FRA i (07.7, 11.7] 9.7 18 18 18/90 18/90 (11.7, 15.7] 13.7 13 31 13/90 31/90 (15.7, 19.7] 17.7 24 55 24/90 55/90 (19.7, 23.7] 21.7 17 72 17/90 72/90 (23.7, 27.7] 25.7 13 85 13/90 85/90 (27.7, 31.7] 29.7 0 85 0/90 85/90 (31.7, 35.7] 33.7 4 89 4/90 89/90 (35.7, 39.7] 37.7 1 90 1/90 90/90 TOTAL 90 90 90/90 90/90 Calcular s 2 y s. m i f i f i m i 9.7 94.09 18 174.6 1693.62 13.7 187.69 13 178.1 2439.97 17.7 313.29 24 424.8 7518.96 21.7 470.89 17 368.9 8005.13 25.7 660.49 13 334.1 8586.37 29.7 882.09 0 0 0

33.7 1135.69 4 134.8 4542.76 37.7 1421.29 1 37.7 1421.29 TOTAL ##### 90 1653.0 34208.10 Algún Comentario de esta página escribir E-mail: jlgcue@colpos.colpos.mx Copyright 2002 Jose 3, ISEI, CP y FES Zaragoza, UNAM Texto: José Luis García Cué, María José Marques Dos Santos y José Antonio Santizo Rincón Home Page: José Luis García Cué