Medidas de Tendencia Central, Medidas de Dispersión & Otros Estadísticos (Cap. 2) Math. 298 Prof. Gaspar Torres Rivera

Documentos relacionados
Técnicas Cuantitativas para el Management y los Negocios

Métodos de Investigación en Psicología (10) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Análisis Exploratorio de Datos Resumen gráfico y numérico

Medidas de Tendencia Central.

Estadística Descriptiva 2da parte

Metodología II: Análisis de Datos. Prof. Reinaldo Mayol Derecho

DESCRIPCIÓN DE DATOS. Medidas Numéricas

Medidas Descriptivas Numéricas

Estadística Básica 1er Cuatrimestre 2012

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Medidas de dispersión. Rango o recorrido. Desviación media. Medidas de dispersión

CLASIFICACIÓN DE LA ESTADÍSTICA

Módulo de Estadística

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

Guía de actividad Independiente No 5. Estadística Descriptiva. Nombre del estudiante: Fecha:

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

ESTADÍSTICA DESCRIPTIVA

Ventanas de SPSS 1 y resultados de los análisis estadísticos descriptivos

OBJETIVOS. Parámetros vs Estadísticos. Descripción de datos: Medidas numéricas. Capítulo 3

UNIDAD I. ESTADISTICA

Instrumentos y matriz de datos

Estadística Aplicada

Medidas de dispersión

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

DEPARTAMENTO DE SOCIOLOGÍA I. Curso

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Estadística I Tema 2: Análisis de datos univariantes

Curso de Estadística Básica

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

PROBABILIDAD. Unidad I Ordenamiento de la Información

Capítulo. Resumir datos numéricamente Pearson Prentice Hall. All rights reserved

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Medidas Descriptivas Numéricas

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

Medidas de posición para variables cuantitativas

MEDIDAS DE TENDENCIA CENTRAL

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Estadística ESTADÍSTICA

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Tema 3: Estadística Descriptiva

Medidas de variabilidad (dispersión)

ESTADÍSTICA UNIDIMENSIONAL

Estadística I. Finanzas y contabilidad

1. Determine en cuantas clases se van a resumir los datos. En este caso se van a resumir en 7 clases, como lo indica la actividad.

Estadística Descriptiva 2da parte

RESPUESTAS BREVES A LA PRÁCTICA 3

ESTADÍSTICA DESCRIPTIVA

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Se quiere medir la dispersión de una muestra a través de su localización. En primer lugar, definimos una medida relacionada con la media.

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

Estadística aplicada al Periodismo

Dr. Abner A. Fonseca Livias

ÁREAS DE LA ESTADÍSTICA

3 ANALISIS DESCRIPTIVO DE LOS DATOS

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

Parámetros Estadísticos básicos, Resumen y Presentación de datos. Jhon Jairo Padilla, PhD.

Julio Deride Silva. 18 de agosto de 2010

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

ESTADISTICA APLICADA A LA EDUCACIÒN CODIGO: HOC220 EJERCICIOS SOBRE MEDIDAS DE TENDENCIA CENTRAL, POSICIONAL Y DE DISPERSIÓN

Muestra: Es un subconjunto de la población, que debe ser representativa y aleatoria.

Estadística. Análisis de datos.

Estadísticas Elemental Tema 3: Describir, Explorar, y Comparar Data

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Estadística Descriptiva en SPSS

Estadísticas Elemental Medidas de dispersión 3.1-1

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

LECCIÓN PÚBLICA. Tema 2 Medidas de Tendencia Central, Posición y Variabilidad. Profa. María Fátima Dos Santos

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

Conceptos de Estadística

Curso de nivelación Estadística y Matemática

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Probabilidad y Estadística, EIC 311

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

TEMA 1: ESTADISTICA DESCRIPTIVA

ESTADÍSTICA. A su vez, las variables pueden ser :

Escala Nominal Permite la clasificación de individuos según escala cualitativa. Ejemplo: Estado civil, profesión, sexo,...

UNIDAD 8. ESTADÍSTICA

Estadística UNIDAD DOS ESTADÍSTICA

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos

RELACIÒN ENTRE LOS PROMEDIOS

Probabilidad y Estadística

Profesora: Beatriz Ponce Nely TADA- 03

LICEO NAVAL CAPITÁN N DE CORBETA MANUEL CLAVERO ESTADÍSTICA. Jose Gonzales Villanueva Profesor de Matemática.

RELACIÓN DE EJERCICIOS TEMA 2

Origen de la Estadística. Ejercicio de estadística 13/05/2015. Víctor Cuchillac (papá) Definiciones de Estadística. Definiciones de Estadística

Resumenes numéricas de una muestra de datos. M. Wiper Análisis Estadístico del Delito 1 / 41

Estadística Descriptiva

Tema 1: Análisis de datos univariantes

Estadística Descriptiva. Tema 1: Estadísticos 1

Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos.

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

En todo proceso de investigación se generan datos y es la Estadística la disciplina encargada de :

TEMA 1 Estadística Descriptiva. Introducción Comparativos gráficos Medidas de tendencia central Medidas de dispersión

MEDIDAS DE TENDENCIA CENTRAL

Transcripción:

Medidas de Tendencia Central, Medidas de Dispersión & Otros Estadísticos (Cap. ) Math. 98 Prof. Gaspar Torres Rivera

Un hombre promedio Roberto tiene 31 años de edad, una estatura de 68.8 pulgadas, pesa 171.96 libras, usa un traje talla 40, usa zapatos número 8 y tiene un tamaño de cintura de 33.7 pulgadas. Cada año ingiere 1.30 libras de pasta italiana, 6.01 libras de guineos, 3.97 lbs de papas fritas, 18.08 lbs de helado y 79.15 lbs de carne de res. Además, cada año Roberto ve 567 horas de TV y recibe 585 cartas (correspondencia) de correo. Termina el día con 7.7 horas de sueño. Al día siguiente lo inicia con viaje de 1 min a su trabajo en el que laborará durante 6.1 horas.

Medidas de Tendencia Central Son valores numéricos que localizan el centro de una colección de datos. Algunas medidas de tendencia central son: 1. Promedio o media aritmética: X Xi x1 + x + x 3 + x 4 + + f n x n Media de la muestra Media de la población: µ X N

. Promedio para la distribuciones de f. (agrupados y no agrupados) X f x f x f x f x f x X + + + + + 1 1 3 3 4 4 f n n f n ( ) M O 3. Moda es el dato con mayor frecuencia x ~ 4. Mediana ó Md es el valor central o medio de la colección i n +1 de datos. Los datos deben estar ordenados. La posición de la mediana es f i 5. Mediana para las distribuciones de f para datos agrupados: Midrange ~ x n ( 0. 5 ) f i m+ M cf ( W 6. Amplitud promedio o recorrido promedio Las tres medidas de tendencia central principales son: media, mediana y la moda. ) + L.I.

Media geométrica (para medias de tasas, porciento y crecimiento) GM n X 1X X 3 X n Media armónica (para problemas de velocidad promedio) HM Media cuadrática (para sistemas de distribuciones de energía eléctrica) n 1 X X i X QM n

Medidas de tendencia central Propiedades de la media: ( es afectada por las variaciones de los datos ) Usa todos los datos La media es utilizada para calcular otros estadísticos, como la desviación estándar. La media es única, y no es necesariamente un valor que pertenece a la lista de datos. La media no se puede calcular para distribuciones de frecuencias semi-abiertas. Es adecuada para distribuciones que se aproximan a lo normal o que sean simétricas.

Medidas de tendencia central Propiedades de la mediana: ( no es afectada tanto por las variaciones de los datos ) Es utilizada para hallar el centro de los datos. Divide a la distribución en mitades: una superior y otra inferior. La mediana es usada para calcular el promedio de distribuciones de frecuencias semi-abiertas. Es adecuada para distribuciones que se alejan de lo normal y de la simetría, es decir asimétricas. Ver figuras (histogramas con sesgo o bias ) dadas en clase. Nota: La mediana es única para una lista de datos.

Propiedades de la moda (Mo) Es utilizada para datos cualitativos. La moda (Mo) es aplicada para datos nominales, ver escala nominal. La moda no es única. Una lista de datos puede tener más de una moda. Es afectada por las variaciones de los datos.

Propiedades del Recorrido promedo o amplitud promedio ( Midrange ) Calcula un punto medio a base de los valores m y M. mmin Mmax Es afectada por las variaciones de los datos, es decir por los valores extremos. Nota: La mediana es única para una lista de datos.

Promedio (Triola, 1997) Qué tan común? Existencia Toma en cuenta todos los datos? Media Más común siempre sí sí La afectan los datos extremos? Md (opción para datos extremos) Mo (usa nivel nominal) R.P. (muy sensible a los datos extremos) Uso común siempre no no Se usa a veces Podría no existir, podría haber más de una no Pocas veces siempre no sí no

Ejemplo #1: A continuación se enumeran los tiempos (años) que los primeros diez pacientes de un hospital sobrevivieron después de entrar en un tratamiento experimental. 10, 9, 6, 8, 15, 3, 17, 5, 0, 0 X X f x 1 + x + x 3 + x n 4 + + x n 10 193 10 + 9 19 + 6.3 + 8 años + 15 + 10 3 + 17 + 5 + 0 + 0

Ejemplo #1: Obtenga la mediana: 0, 10, 15, 17, 0, 3, 5, 6, 8, 9 Ordenar los datos n + 1 10 + 1 i 5.5 posición ~ 0 + 3 43 x Md 1.5 años

Notas importantes: Si el número de datos (n) es impar, entonces la mediana es el número que está situado exactamente a la mitad de la lista de datos. Si el número de datos (n) es par, entonces la Si el número de datos (n) es par, entonces la mediana se obtiene calculando la media de los dos números que están a la mitad.

Ejemplo #1: Obtenga la moda y el recorrido promedio: 0, 10, 15, 17, 0, 3, 5, 6, 8, 9 Moda (Mo ) m + M R.P. todos son 0 + 9 modas 14.5 años

Ejemplo # : A continuación se enumeran las concentraciones de alcohol en la sangre de 15 conductores implicados en accidentes mortales y luego condenados a prisión (basados en datos del Departamento de Justicia) 0.7, 0.17, 0.17, 0.16, 0.13, 0.4, 0.9, 0.4, 0.14, 0.16, 0.1, 0.16, 0.1, 0.17, 0.18. Calcular o determinar: media, mediana, moda, amplitud promedio.

Comparación de Medidas de Tendencia Central Posición Salario 1. Asistente administrativo- $16,000. Ventas/Agente de promoción- $19,500 3. Entrada de datos- $15, 750 4. Estadístico- $4,000 5. Producción de informes- $,500 6. Especialista gráfico- $19,500 7. Vicepresidente consultoría- $35,000 8. Presidente- $100,000 9. Suma de salarios- $5,50.00 10. Salario promedio- $31,531.5 11. Salario mediana- $1,000.00 1. Moda- $19,500.00

Ejemplo # : El conteo de BUN (Urea nitrogenada en la sangre) de 0 pacientes seleccionados aleatoriamente es dado en mg/dl. 11, 11, 1, 13, 14, 15, 16, 16, 16, 1, 17, 17, 17, 17, 18, 11, 17, 17, 17 y 17. Calcular o determinar: media, mediana, moda, amplitud promedio. Cuántos conteos son mayores que el promedio de la muestra? menor? igual?

Ejemplo # : El conteo de BUN (Urea nitrogenada en la sangre) de 0 pacientes seleccionados aleatoriamente es dado en mg/dl. 11, 11, 1, 13, 14, 15, 16, 16, 16, 1, 17, 17, 17, 17, 18, 11, 17, 17, 17 y 17. Si se suma un valor constante de k a cada uno, cómo afecta esto a los resultados originales? Si se multiplica por un valor constante de k a cada uno, cómo afecta esto a los resultados originales? Si se divide por un valor constante de k a cada uno, cómo afecta esto a los resultados originales?

Ejemplo # : 0.7, 0.17, 0.17, 0.16, 0.13, 0.4, 0.9, 0.4, 0.14, 0.16, 0.1, 0.16, 0.1, 0.17, 0.18. Calcular o determinar: media, mediana, moda, amplitud promedio. Cuántos conductores implicados tienen una concentración de alcohol mayor que el promedio de la muestra? menor? igual?

Ejemplo 3 En un estudio de crecimiento, la variable x representa la circunferencia (en cm) de las cabezas de los bebés al momento de su nacimiento en el hospital municipal de un pueblo cercano. Calcular o determinar: media, mediana, moda, amplitud promedio. Los datos son los siguientes:

3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0,, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 34.0, 34.0, 34.0, 34.0, 34.0, 34.0, 34.0, 34.0, 34.0, 35.0, 35.0, 35.0, 35.0, 35.0, 35.0, 37.0, 37.0, 37.0, 37.0, 37.0, 37.0, 37.0, 37.0, 37.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 33.0, 37.0, 37.0, 37.0, 37.0, 37.0, 37.0 cm.

Ejemplo 4 Construye una lista de 7 datos que cumpla con las siguientes: Media 9 Mediana4 Mo5 Ejemplo 5 Construye una lista de 10 datos que cumpla con: X Md Mo

Definición Medidas de dispersión (variación) Las medidas de dispersión son valores numéricos que describen la variación de los datos. Los datos que están agrupados en el centro poseen un grado de dispersión relativamente menor, y los datos que están alejados o dispersos de ese centro de la distribución poseen un grado de dispersión relativamente mayor. El agrupamiento más estrecho ocurre cuando los datos tienen el mismo valor, para los cuales la medida de dispersión es cero.

Algunas medidas de dispersión Recorrido (Amplitud) R Desviación estándar muestral Desviación estándar muestral M m s ( X ) ( X ) n s n ( n 1) ( X X) n 1 Desviación estándar poblacional σ σ X ( X ) N ( X µ ) N Varianza es el cuadrado de la desviación estándar Varianza de la población µ X s ( X ) ( X ) n n n 1 ( ) Índice de sesgo de Pearson I 3 ( X Md) Desviación promedio Ver ejemplo de la página 59 (libro de texto) s Desviaciónpromedio xi n x

Otras medidas de dispersión Coeficiente de variación SE s CV.. V X Coeficiente de asimetría ( skewness ) I Error estándar ( ) ( ) n f X f X n s n ( n 1) σ µ ( 100% ) ó C.. ( 100% ) Desviación estándar muestral para las distribuciones de frecuencias s Nota impor tante : ( X X) 0

Ejemplo # 1 Los siguientes datos muestran los tiempos de vida de cinco vertederos del área sur: 6, 3, 8, 5, 3 años. Calcular las medidas: Recorrido, desviación estándar y varianza. RM-m8-35 años; Desviación estándar: x x 6 36 3 9 8 64 5 5 3 9 5 143 x x

Los datos siguientes muestran los tiempos de vida de cinco vertederos del área sur: 6, 3, 8, 5, 3 años. Calcular las medidas: Recorrido, desviación estándar y varianza. Varianza: s ( X ) ( X) ( ) ( ) n n n 1 90 0 Varianza ( ) 4.5 s.1años 4.5 años 5( 143) ( 5) 5 5 1 ( ) 715 65 0

Los siguientes datos muestran los tiempos de vida de cinco vertederos del área sur: 6, 3, 8, 5, 3 años. Calcular las medidas: Recorrido, desviación estándar y varianza. RM-m8-35 años; Desviación estándar: s ( X ) ( X) n n ( n 1) 5 ( 143 ) ( 5 ) 5( 5 1) 715 65 0 90 0 4.5.1 años

Statistics Valid tiempo de vida de 5 vertederos Cumulative Frequency Percent Valid Percent Percent 3.00 40.0 40.0 40.0 5.00 1 0.0 0.0 60.0 6.00 1 0.0 0.0 80.0 8.00 1 0.0 0.0 100.0 Total 5 100.0 100.0 tiempo de vida de 5 vertederos N Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles 5 50 75 5 0 5.0000.9487 5.0000 3.00.113 4.5000.54.913 -.963.000 5.00 3.00 8.00 5.00 3.0000 5.0000 7.0000

Ejemplo # Los siguientes datos muestran los tiempos de vida de cinco vertederos del área sur: 5, 5, 5, 5, 5 años. Calcular las medidas: Recorrido, desviación estándar y varianza. RM - m s ( X ) ( X) n n ( n 1) 5 ( ) ( ) 5( 5 1) 0 años

Ejemplo # 3: A continuación se enumeran los tiempos (años) que los primeros diez presidentes de Estados Unidos sobrevivieron después de entrar en funciones. 10, 9, 6, 8, 15, 3, 17, 5, 0, 0 Calcular las medidas: Recorrido, desviación estándar y varianza.

Ejemplo # 4: Un técnico de "quality-control" seleccionó una muestra de 48 osos silvestres anestesiados, luego anotó sus edades, en meses. Las mediciones encontradas fueron las siguientes: Edad (meses) Frecuencia 7.00 0 36.00 3 65.00 6 94.00 15 13.00 15 15.00 6 181.00 3 f 48

Ejemplo # 4: Calcular las medidas: Media, Moda, Mediana, Amplitud promedio, Recorrido, desviación estándar y varianza. Edad (meses) Frecuencia 7.00 0 36.00 3 65.00 6 94.00 15 13.00 15 15.00 6 181.00 3 f 48

Statistics Valid edad en meses de 48 osos anestesiados edad en meses de 48 osos anestesiados N Valid 48 Missing 0 Cumulative Mean 108.5000 Frequency Percent Valid Percent Percent Std. Error of Mean 5.1808 36.00 3 6.3 6.3 6.3 Median 108.5000 65.00 6 1.5 1.5 18.8 Mode 94.00 a 94.00 15 31.3 31.3 50.0 Std. Deviation 35.8935 13.00 15 31.3 31.3 81.3 Variance 188.3404 15.00 6 1.5 1.5 93.8 Skewness.000 181.00 3 6.3 6.3 100.0 Std. Error of Skewness.343 Total 48 100.0 100.0 Kurtosis -.14 Std. Error of Kurtosis.674 Range 145.00 Minimum 36.00 Maximum 181.00 Sum 508.00 Percentiles 5 94.0000 50 108.5000 75 13.0000 a. Multiple modes exist. The smallest value is shown

Medidas de localización Definición: Describen la localización o la posición de un valor con respecto al resto de los datos. Localizan la posición relativa de un valor con respecto al al resto de los datos. Algunas medidas son: Cuartiles (Q k) Percentiles (P k) Decile (D k) Interquartile range IQRQ3-Q1 Outliers o valores a 1.5xIQR

Definición: Describen la localización o la posición de un valor con respecto al resto de los datos. Localizan la posición relativa de un valor con respecto al al resto de los datos. Algunas medidas son: EDA o Exploratory Data Analysis de John Tukey, 1977 Box plot (utiliza m, LH, Md, UH, M)