Medidas de Tendencia Central y de Variabilidad



Documentos relacionados
Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

16/02/2015. Ángel Serrano Sánchez de León

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

Tema 1: Estadística Descriptiva Unidimensional

Pruebas Estadísticas de Números Pseudoaleatorios

INTRODUCCIÓN. Técnicas estadísticas

Medidas de Variabilidad

Estas medidas serán más significativas cuanto más homogéneos sean los datos y pueden ser engañosas cuando mezclamos poblaciones distintas.

Estadística Unidimensional: SOLUCIONES

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Prueba de Evaluación Continua

Descripción de una variable

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Medidas de centralización

EXPERIMENTACIÓN COMERCIAL(I)

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

1. Notación y tabulación

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

I.E.S. Historiador Chabás -1- Juan Bragado Rodríguez

SEMANA 13. CLASE 14. MARTES 20/09/16

MEDIDAS DESCRIPTIVAS

Tema 6. Estadística descriptiva bivariable con variables numéricas

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

4ºB ESO Capítulo 12: Estadística LibrosMareaVerde.tk

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Probabilidad Grupo 23 Semestre Segundo examen parcial

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

Organización y resumen de datos cuantitativos

Relaciones entre variables

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

Trabajo y Energía Cinética

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

GUIAS DE ACTIVIDADES Y TRABAJO PRACTICO Nº 22

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

ACTIVIDADES INICIALES

TEMA 1.- CONCEPTOS BÁSICOS

2 Dos tipos de parámetros estadísticos

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

EJERCICIOS RESUELTOS TEMA 2

Además podemos considerar diferentes tipos de medidas de resumen. Entre ellas tenemos:

Capitalización y descuento simple

GUÍA DE APOYO AL APRENDIZAJE N 2

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

17/02/2015. Ángel Serrano Sánchez de León

CAPÍTULO 4 MARCO TEÓRICO

ACTIVIDADES ESTADÍSTICA UNIDIMENSIONAL. a) Calcula la temperatura media y la temperatura mediana de la semana.

Análisis de Regresión y Correlación

Cálculo y EstadísTICa. Primer Semestre.

Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

ESTADÍSTICA UNIDIMENSIONAL

DATOS AGRUPADOS POR INTERVALOS DE CLASE

UNIVERSIDAD DE SONORA

E.U.I.T.I. Bilbao. Asignatura: MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA

4) Ahora elaboremos la tabla de distribución de frecuencias: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS DE LOS PESOS DE LOS ESTUDIANTES MERU CALIDAD.

Métodos Estadísticos de la Ingeniería Tema 3: Medidas Estadísticas Grupo B

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

Tema 1: Análisis de datos unidimensionales

9Soluciones a los ejercicios y problemas

Estadística. Conceptos de Estadística. Un individuo o unidad estadística es cada uno de los elementos que componen la población.

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

REGRESION Y CORRELACION

el blog de mate de aida CSI: Estadística unidimensional pág. 1

Estadística Descriptiva

Un estimado de intervalo o intervalo de confianza ( IC

ANÁLISIS EXPLORATORIO DE DATOS

TEMA 4 Variables aleatorias discretas Esperanza y varianza

Tema 1 Descripción de datos: Estadística descriptiva unidimensional Estadística descriptiva

Unidad I Definición de reacción de combustión Clasificación de combustibles

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

Introducción a la Física. Medidas y Errores

MEDIDAS DE DISPERSIÓN EMPLEANDO EXCEL

Correlación y regresión lineal simple

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

ALN - SVD. Definición SVD. Definición SVD (Cont.) 29/05/2013. CeCal In. Co. Facultad de Ingeniería Universidad de la República.

Tema 4: Variables aleatorias

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objetos de nuestro estudio.

ESTADÍSTICA SEMANA 4

Índice de Precios de las Materias Primas

ESTADÍSTICA DESCRIPTIVA

CANTIDADES VECTORIALES: VECTORES

DEFINICIÓN DE INDICADORES

Smoothed Particle Hydrodynamics Animación Avanzada

Medidas de la tendencia central y las gráficas de caja

ESTADÍSTICA (GRUPO 12)

Aspectos fundamentales en el análisis de asociación

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

Transcripción:

Meddas de Tendenca Central y de Varabldad Contendos Meddas descrptvas de forma: curtoss y asmetría Meddas de tendenca central: meda, medana y moda Meddas de dspersón: rango, varanza y desvacón estándar. Coefcente de varacón Percentles Dagrama de caja MEDIDAS DE TENDENCIA CENTRAL Al trabajar con hstogramas y polígonos de frecuencas, vmos que las dstrbucón de los datos pueden adoptar varas formas. En algunas dstrbucones los datos tenden a agruparse más en una parte de la dstrbucón que en otra. Comenzaremos a analzar las dstrbucones con el objeto de obtener meddas descrptvas numércas llamadas estadístcas, que nos ayuden en el análss de las característcas de los datos. Dos de estas característcas son de partcular mportanca para los responsables de tomar decsones: la tendenca central y la dspersón MEDIDAS DE TENDENCIA CENTRAL: Moda, medana y meda Tendenca central : La tendenca central se refere al punto medo de una dstrbucón. Las meddas de tendenca central se denomnan meddas de poscón. Moda: es el valor que más se repte en un conjunto de datos. Ejemplo 1: Los sguentes datos representan la cantdad de peddos daros recbdos en un período de 0 días, ordenados en orden ascendente 0 0 1 1 4 4 5 5 6 6 7 7 8 1 15 15 15 19 Mo = 15 La cantdad de peddos daros que más se repte es 15 Fte: Empresa NN. 009 Autores: Llana Marcon / Adrana D Amelo

Ejemplo : La cantdad de errores de facturacón por día en un período de 0 días, ordenados en orden ascendente es 0 0 1 1 1 4 4 4 5 6 6 7 8 8 9 9 10 1 1 Esta dstrbucón tene modas. Se la llama dstrbucón bmodal. Mo = 1 y Mo = 4 Fte: Empresa NN. 009 Cálculo de la moda para datos agrupados S los datos están agrupados en una dstrbucón de frecuencas, se seleccona el ntervalo de clase que tene mayor frecuenca llamado clase modal. Para determnar un solo valor de este ntervalo para la moda utlzamos la sguente ecuacón: d 1 Mo = LMo +. h d1 d + M o L Mo d 1 d h Moda Límte nferor de la clase modal frecuenca de la clase modal menos la frecuenca de la clase anteror a ella ( d 1 = f f 1 ) frecuenca de la clase modal menos la frecuenca de la clase posteror a ella ( d = f f+ 1 ) ampltud del ntervalo de clase Ejemplo 3: La edad de los jublados encuestados en Mendoza en novembre del 008 EDAD m f f r f r% F F r F r% [50,60) 55 10 0,0 0 10 0,0 0 [60, 70) 65 18 0,36 36 8 0,56 56 [70, 80) 75 14 0,8 8 4 0,84 84 [80, 90) 85 6 0,1 1 48 0,96 96 [90,100) 95 0,04 4 50 1 100 Autores: Llana Marcon / Adrana D Amelo

La clase modal es [60, 70), ya que es la que presenta la mayor frecuenca L = 60 f = 18 f 10 f 14 h = 10 Mo 1 = +1 = d 1 = f f 1 =18-10 =8 = f f+ 1 d = 18-14=4 8 Mo = 60 +.10 = 66,66 8 + 4 La edad que más se repte es 66,66 años VENTAJAS Y DESVENTAJAS DE LA MODA Se puede utlzar para datos cualtatvos nomnales u ordnales y para datos cuanttatvos No se ve afectada por los valores etremos Se puede utlzar cuando la dstrbucón de frecuencas tenga clases abertas Cuando todas las puntuacones de un grupo tenen la msma frecuenca, se dce que no tene moda S un conjunto de datos contene puntuacones adyacentes con la msma frecuenca común (mayor que cualquer otra), la moda es el promedo de las puntuacones adyacentes Ej. (0,1,1,,,,3,3,3,4,5) tene Mo=,5 S en un conjunto de datos hay dos que no son adyacentes con la msma frecuenca mayor que las demás, es una dstrbucón bmodal. Conjuntos muy numerosos se denomnan bmodales cuando presentan un polígono de frecuencas con lomos, aún cuando las frecuencas en los pcos no sean eactamente guales. Estas lgeras dstorsones de la defncón están permtdas porque el térmno bmodal es muy convenente y en últmo térmno es descrptvo. Una dstncón convenente puede hacerse entre la moda mayor y la moda menor. Por ejemplo en el gráfco sguente, la moda mayor es 6 y las menores son 3,5 y 10 Puntuacones obtendas en un eamen de apttudes Fte: Elaboracón propa. 009 Autores: Llana Marcon / Adrana D Amelo

Medana: es el valor que dvde al conjunto ordenado de datos, en dos subconjuntos con la msma cantdad de elementos. La mtad de los datos son menores que la medana y la otra mtad son mayores En general, vamos a representar un conjunto de n datos como,,,,... n,... ( n ) 1 3 ( 1 ), ( ), ( 3 ) S los datos están ordenados, los ndcaremos, donde el subíndce encerrado entre paréntess ndca el orden o ubcacón en el conjunto ordenado Se presentan dos stuacones: Número mpar de datos: La medana es el dato que está en la poscón Me = m ~ = ~ = n+ 1 n +1 Sea el conjunto ordenado de datos: 3 5 6 8 ( 1 ) ( ) ( 3 ) ( 4 ) ( 5 ) Me = = = ( 3 ) = n + 1 5+ 1 La mtad de las observacones son menores o guales que 5 y la otra mtad son mayores o guales que 5. Número par de datos: Es el promedo entre los dos datos centrales. 5 Me = m ~ = ~ = + n n + 1 3 5 6 8 9 ( 1) ( ) ( 3) ( 4) ( 5) ( 6) Me = 6 + 6 + 1 = ( 3 ) + + ( 3+ 1) ( 3) ( 4 ) = 5 + 6 = = 5,5 La mtad de las observacones son menores o guales que 5,5 y la otra mtad son mayores o guales que 5,5. Autores: Llana Marcon / Adrana D Amelo

Cálculo de la medana para datos agrupados S los datos están agrupados en una dstrbucón de frecuencas, se seleccona el ntervalo de clase que contene a la medana llamado clase medana. Para ello, debemos determnar la frecuenca n + 1 acumulada absoluta que contenga al elemento número. El valor de este ntervalo para la medana se calcula utlzando la sguente ecuacón: Me = m ~ = ~ = L m n + 1 F + f 1.h M e L m n F -1 f h Medana Límte nferor de la clase medana cantdad de datos frecuenca acumulada absoluta de la clase anteror al ntervalo medana frecuenca absoluta de la clase medana ampltud del ntervalo de clase Ejemplo (Contnuacón): La edad de los resdentes en un complejo de vvendas tene la sguente dstrbucón: EDAD m f f r f r% F F r F r% [50,60) 55 10 0,0 0 10 0,0 0 [60, 70) 65 18 0,36 36 8 0,56 56 [70, 80) 75 14 0,8 8 4 0,84 84 [80, 90) 85 6 0,1 1 48 0,96 96 [90,100) 95 0,04 4 50 1 100 50 + 1 La clase medana es la que contenga el elemento en la poscón, es decr en la poscón 5,5. Buscamos en la frecuenca acumulada F y vemos que se halla en el ntervalo [60, 70) L = 60 F 10 f = 18 h = 5 Me Me = 1 = 5,5 10 60 +.10 = 68,61 18 INTERPRETE:... VENTAJAS Y DESVENTAJAS DE LA MEDIANA Se puede utlzar para datos cualtatvos ordnales y para datos cuanttatvos Autores: Llana Marcon / Adrana D Amelo

No se ve afectada por los valores etremos. Esta es la propedad más mportante que tene. Se puede utlzar cuando la dstrbucón de frecuencas tene clases abertas, a menos que la medana caga en una de las clases abertas S hay un gran número de datos, el tener que ordenarlos para hallar la medana nsume esfuerzo y tempo. Meda o meda artmétca: Es el promedo de los datos Una muestra con n (mnúscula) observacones, tene una meda (que se denomna estadístca) Una poblacón con N (mayúscula) elementos tene una meda µ (que se denomna parámetro) Cálculo de la meda para datos no agrupados µ = N = n Vemos que es la suma de las observacones dvddas el total de datos. Cuando calculamos la meda de la poblacón, dvdmos por la cantdad de datos de la poblacón N y cuando se calcula la meda muestral por n Ejemplo: El Departamento de Accón Socal ofrece un estímulo especal a aquellas agrupacones en las que la edad promedo de los nños que assten está por debajo de 9 años. S los sguentes datos corresponden a las edades de los nños que acuden de manera regular al Centro calfcará éste para el estímulo? 8 5 9 10 9 1 7 1 13 7 8 = n 8 + 5 + 9 + 10 + 9 + 1 + 7 + 1 + 13 + 7 + 8 = = 9,09 11 Interpretacón:...... Cálculo de la meda para datos agrupados Para calcular la meda para datos agrupados, prmero calculamos el punto medo de cada clase (marca de clase m ). Después multplcamos cada punto medo por la frecuenca absoluta de cada ntervalo = m.f n Autores: Llana Marcon / Adrana D Amelo

Una manera de hacer los cálculos es utlzando la sguente tabla: EDAD m f m. f [50,60) 55 10 550 [60, 70) 65 18 1170 [70, 80) 75 14 1050 [80, 90) 85 6 510 [90,100) 95 190 Total 50 3470 3470 = = 69,4 50 La edad promedo es de 69,4 años VENTAJAS Y DESVENTAJAS DE LA MEDIA Se trata de un concepto famlar e ntutvamente claro Cada conjunto de datos tene una meda y es únca Es útl para llevar a cabo procedmentos estadístcos como la comparacón de medas de varos conjuntos de datos. En estadístca nferencal es la medda de tendenca central que tene mejores propedades Aunque la meda es confable en el sentdo de que toma en cuenta todos los valores del conjunto de datos, puede verse afectada por valores etremos que no son representatvos del resto de los datos. La meda puede malnterpretarse s los datos no forman un conjunto homogéneo. No se puede calcular la meda s la dstrbucón de frecuencas tene clases abertas COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA Las dstrbucones smétrcas tenen el msmo valor para la meda, la medana y la moda. En una dstrbucón con sesgo postvo, la moda se halla en el punto más alto de la dstrbucón, la medana está haca la derecha de la moda y la meda más a la derecha. Es decr Mo < Me < En una dstrbucón con sesgo negatvo, la moda es el punto más alto, la medana está a la zquerda de la moda y la meda está a la zquerda de la medana. Es decr, < Me < Mo Cuando la poblacón tene una dstrbucón sesgada, con frecuenca la medana resulta ser la mejor medda de poscón, debdo a que está sempre entre la meda y la moda. La medana no se ve altamente nfluda por la frecuenca de aparcón de un solo valor como es el caso de la moda, n se dstorsona con la presenca de valores etremos como la meda. La seleccón de la meda, la medana o la moda, depende de la aplcacón. Por ejemplo, se habla del salaro promedo (meda); el preco medano de una casa nueva Autores: Llana Marcon / Adrana D Amelo

puede ser una estadístca más útl para personas que se mudan a un nuevo vecndar o (s hay una o dos crestas que dstorsonan la meda). Y mentr as que la faml a pr omedo conste de 1,7 nños, tene más sentdo para los dseñadores de automóvles pensar en la faml a modal, con dos nños. M E DIDAS DE V A RIA B I L I DAD Dspersón: L a dspersón se refere a la etensón de los datos, es decr al grado en que las observacones se dstrbuyen (o se separan). E sten otras dos característcas de los conjuntos de datos que proporconannformacón útl: el sesgo y la curtoss. Sesgo ( skewness) : L as curvas que representan un conjunto de datos pueden ser smétrcas o sesgadas. L as curvas smétrcas tenen una forma tal que una línea vertcal que pase por el punto más alto de la curva, dvde al área de ésta en dos partes guales. S los valores se concentran en un etremo se dce sesgada. U na curva tene sesgo postvo cuando los valores van dsmnuyendo lentamente haca el etremo derecho de la escala y sesgo negatvo en caso contraro.? E l sesgo es una medda de la asmetr ía de la curv a. E n general es un valor que va de -3 a 3. Una curv a smétr ca toma el valor 0. SESGO POS I T IVO SI M ÉT R I CA (Sesgo 0) SESGO NEG AT IVO C ur toss ( K urtoss) : Nos da una dea de la agudeza (o lo plano) de la dstrbucón de frecuencas. Una curva normal (es el patrón con el que se compara la curtoss de otras curvas) tene curtoss 0. E sta curva se llama mesocúrtca. S la curtoss es mayor que 0, la curva es más empnada que la anteror y se denomna leptocúrtca (Lepto, del grego, "empnado" o "estrecho"). S la curtoss es menor que 0, es relatvamente plana y se denomna platcúrtca ( "plano", "ancho") (E n el gráfco la curva punteada es la curva normal (mesocúrtca)) A utores: Llana Marcon / A drana D A melo

MEDIDAS DE DISPERSIÓN Las meddas de dspersón son útles porque: Nos proporconan nformacón adconal que nos permte juzgar la confabldad de nuestra medda de tendenca central. S los datos están muy dspersos la poscón central es menos representatva de los datos, como un todo, que cuando estos se agrupan más estrechamente alrededor de la meda. Ya que esten problemas característcos de dstrbucones muy dspersas, debemos ser capaces de dstngur que presentan esa dspersón antes de abordar los problemas Nos permten comparar varas muestras con promedos parecdos Los analstas fnanceros están preocupados por la dspersón de las ganancas de una empresa que van desde valores muy grandes a valores negatvos. Esto ndca un resgo mayor para los acconstas y para los acreedores. De manera smlar los epertos en control de caldad, analzan los nveles de caldad de un producto RANGO: Es la dferenca entre el mayor y el menor de los valores Observados R = ( n ) ( 1 ) Sendo ( n ) la observacón mayor y ( 1 ) la observacón Menor El rango es fácl de entender y de encontrar, pero su utldad como medda de dspersón es lmtada. Como sólo toma en cuenta el valor más alto y el valor más bajo gnora la naturaleza de la varacón entre todas las demás observacones, y se ve muy nfludo por los valores etremos. Debdo a que consdera sólo dos valores tene muchas posbldades de cambar drástcamente de una muestra a otra en una poblacón dada. Las dstrbucones de etremo aberto no tenen rango. VARIANZA Y DESVIACIÓN ESTÁNDAR Las descrpcones más comprensbles de la dspersón son aquellas que tratan con la desvacón promedo con respecto a alguna medda de tendenca central. Veremos dos meddas que nos dan una dstanca promedo con respecto a la meda de la dstrbucón: varanza y desvacón estándar. VARIANZA DE LA POBLACIÓN: Es el promedo de las dstancas al cuadrado que van de las observacones a la meda Autores: Llana Marcon / Adrana D Amelo

σ ( µ ) = = N N µ σ : Varanza de la poblacón : Elemento u observacón µ : Meda de la poblacón N : Número total de elementos de la poblacón DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN: Es la raíz cuadrada de la varanza ( µ ) σ = = N N µ Para calcular la varanza de la poblacón, dvdmos la suma de las dstancas al cuadrado entre la meda y cada elemento de la poblacón. Al elevar al cuadrado cada una de las dstancas, logramos que todos los números que aparecen sean postvos y, al msmo tempo asgnamos más peso a las desvacones más grandes. Las undades de la varanza están elevadas al cuadrado (pesos al cuadrado, undades al cuadradro, etc.) lo que hace que no sean claras o fácles de nterpretar. La desvacón estándar, que es la raíz postva de la varanza, se mde en la msma undad que la varable, y su nterpretacón es " en promedo los valores se alejan de la meda en... undades" Aplcacón de la desvacón estándar poblaconal La desvacón estándar nos permte determnar, con un buen grado de precsón, dónde están localzados los valores de una dstrbucón de frecuencas con relacón a la meda. Para curvas cualesquera, el teorema de Chebyshev asegura que al menos el 75% de los valores caen dentro de ± σ ( desvacones estándar) a partr de la meda µ, y al menos el 89% de los valores caen dentro de ± 3σ. Se puede medr con más precsón el porcentaje de observacones que caen dentro de un rango específco de curvas smétrcas con forma de campana (regla empírca): 1. Apromadamente 68% de las observacones cae dentro de ± 1σ. Apromadamente 95% de las observacones cae dentro de ± σ 3. Apromadamente 99% de las observacones cae dentro de ± 3σ Autores: Llana Marcon / Adrana D Amelo

es En el gráfco nterpretamos el 0 como µ, y los números como undades de σ. Por ejemplo, 1 µ + σ ; -1 es µ σ ; es µ + σ ; etc. Cálculo de la varanza y la desvacón estándar utlzando datos agrupados σ ( m µ ).f = = N m. f N µ σ ( m µ ).f = σ = = N m N.f µ σ : Varanza de la poblacón σ : Desvacón estándar de la poblacón f : frecuenca absoluta de la clase m : marca de clase de la clase µ : meda de la poblacón N : tamaño de la poblacón VARIANZA Y DESVIACIÓN ESTÁNDAR MUESTRAL Para calcular la varanza y la desvacón estándar muestral se utlzan las msmas fórmulas que las poblaconales, susttuyendo µ con y N con n 1. La utlzacón de n 1 en lugar de n se verá con más detalle más adelante. Autores: Llana Marcon / Adrana D Amelo

Las epresones para el cálculo de la varanza y desvacón estándar muestral son: VARIANZA MUESTRAL: DATOS SIN AGRUPAR s ( ) = = n 1 n 1 n. n 1 s : Varanza de la muestra : Elemento u observacón : Meda de la muestra n : Número de elementos de la muestra DESVIACIÓN ESTÁNDAR MUESTRAL: ( ) s = s = = n 1 n 1 n. n 1 VARIANZA MUESTRAL: ( m ).f s = n 1 DATOS AGRUPADOS DESVIACIÓN ESTÁNDAR MUESTRAL: ( m ).f s = n 1 s : Varanza de la muestra s : Desvacón estándar de la muestra f : frecuenca absoluta de la clase m : marca de clase de la clase : meda de la muestra n : tamaño de la muestra Ejemplo: Los sguentes datos representan una muestra de la cantdad de peddos daros entregados : 17 5 8 7 16 1 0 18 3 a) Hallar el rango, la varanza y la desvacón estándar e nterpretar. b) Hallar el porcentaje de observacones que están alrededor de la meda a una dstanca de desvacones estándar. Comparar con el teorema de Chebyshev y con la regla empírca a) Para hallar el rango ordenamos el conjunto de mayor a menor 16 17 18 0 1 3 5 7 8 Autores: Llana Marcon / Adrana D Amelo

R = ( 10 ) ( 1 ) = 8-16 = 1 La dferenca entre el mayor y el menor valor observado es 1 Para el cálculo de la varanza convene realzar un cuadro: (1) () (3) ( ) (1) (4) 16 1,7-5,7 3,49 56 17 1,7-4,7,09 89 18 1,7-3,7 13,69 34 0 1,7-1,7,89 400 1 1,7-0,7 0,49 441 1,7 0,3 0,09 484 3 1,7 1,3 1,69 59 5 1,7 3,3 10,89 65 7 1,7 5,3 8,09 79 8 1,7 6,3 39,69 784 = 17 = 4861 ( ) = 15, 1 1) s ( ) = n 1 15,1 = = 16,9 10 1 s = s = 4,11 En promedo, la cantdad de peddos se separa de la meda, en 4,11 (peddos). ) s = n 1 n. = n 1 4861 9 10. ( 17, ) 9 15,1 = = 16,9 9 b) ( s; + s ) = ( 17, 8,;17, + 8, ) = ( 13,48;8,9 ) Todos los valores de la varable caen en este ntervalo o sea el 100% Según Chebyshev: al menos el 75% de los valores caen en ese ntervalo, por lo tanto se verfca Según la regla empírca: apromadamente el 95% de las observacones caen en dcho ntervalo, (el 100% es un valor bastante cercano) COEFICIENTE DE VARIACIÓN: La desvacón estándar es una medda absoluta de la dspersón que epresa la varacón en las msmas undades que los datos orgnales. Pero no puede ser la únca base para la comparacón de dos dstrbucones. Por ejemplo s tenemos una desvacón estándar de 10 y una meda de 5, los valores varían en una cantdad que es el doble de la meda. S por otro lado tenemos una desvacón estándar de 10 con una meda de 5000, la varacón respecto a la meda es nsgnfcante. Lo que necestamos es una medda relatva que nos proporcone una estmacón de la magntud de la desvacón respecto de la magntud de la meda. El coefcente de varacón es una medda relatva de dspersón que epresa a la desvacón estándar como un porcentaje de la meda σ s CV =.100% en la poblacón CV =.100% en la muestra µ Autores: Llana Marcon / Adrana D Amelo

Se lo utlza en la comparacón de varacón de dos o más grupos. Ejemplo: Se pretende comparar el desempeño en ventas de 3 vendedores. Los resultados sguentes dan los promedos de puntajes obtendos en los cnco años pasados por la concrecón de los objetvos A 88 68 89 9 103 B 76 88 90 86 79 C 104 88 118 88 13 A = 88 s A = 1, 67 1,67 CV =.100% = 14,4% 88 B = 83,8 s B = 6, 0 6,0 CV =.100% = 7,18% 83,8 C = 104, s C = 16, 35 16,35 CV =.100% = 15,69% 104, Vemos que el vendedor C tene la mayor varabldad, mentras que el B tene la menor. El desempeño de C parece ser mejor s analzamos la meda, pero hay que tener en cuenta que tambén tene la mayor varabldad en la concrecón de los objetvos. PERCENTILES Un percentl aporta nformacón acerca de la dspersón de los datos en el ntervalo que va del menor al mayor valor de los datos. En los conjuntos de datos que no tenen muchos valores repetdos, el percentl p dvde e los datos en dos partes. Cerca del p porcento de las observacones tenen valores menores que el percentl p y apromadamente (100-p) por cento de las observacones tenen valores mayores o guales que este valor. Defncón: El percentl p es un valor tal que por lo menos p porcento de las observacones son menores o guales que este valor y por lo menos (100-p) por cento de las restantes son mayores o guales que ese valor. Cálculo del percentl: Paso 1. Ordenar los datos de menor a mayor en orden ascendente. Paso. Calcular el índce p = n 100 donde p es el percentl deseado y n el número de observacones. Paso 3. (a) S no es un número entero, debe redondearse al prmer entero mayor que denotando la poscón del percentl p. (b) S es un número entero, el percentl p es el promedo de los valores en las poscones e +1 Ejemplo: Se tene los prmeros sueldos de 1 egresados en Admnstracón. Ordenados son: 3310 3355 3450 3480 3480 3490 350 3540 3550 3650 3730 395 Autores: Llana Marcon / Adrana D Amelo

p 85 Paso : = n = 1 = 10. 100 100 Paso 3. Como no es un número entero se debe redondear al prmer entero mayor que es 11. Es decr el percentl 85 se encuentra en la poscón 11. Este es 3730 CUARTILES Con frecuenca es convenente dvdr los datos en cuatro partes, así cada una contene el 5% de los datos. A los puntos de dvsón se los llama cuartles : Q 1 = prmer cuartl o percentl 5 Q = segundo cuartl o percentl 50 Q 1 = tercer cuartl o percentl 75 Rango ntercuartílco (RIC) es tambén una medda mportante a tener en cuenta, es la dferenca entre el tercer y prmer cuartel RIC= Q 3 - Q 1 Nos ndca el 50 % de las observacones centrales DIAGRAMA DE CAJA Y BIGOTES Un dagrama de caja es un resúmen gráfco de los datos con base en el resumen de cnco números. La clave para elaborar un dagrama de cajas está en calcular Q 1, Q 3 y la medana o Q. Tambén hay que calcular el RIC= Q 3 - Q 1 Pasos para dbujar el dagrama de cajas: 1. Se dbuja una caja cuyos etremos se localcen en el prmer y tercer cuartel. En nuestros datos de salaros Q 1 =3465 y Q 3 = 3600. Sgnfca que la caja contene el 50% de los datos centrales.. En el punto dónde se localza la medana (3505) se traza una línea horzontal o vertcal según se represente la caja en poscón vertcal u horzontal respectvamente. S se queren comparar dos poblacones a veces tambén se representa la meda dentro de la caja. 3.Usando el rango ntercuartílco RIC= Q 3 - Q 1 se localzan los límtes. En un dagrama de caja los límtes se encuentran en 1,5*(RIC) abajo del Q 1 y 1,5(RIC) arrba del Q 3. En el caso de los salaros el RIC= Q 3 - Q 1 = 3600-3465=135. por lo tanto los límtes son L =3465-1,5*(RIC)= 3465-1,5*135 = 36,5 L s = 3600+ 1,5*(RIC)= 3600+1,5*135=380,5 Los datos que quedan fuera de estos límtes se consderan observacones atípcas. 4. A las líneas punteadas se las llama bgotes. Los bgotes van desde los etremos de la caja hasta los valores menor y mayor de los correspondentes a los límtes nferor y superor encontrados en el paso 3.Por lo tanto los bgotes termnan en los salaros cuyos valores son 3310 y 3730. Autores: Llana Marcon / Adrana D Amelo

5. Por últmo con un círculo o astersco se dentfca la observacón atípca 395. Actvdad con R > sueldo<-c(3310,3355,3450,3480,3480,3490,350,3540,3550,3650,3730,395) > boplot(sueldo, man="prmer sueldo de los egresados de Admnstracón", col="blue") Este gráfco no se puede realzar con Ecel. Para obtener todas las meddas juntas usando R se utlza el comando summary. Summary(sueldo) Mn. 1st Qu. Medan Mean 3rd Qu. Ma. 3310 347 3505 3540 3575 395 Para datos sn agrupar en el caso de la edad de los jublados encuestados se colocan en una columna y luego en el menú herramentas se busca análss de datos estadístca descrptva se marca el rango de las celdas y se le pde resumen de estadístcas aceptar y larga Edad de los jublados encuestados en Mendoza en novembre del 008. Columna1 Meda 68,4 Error típco 1,4777054 Medana 65,5 Autores: Llana Marcon / Adrana D Amelo

Moda 65 Desvacón estándar 10,4140604 Varanza de la muestra 108,45653 Curtoss -0,6706671 Coefcente de asmetría 0,43071849 Rango 40 Mínmo 53 Mámo 93 Suma 341 Cuenta 50 Ejemplo de los salaros de los egresados de Admnstracón: Columna1 Meda 3540 Error típco 47,8198957 Medana 3505 Moda 3480 Desvacón estándar 165,65978 Varanza de la muestra 7440,9091 Curtoss 1,71888364 Coefcente de asmetría 1,09110869 Rango 615 Mínmo 3310 Mámo 395 Suma 4480 Cuenta 1 Autores: Llana Marcon / Adrana D Amelo