Análisis estadístico de datos muestrales



Documentos relacionados
ESTADÍSTICA DESCRIPTIVA

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula:

VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN

Estadística Descriptiva

MÉTODOS ESTADÍSTICOS PARA EL CONTROL DE CALIDAD

V Muestreo Estratificado

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo

Estadística Contenidos NM 4

Tema 60. PARÁMETROS ESTADÍSTICOS: CÁLCULO, PROPIEDADES Y SIGNIFICADO.

Los Histogramas. Histograma simple

ESTADÍSTICA poblaciones

PARTE 2 - ESTADISTICA. Parte 2 Estadística Descriptiva Introducción

6. ESTIMACIÓN PUNTUAL

VARIABLES ESTADÍSTICAS UNIDIMENSIONALES.

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx

MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU

CURSO BÁSICO DE ESTADÍSTICA DESCRIPTIVA

ANÁLISIS DE LA VARIANZA ANOVA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES

Esta t d a í d s í titcos o TEMA 3.3

Colegio Sagrada Familia Matemáticas 4º ESO ESTADÍSTICA DESCRIPTIVA

4. SEGUNDO MÓDULO. 4.1 Resumen de Datos

IV. GRÁFICOS DE CONTROL POR ATRIBUTOS

Colegio Sagrada Familia Matemáticas 4º ESO

Estadística aplicada al Periodismo

Definición. Número obtenido a partir del análisis de una variable estadística. Procedimiento de cálculo bien definido:

Estadística Contenidos NM 4

Trata de describir y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor

INTRODUCCIÓN AL CONCEPTO DE VALOR ESPERADO O ESPERANZA MATEMÁTICA DE UNA VARIABLE ALEATORIA

Estadística Descriptiva

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 12.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS

1.1 INTRODUCCION & NOTACION

-Métodos Estadísticos en Ciencias de la Vida

MEDIDAS DE CENTRALIZACIÓN

GENERALIDADES ESTADISTICA DESCRIPTIVA

Una Propuesta de Presentación del Tema de Correlación Simple

Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión

PROBANDO GENERADORES DE NUMEROS ALEATORIOS

GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA

Teoría Simplificada de ERRORES Suscriben este documento los coordinadores de Laboratorio de Química, Física I y Física II.

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS

CURSO DE ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS CON LA HOJA DE CÁLCULO EXCEL

Guía práctica para la realización de medidas y el cálculo de errores

ESTADÍSTICA. UNIDAD 3 Características de variables aleatorias. Ingeniería Informática TEORÍA

MEDIDAS DE TENDENCIA CENTRAL

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO A

INTEGRAL DE LÍNEA EN EL CAMPO COMPLEJO

ERRORES EN LAS MEDIDAS (Conceptos elementales)

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

Algunas Recomendaciones para la Enseñanza de la Estadística Descriptiva o Análisis de Datos

Inferencia Estadística

La inferencia estadística es primordialmente de naturaleza

RENTABILIDAD Y RIESGO DE CARTERAS Y ACTIVOS TEMA 3- I FUNTAMENTOS DE DIRECCIÓN FINANCIERA. Fundamentos de Dirección Financiera Tema 3- Parte I 1

Matemáticas 1 1 EJERCICIOS RESUELTOS: Números Complejos. Elena Álvarez Sáiz. Dpto. Matemática Aplicada y C. Computación. Universidad de Cantabria

7.1. Muestreo aleatorio simple. 7.2 Muestreo aleatorio estratificado. 7.3 Muestreo aleatorio de conglomerados. 7.4 Estimación del tamaño poblacional.

MATEMÁTICA MÓDULO 4 Eje temático: Estadística y Probabilidades

4º MEDIO: MEDIDAS DE POSICIÓN

V II Muestreo por Conglomerados

Objetivos. Introducción n a las medidas de posición n (tendencia central o tipismo): Moda y Mediana Media aritmética

MEDIDAS DE FORMA Y CONCENTRACIÓN

ANÁLISIS DE DATOS CUALITATIVOS. José Vicéns Otero Eva Medina Moral

PROBABILIDAD Y ESTADISTICA

CURSO BÁSICO DE ANÁLISIS ESTADÍSTICO EN SPSS. FRANCISCO PARRA RODRÍGUEZ JUAN ANTONIO VICENTE VÍRSEDA MAURICIO BELTRÁN PASCUAL

Qué es la estadística? presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva.

(Feb03-1ª Sem) Problema (4 puntos). Se dispone de un semiconductor tipo P paralepipédico, cuya distribución de impurezas es

MEDIA ARITMÉTICA. Normalmente se suele distinguir entre media aritmética simple y media aritmética ponderada.

LECCIONES DE ESTADÍSTICA

Métodos indirectos de estimación: razón, regresión y diferencia

PARÁMETROS ESTADÍSTICOS ... N

Tema I. Estadística descriptiva 1 Métodos Estadísticos LECCIONES DE ESTADÍSTICA

ESTADÍSTICA 4º E.S.O. TERMINOLOGÍA ESTADÍSTICA TERMINOLOGÍA ESTADÍSTICA TERMINOLOGÍA ESTADÍSTICA. Tipos de caracteres.

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA PARA ECONOMISTAS

CONTENIDO MEDIDAS DE POSICIÓN MEDIDAS DE DISPERSIÓN OTRAS MEDIDAS DESCRIPTIVAS INTRODUCCIÓN

PRIMERA PRUEBA DE TÉCNICAS CUANTITATIVAS III. 14-Abril Grupo A

III. GRÁFICOS DE CONTROL POR VARIABLES (1)

ESTRUCTURA Y TECNOLOGÍA A DE COMPUTADORES

UNIDAD DIDÁCTICA 13: Estadística Descriptiva

Calificación= (0,4 x Aciertos) - (0,2 x Errores) No debe entregar los enunciados

CONCEPTOS BÁSICOS DE ESTADISTICA DESCRIPTIVA

Los principales métodos para la selección y valoración de inversiones se agrupan en dos modalidades: métodos estáticos y métodos dinámicos

ESTADÍSTICA I UNIDAD I ESTADÍSTICA DESCRIPTIVA

Análisis de Regresión y Correlación Lineal

MUESTREO EN POBLACIONES FINITAS. Antonio Morillas 1

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO C

Guía para la Presentación de Resultados en Laboratorios Docentes

Apuntes preparados por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia

Si los cerdos de otro granjero tienen los siguientes pesos: 165, 182, 185, 168, 170, 173, 180, 177. Entonces el diagrama de puntos está dado por:

Técnicas básicas de calidad

NOTAS SOBRE ESTADÍSTICA APLICADA A LA CALIDAD

Tema 2: Distribuciones bidimensionales

SOLUCIÓN EXAMEN PARCIAL I

ESTADÍSTICA DESCRIPTIVA E INFERENCIAL I

Estadística descriptiva

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

LECTURA 02: DISTRIBUCIONES DE FRECUENCIAS (PARTE I) DISTRIBUCIONES DE FRECUENCIAS EN PUNTOS AISLADOS

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CONTADURÍA Y ADMINISTRACIÓN. Maestría en Administración. Formulario e Interpretaciones

1 ESTADÍSTICA DESCRIPTIVA

MS Word Editor de Ecuaciones

Introducción a la simulación de sistemas discretos

UNA PROPUESTA DE GRÁFICO DE CONTROL DIFUSO PARA EL CONTROL DEL PROCESO

2.4 Pruebas estadísticas para los números pseudoaleatorios

Transcripción:

Aálss estadístco de datos muestrales M. e A. Víctor D. Plla Morá Facultad de Igeería, UNAM Resume Represetacó de los datos de ua muestra: tablas de frecuecas, frecuecas relatvas y frecuecas relatvas acumuladas. Represetacó gráfca de dchas tablas: Hstogramas y polígoos de frecuecas. Aalogías de estos polígoos co las fucoes de probabldad segú el cocepto frecuetsta de la probabldad: dstrbucoes empírcas de probabldad. Meddas de tedeca cetral, de dspersó de la muestra, de sesgo y aplaameto de la muestra, cuado los datos de ella está o o agrupados. Aalogía de estas meddas co las correspodetes a la fucó de probabldad de la varable aleatora dscreta.. La poblacó y la muestra. Relacó etre la probabldad y la estadístca. Clasfcacoes de la estadístca. Estadístca: E el leguaje comú es coocda como u cojuto de datos. Se refere a u cojuto de métodos para maejar la obtecó, presetacó y el aálss de observacoes umércas. Sus fes so: Descrbr al cojuto de datos obtedos y tomar decsoes, o be, realzar geeralzacoes acerca de las característcas de todas las posbles observacoes bajo cosderacó. De esta defcó puede percbrse dos grades áreas de accó de la Estadístca, la Descrptva y la Iferecal. Estadístca Descrptva. Se refere a aquella parte del estudo que cluye la obtecó, orgazacó, presetacó y descrpcó de la formacó umérca. Estadístca Iferecal. Es ua técca de la cual se obtee geeralzacoes o se toma decsoes co base a formacó parcal o completa obteda medate téccas descrptvas. Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009

Es ecesaro determar que todas las cecas s mportar la dscpla tee como deomador comú al método cetífco, por ede, la Estadístca al ser ua herrameta ecesara ara el método cetífco, forma parte també de todas las cecas. Desde el puto de vsta de la aturaleza de la formacó mapulada, la Estadístca puede clasfcarse como Paramétrca y No Paramétrca. Estadístca Paramétrca. So todas aquellas téccas y herrametas estadístcas que utlza varables cuattatvas, es decr, medbles. Estadístca No Paramétrca. So todas aquellas téccas y herrametas estadístcas que utlza varables cualtatvas. Desde el puto de vsta del úmero de varables sobre las cuales se basa el aálss matemátco respectvo, sedo la estadístca uvarable la que utlza ua sola varable, metras que la estadístca multvarable aalza dos o más varables. Poblacó. Cojuto de todas las posbles observacoes. Sómo de Cojuto Uversal se le defe como la totaldad de todas las posbles medcoes observables, bajo cosderacó e ua stuacó dada por determado problema, crcustacas dferetes mplca stuacoes dferetes. Probabldad y Estadístca Las Poblacoes se clasfca e fucó a su cardaldad. Poblacó Fta. Es aquella que cluye u úmero lmtado de meddas y observacoes. Poblacó Ifta. Es aquella que por clur u gra úmero de meddas y observacoes o es posble determar la catdad de éstas. E lo geeral, las característcas medbles de ua poblacó so deomadas Parámetros. Muestra. Cojuto de observacoes o meddas tomadas a partr de ua poblacó dada, es decr, es u subcojuto de la poblacó. Desde luego, la cardaldad de la muestra depede de la cardaldad de la poblacó. Las muestras debe ser represetatvas para evtar u sesgo u error. Estadístcos Muestrales. E lo geeral, so las característcas medbles de ua muestra El muestreo es la técca seguda para obteer o extraer ua muestra. Su vetaja radca e que os permte coocer, co u grado de aproxmacó aceptable, a partr de sus característcas, las característcas propas de la poblacó de la cual provee. Esto resulta E la lteratura suele deomarse por gual estadístcos o estadístcas a las característcas de las muestras. M.A. Víctor Damá Plla Morá. Novembre 009

valuable, tomado e cueta que e la mayoría de los casos, las característcas de las muestras so descoocdas. El sesgo es la dfereca que exste etre los datos obtedos a través de ua muestra y los datos reales (ormalmete descoocdos) perteecetes a la poblacó. Puede terpretarse como u error absoluto etre u valor real y uo aproxmado. Cuado se deoma como sesgado a determado resultado se pretede establecer que su valor es dferete al real. Las téccas de muestreo puede clasfcarse de la sguete forma: Muestreo Estratfcado. Esta técca mplca dvdr a la poblacó e clases o grupos deomados Estratos. Se supoe que las udades que compoe al estrato, so relatvamete homogéeas, co respecto a las característcas que vaya a estudarse. A meudo se toma ua razó de muestreo gual para todos los estratos geeralmete e proporcó; a ua muestra seleccoada así, se le llama Muestra Estratfcada Proporcoal. (Se estuda sólo el estrato) Cuado la proporcó de rastreo está drectamete relacoada co la homogeedad es decr etre más homogéeo sea el estrato meor será su proporcó cluda e la muestra. A ua muestra obteda de esta forma se le deoma: Muestra estratfcada Desproporcoada. (De ua poblacó ormal se toma ua muestra proporcoal) Muestreo por Coglomerados. Este procedmeto mplca la seleccó de grupos (coglomerados) a partr de la poblacó, las dferecas etre coglomerados so geeralmete pequeñas, auque teramete sus udades so heterogéeas. Cada coglomerado es ua matura de la poblacó. Muestreo Probablístco. Es aquel e dode e la eleccó de ua muestra tervee el azar. Muestreo No Probablístco. Es aquel e dode e la seleccó de ua muestra o tervee el azar. Muestreo sstemátco. Se seleccoa ua muestra tomada cada k-ésma udad de la poblacó a la vez, ua vez que las udades de la poblacó está arregladas de algua forma. k, es la razó del muestreo. (E el metro, pregutar a cada 5 persoas que pasa.) Muestreo Aleatoro Smple. Cada uo de los compoetes de la muestra tee la msma probabldad de ser elegdo. Puede ser: Co Reemplazo logra u úmero fto de las muestras, lo que asegura la depedeca estadístca etre ellas. S Reemplazo logra u úmero fto de las muestras las cuales so estadístcamete depedetes. Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009

. Estadístca descrptva. Represetacó de los datos de ua muestra. La Estadístca Descrptva se ecarga de la obtecó, orgazacó, represetacó y descrpcó de los datos. La obtecó de los datos se logra a través de las téccas de muestreo, coforme al dseño del expermeto seleccoado. Como se podrá observar más adelate, exste expresoes que permte trabajar co la totaldad de los datos de la muestra; al arreglo que utlza la totaldad de los datos se le cooce como datos o agrupados. Ates de la evolucó tecológca o be, cuado los recursos de cómputo so lmtados, trabajar co u úmero alto de datos resulta complcado. Por tal motvo, se coformó u arreglo de datos basado e tervalos coocdo como tabla de frecuecas. Cuado se utlza la tabla de frecuecas se dce que se trabaja co datos agrupados. Ahora be, co el avace e los recursos de cómputo resulta ahora de lo más secllo trabajar co datos o agrupados, lo que evta errores umércos y los propos ocasoados por el agrupameto de los datos e las tablas de frecueca. No obstate, las tablas de frecuecas so ecesaras para costrur las represetacoes gráfcas de las muestras. Itervalos de clase. Se refere a los tervalos e los cuales será agrupados los datos obtedos e el muestreo. Ua tabla de frecuecas se compoe de u úmero fto de tervalos cotuos, todos del msmo acho. El úmero de tervalos es varable y su eleccó depede de la expereca de qué costruye la tabla. No exste coseso por parte de los autores para determar el úmero óptmo de tervalos, pero e lo geeral se cocde que o sea ta pocos que o resulte apropada la agrupacó de datos tatos que la haga poco práctca. E geeral, se recomeda que el úmero de tervalos o sea meor de cco mayor a quce. Por otra parte, certos autores ha establecdo alguas reglas matemátcas para determar el úmero de tervalos. Dos de ellas so: Ley de Sturges: # tervalos +. Log () # tervalos E ambos casos, es el úmero total de datos. Lo que resulta mportate, más que determar el úmero de tervalos, es que estos cumpla co ua sere de característcas:. Todos los tervalos debe teer el msmo acho.. U dato sólo puede perteecer a u solo tervalo.. No debe haber tervalos vacíos. Ilustremos lo ateror co u ejemplo. Ejemplo. Los sguetes datos correspode a 80 medcoes de la logtud de u travesaño parte de u chass. Sus dmesoes so e cetímetros. 50. 50.6 5. 50.8 5. 5.9 5. 5.0 50.6 49. 5.8 5.0 50.8 5.8 5. 49.7 50.7 5.4 5.9 50.4 5.7 5.0 49.5 5.0 5. 5.8 50. 5.5 5.7 50. 49.9 49.7 5.0 5. 5. 50.8 49.4 50. 5. 5. 50.8 5.5 5. 5. 50. 5. 5.7 5.8 5.4 5.0 5.7 50. 5. 5.0 5.8 5. 49.9 50.9 50. 5.5 5.0 50. 49.6 5. 5.8 50. 50.5 5.7 5.7 50.4 49.6 5. 5. 5. 5.6 5.9 5.9 5.6 5. 5.8 Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 4

El prmer paso para costrur los tervalos de clase cosste e ordear los datos de meor a mayor, s elmar guo de ellos. 49. 50. 50.5 5.0 5. 5.4 5.7 5.9 49.4 50. 50.6 5.0 5. 5.4 5.7 5.9 49.5 50. 50.6 5.0 5. 5.5 5.7 5.9 49.6 50. 50.7 5.0 5. 5.5 5.8 5.0 49.6 50. 50.8 5. 5. 5.5 5.8 5.0 49.7 50. 50.8 5. 5. 5.6 5.8 5.0 49.7 50. 50.8 5. 5. 5.6 5.8 5. 49.9 50. 50.8 5. 5. 5.7 5.8 5. 49.9 50.4 50.9 5. 5. 5.7 5.8 5.8 50. 50.4 5.0 5. 5. 5.7 5.9 5. Rago. Es la dfereca etre el dato mayor y el meor. Rago 5. 49. 4.0 Número de tervalos. Es atrbucó del dseñador del expermeto defr el úmero de tervalos co la recomedacó de que o sea meos de cco más de quce. No obstate, es posble utlzar como guía las sguetes expresoes: # tervalos +. Log (80) 7. # tervalos 80 8.94 Se covee e establecer ocho tervalos Acho del tervalo. Se defe como: W : Acho del Itervalo Rago W # tervalos Para uestro ejemplo: 4.0 W 8 Probabldad y Estadístca 0.5 Todos los tervalos medrá 0.5 cm de acho. Ahora be, el prmer tervalo puede comezar justo e el dato más pequeño, auque esto o es regla geeral; s al dseñador le covee, puede empezar co u límte feror meor al dato meor. Para motvos de uestro ejemplo, comezaremos e el dato meor. Itervalos de Clase Clase Límte Iferor Límte Superor 49. 49.6 49.6 50. 50. 50.6 4 50.6 5. 5 5. 5.6 6 5.6 5. 7 5. 5.6 8 5.6 5. Puede observarse que tato el dato meor como el mayor so cludos e algú tervalo; s embargo, se produce u coflcto ya que alguos datos cocde co las froteras compartdas de los tervalos, lo cual o satsface la seguda característca de los tervalos de clase. A este respecto, alguos autores e apego fel a la defcó de tervalos expresa a los tervalos de clase e forma de tervalos abertos por u extremo y cerrados por el otro (el extremo cerrado o aberto es decsó del dseñador). S embargo, por usos y costumbres y pesado e las represetacoes gráfcas de los datos, se utlza alguos recursos para evtar esta evetualdad. Uo de estos recursos cosste e aprovechar la uformdad de los datos producto del dseño del expermeto. E uestro caso, el muestreo arrojó datos uformes e el setdo de que todos ellos so compuestos por dos cfras eteras y ua cfra decmal. Se puede proceder de dos formas:. Icar los tervalos u poco ates que el dato meor, por ejemplo e 49.05. Al establecer u límte de tervalos co ua cfra decmal más, se mmza la probabldad de que algú dato cocda co algua frotera. S embargo, el dato mayor quedará excludo del últmo tervalo, por lo que se deberá aumetar el acho del tervalo. Se les deoma Límtes Reales de Clase. M.A. Víctor Damá Plla Morá. Novembre 009 5

. Aumetar el acho de tervalo e ua cfra decmal más que la que cotee los datos, por ejemplo, 0.55. Debe tomarse e cueta que e determado mometo, la suma de los achos de tervalo puede hacer cocdr u dato. Resulta más coveete utlzar 0.5 Este últmo arreglo garatza el cumplmeto de las tres característcas de los tervalos de clase. Marcas de clase. So los putos termedos de cada tervalo de clase. T : Marca de Clase Itervalos de Clase Clase Límte Iferor Límte Superor 49.0 49.6 49.6 50. 50. 50.6 4 50.6 5.4 5 5.4 5.65 6 5.65 5.6 7 5.6 5.67 8 5.67 5.8 T L sup L f Itervalos de Clase Marcas de Límte Límte Clase Clase Iferor Superor 49.0 49.6 49.6 49.6 50. 49.87 50. 50.6 50.8 4 50.6 5.4 50.89 5 5.4 5.65 5.40 6 5.65 5.6 5.9 7 5.6 5.67 5.4 8 5.67 5.8 5.9 Frecueca. Es el úmero de datos que perteece a cada tervalo de clase. F : Frecueca de la -ésma clase 49. 50. 50.5 5.0 5. 5.4 5.7 5.9 49.4 50. 50.6 5.0 5. 5.4 5.7 5.9 49.5 50. 50.6 5.0 5. 5.5 5.7 5.9 49.6 50. 50.7 5.0 5. 5.5 5.8 5.0 49.6 50. 50.8 5. 5. 5.5 5.8 5.0 49.7 50. 50.8 5. 5. 5.6 5.8 5.0 49.7 50. 50.8 5. 5. 5.6 5.8 5. 49.9 50. 50.8 5. 5. 5.7 5.8 5. 49.9 50.4 50.9 5. 5. 5.7 5.8 5.8 50. 50.4 5.0 5. 5. 5.7 5.9 5. Naturalmete, la suma de todas las frecuecas debe cocdr co el úmero total de datos (). Frecueca Relatva. Se refere a la frecueca de cada ua de las clases dvdda etre el úmero total de datos (). De aquí se derva la terpretacó frecuetsta de la probabldad. F' : Frecueca relatva de la -ésma clase F F' Comprobado el axoma de la probabldad para varables aleatoras dscretas: P ( x), la suma de todas las frecuecas relatvas debe ser la udad. Frecueca Acumulada. So los datos acumulados desde el prmer dato hasta la -ésma clase. Fac : Frecueca Acumulada de la -ésma clase. Este cocepto cocde co el partcular de Fucó de Dstrbucó o Fucó de Probabldad Acumulada. Debe destacarse que la Frecueca Acumulada de la últma clase debe cocdr co el úmero total de datos (). Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 6

Frecueca Acumulada Relatva. E la frecueca acumulada de la clase -ésma etre el umero total de datos (). F' ac : Frecueca Acumulada Relatva Fac F' ac De la msma forma, se comprueba que P ( x) ya que la frecueca relatva de la últma clase, debe ser la udad. La tabla completa queda de la sguete forma: El Hstograma e ua gráfca de barras o columas que se costruye e u sstema coordeado e cuyo eje horzotal o de abscsas se detalla los tervalos de clase y e el eje vertcal o de ordeadas se ubca las frecuecas o las frecuecas relatvas. El polígoo de frecuecas es ua líea quebrada que ue los putos de terseccó de la abscsa que correspode a la marca de clase co la ordeada que puede ser la frecueca o la frecueca relatva. El polígoo se cerra co el eje horzotal al carlo e el límte feror del prmer tervalo de clase y coclurlo e el límte superor del últma tervalo de clase. Clase Itervalos de Clase Frecueca Marcas de Frecueca Frecueca Límte Límte Frecueca Acumulada Clase Relatva Acumulada Iferor Superor Relatva 49.0 49.6 49.6 5 0.06 5 0.06 49.6 50. 49.87 6 0.08 0.4 50. 50.6 50.8 0.5 0.9 4 50.6 5.4 50.89 8 0. 4 0.5 5 5.4 5.65 5.40 6 0.0 57 0.7 6 5.65 5.6 5.9 0 0.5 77 0.96 7 5.6 5.67 5.4 0.0 79 0.99 8 5.67 5.8 5.9 0.0 80.00 Σ 80.00 Esta tabla se cooce como Dstrbucó de Frecuecas. Represetacó gráfca de la dstrbucó de frecuecas. Ua forma muy rápda y efectva de terpretar la formacó coteda e ua dstrbucó de frecuecas cosste e grafcar sus elemetos. Báscamete exste tres tpos de represetacoes: Cuado u polígoo se dbuja sobre u hstograma de la msma dstrbucó, la líea quebrada ue los cetros de las bases superores de los rectágulos del hstograma. Las ojvas de frecuecas so líeas quebradas que se traza por los putos de terseccó de las coordeadas que correspode a las marcas de clase y sus respectvas frecuecas acumuladas o frecuecas acumuladas relatvas. Hstograma Represetacoes Gráfcas Polígoo de frecuecas Ojva de frecuecas Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 7

0 8 6 0 5 0 5 6 5 0 49.0 49.6 50. 50.6 5.4 5.65 5.6 5.67 5.8 Hstograma 0 0 8 5 6 0 5 5 6 0 49.6 49.87 50.8 50.89 5.40 5.9 5.4 5.9 Polígoo de frecuecas 00 80 77 79 80 60 57 40 4 0 0 5 49.6 49.87 50.8 50.89 5.40 5.9 5.4 5.9 Ojva de frecuecas Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 8

Meddas descrptvas. Estos ídces permte caracterzar a las dstrbucoes de frecuecas para poder hacer ua terpretacó acertada de la msma. represetar de la mejor forma a los datos de los cuales provee. Esta represetacó puede lograrse de varas formas. E lo geeral, todas estas meddas puede ser calculadas para datos o agrupados y para datos agrupados. Cuado se datos agrupados se trata, se utlza la formacó coteda e la dstrbucó de frecuecas lo que realmete mplca ua smplfcacó, ya que se cosdera que todos los datos que se ubca e u msmo tervalo de clase (frecueca) so guales y se ubca sobre la marca de clase respectva. Naturalmete, esta smplfcacó orga u error e los cálculos, msmo que o se cosdera sgfcatvo y que puede reducrse utlzado tervalos de cofaza agostos. Meddas de Tedeca Cetral. So aquellas meddas que os proporcoa u dato que, co certos matces, puede cosderarse represetate de los datos obtedos del muestreo. Meda. Tradcoalmete se cosdera a la meda como u promedo artmétco de datos. E realdad es más que esto. La meda pretede Probabldad y Estadístca Meda Artmétca Para datos o agrupados: M.A. Víctor Damá Plla Morá. dode es el úmero total de datos. Para datos agrupados: k F T k F' Dode: F es la frecueca de la -ésma clase T es la marca de clase de la -ésma clase F' es la frecueca relatva de la -ésma clase k represeta el total de clases de la dstrbucó T Novembre 009 9

Como dato represetate de ua muestra, la meda artmétca preseta el problema de los datos ubcados e los extremos de la muestra, los más pequeños y los más grades, que e la geeraldad suele ser pocos, sesga o duce u error e el resultado. La meda artmétca uca debe utlzarse por sí sola para hacer algua coclusó sobre la muestra, resulta coveete acompañarla de algua medda de dspersó como se verá más adelate. Meda Poderada. A dfereca del promedo artmétco, el promedo poderado toma e cueta la exsteca de los elemetos además de su valor a promedar. Es decr, al tomar e cueta el úmero de elemetos repetdos mmza la posbldad de uo o dos datos extremos modfque dramátcamete el resultado. La meda poderada correspode drectamete al valor esperado o esperaza matemátca estudado e Probabldad. Para calcular la meda poderada de datos (datos o agrupados) es ecesaro cotar todos ellos para establecer cuatos de ellos se repte. E la práctca, esto mplca ordearlos, motvo por el cual o se acostumbra su cálculo e esta modaldad. Por otra parte, como puede observarse, la meda poderada para datos agrupados cocde co la meda artmétca para datos agrupados, s cosderamos u puto de vsta frecuetsta de la probabldad, ya que la frecueca de la clase -ésma dvdda etre el úmero total de datos es la probabldad de que u dato perteezca a la clase respectva, metras que la marca de clase represeta el valor específco del dato. k Meda geométrca. F T k F' T E la práctca suele obteerse a través de logartmos. Log + ( G) [ Log( ) + Log( ) + Log( ) +... Log( )] Meda armóca. La meda armóca de ua sere de úmeros es el recíproco de la meda artmétca de los recíprocos de los úmeros. e la práctca se utlza: Medaa. Es el dato que dvde exactamete a la mtad a la muestra. mpar Se muestra los dos posbles casos de la medaa co datos o agrupados, e el prmer caso la muestra está compuesta por u úmero o de observacoes. La medaa es el dato que se ecuetra exactamete a la mtad de la muestra ordeada. (de meor a mayor por ejemplo); esto se puede eteder cosderado ua balaza que cotee los datos; para que esté equlbrada debe exstr el msmo úmero de datos de cada lado, por lo que la medaa será la que quede stuada e el cetro de la balaza. par... Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 0

El segudo caso cuado la muestra está compuesta por u úmero par de observacoes. E este caso, la medaa es el promedo de los dos valores cetrales. Para su cálculo como dato o agrupado es ecesaro ordear los datos e forma descedete o ascedete y ateder la sguete regla, de acuerdo a la aturaleza del úmero total de datos : S es mpar: S es par: med + + med + Como puede observarse, cuado el úmero de elemetos es par o hay u valor que se ecuetre exactamete a la mtad de la muestra; e este caso se puede promedar los dos valores más cercaos a la mtad. Para uestro caso, es par e gual a 80. De tal forma: med 80 + 80 + 40 4 + 5.+ 5. 5. Para su cálculo como dato agrupado, la medaa se obtee determado cual es la clase que cluye a la medaa, la cual se dstgue porque tee ua frecueca acumulada relatva mayor o gual a 0.5 (50% de los datos). Para obteer ua expresó que permta su cálculo, a partr de la ojva de frecuecas acumuladas relatvas se puede aproxmar su medaa trazado ua líea horzotal a partr de la ordeada 0.5 (o 50%) hasta cortar la gráfca y e dcho puto localzar el correspodete e el eje de las abscsas. Fac w Fk F ack- Lf k Med Lsup k Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009

A partr de ua terpolacó leal, se utlza la ecuacó de la recta: y y + m ( x ) 0 x 0 de acuerdo co la ateror fgura: y 0.5 y F' ack dode: x med x 0 Lmf m k : Clase dode se ubca a la medaa F' ac k : Frecueca acumulada relatva de la clase ateror a la e que se ecuetra la medaa f ' k : frecueca de la clase dode se ubca la meda w : acho del tervalo Lm f : Límte feror de la clase dode se ubca la medaa. Susttuyedo los valores: f ' k w para uestro ejemplo, la clase medaa (o la que cluye a la medaa) es la clase 4, ya que su frecueca acumulada relatva es de 0.5. De tal forma: 80 med 50.6+ 8 ( 0.5) 5. Moda. Es el elemeto de la muestra que más se repte. Ua muestra puede teer ua o más modas. Cuado todos los elemetos de la muestra so dferetes, o tee setdo hablar de ella. Para datos o agrupados, la moda se determa por speccó, metras que para datos agrupados se puede aproxmar co la marca de clase del tervalo de la clase modal, que es la que tega la mayor frecueca. E alguos casos se puede mejorar la aproxmacó cosderado que la moda es la abscsa del máxmo de ua curva hpotétca que pasa por las marcas de clase, como se observa: f ' k 0.5 F' ack + Lm w ( me ) f D R E P S F D despejado: med w ( 0.5 F' ac ) Lmf + k f ' k Q T No obstate, por motvos geeralstas, resulta mejor expresar a la medaa e fucó de frecuecas absolutas e lugar de relatvas: med Lm f Fac + Fk k w Lf mod Lsup Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009

De acuerdo co lo ateror, se puede cosderar que la moda debe perteecer al tervalo de clase co máxma frecueca, pero proporcoalmete más cercao al tervalo adyacete que le sga e frecueca, de esta maera se puede platear la proporcó (trágulos semejates): Meddas de dspersó. Estas meddas refleja la separacó o alejameto de los elemetos de ua muestra. Estas meddas debe acompañar a las meddas de tedeca cetral, partcularmete a la meda, para evtar los efectos que los datos extremos tee sobre ellas. EP RQ PF ST Mod L D f L sup Mod D La medda de dspersó más seclla es el Rago, ampltud o recorrdo, que como ya se mecoó es la dfereca etre el dato mayor y del meor. S: ( Mod L f ) D ( L sup Mod ) D ( D D ) Lf D LsupD Mod + w L L L L + w sup f sup f susttuyedo ( D D ) L f D + ( L f w) D L ( D + D ) + wd Mod + Mod f Mod L f D + D D + D + D w dode: L f : Límte feror de la clase modal w : acho del tervalo D :dfereca de las frecuecas de la clase modal y la premodal D : dfereca de las frecuecas de la clase modal y la postmodal para uestro ejemplo, la clase modal es la úmero 6. Dado lo ateror: 4 mod 5.65 + 4 + 8 ( 0.5) 5. 7 A partr de la speccó de la muestra, el dato que más se repte es 5. co sete repetcoes. Varaza. Tal y como la defe la probabldad, la varaza de ua varable aleatora es el segudo mometo de la msma co respecto a la meda. Asmsmo, se terpreta de la msma forma, como u promedo de las dstacas de cada dato haca la meda. Mometos para datos o agrupados: mk ( ) k Mometos para datos agrupados: m k r k F ( T ) Para datos o agrupados la varaza se defe como: σ ( ) Esta fórmula puede expresarse de ua forma más seclla a partr del desarrollo del bomo al cuadrado: σ σ ( ) ( + ) + + E este caso r represeta el total de clases, hacedo ua dstcó co k, que es el orde del mometo. Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009

ya que susttuyedo σ Desvacó meda. Certos autores opa que para obteer el promedo de las dstacas de cada dato co respecto a la meda debe obteerse el valor absoluto de la dstaca etre ambos putos y después obteerse su promedo. De tal forma, la desvacó meda (para datos o agrupados) se defe como: σ Para datos agrupados: σ r F r ( T ) F' ( T ) Utlzado esta últma expresó, para uestro ejemplo la varaza es de: σ 0.6564 Por otra parte, utlzado la fórmula para datos o agrupados: σ 0.608 Desvacó estádar. Es fácl de percbr, a partr de u aálss dmesoal, que la varaza posee las udades de la varable muestreada elevada al cuadrado. Esta stuacó o permte ua rápda vsualzacó o terpretacó de la dspersó de los datos. E vrtud de lo ateror, la desvacó estádar es la raíz cuadrada de la varaza: σ σ La desvacó estádar també es coocda como desvacó típca o error estádar. Desvacó Meda Asmsmo, alguos autores utlza como refereca a la medaa e lugar de la meda. Desvacó Meda med Es ecesaro cometar que debdo a las complejdades que mplca el maejo del valor absoluto, estos coceptos o so muy socorrdos. Asmetría. Esta medda, també llamada sesgo, tee como faldad mostrar haca qué lado de le meda se ubca más datos. Correspode al tercer mometo co respecto a la meda determar esta stuacó. No obstate, e stuacó smlar a lo que ocurre co la varaza, el tercer mometo posee las udades de la varable muestreada elevada al cubo. Co el f de volver admesoal al tercer mometo, se defe al coefcete de asmetría de la sguete forma: α m ( m ) ( ) Este coefcete tee como refereca al valor cero. S: α 0 La dstrbucó es smétrca, es decr, exste la msma catdad de datos a ambos lados de la meda. σ m Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 4

Esto mplca que debe cumplrse la sguete relacó: med mod S: α < 0 La dstrbucó es asmétrca egatva, es decr, exste más datos a derecha de la meda. Esto mplca que debe cumplrse la sguete relacó: mod < med < S: α > 0 La dstrbucó es asmétrca postva, es decr, exste más datos a zquerda de la meda. Esto mplca que debe cumplrse la sguete relacó: > med > mod α 0 Datos o agrupados: α 0. 8 Datos agrupados: α 0. 8 Implca que se trata de ua curva asmétrca egatva. Comprobado lo ateror: 5.057 med 5. 7 mod 5.74 mod med Aputameto. Correspode al cuarto mometo co respecto a la meda detfcar a ua medda que auxlar drectamete a las meddas de dspersó. El aputameto o curtoss 4 detalla lo putagudo o aplastado de ua dstrbucó. Ua dstrbucó putaguda mplca que los datos está más cercaos a la meda lo que a su vez arroja ua varaza pequeña. E caso cotraro, ua dstrbucó aplastada mplca que los datos se aleja de la meda, lo que mplca ua varaza grade. El cuarto mometo co respecto a la meda posee las udades de la varable muestreada elevadas a la cuarta poteca. Para mejorar ua posble terpretacó, se defe al coefcete de aputameto o coefcete de curtoss: α > 0 4 α m 4 4 ( m ) ( ) σ m α < 0 El valor de refereca de este coefcete es tres. Alguos autores, para homologar el uso de este coefcete co el de smetría, dsmuye e tres udades el valor obtedo y así logra que el valor de refereca sea cero. 4 α m 4 m 4 ( m ) ( σ ) Para uestro ejemplo: 4 Kurtoss e Iglés Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 5

El lector deberá estar ateto a esta stuacó, ya que la gra mayoría de los programas de computadoras realza su comparacó cotra el cero. La terpretacó es la sguete: S α 4 0 (o tres), se trata de ua dstrbucó mesocúrtca. S α 4 > 0 (o tres), se trata de ua dstrbucó Leptocúrtca (o putaguda). S α 4 < 0 (o tres), se trata de ua dstrbucó Platcúrtca (o aplastada). Fractles. S ua sere de datos que se coloca e orde de magtud, el valor medo (o la meda artmétca de los dos valores medos) que dvde al cojuto de datos e dos partes guales es la medaa. Por extesó, de esta dea se puede pesar e aquellos valores que dvde a los datos e cuatro partes guales. Estos valores se llama prmero, segudo y tercer cuartíl, respectvamete; el segudo cuartíl correspode a la medaa de la dstrbucó. Aálogamete, los valores que dvde a la dstrbucó e dez partes guales se deoma decles, metras que aquellos que lo hace e ce partes guales se llama percetles. El quto decíl y el qucuagésmo percetl Para uestro ejemplo: Para datos o agrupados: 4 α 0. Para datos agrupados: 4 α 0. 4986 correspode a la medaa. El cálculo de los fractles es bajo el msmo procedmeto utlzado para la medaa. Fractl Lm f fraccó Fac + Fk k w dode: Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 6

Lm f : Límte feror de la clase e que se ubca el fractl buscado. : Total de datos de la dstrbucó. fraccó : Porcetaje de la muestra buscado. Fac k : Frecueca acumulada de la clase ateror a aquella e que se ubca F k : w : el fractl buscado. Frecueca de la clase e la cual se ubca el fractl buscado. Acho del tervalo. El procedmeto es aálogo al utlzado para calcular la medaa. Co auxlo de la frecueca acumulada relatva debe ubcarse la clase e la cual se ubca el fractl buscado. Por ejemplo, s de desea calcular el prmer cuartíl debe ubcarse la clase que cluye a la frecueca acumulada relatva al 0.5 o 5%; para el tercer cuartíl correspode al 0.75 o 75% de la dstrbucó; para oveo decíl ocurre a.90 o 90%. La fraccó correspode a la parte de la dstrbucó e la que se desea dvdr, por ejemplo, para la medaa o mtad de la dstrbucó la fraccó fue o 0.5, para el prmer cuartíl será cosecutvamete. 4 o 0.5 y así Ua forma de terpretar la formacó que os etrega los fractles cosste e ubcar los límtes que comprede las froteras msmas que so los fractles. Por ejemplo, la medaa os ubca a la frotera que dvde e dos partes guales a la muestra. Pero además mplca que la prmer parte de la muestra ca e el límte feror de la prmera clase y cocluye e la medaa, así como que la seguda parte ca e la medaa y cocluye e el límte superor del últmo tervalo de clase. Asmsmo, s se resta el tercer y prmer cuartíl estaremos acotado el 50% de la dstrbucó, pero cetrada e toro a la medaa. A esta dstaca se le cooce como dstaca tercuartílca. Aálogamete, a la dfereca etre el oveo y el prmer decíl se le cooce como dstaca terdecílca y acta al 80% de la poblacó cetrada e toro a la medaa. Para el ejemplo desarrollado, los cálculos so los sguetes: Prmer cuartíl (ubcado e la tercera clase) Q 50. + ( 80)(.5) ( 0.5) 50. 505 Tercer cuartíl (ubcado e la sexta clase) Q 5.65 + ( 80)(.75) 0 57 ( 0.5) 5. 765 Dstaca tercuartílca: 5.765 50.505.4 Prmer decíl (ubcado e la seguda clase) D 49.6+ ( 80( 0.) 5 ) ( 0.5 ) 49. 8650 Noveo decíl (ubcado e la sexta clase) D 5.56 + 6 ( 80)( 0.9) 0 57 9 ( 0.5) 5. 05 Dstaca terdecílca: 5.05 49.8650.675 Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 7

Como coclusó de este capítulo, se muestra ua tabla resume co las meddas descrptvas del ejemplo que se ha desarrollado a lo largo del msmo. Datos o agrupados Datos Agrupados 80 Rago 4.0 Sturges 7. 8.94 meda 5.065 meda 5.057 medaa medaa 5.7 moda moda 5.747 Varaza 0.608 Varaza 0.6564 Desv. Est. 0.794 Desv. Est. 0.80 Asmetría -0.800 Asmetría -0.8 Aputameto -0. Aputameto -0.4986 Prmer cuartl 50.4750 Prmer cuartl 50.505 Tercer cuartl 5.7000 Tercer cuartl 5.765 Prmer decl 49.9000 Prmer decl 49.8650 Noveo decl 5.9 Noveo decl 5.05 Bblografía Taro Yamae, Estadístca, Edtoral Harla, Méxco 999. Spegel, Estadístca Sere Schaum, Edt. Mc. Graw Hll, Méxco 999. Frotaa et al, Aputes de Probabldad y Estadístca, Facultad de Igeería, Méxco 985 Berk & Carey, Aálss de datos co Mcrosoft Excel, Edt. Thompso Learg, Méxco 00 Caavos, Probabldad y Estadístca, Mc. Graw Hll, Méxco 994. Captura y Edcó: M.A. María Torres Herádez. Probabldad y Estadístca M.A. Víctor Damá Plla Morá. Novembre 009 8