1 ESTADÍSTICA DESCRIPTIVA

Documentos relacionados
Estadística Descriptiva

ESTADÍSTICA poblaciones

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo

Tema 60. PARÁMETROS ESTADÍSTICOS: CÁLCULO, PROPIEDADES Y SIGNIFICADO.

MEDIDAS DE TENDENCIA CENTRAL

VARIABLES ESTADÍSTICAS UNIDIMENSIONALES.

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS

Estadística Contenidos NM 4

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula:

Qué es la estadística? presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva.

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO A

Curso de Estadística Unidad de Medidas Descriptivas. Lección 2: Medidas de Tendencia Central para Datos Agrupados por Valor Simple

MEDIDAS DE FORMA Y CONCENTRACIÓN

PARÁMETROS ESTADÍSTICOS ... N

Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión

Estadística Descriptiva

4º MEDIO: MEDIDAS DE POSICIÓN

PROBABILIDAD Y ESTADISTICA

MATEMÁTICA MÓDULO 4 Eje temático: Estadística y Probabilidades

La inferencia estadística es primordialmente de naturaleza

Colegio Sagrada Familia Matemáticas 4º ESO ESTADÍSTICA DESCRIPTIVA

Apuntes preparados por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia

ESTADÍSTICA I UNIDAD I ESTADÍSTICA DESCRIPTIVA

Si los cerdos de otro granjero tienen los siguientes pesos: 165, 182, 185, 168, 170, 173, 180, 177. Entonces el diagrama de puntos está dado por:

MEDIA ARITMÉTICA. Normalmente se suele distinguir entre media aritmética simple y media aritmética ponderada.

Teoría Simplificada de ERRORES Suscriben este documento los coordinadores de Laboratorio de Química, Física I y Física II.

PARTE 2 - ESTADISTICA. Parte 2 Estadística Descriptiva Introducción

EJERCICIOS RESUELTOS TEMA 3.

CAPITULO II. Medidas estadísticas. Objetivo. Contenido. Calcular las medidas posición, de tendencia central, de dispersión y de forma.

APROXIMACIÓN NUMÉRICA AL CÁLCULO DEL ÁREA BAJO LA GRÁFICA DE UNA FUNCIÓN MEDIANTE RECTÁNGULOS INSCRITOS

MEDIDAS DE TENDENCIA CENTRAL

Curso de Estadística Unidad de Medidas Descriptivas. Lección 3: Medidas de Tendencia Central para Datos Agrupados por Clases

Experimento: TEORÍA DE ERRORES. UNIVERSIDAD DE ATACAMA Facultad de Ciencias Naturales Departamento de Física I. OBJETIVOS

NOCIONES BÁSICAS DE ESTADÍSTICA UTILIZADAS EN EDUCACIÓN

4. SEGUNDO MÓDULO. 4.1 Resumen de Datos

Estadística Espacial. José Antonio Rivera Colmenero

Estadística descriptiva

Tema 2: Distribuciones bidimensionales

El valor en el que se estabilizan las proporciones se le conceptualiza como la probabilidad

UNIDAD 14.- Distribuciones bidimensionales. Correlación y regresión (tema 14 del libro)

VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN

TEMAS CUESTIONARIO DE AUTOEVALUACIÓN

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE CONTADURÍA Y ADMINISTRACIÓN. Maestría en Administración. Formulario e Interpretaciones

Objetivos. Introducción n a las medidas de posición n (tendencia central o tipismo): Moda y Mediana Media aritmética

1 Estadística. Profesora María Durbán

Probabilidad y estadística

DISTRIBUCIÓN DE LA MEDIA Y EL TEOREMA DEL LÍMITE CENTRAL

NOTAS SOBRE ESTADÍSTICA APLICADA A LA CALIDAD

x x x x x Y se seguía operando

V II Muestreo por Conglomerados

REGRESIÓN LINEAL SIMPLE

División de Estadísticas y Proyecciones Económicas (DEPE) Centro de Proyecciones Económicas (CPE)

Estadística Descriptiva

MEDIDAS DE CENTRALIZACIÓN

Intensificación en Estadística

CONTENIDO MEDIDAS DE POSICIÓN MEDIDAS DE DISPERSIÓN OTRAS MEDIDAS DESCRIPTIVAS INTRODUCCIÓN

CAPÍTULO III TÉCNICAS DE SIMULACIÓN ESTADÍSTICA. Los datos sintéticos son elementos de suma importancia en los sistemas de diseño en

G - Métodos de Interpolación

Respuesta. Si 100 manzanas es una muestra suficientemente grande podemos ocupar el TCL. Por lo tanto:

6. ESTIMACIÓN PUNTUAL

Medidas de Tendencia Central

Análisis estadístico de datos muestrales

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

5.3 Estadísticas de una distribución frecuencial

En esta sección estudiaremos el caso en que se usa un solo "Predictor" para predecir la variable de interés ( Y )

CAPITULO TRES MEDIDAS DE TENDENCIA CENTRAL

MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU

CAPITULO 1 DEFINICIONES GENERALES

ESTADÍSTICA DESCRIPTIVA

2 Representación gráfica de las series de frecuencias.

n p(a ) = n p(a ) = n k Nº de casos favorables de A Nº de casos posibles de E p(a) = Capítulo PROBABILIDAD 1. Introducción

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

Estadística I. Carmen Trueba Salas Lorena Remuzgo Pérez Vanesa Jordá Gil José María Sarabia Alegría. Capítulo 2. Medidas de posición y dispersión

TRABAJO 2: Variables Estadísticas Bidimensionales (Tema 2).

INSTITUTO TECNOLÓGICO DE APIZACO PROBABILIDAD AXIOMAS Y TEOREMAS DE LA PROBABILIDAD.

Ventajas e Inconvenientes.

ESTADÍSTICA DESCRIPTIVA

Ensayos de control de calidad

Tema 9 Estadística Matemáticas B 4º E.S.O. 1 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRÁFICAS EN VARIABLES DISCRETAS

2 - TEORIA DE ERRORES : Calibraciones

MEDIDAS RESUMEN OBJETIVOS. Al término de la unidad el alumno podrá:

MUESTREO EN POBLACIONES FINITAS (1) Dos aspectos básicos de la inferencia estadística, no vistos aún:

Gráfica de los resultados experimentales: Variable Independiente: Variable Dependiente: Variable asociada:

4 METODOLOGIA ADAPTADA AL PROBLEMA

1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL

Práctica 11. Calcula de manera simbólica la integral indefinida de una función. Ejemplo:

I n t r o d u c i ó n A l a E s t a d í s t i c a 1

Análisis de Regresión

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 12.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS

CURSO BÁSICO DE ESTADÍSTICA DESCRIPTIVA

Regresión lineal simple

n 2 fi donde: n es el número de individuos

x θ es conocida pero se desconoce θ total o ˆθ ) debe ser función de los datos de la muestra

ANGEL FRANCISCO ARVELO LUJAN

IV. GRÁFICOS DE CONTROL POR ATRIBUTOS

2. Censura y truncamiento

que queremos ajustar a los datos. Supongamos que la función f( x ) describe la relación entre dos cantidades físicas: x e y = f( x)

En este capítulo 5 estudiaremos una serie de conceptos básicos, y que serán fundamentales para el posterior desarrollo de la inferencia estadística.

Incertidumbre en las mediciones directas e indirectas

Transcripción:

1 ESTADÍSTICA DESCRIPTIVA 1.1 OBJETO DE ESTUDIO Y TIPOS DE DATOS La estadístca descrptva es u cojuto de téccas que tee por objeto orgazar y presetar de maera coveete para su aálss, la formacó coteda e ua muestra. Detro de ella exste báscamete tres tpos de téccas: - Dstrbucó de Frecuecas - Gráfcas - Parámetros umércos La estadístca descrptva, e geeral es bastate seclla, auque o por ello deja de ser teresate y sobre todo mportate. Es así que s a través de la estadístca buscamos obteer coclusoes acerca de toda ua poblacó a partr de la formacó coteda e ua muestra, parece claro que o es posble hacerlo s o somos capaces prmeramete de descrbr el comportameto del cojuto de datos que teemos a la mao. Esto es, o podemos preteder descrbr o tur lo que ocurre co lo descoocdo, s o somos capaces de descrbr y aalzar prmero lo que sucede co lo que sí coocemos. De ahí la mportaca de la estadístca descrptva. Como se mecoó ates, la estadístca descrptva es u cojuto de téccas, pero cabe aclarar que dchas téccas o so excluyetes, so complemetaras, s embargo depededo del tpo de datos que se desee maejar, o sempre es posble utlzarlas todas. Idetfquemos etoces etre datos cualtatvos y cuattatvos. Los datos cualtatvos se refere, como su ombre lo dce, a formacó sobre cualdades o característcas del expermeto, que e ocasoes puede estar represetados por úmeros, metras que los datos cuattatvos so, ecesaramete, datos umércos. Exste la tedeca a pesar que todos los datos umércos so datos cuattatvos, s embargo esto o es así. E u proceso de medcó se puede detfcar cuatro dferetes escalas de meddas: M. e I. Isabel Patrca Agular Juárez 15

a) Nomal: Es el vel más prmtvo de medcó. E esta escala los úmeros se utlza como ombres y o como catdades o magtudes. Por lo tato los datos meddos e escala omal so datos cualtatvos aú sedo datos umércos. b) Ordal: E la escala ordal los dferetes valores observados represeta dferetes veles de posesó de la característca observada, etre las dferetes udades, auque o es posble comparar dchos veles a través de los valores observados. Esto sgfca que los datos auque o so comparables se puede ordear. U ejemplo de medcoes co esta escala so las observacoes del status ecoómco de ua persoa (alto, medo, bajo, etc.). Podría cosderarse las medcoes realzadas e esta escala como datos cualtatvos. c) Itervalar: Es ua forma más fa de medr, que la escala ordal y desde luego que la omal. Los datos meddos e esta escala represeta la magtud de las dferecas etre dsttas udades observadas, auque las medcoes aú o so del todo comparables. Por otro lado, el cero e esta escala de medcó es arbtraro y o mplca la auseca total de la característca medda. Por ejemplo cosdere medcoes relacoadas co el coefcete telectual de dferetes persoas, a partr de dchas medcoes o se puede cosderar que ua persoa A que tee el C.I. del doble de otra B, sea doblemete telgete que B. Otro ejemplo es la medcó de temperaturas e grados Fahrehet. Auque la dfereca etre 0 o F y 45 o F es la msma que etre 90 o F y 105 o F, s embargo e cuato a la catdad de calor, 90 o F o es el doble que 45 o F y 0 o F o sgfca auseca de temperatura. d) De razó: La escala de razó es ua escala tervalar, úcamete que cosdera u cero absoluto, esto es, los úmeros medos represeta gual úmero de udades de dstaca del cero absoluto, por lo tato las observacoes se puede comparar a través de razoes o porcetajes. Como ejemplos se puede mecoar las medcoes del tempo, la temperatura y la dstaca etre otras. Como se mecoó aterormete, el tpo de datos que se maeja e ua vestgacó lmta la utlzacó de alguos métodos estadístcos para el aálss de la formacó. Así, para descrbr datos cualtatvos lo usual es utlzar métodos gráfcos, ya que por las característcas de las otras téccas, o es posble aplcarlas co ese tpo de M. e I. Isabel Patrca Agular Juárez 16

formacó, metras que para aalzar datos cuattatvos (tervalares o de razó) puede aplcarse los tres tpos de téccas mecoadas aterormete y e este caso, como se djo ates, se apoya uas co otras, para lograr ua mejor y más ampla descrpcó del cojuto de datos. E muchas ocasoes o es posble elegr la escala e la que se desea efectuar las medcoes, so que esta está determada por el tpo de expermeto que se observará. De cualquer maera, el objetvo de presetar las cuatro escalas de medcó o es preocuparse por realzar ua clasfcacó precsa de los datos e algua de las cuatro escalas, ya que e muchos casos puede haber ambgüedad y o resulta u problema secllo, so úcamete detfcar etre los dsttos tpos de datos que usualmete se maeja, co el f de determar el tpo de téccas utlzables e el aálss de la formacó, así como cudar la terpretacó que se haga de los datos y de los resultados que a partr de ellos se geere. Descrbremos a cotuacó cada ua de las téccas de la estadístca descrptva, así como su aplcabldad de acuerdo al tpo de datos que costtuya la muestra.. DISTRIBUCIÓN DE FRECUENCIAS La costruccó de Tablas de Dstrbucó de Frecuecas es ua técca muy usual e la estadístca ya que hace más efcete el aálss de cojutos grades de datos. La tabla de dstrbucó de frecuecas se utlza prcpalmete para el aálss de datos cuattatvos, o obstate, també es comú realzar agrupacoes de datos cualtatvos, auque realmete tales agrupacoes o so tablas de dstrbucó de frecuecas propamete dchas, so solamete ua orgazacó de la formacó e la que el objetvo es cuatfcar el úmero de veces que se observó cada udad de formacó. M. e I. Isabel Patrca Agular Juárez 17

Ejemplo 1.1 E los estudos demográfcos de u país suele ser de terés la poblacó de cada ua de las dferetes razas: Blaca, Cha, Arabe, Ida, Negra, Mestza. Se seleccoa de maera aleatora u grupo de 500 persoas de la poblacó del país y se vestga cuál es su orge. Los resultados se obtedría de maera persoal, ya que sería las respuestas a la preguta cuál es su raza de oríge?, s embargo, u prmer teto para aalzar la formacó es agruparla, y el resultado sería ua tabla como la sguete: Raza del ecuestado Número de persoas Blaca 500 Cha 800 Arabe 300 Ida 50 Negra 300 Mestza 350 Defcó 1.1: Ua tabla de dstrbucó de frecuecas es ua clasfcacó de los datos e clases o categorías de acuerdo a sus valores. Este tpo de clasfcacó es comú e la presetacó de datos ecoómcos, cesales, etc. U ejemplo típco de ua tabla de dstrbucó de frecuecas es la que se muestra a cotuacó. M. e I. Isabel Patrca Agular Juárez 18

Límtes de clase Marcas de clase x Frecueca f Frecueca acumulada F Frecueca relatva f * Frecueca relatva acumulada F * - x < 7 0.05 0.05 7 x < 16 11 4 6 0.1 0.15 16 x < 5 0 7 13 0.175 0.35 5 x < 34 9 14 7 0.35 0.675 34 x < 43 38 8 35 0. 0.875 43 x < 5 47 5 40 0.15 1.000 40 Tabla 1.1 Tabla clásca de dstrbucó de frecuecas. Como se puede observar, ua tabla completa de dstrbucó de frecuecas costa de ses columas cuyo cotedo se explcará eseguda. S aceptamos que e la costruccó de ua tabla de dstrbucó de frecuecas se realzará ua clasfcacó de los datos, resulta claro que es dspesable cotar, prmeramete, co el crtero de clasfcacó a utlzar, msmo que se defe a través de los límtes de clase ó be medate las froteras de clase. Límtes de clase: Costtuye u tervalo semaberto ( cerrado por la zquerda y aberto por la derecha). Los datos e la muestra, que sea mayores o guales al límte feror de la clase y meor que el límte superor de ella msma, perteecerá a la clase e cuestó. Los límtes de clase tedrá la msma aproxmacó que los datos, es decr: Aproxmacó de los datos eteros décmas cetésmas Aproxmacó de los límtes eteros décmas cetésmas Co este crtero se puede deducr de la tabla 1.1 que los datos que e ella se agruparo era todos úmeros eteros. M. e I. Isabel Patrca Agular Juárez 19

Para que la agrupacó sea válda, absolutamete todos los datos e la muestra se debe poder clasfcar co el crtero dado por los límtes, esto sgfca que guo debe estar fuera de esta clasfcacó. Por lo tato, també podemos estar seguros de que e la supuesta muestra agrupada e la tabla 1.1, gú dato es meor que - como tampoco exste gú dato mayor que 5. Marca de clase (x ): Es el puto medo del tervalo de clase y se cosdera represetatvo de los datos e dcha clase. Frecueca (f ): Es el úmero de datos de la muestra que correspode a la clase e cuestó. Para determar la frecueca de ua clase, basta co realzar u coteo del úmero de observacoes e la muestra, detfcado aquellos datos que cae detro del tervalo dcado por los límtes de clase. Frecueca acumulada (F ): Es el úmero de datos e la muestra cuyo valor es meor que el límte superor de la clase e cuestó. Para calcular F basta cotablzar las frecuecas observadas e la clase de terés y las aterores. Esto es, F = j=1 f j Frecueca relatva (f * ): Es la proporcó de los datos e la muestra que perteece a la clase e cuestó. S deotamos por al úmero de datos e la muestra y a como el úmero de la clase, la frecueca relatva se expresa como sgue: f f = = f * m j= 1 e dode m es el úmero de clases costrudas e la tabla de dstrbucó de frecuecas. Podríamos detfcar e este mometo ua prmera relacó etre la probabldad y la estadístca, ya que s recordamos, la terpretacó frecuetsta de la probabldad defe la probabldad de u eveto como la frecueca relatva co la que dcho eveto f j M. e I. Isabel Patrca Agular Juárez 0

ocurre e u úmero grade de repetcoes del expermeto bajo estudo, por lo tato, s uestra muestra fuera grade, podríamos pesar que la frecueca relatva de clase se aproxmaría a la probabldad de que la v.a. poblacoal tome valores e dcha clase. Evdetemete, se tedrá ua mejor aproxmacó cuato más grade sea la clase. Frecueca relatva acumulada (F * ): Es la proporcó de los datos e la muestra que so meores que el límte superor de la clase e cuestó. * F = = F F m f j e dode uevamete m es el úmero de clases costrudas. j=1 Por extesó, se puede coclur que la frecueca acumulada relatva se asemeja a la fucó de dstrbucó, y que la semejaza será mayor sempre que la muestra sea más grade. Lotgud de la clase: Se deota por c y es la dfereca etre los límtes superor e feror de ua msma clase. E este mometo estamos e codcoes de terpretar la formacó coteda e ua tabla de dstrbucó de frecuecas, s embargo queda aú s resolver el problema mportate de la costruccó de ua de ellas, a partr de u cojuto de datos. Es claro que la agrupacó de datos e tablas es vetajosa puesto que permte aalzar la formacó coteda e la muestra, de ua maera más seclla, dado que dsmuye el volume de formacó co la que tedrá que trabajar, s embargo tee la desvetaja de que al agrupar, se perde precsó e los datos que se maejará, co ua cosecuete pérdda e la precsó de las coclusoes que se obtega a partr de dcha formacó. Para evtar al máxmo la pérdda de formacó que provee la muestra, es ecesaro cudar la costruccó 1 de la tabla de dstrbucó de 1 Cabe aclarar que la que aquí se presetará es ua forma partcular de costruccó de ua tabla de dstrbucó de frecuecas, o así la úca, ya que e este setdo o hay u coseso. Exste alguas forma alteras de costruccó, s embargo, las dferecas que exste etre ellas so de forma y o de fodo, por lo cual es relatvamete secllo terpretar la formacó coteda e otra tabla de dstrbucó de frecuecas costruda de algua otra forma, y los resultados que de dcho aálss se obtega o tedrá dferecas radcales co los geerados medate la costruccó que aquí haremos, atrbubles a la forma de realzar la agrupacó. M. e I. Isabel Patrca Agular Juárez 1

frecuecas y por ello es coveete tomar e cosderacó las sguetes recomedacoes empírcas: 1.- La tabla de dstrbucó de frecuecas costará de etre 5 y 0 clases, clusve..- Todas las clases será de la msma logtud (c). Mostraremos la forma de costruccó de ua tabla de dstrbucó de frecuecas, a través de u ejemplo. Ejemplo 1. Cosdere los sguetes úmeros de scrpcó de alguos estudates de la Facultad de Igeería. Agrúpelos e ua tabla de dstrbucó de frecuecas. 1045 80 65 110 639 188 10 10 784 847 113 149 56 1370 1767 463 491 109 1305 93 1313 77 1465 193 3073 00 933 985 1565 947 1303 460 650 55 531 181 004 5308 1800 1706 045 415 1400 946 1703 039 Resolucó Recordemos que para que la tabla que se costruya se pueda cosderar adecuada para aalzar los datos, se requere que cotega a todos los datos e la muestra. Así, es ecesaro coocer el rago e el que se ecuetra los datos, para lo cual se tee la sguete defcó: Rago de la muestra: Es la dfereca etre los valores (datos) mayor y meor de la muestra. E este caso se tee que Rago = 5308-55 = 553 M. e I. Isabel Patrca Agular Juárez

Para determar ahora la logtud de clase, se puede empezar por establecer el úmero de clases que covee costrur, para lo cual se puede cosderar como valor adecuado el resultado de calcular Esto es, m = 46 7 Como el límte feror de la prmera clase debe ser u valor u poco meor al mímo, 5308-54 utlcemos 54. Por lo tato, la logtud de clase será = 750.57 750 7 Por al razó utlzaremos c = 750. Como ya djmos, el límte feror de la prmera clase será 54. La tabla resultate será la que se muestra: Límtes x f F f * F * 54-804 49 1 1 0.609 0.609 804-1554 1179 17 9 0.3696 0.6304 1554-304 199 1 41 0.609 0.8913 304-3054 679 43 0.0435 0.9348 3054-3804 349 1 44 0.017 0.9565 3804-4554 4179 0 44 0.0000 0.9565 4554-5304 499 1 45 0.017 0.9783 5304-6054 5679 1 46 0.017 1.0000 46 Descrpcó gráfca de los datos Geeralmete, cuado se desea hacer ua presetacó clara de u cojuto de datos, se elge ua forma gráfca. Así, se acostumbra presetar gráfcamete los resultados de ua compañía, se hace gráfcas comparatvas de las utldades de ua empresa, se hace gráfcas que muestre la composcó de ua poblacó (% de hombres adultos, % de mujeres adultas, %de ños), etc. M. e I. Isabel Patrca Agular Juárez 3

E realdad para todos es más claro compreder cuál es el comportameto de u cojuto de datos s éste se preseta de maera gráfca, que s se muestra úcamete a través de valores umércos. Por ello, exste ua gra varedad de gráfcas, s embargo utlzaremos solamete alguas de ellas. Cosderemos uevamete el tpo de datos a maejar. Usualmete para la represetacó de datos cualtatvos se utlza, etre otros, dos tpos de gráfcas: - Gráfcas de barras - Gráfcas de sectores crculares ( gráfcas de pe). Por su parte, para represetar el comportameto de datos cuattatvos exste també ua ampla varedad de posbldades de gráfcas, pero úcamete presetaremos tres de ellas: - Hstograma de frecuecas - Polígoo de frecuecas - Ojva o polígoo de frecuecas acumuladas 1.- Hstograma de Frecuecas Es ua gráfca formada por barras rectagulares cuyas bases se cetra e las marcas de clase de ua dstrbucó de frecuecas y sus áreas represeta las frecuecas absolutas o relatvas correspodetes. Nótese que de acuerdo co esta defcó o se requere más que u eje, e el cual se detfcará las marcas de clase coforme a las clases que se haya costrudo. Cabe sstr e que e este caso també es solo ua de las costruccoes posbles o coocdas, s embargo tee la vetaja de que es fácl ecotrar la smltud etre el hstograma de frecuecas relatvas, y el hstograma de probabldad que se costruye e probabldad para las fucoes de probabldad. Por otro lado, se matee la cocepcó de la probabldad de u eveto como área, que resulta útl para la más fácl compresó del cocepto de fucó de desdad e el caso de varables aleatoras cotuas. A cotuacó se muestra el hstograma de frecuecas absolutas para los datos del ejemplo: M. e I. Isabel Patrca Agular Juárez 4

Hstograma de Frecuecas 18 16 14 1 10 8 6 4 0 17 1 1 1 0 1 1 49 1179 199 679 349 4179 499 5679 marcas de clase També es comú costrur el hstograma de frecuecas como ua gráfca e el plao cartesao, cosderado a las frecuecas como las alturas de las barras, tal como se muestra a cotuacó. Hstograma de Frecuecas frecuecas 18 16 14 1 10 8 6 4 0 49 1179 199 679 349 4179 499 5679 marcas de clase.- Polígoo de Frecuecas Es ua gráfca polgoal que represeta para cada marca de clase la frecueca de dcha clase y se costruye uedo, medate líeas rectas, los putos medos de las bases superores de las barras del hstograma de frecuecas. Es claro que tampoco se requere trazar más que u eje, para hacer la gráfca del polígoo de frecuecas. M. e I. Isabel Patrca Agular Juárez 5

Como caso partcular se preseta a cotuacó la gráfca del polígoo de frecuecas de los datos del ejemplo ateror. Polígoo de Frecuecas Frecueca 18 16 14 1 10 8 6 4 0 49 1179 199 679 349 4179 499 5679 Marcas de Clase Exste ua forma alteratva de trazar la gráfca del polígoo de frecuecas, s ecesdad de hacerlo sobre el hstograma. Observe la sguete gráfca. Polígoo de Frecuecas Frecuecas 18 16 14 1 10 8 6 4 0 49 1179 199 679 349 4179 499 5679 Marcas de Clase M. e I. Isabel Patrca Agular Juárez 6

3.- Ojva Es ua gráfca polgoal que represeta para cada límte de clase la frecueca acumulada o la frecueca relatva acumulada hasta dcha frotera. Cuado la que se represeta es la frecueca relatva acumulada se le llama ojva porcetual. A dfereca de las gráfcas aterores, para trazar esta gráfca s es dspesable cotar co los dos ejes coordeados. Es claro que la dfereca etre la ojva y la ojva porcetual o es la forma de ellas, so solamete que ua de ellas es el resultado de trasladar a la otra haca arrba o haca abajo, depededo de cual se esté tomado como base. La ojva porcetual es, además, ua aproxmacó a la gráfca de la fucó de dstrbucó de la varable aleatora que represete a la poblacó. Ejemplo: Cosdere la sguete tabla de dstrbucó de frecuecas. Trace la ojva correspodete. Límtes x f F f * F * 7-30 8.5 0.667 0.066 30-33 31.5 3 5 0.1 0.167 33-36 34.5 9 14 0.3 0.467 36-39 37.5 5 19 0.167 0.633 39-4 40.5 1 0.667 0.7 4-45 43.5 4 5 0.133 0.833 45-48 46.5 3 8 0.1 0.933 48-51 49.5 1 9 0.033 0.967 51-54 5.5 1 30 0.033 1 30 M. e I. Isabel Patrca Agular Juárez 7

Polígoo de Frecuecas Acumuladas (Ojva) 35 Frecueca Acumulada 30 5 0 15 10 5 0 7 30 33 36 39 4 45 48 51 54 Límtes de Clase Descrpcó de los datos a través de parámetros umércos Desde luego es posble ya, medate la tabla de dstrbucó de frecuecas y las gráfcas hacer certa descrpcó del comportameto de los datos e la muestra, pero covee estar cocete de que sabemos que las gráfcas puede metr, e el setdo de que smplemete co u cambo de escala, varacoes que probablemete sea pequeñas se puede ver muy grades y vceversa, y la obtecó de valores que caracterce a toda la muestra puede solamete aproxmarse, ya que como djmos ates, ua represetacó gráfca puede o ser lo precsa que uo desearía, por lo que además de ua gráfca requermos de valores que sea represetatvos del comportameto de los datos y que depeda úcamete de dchos datos. A estos valores se les llama "parámetros umércos" y se utlza para ayudar a descrbr el comportameto de la muestra co u poco más de precsó. Los parámetros umércos, por el tpo de formacó que da, se clasfca e: M. e I. Isabel Patrca Agular Juárez 8

- Meddas de tedeca cetral - Meddas de dspersó - Parámetros de forma Presetaremos solamete los parámetros umércos que más comúmete se utlza. 1.- MEDIDAS DE TENDENCIA CENTRAL: So valores que se ecuetra detro del rago de la muestra y que se puede cosderar como represetatvos de la msma. Es mportate aclarar que o ecesaramete cocde co alguo de los datos observados. Etre las más usuales está la meda artmétca, la medaa y la moda, que estudaremos a cotuacó. a) Meda artmétca Es probablemete la medda de tedeca cetral de uso más geeralzado, se deota por x (es muy mportate que la x sea múscula, ya que la mayúscula se utlzará más adelate para deotar algo dferete} y se defe de la sguete forma: a) S x 1, x, x 3,..., x so los datos cotedos e ua muestra, y se ecuetra s agrupar, etoces dode es el tamaño de la muestra. x = Nótese que es la defcó que coocemos para el promedo usual de los datos e la muestra. x b) S los datos se ecuetra agrupados e ua tabla de dstrbucó de frecuecas, y utlzamos el msmo cocepto que para los datos s agrupar, se defe la meda artmétca como: x = m x f = m x f *, puesto que f = f * M. e I. Isabel Patrca Agular Juárez 9

e dode m es el úmero de clases x la marca de clase de la clase, y f la frecueca de la clase b) Medaa Es el valor que dvde al cojuto de datos de la muestra e dos cojutos de gual tamaño, es decr, es aquel valor para el cual exste el msmo úmero de datos meores o guales a él que mayores o guales a él. E otras palabras, la medaa es aquel valor para el cual el 50% de los datos so meores o guales a él. Para calcular la medaa de la muestra cuado los datos o se ecuetra agrupados e ua tabla de dstrbucó de frecuecas, se debe segur los sguetes pasos: 1.- Se ordea los datos e forma crecete..- Ua vez ordeados se tee dos casos: a) S el úmero de datos es mpar, la medaa es el valor cetral; aquel que se + 1 ecuetre e el lugar e la ordeacó. Esto es: x+ 1 x~ = b) S el úmero de datos es par, la medaa será el promedo de los dos datos cetrales e la ordeacó, es decr, de la datos que se ecuetre e los lugares y + 1. x x~ = + x +1 Ejemplo: E u proceso de maufactura, se observa el úmero de veces al mes que se detee el proceso durate u período de u año, debdo a fallas mecácas de la maquara. M. e I. Isabel Patrca Agular Juárez 30

Los datos obtedos so los sguetes: 7, 4, 1, 3, 9,, 7, 8, 0, 7, 3,. Obtega la medaa del úmero de fallas. Resolucó: 1) Ordeado los datos de meor a mayor se tee: 0, 1,,, 3, 3, 4, 7, 7, 7, 8, 9 ) Dado que el úmero de datos es par, la medaa será el promedo de los datos que ocupa los lugares / y (/) + 1 e la ordeacó, es decr, la medaa será el promedo de los datos que ocupe los lugares 6 y 7 e la ordeacó. 3+ 4 x~ = = 3.5 S los datos se ecuetra agrupados, para obteer la medaa se debe realzar ua terpolacó e la ojva, como se dca a cotuacó: 1.- Idetfcar la clase e la que se alcaza el 50% de los datos. Esta clase recbe el ombre de clase medaa..- Grafcar la ojva correspodete a la clase medaa. Frecueca Acumulada (0.5) F + 1 F L L + 1 Medaa Límtes de clase M. e I. Isabel Patrca Agular Juárez 31

x~ - L L+1 -L = F F 50% +1 -F - F ; F 50% = x~ - L L+1 -L -F = F+1 - F ( - F)(L +1 - L ) x~ = + L F+1- F e dode: L es el límte feror de la clase medaa L +1 es el límte superor de la clase medaa F es la frecueca acumulada hasta L F +1 es la frecueca acumulada hasta L +1 es el tamaño de la muestra Ejemplo: Los datos que se desplega e la sguete tabla de dstrbucó de frecuecas provee de u cojuto de observacoes de la duracó (e mutos) de las llamadas telefócas locales que se realza e el D. F. Calcule la medaa de dchos datos. Resolucó: Límtes de clase Marca de clase Frecueca 0-3 1.5 15 15 3-6 4.5 9 44 6-9 7.5 10 54 9-1 10.5 5 59 1 15 13.5 4 63 15-18 16.5 1 64 Frecueca Acumulada La muestra es de tamaño = 64, por lo tato, / = 3 Por lo ateror, la clase medaa es la seguda, esto es, la medaa está etre 3 y 6. M. e I. Isabel Patrca Agular Juárez 3

Frecueca Acumulada 44 3 15 3 x ~ 6 Límtes de clase De dode, etoces, -F x~ = F +1 ( - ) L +1 - F L +L (3-15)(6-3) = +3 = 4.7586 44-15 c) Moda Se deota como m o y es aquella observacó que se repte co mayor frecueca detro de la muestra. Puede exstr más de ua moda e ua msma muestra. De los datos agrupados se puede cosderar como moda, la marca de clase del tervalo co mayor frecueca. Es mportate hacer otar que a dfereca de la meda artmétca y la medaa, la moda o ecesaramete es u valor úco. Esto sgfca que e u msmo cojuto de datos, puede exstr varas modas, auque també puede ser úca..- MEDIDAS DE DISPERSIÓN Exste varas meddas de dspersó, y alguas de ellas (la mayoría) se mde co respecto a la meda por ser esta últma ua medda que se ecuetra alrededor del cetro del rago de la muestra, y cosderarse ua medda represetatva de los datos. Estas meddas os permte, además de descrbr el comportameto de la muestra, M. e I. Isabel Patrca Agular Juárez 33

valdar la represetatvdad de la meda como característca de todo el cojuto de datos. Rago Tal vez la medda de tedeca cetral más smple sea el rago que se defó para costrur la tabla de dstrbucó de frecuecas. Es ua medda de dspersó teresate, ya que proporcoa formacó medata acerca de la varabldad que tee los datos etre sí. Como se djo ates, el rago se defe como la dfereca etre los datos mayor y meor e la muestra, esto es: Rago = Dato mayor e la muestra - dato meor e la muestra. Auque el rago es ua medda mportate de dspersó, exste otras meddas, que proporcoa formacó adcoal acerca de dcha varabldad, alguas de ellas las defremos a cotuacó. Veamos: Sea x, = 1,,..., los datos de la muestra. Para medr la dspersó promedo de los datos co relacó a la meda de la muestra, pesaríamos medatamete e lo sguete: ( x - x ), s embargo, s desarrollamos dcha suma, ecotramos que se aula, depedetemete de cuales sea los datos cosderados, ya que : pero por defcó x = (x- x ) x = _ x - x = x x M. e I. Isabel Patrca Agular Juárez 34

y por otro lado, x = x de dode: ( x - x ) = x - x = 0 esto es: ( x - x ) = 0 por lo cual o es útl como medda de dspersó. Para evtar la cacelacó de los sgos e la suma, se tee dos opcoes: 1) Utlzar la fucó valor absoluto, lo cual da lugar a la desvacó meda. Desvacó meda: Sea x 1, x, x 3,..., x, los datos cotedos e ua muestra, se defe la desvacó meda como el promedo de los valores absolutos de las dspersoes alrededor de la meda, es decr, x - x d. m. = S los datos se ecuetra agrupados e ua tabla de dstrbucó de frecuecas, la expresó para el cálculo de la desvacó meda se trasforma e d. m. = m x - x f e dode m es el úmero de clases, x es la marca de la clase, y f es la frecueca de la msma clase. ) Utlzar ua fucó cuadrátca. Esta es probablemete la forma más geeralzada de resolver el problema. M. e I. Isabel Patrca Agular Juárez 35

Varaza: S x (,,3,..,) so los datos de la muestra, se defe la varaza de la muestra (s ) como: s = (x - x e tato que s los datos se tee e forma agrupada, se calculará la varaza como se dca a cotuacó: s = m ) ( x - x ) f e dode, uevamete, m es el úmero de clases, x es la marca de la clase -ésma, y f represeta la frecueca de la msma clase. La varaza, auque es más utlzada que la desvacó meda, preseta el problema de que sus udades o cocde co las de los datos de la muestra, ya que al elevar al cuadrado se obtee udades cuadradas, por lo que su terpretacó podría resultar u tato cofusa, s embargo, la forma que se ha ecotrado de resolver dcho problema de udades, cosste smplemete e extraer la raíz cuadrada de dcha medda, co lo cual el resultado se ecotrará e udades leales, por tal razó se defe la desvacó estádar de los datos. Desvacó estádar: Se defe la desvacó estádar de ua muestra, como la raíz cuadrada de la varaza de la msma muestra, y se deota por s. Esto es: s = s Coefcete de varacó: Evta el teer que referrse a los datos para determar la magtud de la varacó. s c.v. = x M. e I. Isabel Patrca Agular Juárez 36

Mometos Los mometos e probabldad, se calcula de la msma maera que e la mecáca, solamete que, e la prmera o tee ua terpretacó físca y solo se utlza como ua herrameta para la determacó de certos parámetros. Se puede defr co respecto a cualquer puto "a", pero las mas usuales so co respecto al orge y co respecto a la meda. Las defcoes correspodetes so: El r-ésmo mometo muestral co respecto al orge (m' r ) se defe como: S los datos se ecuetra s agrupar: m' r = x r dode x so los datos e la muestra y es el tamaño de la muestra. S los datos se ecuetra e forma agrupada: m' r = m x m dode x so marcas de clase, f so las frecuecas de clase y m es el úmero de clases r f f El r-ésmo mometo o mometo de orde r, de la muestra co respecto a la meda se defe como: S los datos se ecuetra s agrupar: m r = (x - x ) r dode x so datos de la muestra y es el tamaño de la muestra. S los datos se ecuetra agrupados: M. e I. Isabel Patrca Agular Juárez 37

m r = m (x - x m f ) r f dode x es la marca de clase, f la frecueca y m el úmero de clases. Así la varaza es el segudo mometo respecto a la meda y la meda es el prmer mometo respecto al orge. 3.- PARÁMETROS DE FORMA Coefcete de sesgo o asmetría El coefcete de sesgo se deota por "a" y se defe como: a = m3 s 3 tercer mometo respecto a la meda., dode m 3 es el De esta forma, s: a < 0 Sesgo egatvo a > 0 Sesgo postvo a = 0 Smétrca Curva Smétrca Curva Asmétrca (Sesgo postvo) M. e I. Isabel Patrca Agular Juárez 38

Coefcete de curtoss Es ua medda del grado de aputameto de ua dstrbucó. Se deota por k. k = m4 s 4 k < 3 > 3 = 3 platcúrt ca leptocúrt ca mesocúrtc a 1 0.8 0.6 0.4 0. -4-0 4 x Dstrbucó Mesocúrtca 1 0.8 0.6 0.4 0. -4-0 4 x Dstrbucó Leptocúrtca M. e I. Isabel Patrca Agular Juárez 39

0.8 0.6 0.4 0. -4-3 - -1 0 1 x 3 Ejemplo: Dstrbucó Platcúrtca Ua muestra de 0 trabajadores de ua Cía. obtuvero los sguetes salaros e u mes determado: $40000, $40000, $40000,$40000, $40000, $40000, $40000, $40000, $55000, $55000, $65000, $65000, $80000, $80000, $90000, $300000, $305000, $35000, $330000, $340000. Calcular: la meda, medaa, moda, varaza, desvacó estádar, coefcete de desvacó, rago, coefcete de sesgo, coefcete de curtoss. Qué puede decr acerca de los salaros? Resolucó: a)meda: 8(40000) + (55000) + (65000) + (80000) + 90000+ 300000+ 305000+ 35000+ 330000+ 340000 0 x = 70,500 + x x +1 55000 +65000 b) Medaa: x~ = = = 60000 c) Moda = 40,000 M. e I. Isabel Patrca Agular Juárez 40

0 (x - x ) d) Varaza: s = 0 =1,097,50, 000 e) Desvacó Estádar: s = 33,14.76 f) Coefcete de varacó: c.v.= x s = 0.15 = 1.5%. Esto es que los datos se aleja de la meda u 1.5 %. g) Rago= 100,000 3 (x - x ) h)coefcete de sesgo: a = m3 = 3 m3 s 0 a = 0.75569 Es decr, los datos tee sesgo postvo 18 ) m4.70311x k = = 10 =.4 La dstrbucó de los datos es platcúrtca 4 4 s (3314.764 ) Co estos datos, hacer ua tabla de dstrbucó de frecuecas: Rago = 100,000 # aproxmado de clases = 0 = 4.47 5 Límte feror de la prmera clase =35,000 c=105,000 / 5 = 1,000 Itervalos de clase Marcas de clase Frecuecas Frecueca Relatva Frecueca Frecueca AcumuladaAcum. Relat. 35,000 56,000 45,500 10 0.5 10 0.5 56,000 77,000 66,500 0.1 1 0.6 77,000 98,000 87,500 3 0.15 15 0.75 98,000 319,000 308,500 0.1 17 0.85 319,000 340,000 39,500 0.1 19 0.95 340,000 361,000 350,500 1 0.05 0 1 0 0 M. e I. Isabel Patrca Agular Juárez 41

6 xf = 1 5,477,000 Meda: x = = = 73,850 0 Moda: Prmera marca de clase. Mo=45,500 Medaa: x~ = 56,000 Rago= 361,000 35,000 = 16,000 11 (x - 73,850) f.3175e + 10 Varaza: s = = = 1,158,77, 500 0 0 Desvacó estádar: s = 34,040.0867 C.V. = x s = 0.1430194 = 1.430% Coefcete de sesgo: = m s 3 a 3 11 (x - x ) 3 f =1 6.571E + 14 m3 = = = 3.86E + 13 11 0 f = 1 3.86E + 13 = (34,040.08 67 ) a 3 =0.83310573 3 por lo tato tee u sesgo postvo Coefcete de curtoss: = m s 4 k 4 M. e I. Isabel Patrca Agular Juárez 4

11 (x - x ) 4 f 6.3158E 19 = =1 + m4 = = 3.15764E + 18 11 0 f =1 4 s = ( 34,040.086 7 ) 4 k =.35179670 ; k < 3, por lo tato es platcúrtca. M. e I. Isabel Patrca Agular Juárez 43