Estadístca descrptva. ESTADÍSTICA DESCRIPTIVA POBLACIÓN Y MUESTRA. VARIABLES ESTADÍSTICAS DISTRIBUCIÓN DE FRECUENCIAS DE UNA MUESTRA AGRUPACIÓN DE DATOS REPRESENTACIONES GRÁFICAS DE LAS MUESTRAS PRINCIPALES MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN CÁLCULO DE LA MEDIA Y LA VARIANZA OTRAS MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 7
Estadístca Aplcada a la Ingenería Cvl 8
Estadístca descrptva. POBLACIÓN Y MUESTRA. VARIABLES ESTADÍSTICAS. Una poblacón es el conjunto de todos los elementos que cumplen una o varas propedades prefjadas. Ejemplos de poblacones son: el colectvo de todos los consumdores de un determnado producto, el conjunto de tornllos fabrcados en un día por una empresa, etc. Llamamos tamaño de la poblacón al número de elementos que la componen. S dcho número es fnto, la poblacón es fnta; s por el contraro es nfnto, la poblacón es nfnta. En la práctca las poblacones son fntas, pero por consderacones teórcas nteresa estudar poblacones nfntas. La Estadístca se nteresa por el estudo de las poblacones. Para estudar una poblacón se puede usar: - Un censo o encuesta exhaustva, que consste en observar todos y cada uno de los elementos de la poblacón. 9
Estadístca Aplcada a la Ingenería Cvl - Una muestra, que es un subconjunto de la poblacón. Llamamos tamaño de la muestra al número de elementos que la componen. La nspeccón de una poblacón por muestreo es rápda y barata. Además, en algunos casos, es la únca manera práctca de observar una poblacón; esto ocurre cuando la observacón de un elemento supone su destruccón, por ejemplo cuando se ntenta estudar la resstenca de certos materales. Se debe plantear la cuestón de s podemos sacar conclusones sobre la poblacón a partr de la nformacón sumnstrada por una muestra. Es evdente que para que la respuesta sea afrmatva el procedmento medante el cual obtenemos la muestra no puede ser cualquera. De ahí que se requera que las muestras sean representatvas de sus respectvas poblacones, lo que se consgue elgendo sus elementos al azar. El papel de la Inferenca Estadístca es obtener conclusones váldas sobre la poblacón a partr de una muestra representatva de la msma. El estudo de la Inferenca Estadístca se fundamenta en la Teoría de la Probabldad. Los elementos de una poblacón poseen certas cualdades que llamamos caracteres o varables. Ejemplos de caracteres en una poblacón de ndvduos son la estatura, el estado cvl, la profesón, la edad, etc. Una propedad fundamental de los caracteres es que no son constantes en los elementos de la poblacón, sno que varían de unos a otros. El estudo de la varabldad de los caracteres de las poblacones es el objeto de la estadístca. 10
Estadístca descrptva. Los caracteres (que a partr de ahora llamaremos varables) se clasfcan en cualtatvos y cuanttatvos. Las varables cualtatvas se caracterzan porque sus modaldades no pueden descrbrse medante números sno medante palabras. Ejemplos de varables cualtatvas son el sexo, la naconaldad, la profesón, etc. A cada una de estas modaldades las llamaremos clases. Aunque cada una de estas clases se descrben medante palabras, pueden codfcarse medante números. En cambo, las varables cuanttatvas son medbles pudendo atrbur a cada una de sus modaldades un número. Ejemplos de dchas varables son el peso, la estatura, la edad, etc. Es mportante dentfcar el tpo de varable objeto de estudo porque los métodos adecuados de análss estadístco son dferentes en cada caso. 11
Estadístca Aplcada a la Ingenería Cvl DISTRIBUCIÓN DE FRECUENCIAS DE UNA MUESTRA. 1. Datos cualtatvos o categórcos. A contnuacón se presenta una tabla donde aparecen los resultados de una encuesta realzada a 25 alumnos matrculados en certa asgnatura del prmer curso de I. T. O. P., acerca de la calfcacón obtenda en dcha asgnatura: Suspenso Aprobado Suspenso Suspenso Aprobado Notable Notable Suspenso Aprobado Suspenso Sobresalente Suspenso Aprobado Suspenso Aprobado Aprobado Aprobado Suspenso Suspenso Notable Suspenso No Presentado No Presentado Suspenso No Presentado Tabla 1 Estos datos representan una muestra tomada de la poblacón formada por todos los alumnos matrculados en dcha asgnatura. La varable a la que corresponden tene 6 clases dstntas: No Presentado (N. P.), Suspenso (SS.), Aprobado (Ap.), Notable (Nt.), Sobresalente (Sb.) y Matrcula de Honor (M. H.), cada una de los cuales aparece un número de veces en la muestra. Dada una muestra de n valores de una varable cualtatva, la frecuenca absoluta de la clase (que representamos por n ) es el número de veces que aparece dcha clase en la muestra. La frecuenca relatva de la clase (que representamos por f ) es la frecuenca absoluta dvdda por el tamaño de la muestra: 12
Estadístca descrptva. n f =. n Multplcando por 100 el valor de la frecuenca relatva obtenemos el porcentaje de elementos de la muestra que corresponden a dcha clase. La dstrbucón de frecuencas de una varable categórca o cualtatva es una lsta de todos los valores posbles de la varable acompañados de las frecuencas relatvas. Para la tabla anteror: Clase n f f % N.P. 3 0.12 12 SS. 11 0.44 44 Ap. 7 0.28 28 Nt. 3 0.12 12 Sb. 1 0.04 4 M.H. 0 0 0 Total 25 1 100 2. Datos cuanttatvos o medbles. S en una poblacón extraemos una muestra correspondente a una varable medble los datos que obtenemos son numércos. Un ejemplo como éste se da en la sguente tabla, en que se muestran los pesos de 50 sobres de correo aéreo de certo tpo, producdos por una fábrca en un solo día, y selecconados al azar. 13
Estadístca Aplcada a la Ingenería Cvl 0.098 0.103 0.104 0.100 0.108 0.099 0.105 0.101 0.110 0.095 0.106 0.105 0.096 0.107 0.101 0.115 0.100 0.103 0.097 0.103 0.103 0.098 0.107 0.099 0.105 0.092 0.104 0.106 0.102 0.111 0.108 0.097 0.109 0.110 0.096 0.102 0.101 0.094 0.104 0.100 0.101 0.104 0.094 0.102 0.112 0.103 0.099 0.107 0.098 0.108 Tabla 2 Estos datos representan un ejemplo de una muestra tomada de la poblacón de los pesos de todos los sobres. La muestra consta de 50 números, llamados valores de la muestra, por tanto el tamaño de la muestra es n = 50. Para ver qué nformacón está contenda en una tabla, debemos ordenar los datos. Supongamos que en una muestra hay k valores dstntos ( x, = 1,2, K,k ). En una columna escrbmos estos valores ordenados de menor a mayor. En una segunda columna anotamos el número de veces que aparece cada dato. El número de veces que aparece un valor x en una muestra, se llama frecuenca absoluta ( n ) de ese valor x en la muestra. Dvdendo la frecuenca absoluta entre el tamaño n de la muestra obtenemos la frecuenca relatva ( f = n ), que se anota en una tercera columna. n S para certo valor x sumamos todas las frecuencas correspondentes a todos los valores de la muestra que son menores o guales que x, se obtendrá la frecuenca acumulada ( N ) correspondente a x. La dvsón de la frecuenca acumulada entre el tamaño n de la muestra, dará la frecuenca relatva acumulada ( F ). 14
Estadístca descrptva. frecuencas: Obtenemos así una tabla como la que sgue y que llamaremos tabla de x n f N F x1 n1 f1 N F1 1 x2 n2 f N 2 2 F2 M M M M M xk 1 n k 1 f k 1 N k 1 F k 1 xk nk fk N k = n = 1 F k Total n k = 1 f = 1 Ejemplo. Calculemos la tabla de frecuencas para los datos de la Tabla 2. x n f f % N F 0.092 1 0.02 2 1 0.02 0.094 2 0.04 4 3 0.06 0.095 1 0.02 2 4 0.08 0.096 2 0.04 4 6 0.12 0.097 2 0.04 4 8 0.16 0.098 3 0.06 6 11 0.22 0.099 3 0.06 6 14 0.28 0.100 3 0.06 6 17 0.34 0.101 4 0.08 8 21 0.42 15
Estadístca Aplcada a la Ingenería Cvl x n f f % N F 0.102 3 0.06 6 24 0.48 0.103 5 0.10 10 29 0.58 0.104 4 0.08 8 33 0.66 0.105 3 0.06 6 36 0.72 0.106 2 0.04 4 38 0.76 0.107 3 0.06 6 41 0.82 0.108 3 0.06 6 44 0.88 0.109 1 0.02 2 45 0.90 0.110 2 0.04 4 47 0.94 0.111 1 0.02 2 48 0.96 0.112 1 0.02 2 49 0.98 0.115 1 0.02 2 50 1 Total 50 1 100 Así, s elegmos un dato de la muestra, por ejemplo x = 0. 18 110, observamos que: - Aparece 2 veces en la muestra ( n = 18 2 ). - Representa el 4% de los datos de la muestra ( f = 0. 18 04 ). - Hay 47 datos en la muestra que son menores o guales a x = 0. 18 110 ( N = 18 47 ). - El 94% de los datos en la muestra son menores o guales a x = 0. 18 110 ( F = 0. 18 94 ). 16
Estadístca descrptva. AGRUPACIÓN DE DATOS. S una muestra consta de demasados valores numércamente dferentes, las gráfcas correspondentes, que estudaremos a contnuacón, son muy complcadas y quzás confusas, por lo que nos podría nteresar smplfcar los datos elmnando detalles nnecesaros. Esto puede hacerse por medo del sguente proceso de agrupacón de datos. Para una muestra dada, escogemos un ntervalo I, determnado por el menor y el mayor valor de la muestra, que contenga a todos los valores Subdvdmos I en subntervalos que se llaman ntervalos de clase; los puntos medos de estos ntervalos se denomnan marcas de clase. Al número de valores en cada ntervalo de clase se le llama frecuenca de clase; su dvsón entre el tamaño n de la muestra es la frecuenca relatva de clase. En muchas aplcacones será posble obedecer las sguentes reglas que son útles para evtar complcacones nnecesaras en el uso posteror de una muestra agrupada. - Todos los ntervalos deberán tener la msma ampltud. - Los ntervalos de clase se escogerán de manera que las marcas de clase correspondan a números smples. - S un valor de una muestra concde con el punto extremo común de dos ntervalos de clases se coloca este valor en el ntervalo que se encuentra a la derecha de dcho valor. 17
Estadístca Aplcada a la Ingenería Cvl Ejemplo. Para la tabla 2 podemos hacer la sguente agrupacón de los datos: Int. de clase Marcas de clase Frec. de clase Frec. relatvas de clase [0.090,0.095) 0.0925 3 0.06 [0.095,0.100) 0.0975 11 0.22 [0.100,0.105) 0.1025 19 0.38 [0.105,0.110) 0.1075 12 0.24 [0.110,0.115] 0.1125 5 0.10 Total 50 1 Cuantas menos clases escojamos, será más smple la muestra agrupada, pero se perderá más nformacón, ya que los valores orgnales de la muestra no aparecen explíctamente. El agrupamento debe hacerse de tal manera que sólo se elmnen los detalles que no son esencales. El agrupamento sempre sgnfcará perdda de nformacón y en consecuenca, s la nferenca estadístca se basa en los datos agrupados, se pueden crear problemas de varedad de grados de exacttud, que dependerán de los métodos de nferenca empleados. Por lo tanto, s estamos mposbltados para juzgar los efectos de la agrupacón, bajo condcones ordnaras, debemos consderar la posbldad de usar los datos orgnales no agrupados. Se observa que la muestra agrupada puede cambar s cambamos las marcas de clase, mantenendo las longtudes y el número de los ntervalos de clase. De este modo, vemos que hay factores arbtraros en el proceso de agrupacón. De hecho s necestamos comparar una muestra con otra prevamente agrupada, es muy mportante que la agrupacón de datos sea smlar. 18
Estadístca descrptva. REPRESENTACIONES GRÁFICAS DE LAS MUESTRAS. Datos cualtatvos. Dagrama de barras. Es la representacón gráfca de la dstrbucón de frecuenca de una varable categórca. El dagrama de barras para la Tabla 1 es Dagrama de barras Tabla 1 Frecuenca % 50 40 30 20 10 0 N.P. SS Ap Nt. Sb. M.H. Calfcacón En el eje horzontal se colocan los valores abrevados de las categorías de la varable y en el eje vertcal se mden las frecuencas relatvas. Sobre el valor abrevado de cada categoría se dbuja una barra de altura gual a su frecuenca relatva. Gráfco de sectores. El gráfco de sectores se construye trazando un círculo y asgnando a cada categoría un sector de ampltud ω (en grados sexagesmales) proporconal a su frecuenca relatva: ω = 360 f 19
Estadístca Aplcada a la Ingenería Cvl Para la Tabla 1 el gráfco de sectores es: Gráfco de sectores Tabla 1 N.P. SS Ap Nt. Sb. M.H. Datos cuanttatvos. Estudaremos sólo representacones para datos agrupados: Hstograma. Es la representacón gráfca de una dstrbucón de frecuenca de una varable medble o cuanttatva. Para la tabla Clase Marca n f f % N F [80-90) 85 1 0.0278 2.78 1 0.0278 [90-100) 95 0 0.000 0.00 1 0.0278 [100-110) 105 2 0.0556 5.56 3 0.0833 [110-120) 115 5 0.1389 13.89 8 0.2222 [120-130) 125 11 0.3056 30.56 19 0.5278 [130-140) 135 4 0.1111 11.11 23 0.6389 [140-150) 145 3 0.0833 8.33 26 0.7222 20