CURSO BÁSICO DE ANÁLISIS ESTADÍSTICO EN SPSS. FRANCISCO PARRA RODRÍGUEZ JUAN ANTONIO VICENTE VÍRSEDA MAURICIO BELTRÁN PASCUAL



Documentos relacionados
VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN

ESTADÍSTICA DESCRIPTIVA

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula:

ESTADÍSTICA poblaciones

MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU

VARIABLES ESTADÍSTICAS UNIDIMENSIONALES.

CURSO BÁSICO DE ESTADÍSTICA DESCRIPTIVA

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 12.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS

Definición. Número obtenido a partir del análisis de una variable estadística. Procedimiento de cálculo bien definido:

Estadística Descriptiva

Esta t d a í d s í titcos o TEMA 3.3

6. ESTIMACIÓN PUNTUAL

Tema 60. PARÁMETROS ESTADÍSTICOS: CÁLCULO, PROPIEDADES Y SIGNIFICADO.

MÉTODOS ESTADÍSTICOS PARA EL CONTROL DE CALIDAD

Estadística Contenidos NM 4

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx

ANÁLISIS DE LA VARIANZA ANOVA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES

MEDIDAS DE FORMA Y CONCENTRACIÓN

ANÁLISIS DE DATOS CUALITATIVOS. José Vicéns Otero Eva Medina Moral

Trata de describir y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo

PARTE 2 - ESTADISTICA. Parte 2 Estadística Descriptiva Introducción

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO A

V Muestreo Estratificado

IV. GRÁFICOS DE CONTROL POR ATRIBUTOS

-Métodos Estadísticos en Ciencias de la Vida

CURSO DE ESTADÍSTICA DESCRIPTIVA Y ANÁLISIS DE DATOS CON LA HOJA DE CÁLCULO EXCEL

Estadística Descriptiva

Colegio Sagrada Familia Matemáticas 4º ESO ESTADÍSTICA DESCRIPTIVA

INTRODUCCIÓN AL CONCEPTO DE VALOR ESPERADO O ESPERANZA MATEMÁTICA DE UNA VARIABLE ALEATORIA

Los Histogramas. Histograma simple

Colegio Sagrada Familia Matemáticas 4º ESO

RENTABILIDAD Y RIESGO DE CARTERAS Y ACTIVOS TEMA 3- I FUNTAMENTOS DE DIRECCIÓN FINANCIERA. Fundamentos de Dirección Financiera Tema 3- Parte I 1

Estadística aplicada al Periodismo

Análisis estadístico de datos muestrales

Una Propuesta de Presentación del Tema de Correlación Simple

PROBANDO GENERADORES DE NUMEROS ALEATORIOS

ESTADÍSTICA DESCRIPTIVA Métodos Estadísticos Aplicados a las Auditorías Sociolaborales

1.1 INTRODUCCION & NOTACION

PARÁMETROS ESTADÍSTICOS ... N

Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión

Estadística Contenidos NM 4

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO C

GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA

Inferencia Estadística

MATEMÁTICA MÓDULO 4 Eje temático: Estadística y Probabilidades

(Feb03-1ª Sem) Problema (4 puntos). Se dispone de un semiconductor tipo P paralepipédico, cuya distribución de impurezas es

4. SEGUNDO MÓDULO. 4.1 Resumen de Datos

ESTRUCTURA Y TECNOLOGÍA A DE COMPUTADORES

1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL

Introducción a la Inferencia Estadística. Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff

UNIDAD DIDÁCTICA 13: Estadística Descriptiva

Calificación= (0,4 x Aciertos) - (0,2 x Errores) No debe entregar los enunciados

Tema I. Estadística descriptiva 1 Métodos Estadísticos LECCIONES DE ESTADÍSTICA

ESTADÍSTICA. UNIDAD 3 Características de variables aleatorias. Ingeniería Informática TEORÍA

Matemáticas 1 1 EJERCICIOS RESUELTOS: Números Complejos. Elena Álvarez Sáiz. Dpto. Matemática Aplicada y C. Computación. Universidad de Cantabria

Tema 2: Distribuciones bidimensionales

Qué es la estadística? presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva.

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA PARA ECONOMISTAS

Modelos de Regresión Simple

SOLUCIONES A LOS EJERCICIOS DE LA UNIDAD

4º MEDIO: MEDIDAS DE POSICIÓN

ESTADÍSTICA DESCRIPTIVA

Estadística Descriptiva

AGRO Examen Parcial 1

Guía práctica para la realización de medidas y el cálculo de errores

PROBABILIDAD Y ESTADISTICA

LECCIONES DE ESTADÍSTICA

Orden de la tirada. Figura 1: Frecuencia relativa de cara para una sucesión de 400 tiradas.

Teoría Simplificada de ERRORES Suscriben este documento los coordinadores de Laboratorio de Química, Física I y Física II.

MEDIDAS DE CENTRALIZACIÓN

Los principales métodos para la selección y valoración de inversiones se agrupan en dos modalidades: métodos estáticos y métodos dinámicos

Ejercicios Resueltos de Estadística: Tema 1: Descripciones univariantes

Control estadístico de procesos. Control de procesos. Definición de proceso bajo control estadístico. Causas de la variabilidad en un proceso

Este documento es de distribución gratuita y llega gracias a El mayor portal de recursos educativos a tu servicio!


No debe entregar los enunciados

ESTADÍSTICA 4º E.S.O. TERMINOLOGÍA ESTADÍSTICA TERMINOLOGÍA ESTADÍSTICA TERMINOLOGÍA ESTADÍSTICA. Tipos de caracteres.

MEDIDAS DE TENDENCIA CENTRAL

EJERCICIOS RESUELTOS TEMA 3.

Gestión de operaciones

Calificación= (0,4 x Aciertos) - (0,2 x Errores) No debe entregar los enunciados

Análisis de Regresión y Correlación Lineal

Métodos indirectos de estimación: razón, regresión y diferencia

MUESTREO EN POBLACIONES FINITAS. Antonio Morillas 1

ESTADÍSTICA. Unidad didáctica ESTADÍSTICA: CONCEPTOS BÁSICOS Caracteres y variables estadísticos

UNIDAD 14.- Distribuciones bidimensionales. Correlación y regresión (tema 14 del libro)

NOTAS SOBRE ESTADÍSTICA APLICADA A LA CALIDAD

MEDIA ARITMÉTICA. Normalmente se suele distinguir entre media aritmética simple y media aritmética ponderada.

LÍNEA DE REGRESIÓN MÍNIMO CUADRÁTICA BASADA EN ERRORES RELATIVOS

CONTENIDO MEDIDAS DE POSICIÓN MEDIDAS DE DISPERSIÓN OTRAS MEDIDAS DESCRIPTIVAS INTRODUCCIÓN

TEMAS CUESTIONARIO DE AUTOEVALUACIÓN

Probabilidad ( A) Los axiomas de la probabilidad. φ = el conjunto vacío A B = A y no B C

Simulación de sistemas discretos

MS Word Editor de Ecuaciones

ERRORES EN LAS MEDIDAS (Conceptos elementales)

La inferencia estadística es primordialmente de naturaleza

Introducción a la simulación de sistemas discretos

Manual de Estadística

Transcripción:

CURSO BÁSICO DE ANÁLISIS ESTADÍSTICO EN SPSS. FRANCISCO PARRA RODRÍGUEZ JUAN ANTONIO VICENTE VÍRSEDA MAURICIO BELTRÁN PASCUAL

EL PROGRAMA ESTADÍSTICO SPSS

. EL PROGRAMA ESTADÍSTICO SPSS. INTRODUCCIÓN El programa formátco SPSS es e la actualdad el más exteddo etre los vestgadores y profesoales, o sólo e el campo de las cecas socales, so també e las humaas, bomédcas, e la ecoomía, y, e geeral, e múltples campos de actvdad e el que se precse realzar u tratameto estadístco de la formacó. La gra acogda dspesada al programa SPSS es debdo a su flexbldad y facldad de maejo. El SPSS cluye ua ampla y varada gama de aálss estadístcos y de gestó de datos e u etoro gráfco. El programa se maeja a través de meús descrptvos y cuadros de dálogo, pero també se puede realzar todas las tareas a través de u leguaje de comados (programacó). Señalar que alguas de las opcoes dspobles sólo so accesbles a través de dcho leguaje. El paquete estadístco se puede adqurr e stalar de forma modular. Los módulos dspobles so: Base, Téccas estadístcas Profesoales, Téccas Estadístcas Avazadas, Tablas, Tedecas, Categorías, CHAID, Pruebas exactas, Redes Neuroales, Mapfo y AllCLEAR III. A cotuacó se preseta de forma gráfca las prcpales opcoes del programa a través del sstema de meús descrptvos y cuadros de dalogo. A lo largo del desarrollo del curso ofreceremos ua vsó global de las posbldades del programa y cometaremos los cotedos de los dferetes meús descrptvos.. LOS MENÚS EN SPSS MENÚ GENERAL DEL PROGRAMA E la barra de meús se ecuetra 0 opcoes co el sguete cotedo: ARCHIVO A través de este meú se realza las operacoes de abrr, crear o grabar fcheros, que puede ser de datos, struccoes, resultados o procesos. També se cotrola las tares de mpresó 3

EDICIÓN Se realza las tareas habtuales de edcó de texto, dspobles e la mayor parte de los programas del etoro Wdows: modfcar, borrar, copar, pegar, seleccoar, buscar, etcétera. 4

VER Desde esta opcó se cotrola dversos parámetros de vsualzacó. DATOS Permte defr varables y fechas, modfcar los fcheros de datos actvos, segmetar archvos, seleccoar y poderar casos, etc... Las fucoes de este meú so temporales y sólo permaece actvas metras dure la sesó. 5

TRANSFORMAR Permte, e el fchero de datos actvo, calcular uevas varables a partr de las exstetes, recodfcar, asgar etquetas a casos, y dversas operacoes relatvas a la modfcacó y creacó de uevas varables. També las modfcacoes so temporales y s éstas se quere coservar hay que grabar los cambos. ANALIZAR Medate este meú se accede a los dferetes aálss estadístcos dspobles e SPSS. 6

GRÁFICOS Desde aquí se accede a las posbldades gráfcas UTILIDADES Icluye dferetes opcoes para vsualzar el cotedo de los fcheros de datos y crear subcojutos de varables. 7

VENTANA Desde esta opcó podemos cotrolar la vetaa que queremos teer actva (ver apartado.3). AYUDA El programa permte acceder al maual de ayuda a través de u completo meú de opcoes:.3 EL SISTEMA DE VENTANAS EN EL SPSS El SPSS dspoe de ocho tpos de vetaas desde las cuales se puede efectuar dversas operacoes. Vetaa del edtor de datos. E esta vetaa está los datos del fchero co el que se está trabajado. Sólo puede haber u cojuto de datos actvo (u solo fchero). Los fcheros de datos e SPSS se ombra: *.sav Vetaa del vsor de resultados. E esta vetaa se guarda los dferetes resultados que geeramos: saldas de los dferetes procedmetos, lstados, subprogramas, mesajes de error, gráfcos, etcétera. Ua vetaa de este tpo se abre automátcamete cuado se geera el prmer resultado de la sesó. Se puede teer tatas vetaas abertas como se quera. Los fcheros de resultados e SPSS se ombra: *.spo 8

Vetaa del vsor de resultados de borrador. Es posble evar los resultados a u vsor preestablecdo al que se accede a través de: "archvo"/"uevo"/"resultados de borrador". També se puede mateer abertas tatas como se desee. Vetaa del edtor de tablas pvote. Permte edtar y modfcar las tablas pvote. Estas tablas dspoe de la posbldad de edtar texto, tercambar los datos traspoedo flas y columas, modfcar colores, etcétera. Vetaa del edtor de gráfcos. E todos los gráfcos que se geera e SPSS se puede realzar modfcacoes cambado colores, fuetes y tamaños, ejes, rotacoes, etc. Vetaa del edtor de resultados de texto. Para modfcar aquellos resultados de texto geerados por el programa. Vetaa del edtor de staxs. Vsualza los fcheros de staxs o de leguaje de comados, que se puede modfcar desde este edtor. Los fcheros de staxs se ombra: *.sps. Este edtor es de gra utldad especalmete e tres casos: - Alguas posbldades del SPSS sólo so accesbles a través del leguaje de comados. - E operacoes que habtualmete se repte es más adecuado grabar el programa completo y ejecutarlo desde esta vetaa. - S el ordeador tee que ser compartdo por muchos usuaros. Vetaa del edtor de procesos. També es posble automatzar y persoalzar procesos aplcado la tecología OLE y el leguaje BASIC. 9

ESTADÍSTICA DESCRIPTIVA 0

. ESTADÍSTICA DESCRIPTIVA.. INTRODUCCIÓN.. MEDIDAS DE POSICIÓN Meddas de poscó cetral Meda artmétca Meda geométrca Meda armóca La medaa La moda Meddas de poscó o cetral Cuartles Decles Percetles.3. MEDIDAS DE DISPERSIÓN Meddas de dspersó absoluta Recorrdo Recorrdo tercuartlco Desvacó absoluta meda respecto a la meda artmétca Desvacó absoluta meda respecto a la medaa La varaza La desvacó típca o estádar Meddas de dspersó relatva Coefcete de apertura Recorrdo relatvo Recorrdo sem-tercuartílco Coefcete de varacó de Pearso Ídce de dspersó de la medaa.4. TIPIFICACIÓN DE VARIABLES.5. MEDIDAS DE FORMA: ASIMETRÍA Y CURTOSIS

Meddas de asmetría Coefcete de asmetría de Fsher Coefcete de asmetra de Bowley Medda de asmetría de Pearso Meddas de aputameto o curtoss Coefcete de aputameto o curtoss.6. MEDIDAS DE CONCENTRACIÓN Ídce de G Curva de Lorez.7. LA REPRESENTACIÓN GRÁFICA DE LOS DATOS Dagrama de Pareto Gráfcos de barras Hstograma Gráfcos de seres temporales Gráfcos de sectores Gráfcos de dspersó Dagramas de caja Dagramas de tallos y hojas (Stem a Leaf) Otras represetacoes gráfcas Creacó de gráfcos co Excel

.. INTRODUCCIÓN La Estadístca Descrptva es el prmer paso e la vestgacó de poblacoes o cojuto de datos procedetes del recueto o de expermetos. Nos proporcoa herrametas que os permte resumr la formacó obteda y pasar así de u gra volume de datos a otro más reducdo. La Estadístca Descrptva cubre u amplo cojuto de téccas y métodos. E este capítulo cotemplamos sólo alguos coceptos, los más elemetales. Las prcpales meddas que se estuda e la Estadístca Descrptva so: Meddas de Poscó Meddas de Dspersó Meddas de Asmetría y Curtoss Meddas de Cocetracó Los datos estadístcos sobre los que vamos a realzar los aálss que os proporcoa la Estadístca Descrptva se suele presetar e tres stuacoes dferetes: a) Los valores o se repte e gú caso. b) Cada valor de la característca medda se repte u determado úmero de veces. c) E umerosas ocasoes, clasfcamos las observacoes e tervalos. Así, al pregutar a ua persoa por su edad su respuesta puede ser clasfcada e uo de los sguetes tervalos: 0 a 8 años 9 a 30 años 3 a 45 años 45 a 60 años Más de 60 años lo habtual es que dchos tervalos se costruya basádose e u estudo prevo o medate algú crtero cetífco o técco específco. Por ejemplo, s medate u estudo ateror realzado por la Orgazacó Mudal de la Salud sabemos que el cosumo de ses cgarrllos daros o ejerce gú tpo de flueca 3

e la salud, de sete a dez cgarrllos se cosdera u cosumo moderado, de oce a vete es u cosumo de resgo y co más de vete teemos u cosumo excesvo, estableceremos los tervalos de acuerdo a dcho crtero. Es decr, defmos los sguetes grupos de cosumo: 0 a 6 cgarrllos 7 a 0 cgarrllos a 0 cgarrllos Más de 0 cgarrllos Establecer tervalos de ua forma arbtrara puede coducros a falsas coclusoes, de ahí la mportaca de utlzar u crtero recoocdo para defr los estratos. Segú estemos e ua u otra stuacó se utlzará ua forma dstta de presetacó de los datos, deomádose de tpo I a la prmera stuacó, de tpo II a la seguda y de tpo III a la tercera. A) PRESENTACIÓN DE TIPO I La otacó más utlzada e Estadístca y que se asume e este trabajo es la sguete: N -> Número de udades e las cuales efectuamos la medcó. X -> Valor que toma la característca e el dvduo. Por lo tato, los datos se represeta como la sucesó: X, X, X 3,..., X N. B) PRESENTACIÓN DE TIPO II La otacó utlzada es la sguete: N -> Número de udades e las cuales efectuamos la medcó. k -> Número de valores dsttos. X -> Valor que toma la característca e el dvduo, =,..., k. 4

-> Número de veces que aparece el valor X, es decr, frecueca del valor X, =,..., k. Por lo tato, cada dato X, tedrá asocada su frecueca de aparcó,. decr, N. Bajo esta otacó, la suma de todos los será gual al úmero de datos, es N = k = C) PRESENTACIÓN DE TIPO III S teemos los datos clasfcados e tervalos, utlzaremos la sguete otacó: N -> Número de udades e las cuales efectuamos la medcó. K -> Número de tervalos cosderados. L - -L -> Itervalo, sedo L - el límte feror y L el límte superor. -> Número de udades compreddas e el tervalo. N -> Número acumulado de udades hasta el tervalo. Así pues, a cada tervalo se le asoca el úmero de valores que cotee, verfcádose por tato: N = k = Se muestra a cotuacó ua tabla resume e la que aparece los tres tpos de presetacoes: 5

Tabla.. Formas de presetacó de los datos Tpo I Tpo II Tpo III X X N Itervalo N ---- ---- ---- ---- -------------- ---- ---- X X N L 0, L N X X N L, L N..................... X X N L -, L N..................... X N X k k N k L k-, L k k N k defcoes. E los apartados que sgue utlzaremos esta omeclatura para las sucesvas 6

.. MEDIDAS DE POSICION Meddas de poscó cetral Las meddas de poscó cetral más comues so: la meda, la medaa, y la moda. La meda, a su vez, puede ser defda como meda artmétca, geométrca y armóca. Cada ua de ellas preseta sus vetajas e coveetes y su eleccó depede tato de la aturaleza de la estadístca como del propósto para el que se utlza. a) La meda artmétca. Es la suma de todos los valores de la varable dvdda por el úmero total de los datos. x = x + x +... + x = N x = N Las propedades de la meda artmétca so:. La suma de las desvacoes de los valores de la varable respecto al valor de la meda es cero. = x x ( ) = 0. La meda de las desvacoes elevadas al cuadrado de los valores de la varable respecto a ua costate cualquera es míma s esta costate es la meda. = x x N ( ) es míma 3. S a todos los valores de la varable les sumamos ua catdad costate k, la meda artmétca de la varable queda aumetada e esa costate. Lo msmo puede decrse respecto de la multplcacó. S a todos los valores de la varable les multplcamos por ua costate, la meda de esa varable se multplca por esa costate. 7

Bajo esta propedad, la varable X, defda de la sguete forma: x x = o c sedo o y c dos costates cualesquera, se cumple que: x o x = cx = x o x = cx + o c Las vetajas de utlzar la meda artmétca so: E el calculo tervee todos los valores de la varable Es úca Es calculable Es el cetro de gravedad de la dstrbucó. S embargo está muy afectada por los valores extremos que presete los datos, lo que puede orgar que a veces las coclusoes o sea muy atadas. b) La meda geométrca. Es la raíz N-ésma del producto de los valores de la varable elevados por sus respectvas frecuecas. G N x x... x = La propedad fudametal de esta meda es que el logartmo de la meda geométrca es gual a la meda artmétca de los logartmos de los valores de la varable. La prcpal vetaja que ofrece esta meda respecto a la meda artmétca es su meor sesbldad respecto a los valores extremos de la varable. La desvetaja es que o está determada s alguo de los valores de la varable es egatvo. També tee u sgfcado meos tutvo que la meda artmétca. Su utlzacó más frecuete es promedar porcetajes, y també se acoseja su uso cuado se presupoe que la varable aalzada se ha formado a partr de varacoes acumulatvas. 8

c) La meda armóca. La meda armóca es la meda artmétca de los versos de los valores de la varable. H = N N = + +... + X X X X = artmétca. E certos casos la meda armóca es más represetatva que la meda Tee como coveetes que está muy fluecada por los valores pequeños y o está determada cuado algú valor de la varable es gual a cero. d) La medaa. La medaa es el valor de la dstrbucó que dvde la dstrbucó de la varable e dos partes guales, es decr deja a la zquerda y a la derecha gual úmero de valores s el umero de datos es mpar. Cuado el úmero de valores es par se toma la meda artmétca de los dos valores cetrales. E térmos de frecueca se defe la medaa como aquel valor de la dstrbucó cuya frecueca acumulada es N. Para dstrbucoes agrupadas e tervalos aplcamos la sguete fórmula: M e L = + N N c sedo c es la ampltud del tervalo dode se ecuetra la mtad de la dstrbucó y N - es la frecueca acumulada medatamete ateror al tervalo dode se ecuetra la mtad de la dstrbucó (N/) y la frecueca del tervalo. La propedad fudametal de la medaa es que la suma de todas las desvacoes e valor absoluto de la varable respecto de la medaa es míma. La medaa adquere mayor mportaca cuado las varables so ordales, o susceptbles de ser ordeadas, e cuyo caso la medaa es la medda de tedeca cetral más represetatva. 9

d) La moda. Es el valor de la varable que más veces se repte. Para dstrbucoes agrupadas e tervalos se utlza la sguete fórmula. M o L = + + + c + dode - + so las frecuecas asocadas a los tervalos ateror y posteror del tervalo que más se repte. N 4 S los tervalos o tee la msma ampltud debemos calcular las desdades de frecueca, que se obtee dvdedo las frecuecas absolutas de cada valor de la varable por las ampltudes de cada tervalo. Sedo d = c M o L = + d d + + d c + Meddas de poscó o cetral So meddas de poscó o cetral los cuartles, decles y percetles. Las meddas de poscó o cetrales dvde la dstrbucó e partes guales. Los cuartles so tres valores y dvde la dstrbucó e cuatro partes guales. Los decles so ueve y dvde la dstrbucó e dez partes. Los percetles so 99 y dvde la dstrbucó e ce partes. Así, el prmer cuartl C es el valor que ocupa el lugar el prmer decl D es el valor que ocupa el N 0 y el prmer percetl P es el valor que ocupa el lugar lugar N 00 Para dstrbucoes agrupadas e tervalos utlzamos la sguete fórmula 0

Q r/ k L = + r. k N N. c S k=4 y r =,, 3 obteemos los cuartles S k=0 y r =,,...,9 obteemos los decles S k=00 y r =,,...,99 obteemos los percetles A cotuacó vamos a calcular la meda, la medaa y la moda de la dstrbucó de salaros de la empresa XXX,SA (tabla.), costtuda por.000 trabajadores: Tabla.. Dstrbucó de los salaros que paga la empresa XXX S.A. Salaro Mesual X Marca de clase Nº de Trabajadores Nº acumulado de trabajadores N Total de Salaros X 60.000-80.000 70.000 60 60.00.000 80000-00000 90.000 00 360 8.000.000 00000-0000 0.000 00 460.000.000 0000-40000 30.000 0 570 4.300.000 40000-60000 50.000 00 670 5.000.000 60000-80000 70.000 85 755 4.450.000 80000-00000 90.000 0 765.900.000 00000-0000 0.000 4 779.940.000 0000-40000 30.000 5 804 5.750.000 40000-60000 50.000 47 85.750.000 60000-80000 70.000 4 875 6.480.000 80000-30000 90.000 40 95.600.000 30000-340000 30.000 85.000 6.350.000 50.70.000 La meda artmétca se calcularía: x = x + x +... + x = N x = N 50. 70. 000 = = 50. 70 000 Para calcular la medaa partmos del tervalo cetral, el tervalo 0.000-40.000, e dode sabemos que ha de estar la mtad de uestra dstrbucó (N/). Esto

mplca que 460 sea el valor que toma N - (frecueca acumulada del tervalo medatamete ateror), y 0 el valor de (frecueca relatva del tervalo). M e L = + N N c = 0 000 + 500 460. 0. 000 = 7. 73 0 E el cálculo de la moda dado que el tervalo que más se repte es el de 80.000-00.000, el valor de - es 60 y el de + es 00. M o L = + + + c + = 80. 00 000 + 0 000 = 87 69 60 + 00..

.3. MEDIDAS DE DISPERSION Meddas de dspersó absoluta Las meddas de dspersó o de varabldad mde la represetatvdad de las meddas de tedeca cetral, obteédose como desvacó de los valores de la dstrbucó respecto a estas meddas. Las meddas de dspersó o de varabldad so: el recorrdo, el recorrdo tercuartílco, la desvacó absoluta meda respecto a la meda artmétca, la desvacó absoluta meda respecto a la medaa, la varaza y la desvacó típca o estádar. a) Recorrdo. Es la dfereca etre el valor mayor y el valor meor de la dstrbucó X X R = b) Recorrdo tercuartílco. Es la dfereca que exte etre el tercer cuartl y el prmer cuartl R = C 3 C c) Desvacó absoluta meda respecto a la meda artmétca D = x X X = N d) Desvacó absoluta meda respecto a la medaa D X M = e M e = N e) La Varaza e) La Desvacó típca o estádar S X X = ( ) = N 3

S X X = ( ) = Las propedades de la desvacó típca so: Es sempre mayor o gual que cero Es ua medda de dspersó óptma Está acotada superor e ferormete No está afectada por cambos de orge S que está afectada por cambos de escala (queda multplcada por el factor de escala) N Meddas de dspersó relatva Las meddas de dspersó relatva trata de hacer comparables dstrbucoes dferetes, es decr, dstrbucoes que o vee expresadas e las msmas meddas. A dfereca de la meddas de varabldad, las meddas de dspersó relatva so meddas admesoales y las más utlzadas so: el coefcete de apertura, el recorrdo relatvo, el recorrdo sem-tercuartílco y el coefcete de varacó de Pearso. f) Coefcete de apertura. Es la relacó etre el mayor y el meor valor de la dstrbucó A = X X g) Recorrdo relatvo. Es el cocete etre el recorrdo y la meda. Esta expresó mde el úmero de veces que el recorrdo cotee a la meda artmétca RR = R e X h) Recorrdo sem-tercuartílco. Es el cocete etre el recorrdo tercuartílco y la suma del prmer y tercer cuartl 4

R C = C 3 s + 3 C C g) Coefcete de Varacó de Pearso. Resuelve el problema de comparar medas artmétcas proveetes de dstrbucoes meddas co udades dferetes. Es el cocete etre la desvacó típca y la meda artmétca V S = també se puede expresar e porcetaje: V X S =.00 X Al ver expresados tato la desvacó típca como la meda e las msmas udades, el coefcete de varacó de Pearso es admesoal. També es varable respecto a los cambos de orge. Dado que el coefcete represeta el úmero de veces que la desvacó típca cotee a la meda, etoces s V=0 la represetatvdad de la meda sería máxma y s V>0,5 dcaría ua baja represetatvdad de la meda j) Ídce de dspersó de la medaa V Me D M Me = = e = X M e M N. e 5

.4. LA TIPIFICACIÓN DE VARIABLES La tpfcacó de varables cosste e expresar la dfereca etre la meda y los valores de la varable e térmos de desvacó típca. Z = X X S Cuado tpfcamos ua varable, la meda de la varable tpfcada Z es gual a 0 y su desvacó típca. Veamos co u ejemplo, el uso de esta técca. Supógase que los alumos de prmer curso de matemátcas está dstrbudos e u cetro e dos aulas dsttas (Clase A y Clase B) y que para ua msma asgatura, aálss matemátco por ejemplo, tee dos profesores dsttos. Supógase además que detro de cada aula o ha habdo gua seleccó de alumos preva y puede esperarse u msmo vel de apredzaje e las dos aulas. Después de realzar el msmo exame de aálss matemátco, las otas de los alumos para cada aula so las sguetes: 6

Tabla.3. Notas de las clases A y B NOTAS Clase A Clase B Alumo 5,00 5,50 Alumo,00 7,00 Alumo 3 6,75 7,5 Alumo 4 9,00 5,00 Alumo 5 7,50 8,5 Alumo 6 6,75,80 Alumo 7 3,50 7,75 Alumo 8 5,30 8,5 Alumo 9 8,50 6,75 Alumo 0,75 7,5 Alumo 4,00 8,75 Alumo,75 6,75 Alumo 3 4,75 9,50 Alumo 4 3,00 8,5 Alumo 5 4,00 7,50 Alumo 6 3,00 5,5 Alumo 7 4,50 6,5 Alumo 8 4,75 6,50 Alumo 9 6,50 8,50 Alumo 0 5,00 5,75 Alumo 5,00 5,5 Alumo 4,50 4,75 Alumo 3 7,5 6,75 Alumo 4 6,00 8,50 Alumo 5 5,50 8,00 Las otas medas y las desvacoes típcas para cada aula so las sguetes: Clase A Clase B Meda 5,0 6,88 Desvacó típca,80,5 Puede observarse, que e la Clase A la ota meda ha sdo más baja que e la Clase B, dádose e la Clase A ua mayor varabldad. Esto puede deberse a que el profesor de la clase A ha sdo algo más exgete a la hora de corregr. S queremos comparar dos alumos, uo de ua clase y otro de otra, co el objetvo de comprobar cuál de ellos ha alcazado u mayor vel de apredzaje, utlzar la ota obteda por cada uo e el exame puede llevaros a falsas coclusoes, coscetes de que el profesor de la Clase A ha sdo, probablemete, más duro a la hora de corregr.. 7

Co el objetvo de elmar esta flueca, tpfcamos las otas de ambas clases. Los resultados obtedos so los sguetes: Tabla.4. Notas tpfcadas de las clases A y B NOTAS Clase A Clase B Alumo -0,06-0,9 Alumo -,7 0,08 Alumo 3 0,9 0,4 Alumo 4,7 -,4 Alumo 5,33 0,90 Alumo 6 0,9 -,69 Alumo 7-0,89 0,57 Alumo 8 0, 0,90 Alumo 9,89-0,09 Alumo 0 -,3 0,4 Alumo -0,6,3 Alumo -,3-0,09 Alumo 3-0,0,7 Alumo 4 -,7 0,90 Alumo 5-0,6 0,4 Alumo 6 -,7 -,07 Alumo 7-0,33-0,4 Alumo 8-0,0-0,5 Alumo 9 0,78,06 Alumo 0-0,06-0,75 Alumo -0,06 -,07 Alumo -0,33 -,40 Alumo 3,9-0,09 Alumo 4 0,50,06 Alumo 5 0, 0,74 Clase A Clase B Meda de varable tpfcada 0,00 0,00 Desvacó típca de varable tpfcada,00,00 S comparamos el prmer alumo de cada clase, podemos observar lo sguete: Alumo Clase A Clase B Dfereca Nota 5,00 5,50-0,50 Nota tpfcada -0,06-0,9 0,85 A pesar de que el alumo de la clase A tee ua ota lgeramete feror al de la clase B (5 frete a 5,5), e relacó al vel medo de su clase o cabe duda del mayor vel de apredzaje del prmer alumo de la clase A, ya que su ota tpfcada es mayor (-0,06 frete a -0,9). Además, gracas a la tpfcacó comprobamos que ambos alumos está por debajo de la meda de apredzaje. 8

.5. MEDIDAS DE FORMA: ASIMETRIA Y CURTOSIS Meddas de asmetría Las meddas de asmetría so dcadores que permte establecer el grado de smetría de ua dstrbucó de valores estadístcos s ecesdad de realzar el gráfco de la dstrbucó. a) Coefcete de asmetría de Fsher. g = 3 ( N ) = = x x ( ( x x) ) N 3 Segú el valor de g, se deduce: S g = 0 S g < 0 S g > 0 la dstrbucó es smétrca la dstrbucó es asmétrca a la zquerda la dstrbucó es asmétrca a la derecha b) Coefcete de asmetría de Bowley. Está basado e los valores de los cuartles y la medaa. + A C C M 3 e = B 3 Depededo del valor de A B coclumos que: S A B =0 la dstrbucó es smétrca S A B >0 la dstrbucó es asmétrca a la derecha S A B <0 la dstrbucó es asmétrca a la zquerda C C c) Medda de Asmetría de Pearso. A x M o = p S Dado que para dstrbucoes campaformes, umodales y moderadamete asmétrcas, se verfca que X 3( X ), alguos autores prefere utlzar esta otra medda de asmetría: M o M e 9

A p = 3( x ) M S e Depededo del valor que tome A p, señalamos que: S A p =0 la dstrbucó es smétrca S A p >0 la dstrbucó es asmétrca a la derecha S A p <0 la dstrbucó es asmétrca a la zquerda Meddas de aputameto o curtoss Por su parte, las meddas de aputameto o curtoss trata de estudar la dstrbucó de frecuecas e la zoa meda. El mayor o meor úmero de valores de la varable alrededor de la meda dará lugar a ua dstrbucó más o meos aputada. Para estudar el aputameto hay que defr ua dstrbucó tpo que os srva de refereca. Esta dstrbucó es coocda como dstrbucó Normal o curva de Gauss y se correspode co umerosos feómeos de la aturaleza. Su forma es la de ua campaa e dode la gra mayoría de los valores se ecuetra cocetrados alrededor de la meda, sedo escasos los valores que está muy dstacados de ésta. La represetacó gráfca de la dstrbucó ormal es: 30

Gráfco.. Represetacó gráfca de la dstrbucó ormal 0,5 DISTRIBUCIÓN NORMAL 0,5 0,4 0,4 0,3 0,3 0, 0, 0, 0, 0,0-4 -3 - - 0 3 4 Al tomar como refereca la dstrbucó ormal se dce que otra dstrbucó es más aputada que la dstrbucó ormal (leptocúrtca) o meos aputada (platcúrtca). A las dstrbucoes que se asemeja a la dstrbucó ormal se les deoma mesocúrtcas. Dado que e ua dstrbucó Normal se verfca sempre que : 4 m4 = ( x x ) = 3 ( x x) = 3( S ) = 3S N N = = 4 El coefcete de aputameto o curtoss utlzado es el sguete: g m4 = S 4 3 Depededo etoces del valor del coefcete g llamamos Mesocúrtca(Normal) Leptocúrtca Platcúrtca s s s g = 0 g > 0 g < 0 3

.6. MEDIDAS DE CONCENTRACION Deomamos cocetracó de ua varable a la mayor o meor equdad e el reparto de la suma total de esa varable. Las meddas de cocetracó teta, pues, mostraros el mayor o meor grado de gualdad e el reparto del total de los valores de ua varable Estas meddas tee mucho terés e alguas dstrbucoes dode la meda la varaza so sgfcatvas. Las meddas de cocetracó más utlzadas so el ídce de cocetracó de G y la curva de Lorez. Para proceder a su cálculo se utlza la sguete tabla Tabla.5. Cálculo del Ídce de G y la curva de Lorez x x N U p N = 00 q N U = 00 U x () x N U p q x () x N U p q............ x () x N U p q I...... x () x N U p q N u Prmero, se ordea los valores de la varable X; x( ) x( ) x( 3 )... x( ) se calcula los productos x ; y las frecuecas acumuladas N. Los valores U se calcula de la sguete forma: U = X U = X + X. U = X + X +... + X = X = 3

Ídce de G El ídce de G se calcula a través de la sguete expresó: I G = = p q ( ) p = El ídce de G toma valores etre 0 y. S la varable está dstrbuda homogeeamete la cocetracó es míma p q = lo que mplca que el Ídce de G tome u valor próxmo a cero. Por el cotraro, s el total de la dstrbucó está muy cocetrado e el últmo valor de la varable el ídce se aproxmaría a. Curva de Lorez La curva de Lorez es la represetacó gráfca de los coefcetes p y q. E el eje de abcsas se represeta p y e el de ordeadas q. E la represetacó gráfca de la curva de Lorez se cluye la dagoal prcpal, que dca la mayor gualdad e el reparto de la varable (p =q ). E cosecueca, cuado la curva de Lorez se aproxme a la dagoal prcpal mayor homogeedad habrá e la dstrbucó de la varable. El ídce de G se calcula como el cocete del área compredda etre la dagoal prcpal y la curva de Lorez, y el área que está por debajo de la dagoal prcpal. Vamos a calcular el ídce de G y la curva de Lorez utlzado como ejemplo la dstrbucó de salaros de la tabla.. 33

Salaro Mesual 60.000-80.000 80.000-00.000 00.000-0.000 0.000-40.000 40.000-60.000 60.000-80.000 80.000-00.000 00.000-0.000 0.000-40.000 40.000-60.000 60.000-80.000 80.000-300.000 30.000-340.000 Tabla.6. Ídce de G y curva de Lorez de la dstrbucó de salaros Marca de clase X Nº de Trabajado res Nº acumulado de trabajadores Total de Salaros N U = X = N U p = 00 N q = 00 U X U p 70.000 60 60.00.00 0.00.000 6 7 90.000 00 360 8.000.00 9.00.000 36 9 0 0.00 00 460.000.00 40.00.000 46 7 0 0 30.00 0 570 4.300.00 54.500.000 57 36 0 0 50.00 00 670 5.000.00 69.500.000 67 46 0 0 70.00 85 755 4.450.00 83.950.000 76 56 0 0 90.00 0 765.900.000 85.850.000 77 57 0 0.00 4 779.940.000 88.790.000 78 59 0 30.00 5 804 5.750.000 94.540.000 80 63 0 50.00 47 85.750.00 06.90.00 85 7 0 0 0 70.00 4 875 6.480.000.770.00 88 75 0 0 90.00 40 95.600.00 4.370.00 9 83 0 0 0 30.00 85.000 6.350.00 50.70.00 00 00 0 0 0 q Al aalzar las dos últmas columas se observa que el 6% de los trabajadores se reparte el 7% de los salaros de la empresa y que el 46% de los trabajadores percbe solamete el 7% del total de los salaros.s los salaros estuvera equdstrbudos etoces el 6% de los trabajadores recbría el 6% de los salaros, el 46% recbría el 46% del total de los salaros, etc. Comprobamos a través del ídce de G que los salaros o está equdstrbudos. 34

I G = p = p = q ( ) = 0, 5 A la msma coclusó llegamos al realzar la curva de Lorez Gráfco.. Curva de Lorez de la dstrbucó de salaros 00 90 80 70 60 50 40 30 0 0 0 0 0 40 60 80 00 35

.7. LA REPRESENTACIÓN GRÁFICA DE LOS DATOS El estudo de las dstrbucoes estadístcas resulta más atractvo cuado va acompañado, o sólo de las meddas descrptvas señaladas aterormete, so també de gráfcos y dagramas que realce las característcas que tratamos de descrbr. Exste dversos tpos de aálss gráfcos. Aquí se descrbe aquellos más utlzados: Dagramas de Pareto pasos: Se emplea para represetar datos cualtatvos y su costruccó se realza e dos a) Ordeamos las clases o categorías segú la frecueca relatva de su aparcó b) Cada clase se represeta por u rectágulo co ua altura gual a la frecueca relatva El dagrama de Pareto represeta los valores de las varables e el eje de abscsas y las frecuecas absolutas y relatvas acumuladas e el eje de ordeadas. Gráfco.3. Ejemplo de dagrama de Pareto Frecueca 5 00,00% 90,00% 0 80,00% 70,00% 5 60,00% 50,00% 0 40,00% 30,00% 5 0,00% 0 A B C D E F G H I y mayor... Frecueca Clase % acumulado 0,00%,00% 36

Gráfcos de barras E geeral, se emplea para varables dscretas e dstrbucoes de frecuecas de datos s agrupar. Su mayor utldad es comparar valores dscretos a partr de dos o más seres. Estos dagramas represeta los valores de las varables e el eje de abscsas y e el de ordeadas se levata, para cada puto, ua barra co u valor gual a la frecueca absoluta o relatva. Gráfco.4. Ejemplo de dagrama de barras 30 0 0 00 90 80 70 60 50 40 30 0 0 0 7 3 0 9 89 77 79 74 75 70 67 65 60 6 57 5 53 5 5 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0 Clase Nº alumos Hstograma Los hstogramas so las represetacoes más frecuetes para ver los datos agrupados. Esta represetacó es u cojuto de rectágulos dode cada uo represeta ua clase. La base de los rectágulos es gual a la ampltud del tervalo y la altura se determa de tal forma que el área del rectágulo sea proporcoal a la frecueca de cada clase. 37

Gráfco.5. Ejemplo de hstograma 0 8 6 4 0 0 3 4 5 6 7 Clases Gráfcos de seres temporales Ua secueca de valores a tervalos regulares de tempo costtuye ua sere temporal. E los gráfcos de seres temporales se represeta los valores ordeados segú la secueca temporal, la cual fgura e ordeadas, e tato que los valores obtedos se represeta e el eje de abscsas. Gráfco.6. Ejemplo de sere temporal 5 VENTAS MENSUALES. 996-998 0 5 0 5 0 /0/96 /03/96 /05/96 /07/96 /09/96 //96 /0/97 /03/97 /05/97 /07/97 /09/97 //97 /0/98 /03/98 /05/98 /07/98 /09/98 //98 38

Gráfcos de sectores Estos gráfcos se utlza para mostrar las cotrbucoes relatvas de cada puto de los datos al total de la sere. E u gráfco de sectores sólo se represeta ua sere. Gráfco.7. Ejemplo de gráfco de sectores EXPORTACIONES POR DESTINO ECONÓMICO. CASTILLA Y LEÓN. AÑO 997. BIENES INTERM EDIOS 6% BIENES DE CAPITAL 6% BIENES DE CONSUM O 58% Gráfcos de dspersó E este tpo de gráfcos se vsualza dos seres. Habtualmete el eje de ordeadas o eje y, es el eje de valores, y el de abcsas o eje x, es el de categorías. E los gráfcos de dspersó ambos ejes tee valores medbles, y ormalmete se utlza para ver la relacó que exste, etre las seres de datos que se represeta. E el ejemplo que sgue se muestra la relacó etre gastos e publcdad y vetas e ua empresa durate sete años. 39

Gráfco.8. Ejemplo de gráfco de dspersó 900 700 500 Vetas 300 00 900 700 500 90 00 0 0 30 40 Gastos e publcdad Dagramas de caja Los dagramas de caja so represetacoes semgráfcas de u cojuto de datos que muestra las característcas prcpales de la dstrbucó y señala los datos atípcos (outlers). Para la costruccó de u dagrama de caja hay que segur certos pasos. a) Se ordea los datos y se calcula el valor mímo, el máxmo y los tres cuartles Q, Q,Q 3 b) Dbujamos u rectágulo cuyos extremos sea Q y Q 3 y se dca detro de la caja medate ua líea la poscó de la medaa Q. c) Calculamos los valores atípcos, que será aquellos valores que cae fuera de los sguetes límtes: Límte feror Límte superor L I = Q -,5 ( Q 3 - Q ) L 5 = Q 3 +,5 ( Q 3 - Q ) d) Se dbuja ua líea que vaya desde cada extremo del rectágulo cetral hasta el valor más alejado y que o sea atípco. 40

e) Se marca todos los valores que sea atípcos La utlzacó de la medaa e este tpo de gráfcos, e vez de la meda, como medda cetral de los datos, vee justfcada porque la medaa es poco fluecable por los valores atípcos. E el sguete gráfco se ha represetado dos varables, la prmera co ua meda de 5 y co ua desvacó típca de 3, y la seguda co la msma desvacó típca y co ua meda de 9: Gráfco.9. Ejemplo de dagrama de caja (box plot) Dagramas de tallos y hojas. (Stem ad Leaf) Estos dagramas so procedmetos sem-gráfcos cuyo objetvo es presetar los datos cuattatvos de ua forma stétca, sempre y cuado, éstos o sea muy umerosos. 4

Para su costruccó seguremos los sguetes pasos. a) Se redodea los datos expresádolos e udades coveetes b) Se dspoe e ua tabla. A la zquerda se escrbe, para datos co dos cfras, el prmer úmero, que será el tallo, y a la derecha, las udades que formará las hojas. S el úmero es el 54 se escrbe 5/4 c) Cada tallo defrá ua clase y sólo se escrbe ua vez. El úmero de hojas represeta la frecueca de dcha clase. A cotuacó vamos a represetar u dagrama de tallos y hojas, utlzado como varable las meddas e cetímetros de ua peza de metal que se ha obtedo a partr de ua muestra de todas las pezas fabrcadas por ua udad de fabrcacó: 60, 70,4 58,9 60,7 6, 58, 60,4 70,6 66, 58, 60,9 55, 60,4 57, 70, 70,4 58,3 6,4 70,7 66,5 Redodeamos los datos a mlímetros 60 70 59 6 6 58 60 7 66 58 6 55 60 57 70 70 58 6 7 66 Represetamos el dagrama de tallos y hojas Gráfco.0. Ejemplo de dagrama de tallos y hojas 5 5 7 8 8 8 9 6 0 0 0 6 6 6 7 0 0 0 4

Otras represetacoes gráfcas Dado que el verdadero terés de los gráfcos es descrbr la formacó de los datos, la aturaleza de las varables os puede sugerr otras represetacoes dsttas de las aterores. Dos ejemplos de ello se muestra a cotuacó: Gráfco.. Ejemplo de mapa o cartograma Gráfco.. Ejemplo de pctograma 80000 MATRICULACIÓN DE VEHÍCULOS EN CASTILLA Y LEÓN 70000 60000 50000 40000 30000 0000 0000 0 99 993 994 995 996 997 43

.8 Ejemplo e SPSS E el SPSS el aálss descrptvo de los datos e SPSS es secllo. El meú "aálss"/"estadístcos descrptvos" dspoe de varar opcoes para aalzar las varables del fchero de datos. Vamos a utlzar la varable EDAD de la ecuesta descrta e el Aexo º. Desde el meú de SPSS Aalzar / Estadístcos Descrptvos accedemos a la sguete patalla: S optamos por Frecuecas obteemos los sguetes cuadros de dálogo E Estadístcos podemos elegr dferetes meddas de poscó, dspersó y forma: 44

E la opcó de Gráfcos podemos optar por realzar u hstograma, u gráfco de barras o de sectores També podemos dar formato a la salda de resultados: 45

La salda de resultados se preseta a cotuacó: EDAD N Váldos 465 Perddo 69 s Meda 40,6 Error típ. de la,3 meda Medaa 39,00 Moda 40 Desv. típ. 5,36 Varaza 35,85 Asmetría,466 Error típ. de,049 asmetría Curtoss -,377 Error típ. de,099 curtoss Rago 90 Mímo 9 Máxmo 99 Suma 003 4 Percetles 5 8,00 50 39,00 75 50,00 46

400 EDAD 300 00 Frecueca 00 0 Desv. típ. = 5,36 Meda = 40,6 N = 465,00 00,0 95,0 90,0 85,0 80,0 75,0 70,0 65,0 60,0 55,0 50,0 45,0 40,0 35,0 30,0 5,0 0,0 5,0 0,0 EDAD E Descrptvos teemos dos patallas ua para troducr las varables y otra para elegr las meddas estadístcas 47

E Opcoes os muestra esta patalla El aálss exploratoro de datos es u cojuto de téccas que se utlza desde hace poco tempo y que persgue los msmos objetvos que la estadístca descrptva, pero cdedo de forma especal e la deteccó de aomalías y errores e la dstrbucó de las varables. Estos aálss se basa e aálss gráfcos y e estadístcos robustos relacoados co el orde y la medaa. Esta opcó permte realzar A cotuacó se muestra las patallas de SPSS relacoadas co el aálss exploratoro de los datos. 48

Descrptvos EDAD SEXO Hombre Meda Itervalo de cofaza para la meda al 95% Límte feror Límte superor Estadístco Error típ. 43,,40 4,33 43,9 Mujer Meda recortada al 5% Medaa Varaza Desv. típ. Mímo Máxmo Rago Ampltud tercuartl Asmetría Curtoss Meda Itervalo de cofaza para la meda al 95% Límte feror Límte superor 4,85 43,00 39,960 5,49 84 73,00,00,063 -,669,7 36,53,45 35,64 37,4 9 Meda recortada al 5% Medaa Varaza Desv. típ. Mímo Máxmo Rago Ampltud tercuartl Asmetría Curtoss Meda Itervalo de cofaza para la meda al 95% Límte feror Límte superor 35,74 34,00 95,39 3,97 9 99 90 7,00,850,079,439,57 56,50 6,99 38,5 74,48 Meda recortada al 5% Medaa Varaza Desv. típ. Mímo Máxmo Rago Ampltud tercuartl Asmetría Curtoss 56,8 55,00 93,500 7,3 4 76 35 3,5,074,845-3,0,74 49

EDAD Stem-ad-Leaf Plot for SEXO= Hombre GRÁFICO DE TALLOS Y HOJAS Frequecy Stem & Leaf 7,00. 4& 79,00. 556667778889999 30,00. 00033333344444 6,00. 5555666777788888899999 36,00 3. 00333344444444 73,00 3. 55555555556666777778888889999999999 50,00 4. 0000000003334444444 98,00 4. 5555555566666666667777778888888899999999 57,00 5. 000000000333334444444 08,00 5. 555555666677778888899 65,00 6. 00003344 89,00 6. 555556667777888889 50,00 7. 000034 8,00 7. 55678& 7,00 8. & Stem wdth: 0 Each leaf: 5 case(s) & deotes fractoal leaves. 50

Gráfco Q-Q ormal de EDAD 4 Para SEXO= Hombre 3 0 Normal esperado - - -3-4 -0 0 0 40 60 80 00 Valor observado Alguos de los resultados que os preseta SPSS, co las opcoes elegdas, se :muestra a cotuacó Resume del procesameto de los casos EDAD SEXO Hombre Mujer 9 Casos Váldos Perddos Total N Porcetaje N Porcetaje N Porcetaje 493 96,0% 6 4,0% 555 00,0% 963 95,3% 48 4,7% 0 00,0% 6,8% 4 87,% 47 00,0% 5

DISTRIBUCIONES DE PROBABILIDAD Y CONTRASTES DE HIPÓTESIS 5

3. DISTRIBUCIONES DE PROBABILIDAD Y CONTRASTE DE HIPÓTESIS 3.. INTRODUCCIÓN 3.. DEFINICIÓN DE PROBABILIDAD, VARIABLE ALEATORIA Y VALOR ESPERADO Defcó de probabldad Defcó de varable aleatora Defcó de valor esperado: esperaza y varaza 3.3. DISTRIBUCIONES DE PROBABILIDAD Dstrbucó bomal Dstrbucó hpergeométrca Dstrbucó ormal o de Gauss 3.4. DISTRIBUCIONES DERIVADAS DE LA NORMAL Dstrbucó χ de Pearso Dstrbucó t de Studet Dstrbucó F de Fsher-Sedecor 3.5. TEOREMA CENTRAL DEL LÍMITE 3.6. DISTRIBUCIONES MUESTRALES Dstrbucó de la meda muestral Dstrbucó de la dfereca etre dos medas muestrales Dstrbucó de la proporcó muestral Dstrbucó de la dfereca etre dos proporcoes muestrales Dstrbucó de la varaza muestral Dstrbucó de la razó de varazas muestrales 3.7. INTERVALOS DE CONFIANZA 3.8. CONTRASTE DE HIPÓTESIS 3.9. DISTRIBUCIONES BIDIMENSIONALES Dstrbucoes margales Dstrbucoes codcoadas Depedeca leal 3.0. TABLAS DE CONTINGENCIA Estadístco χ de Pearso 53

Meddas de asocacó Odds Rato Coefcete de cotgeca Coefcete V de Cramer Q de Yule 54

3.. INTRODUCCIÓN E este capítulo desarrollaremos los coceptos fudametales de la teoría de la probabldad, los cotrastes de hpótess, el aálss de la varaza y la teoría de la regresó. Dchos coceptos se juzga claves a la hora de efretaros co la teoría del muestreo, la cual se expoe e el capítulo sguete. Uo de los objetvos de la ceca cosste e descrbr y predecr sucesos que ocurre a uestro alrededor de forma cotdaa. Ua maera de hacerlo es medate la costruccó de modelos matemátcos. Así, las dstrbucoes de probabldad se defe como modelos matemátcos que descrbe ua fdad de sucesos que acotece a uestro alrededor. S os plateamos predecr el sexo de cada uo de los acdos e u determado lugar, vemos que la costruccó de ua ecuacó que lo determe co total exacttud sería excesvamete compleja, hasta tal puto que o se ha descuberto aú gua, pero s embargo, aproxmarse al úmero total de acdos de cada sexo s puede realzarse satsfactoramete a través de u modelo matemátco. Se expoe e este capítulo los modelos matemátcos más mportates que os descrbe grupos de sucesos. Asmsmo, estos modelos matemátcos os permtrá, como veremos, cotrastar hpótess realzadas sobre u grupo de sucesos. 55

3.. DEFINICIÓN DE PROBABILIDAD, VARIABLE ALEATORIA Y VALOR ESPERADO Defcó de probabldad Se expoe a cotuacó las tres defcoes exstetes de probabldad, e orde al desarrollo hstórco de la teoría: a) Probabldad clásca o a pror: es ua probabldad cal. Por ejemplo, ates de lazar ua moeda al are, se supoe que la probabldad de que salga cara va a ser gual a ½, de gual forma, podría decrse que s u dado se arroja muchas veces la probabldad de obteer u uo o u dos será de /6, ya que este suceso puede aparecer veces de 6. Esta probabldad la defe Mood y Graybll (978) de la sguete maera: s u suceso puede ocurrr de maeras mutuamete excluyetes e gualmete verosímles y s A de éstas posee u atrbuto A, la probabldad de A es la fraccó A /. b) Probabldad a posteror o frecuecal: es ua probabldad expermetal. Por ejemplo, s sospechamos que u dado o está equlbrado, la úca maera de probar esta sospecha es arrojádolo muchas veces y observar s la frecueca relatva de obteer u uo se aproxma a u sexto. La probabldad a posteror se defe como el límte de la frecueca relatva cuado el úmero de expermetos realzados tede a fto, y se euca formalmete de la sguete maera: P(A) = lm A dode A sería el suceso obteer u uo y: úmero de veces que se repte el expermeto (lazameto del dado) A úmero de veces que aparece el resultado A. A deota, por tato, la frecueca relatva 56

lm deota el límte de la frecueca relatva a medda que el úmero de lazametos se aproxma a fto. La probabldad frecuecal parte del supuesto de que los dsttos posbles resultados o sucesos que puede dervarse de u expermeto o tee por que ser gualmete verosímles. c) De las defcoes aterores se deduce tres axomas que so los que costtuye la defcó axomátca de la probabldad. Sea S u espaco muestral (cojuto de todos los posbles sucesos de u determado expermeto) y A u determado suceso de S (cualquer elemeto o subcojuto de S), dremos que P es ua fucó de probabldad e el espaco muestral S s se satsface los tres axomas sguetes: Axoma. P(A) es u úmero real tal que P(A) 0 para todo suceso A de S, es decr, la probabldad de cualquer suceso e u expermeto es sempre mayor o gual que 0. Axoma. P(S) =, es decr, la probabldad de todos los sucesos posbles de u expermeto es gual a. Axoma 3. S A, B, C, es ua sucesó de sucesos mutuamete excluyetes de S, la probabldad asocada a la uó de todos ellos (que e u expermeto ocurra cualquera de ellos) es gual a la suma de sus probabldades. P( AU BU C) = P( A) + P( B) + P( C) De estos tres axomas se deduce los sguetes teoremas: 57

Teorema : S defmos suceso complemetaro de A, A, como aquel que está formado por todos los putos o sucesos del espaco muestral S que o está e A, etoces la probabldad de A será gual a: P(A ) = - P(A) ya que P(A U A ) = P(S) = P(A) +P(A ) = P(A ) = - P(A) Teorema. Sea A u suceso de S. Etoces se verfca: 0 P(A) ya que por el axoma p(a) 0 y por el teorema ateror sabemos que: P(A) + P(A ) = sedo por el axoma P(A) y P(A ) 0 P(A) = - P(A ) Teorema 3. S φ es el suceso ulo, etoces se verfca que: P(φ) = 0 ya que φ es el suceso complemetaro de S. Señalar por últmo que el cojuto de todos los sucesos posbles, S, puede ser: Dscreto: s toma solamete u úmero fto o umerable de valores. Cotuo: puede tomar cualesquera de los ftos valores de u tervalo. Defcó de varable aleatora Sea S u espaco muestral e el que se defe ua fucó de probabldad. Sea X ua fucó de valores reales defda e S. S la fucó X trasforma putos de S e 58

putos del eje X y es medble, etoces se dce que X es ua varable aleatora (varable aleatora udmesoal). Ua varable aleatora es, por tato, ua regla o mecasmo que asga u valor umérco a todos y cada uo de los sucesos asocados a u expermeto. Se muestra a cotuacó u ejemplo secllo de varable aleatora. los sguetes: Supogamos que se laza al are tres moedas, etoces los sucesos posbles so CCC XCC CXC CCX CXX XCX XXC XXX La probabldad de cada uo de estos sucesos es gual a /8. S asgamos u valor umérco a sacar ua cara, por ejemplo, u, y u valor umérco a sacar ua cruz, por ejemplo u 0, estamos costruyedo la sguete varable aleatora: S X(S) CCC 3 XCC CXC CCX CXX XCX XXC XXX 0 La fucó de probabldad de la varable aleatora sería etoces la sguete: P(X = 0) = P(X(S) = 0) = P(XXX) = /8 P(X = ) = P(X(S) = ) = P(CXX) + P(XCX) + P(XXC) = /8 + /8 + /8 = 3/8 59

P(X = ) = P(X(S) = ) = P(XCC) + P(CXC) + P(CCX) = /8 + /8 + /8 = 3/8 P(X = 3) = P(X(S) = 3) = P(CCC) = /8 Señalar que ua varable aleatora se dce dscreta s toma solamete u úmero fto o umerable de valores y cotua s puede tomar cualesquera de los ftos valores de u tervalo. Defcó de valor esperado El valor esperado, esperaza o meda de ua varable aleatora se obtee calculado el valor medo de la dstrbucó de valores de la varable aleatora. E el ejemplo ateror, el valor esperado de la varable aleatora costruda sería: E( X ) = 0 * + * + * + * =, 8 3 3 3 5 8 8 8 Este valor esperado o esperaza de la varable aleatora se expresa formalmete de la sguete maera: + E( X ) = x * f ( x) s la varable aleatora es dscreta E( X ) = x * f ( x) dx s la varable aleatora es cotua sedo f(x) la fucó de probabldad y deotado el tervalo (-,+ ) el cojuto de todos los posbles valores que toma la varable aleatora. El valor esperado, esperaza o meda de ua fucó de ua varable aleatora se obtee calculado el valor medo de la dstrbucó de valores de la fucó de la varable aleatora. Formalmete toma la sguete expresó: + E( h( X )) = h( x) * f ( x) s la varable aleatora es dscreta 60

E( h( X )) = h( x) * f ( x) dx s la varable aleatora es cotua Nótese que s h(x) = x estaríamos calculado el valor esperado, esperaza o meda de la varable aleatora S calculamos el valor para h(x) = x estaríamos calculado el valor esperado, esperaza o meda de la varable aleatora al cuadrado, y s a este valor le restamos (E(X)), obtedremos la varaza de la varable aleatora, es decr: + Var( X ) = x f ( x) E( X ) s la varable aleatora es dscreta Var( X ) = x f ( x) dx E( X ) s la varable aleatora es cotua Cotuado co el ejemplo ateror, la varaza de la varable aleatora sería: + Var( X ) = x P( x) E( X ) = * + * + * + *, 0 8 3 3 3 8 8 8 5 = 0 75 6

3.3. DISTRIBUCIONES DE PROBABILIDAD Se deoma dstrbucó de probabldad a cualquer regla o mecasmo que os permta determar la probabldad de que la varable aleatora ξ tome cada uo de los posbles valores x. Esta regla o mecasmo puede ser ua tabla, ua fórmula o u gráfco. La fucó de probabldad, será la fórmula que se emplee para calcular P[ξ=x]. Cualquer dstrbucó de probabldad, como se deduce del apartado ateror, ha de teer dos característcas ecesaras: cotua. x ) P(ξ x) 0 x s es dscreta o be f ( x) dx x 0 s es ) P(ξ =x) = s es dscreta o be f ( x) dx = s es cotua La fucó de dstrbucó es la probabldad de que la varable aleatora tome todos los valores meores o guales a x. Las dstrbucoes de probabldad puede ser dscretas o cotuas. No obstate, podríamos defr fucoes de probabldad mxtas, es decr, e uos tramos dscretas y e otros cotuas. Las dstrbucoes de probabldad dscretas que vamos a aalzar e este capítulo so: la dstrbucó bomal y la dstrbucó hpergeométrca. Etre las dstrbucoes cotuas se estuda la dstrbucó ormal o de Gauss, la dstrbucó χ de Pearso, la dstrbucó t de Studet y la dstrbucó F de Fsher- Sedecor. 6

Dstrbucó bomal Para comezar el estudo de la dstrbucó bomal vamos a cosderar ua varable aleatora ξ que puede tomar úcamete los valores y 0 co probabldades p y q respectvamete. P[ξ = ] = p P[ξ = 0] = q p + q = Ejemplos cocretos de estos feómeos aleatoros so: el lazameto de ua moeda a cara o cruz, los resultados de u exame de aprobado o suspeso o el lazameto de u dado co posbles resultados de sólo par o mpar. Estos expermetos dode se produce resultados mutuamete excluyetes se deoma esayos de Beroull, e hoor al matemátco suzo Jakob Beroulle (654-705). Las codcoes que se debe de satsfacer so:. La probabldad de éxto p permaece costate de u expermeto a otro.. Los esayos so depedetes. La esperaza matemátca o la meda de esta dstrbucó es : E(ξ ) = p + 0q=p La varaza se calcula medate la sguete expresó: sedo q = -p σ = E(ξ - p) = pq La dstrbucó bomal de parámetros, p se basa e ua prueba coocda como expermeto de Beroull o problema de las pruebas repetdas, que cosste e averguar la probabldad de que e las extraccoes o pruebas se haya cosegudo x valores o/y -x valores 0. 63

La dstrbucó bomal de parámetros, p se costruye, pues, como ua suma de varables depedetes dstrbudas como las aterores. La varable ξ puede tomar todos los valores compreddos etre 0 y ξ = ξ + ξ +..+ ξ La fucó de cuatía o de probabldad vee expresada por la sguete fucó: x P[ ξ = x] = p q x x Para facltar la compresó de esta fucó os vamos a apoyar e el sguete ejemplo. Supógase la extraccó de r bolas e ua ura, de las cuales so blacas y egras, sedo el suceso a medr el úmero de bolas blacas extraídas. Cada vez que efectuemos ua extraccó se volverá a troducr la bola detro de la ura. La fucó de cuatía o probabldad tee ua seclla deduccó e el ejemplo expuesto. E prmer lugar, dado que partmos de sucesos depedetes, la probabldad se obtee multplcado las probabldades de los sucesos, es decr, s la ura cotee úcamete cuatro bolas, dos blacas y dos egras, y efectuamos dos extraccoes, la probabldad de que ua sea blaca y la otra o, sedo la probabldad de obteer bola blaca p = 0,5 (ya que teemos dos bolas blacas sobre cuatro), sería: p(blaca, egra) = p(blaca) * p(egra) = p(-p) = pq=0,5 Ahora be, hemos de teer e cueta que el orde o fluye y, por tato, obteemos dos casos favorables sobre los cuatro posbles, teedo cada uo probabldad pq: Casos posbles Blaca, egra Negra, blaca Negra, egra Blaca, blaca Casos favorables 64

Al ser dos los casos favorables se deberá multplcar pq por, es decr la probabldad del suceso a evaluar es la sguete: pq. El úmero de estos casos favorables se calcula a través del úmero combatoro, sedo e el caso que os ocupa = y x =. x La esperaza matemátca de la dstrbucó es: E(ξ) = p La varaza de la dstrbucó es: σ = pq Por ejemplo, la probabldad de obteer x caras e 0 lazametos de ua moeda será gual a: P[ x] x p x q x x x ξ = = = 0 0 0, 5 0, 5 0 sedo 0 x 0 x S x = 0 estaríamos calculado la probabldad de obteer 0 cruces o gua cara, que sería gual a 0,00097. A su vez, la probabldad de obteer 5 caras y 5 cruces (x = 5) sería de 0,4609. Esta dstrbucó se aplca a sodeos exhaustvos co reemplazameto, costtuyedo la base teórca de las formulacoes desarrolladas e el muestreo aleatoro co reemplazameto. 65

Dstrbucó hpergeométrca Ua varable aleatora, ξ, que toma todos los valores compreddos etre 0 y, se dce que sgue ua dstrbucó hpergeométrca cuado: P [ = r] ξ Np Nq r r = N r dode Np y Nq so úmeros eteros, sedo Np + Nq = N. U ejemplo de esta dstrbucó lo ecotramos cuado queremos saber cual es la probabldad de extraer de ua ura que cotee N bolas, de las cuales (Np e la fórmula) so blacas y (Nq) so egras, r bolas blacas y -r bolas egras al hacer extraccoes. Cada vez que se efectúe ua extraccó, la bola o se repoe de uevo e la ura, es decr, o etrará a formar parte de la sguete extraccó. La esperaza matemátca de la dstrbucó es: E[ξ ] = p La varaza de la dstrbucó vee dada por la sguete expresó: σ = N pq N Esta dstrbucó es la base teórca del muestreo aleatoro s reposcó. Dstrbucó ormal o de Gauss E u bue úmero de sucesos aleatoros, la dstrbucó de probabldad, sgue ua dstrbucó específca e forma de campaa, llamada curva ormal o curva de 66

Gauss. Esta dstrbucó es la más comú y útl de la estadístca, dado que muchos feómeos se suele ajustar a esta dstrbucó: errores de observacó, procesos de medcó s errores sstemátcos, meddas físcas del cuerpo humao, etc. Decmos que ua varable aleatora ξ que toma los valores x (desde - hasta + ) se dstrbuye ormalmete co parámetros (0, ), es decr, co meda 0 y varaza, cuado su fucó de dstrbucó vee dada por la sguete expresó: x P[ ξ x] = F( x) = e dx π x - <x< La fucó de desdad la obteemos dervado la fucó de dstrbucó: f ( X ) = e x π A su vez, decmos que ua varable aleatora η se dstrbuye ormalmete co parámetros (α, σ) cuado está lgada a la dstrbucó ormal de parámetros (0, ) por la sguete expresó: η = σξ + α sedo σ > 0 La fucó de desdad de la dstrbucó ormal de parámetros (α, σ) toma, etoces, la sguete expresó: f ( X ) x α = σ πσ e La represetacó gráfca de la fucó de desdad de la dstrbucó ormal de parámetros (α, σ), tee las sguetes característcas: Karl Fredrch Gauss, 977-855, vestgó el comportameto de los errores de medda y llegó a la expresó matemátca que se cooce como Ley de los errores o Ley de Gauss. 67