Imagnacón Estadístca y descrpcón de datos Programa : Estadístca aplcada I 1
Materal ddáctco Título Espaco Académco Plan de estudos Undad de Aprendzaje Núcleo de formacón Modaldad Tpo Vsual Imagnacón Estadístca y descrpcón de datos -Arqutectura Maestría en Sustentabldad, Desarrollo Regonal y Metropoltano Estadístca Aplcada I Presencal Oblgatora
Este materal se compone de 68 dapostvas para apoyar el desarrollo de la undad de aprendzaje Estadístca Aplcada I de la Maestría en Sustentabldad y Desarrollo Regonal cuyos contendos temátcos del modulo1: Nvel Conceptual y Teórco de la Estadístca Descrptva e Inferencal son los sguentes: 1. Imagnacón Estadístca. Descrpcón de datos: Grafca y Numérca Cada dapostva se encuentra ordenada por temas de conformdad al programa y calendaro del curso : el prmer tema comprende las dapostvas de la 4 a la 5; el segundo de la 6 a la 39 y el tercero de la 40 a la 67. La dapostva 68 corresponde a la bblografía. 3
IE Introduccón Enlace IE_IS Pensamento proporconal éxto Denomnadores pequeños IE Normas E-S Herramentas Cálculo Organzacón portafolo Ideales E Valores S EsD-Il Proporcones Técnca de lectura Qué es Cenca Porcentajes 100% asstenca Esceptcsmo/ Imagnacón tasa Ejerccos: procedmento y resultado Imagnacón estadístca Datos Actvdades en tempo y forma Investgacón No dudes preguntar 4
El campo de la estadístca es un conjunto de procedmentos para reunr, medr clasfcar, computar, analzar y resumr nformacón numérca adqurda sstemátcamente. La estadístca mplca aprender una nueva manera de ver las cosas El análss estadístco es una parte vtal del método centífco Mantener un sentdo claro de equlbro y proporcón con respecto a la realdad 5
Imagnacón socológca 6
El comportamento ndvdual se rge en funcón de estructuras socales más grandes; Las accones ndvduales deben apegarse a las reglas de la socedad y no a ncatva personal; Las reglas se defnen dentro de un contexto cultural. Ver el árbol y el bosque. *Charles Wrght Mlls (8 de agosto de 1916, Waco (Texas) 0 de marzo de 196, West Nyack, (Nueva York) socólogo estadoundense. 7
Estadístca 8
Aprecacón de qué tan usual es un evento, Crcunstanca o Comportamento, en Relacón con un Conjunto mayor de Eventos smlares. Y una aprecacón de Las causas y Consecuencas del evento, Crcunstanca o Comportamento 9
10
Relacón de correspondenca entre las partes y el todo, o entre varas cosas relaconadas entre sí, en cuanto a tamaño, cantdad, dureza, etc. 11
stuacón que se da en un sstema cuando todos los factores exterores y/o procesos nternos no producen cambos. 1
Una medda de la realdad? Una estadístca no sgnfca mucho por sí sola La nterpretacón depende del lugar tempo y cultura de donde se observa 13
14
15
Datos: nformacón sstemátcamente adqurda que se organza sguendo los procedmentos de la cenca y la estadístca Se conocen las lmtacones Del razonamento y de los procesos matemátcos y se sabe el grado de mprecsón o de confanza Un objetvo es Controlar el error estadístco Error estadístco. grado de mprecsón en los procedmentos utlzados para reunr y procesar nformacón 16
Descrpcón poblacón muestra Observacón P R O B A B I L I D A d 17
18
Error estadístco Introduccón Control del error Nveles de medcón Codfcacón y conteo de observacones Dstrbucón de frecuencas Codfcacón y conteo de datos /r Cuantlas Agrupacón de datos /r Muestra representatva Estmacón cudadosa Medcón Estandarzacón Redondeo Cuartles Teoría dela probabldad V. nomnales Lmtes reales Percentles V. ordnales DF de prop. Y porc. V. De ntervalo DFA V. De razón Mejora del NM Nvel de medda nvel de medcón Organzacón de Datos 19
(Procedmentos estadístcos) (Defncón operaconal Representatvdad y tamaño de la muestra Instrumento Observacones Redondeo 0
Poblacón parámetro Muestra estadístco Estmacón estadístca vs apresurada 1
Símbolo que asgnamos a las dferencas observadas en las cualdades o cantdades de una varable Nomnal Redondeo y límtes reales Nvel Ordnal Intervalo Razón Undad De medda Medcón precsa
Varable Edad Descrpcón de códgos 0=mujer, 1=hombre,9=faltante 3
Absolutas Smples Acumuladas cuantlas Relatvas Proporcones Porcentajes 4
5
Tablas y gráfcas Lneamentos Datos nomnales ordnales V. Intervalo razón Uso y aplcacón Dstorsón gráfca Gráfcos de pastel Hstogramas Gráfcos de barras Polígonos y líneas Tablas y Gráfcas 6
Relacón de la vctma y el Porcentaje delncuente (%) Famla 1.7 Extraño 14 Otro conocdo 30.5 Desconocdo 4.8 Total 100 Unversdad Autónoma de Estado de Méxco 1. Nvel de medcón Relacón de la vctma y el delncuente Sector/pastel Famla Extraño Otro conocdo Desconocdo Bases para elegr Gráfcos. Objetvo y relevanca 3. Característcas del lector 7
Clardad y smpleza Bosquejar alternatvas Transmtr nformacón Prncpo de nclusvdad En su caso fuente 8
Grafcacón de datos nomnales/ordnales 10 9 8 7 6 5 4 3 1 0 % PIB gasto en atencón médca en 1990 7,6 8,8 8,3 8, 6,6 Bélgca Franca Alemana Pases Bajos España Unversdad Autónoma de Estado de Méxco País % PIB gastado en atencón médca en 1990 Bélgca 7.6 Franca 8.8 Alemana 8.3 Pases Bajos 8. España 6.6 Pases Bajos Seres1 Barras % PIB gasto en atencón médca en 1990 España Bélgca Alemana Franca 6,6 7,6 8, 8,3 8,8 0 4 6 8 10 9
Género y nvel educatvo 30 5 0 Porcentaje 15 10 5 masculno Femenno 0 Menos de secundara Secundara Menos de unversdad Ttulo de lcencatura o equvalente Maestra Ttulo profesonal Doctorado Femenno masculno Barras agrupadas 30
35 30 5 0 15 10 5 Género y nvel educatvo 30 5 0 15 10 5 Menos de secundara Secundara Menos de unversdad Ttulo de lcencatura o equvalente Maestría Ttulo profesonal Doctorado 0 Masculno 0 Femenno Barras agrupadas 31
Grafcacón de varables de Intervalo/razón Estudantes Edades (n) 18 3 19 5 0 1 3 4 3 4 5 0 6 0 7 0 8 1 suma Alumnos 6 5 4 3 1 0 Equpo de futbol: edades 18 19 0 1 3 4 5 6 7 8 3
6 Equpo de futbol: edades 5 4 alumnos 3 1 0 18 19 0 1 3 4 5 6 7 8 33
6 Equpo de futbol: edades 5 4 alumnos 3 1 0 18 19 0 1 3 4 5 6 7 8 34
35
Dagrama de caja y bgote Edades Estudant es (n) f F 18 3 13.6 13.6 19 5.7 36.4 0 9.1 45.5 1 3 13.6 59.1 4 18. 77.3 3 9.1 86.4 4 9.1 95.5 5 0 0.0 95.5 6 0 0.0 95.5 7 0 0.0 95.5 8 1 4.5 100.0 suma 100 Mn P5 P 50 P75 Max 18 19 1 8 36
n Unversdad Autónoma de Estado de Méxco 17 18 19 0 1 3 4 5 6 7 8 9 X 37
Mexco: Número de Muncpos de las Zonas Metropoltanas con más de 10 muncpos, 010 Valle de Méxco Toluca Monterrey Oaxaca Puebla-Tlaxcala Tlaxcala-apzaco Orzaba 39 19 1 13 15 76 80 60 40 0 0 Orzaba Tlaxcala-apzaco Puebla-Tlaxcala Méxco:Número de munpos de las Zonas Metropoltanas con mas de 10 muncpos, 010 Seres1 Oaxaca Monterrey Seres1 Toluca Valle de Méxco 0 0 40 60 80 38
80 Méxco:Número de munpos de las Zonas Metropoltanas con mas de 10 muncpos, 010 70 60 50 40 Seres1 30 0 10 0 Valle de Méxco Puebla-Tlaxcala Oaxaca Tlaxcala-apzaco Toluca Monterrey Orzaba 39
Promedos Introduccón Estadístcos n 1 x Meda Medana Moda curvas cálculos falacas 40
Rangos de edad Estatura Peso H M H M >18 1.64 1.58 74.8 68.7 18-5 1.67 1.61 70.4 6.9 40-50 77.3 7. Datos de 17 ml 364 personas mayores de 18 años. Cámara Naconal de la Industra del Vestdo http://www.muynteresante.com.mx/preguntas-y-respuestas/1/0/09/meddas-poblacon-mexcana/ 41
Una medda de poscón o de tendenca es un número que se toma como orentacón para referrnos a un conjunto de datos. La meda artmétca muestral representa el centro físco del conjunto de datos y se defne como la suma de los valores observados, dvddo por el total de observacones. Sere smple 1 x n n 1 x Sere de frecuencas x c1 f c1 c f x c c x Sere de clases y frecuencas c1 c1 pm x c pm c c 4
Propedades de la Meda artmétca La suma de las desvacones respecto de la meda es gual a cero, n ( x x 1 ) La suma de los cuadrados de las desvacones a partr de la meda artmétca es menor que la suma de los cuadrados de las desvacones a partr de cualquer otro valor. 0 n n x x) ( x 1 1 ( ) La meda no se altera por una transformacón lneal de escala. a bx 43
Sentdo de proporconaldad Ventajas Unversdad Autónoma de Estado de Méxco 1. Es fácl de calcular. Se entende fáclmente. 3. Se presta a operacones algebracas. 4.Es el estadístco más comúnmente usado x 1 x n 1 1 x1 x Pero s n1 n 1 x n 1 n n x 1 Desventajas Está desproporconalmente afectada por los valores extremos y que, por consguente, puede estar muy lejos de ser una representacón de la muestra, por lo que no es recomendable usarla en dstrbucones muy asmétrcas. 44
La medana muestral representa el valor central de los datos cuando las medcones están ordenadas Sere smple Poscón ~ x 0.5( n 1) ~ x valor de la Poscón ~ x Sere de frecuencas Poscón ~ x 0.5 f ~ x valor de la Poscón ~ x Sere de clases y frecuencas ~ x L nf 0.5( f f ) F * c 45
Desventajas Es nsensble a los valores de la varable X, pero es muy sensble con el tamaño de muestra n Indcador Undad de medda Año Valor Poblacón total a Mles de 010 11 337 habtantes Tempo de duplcacón a Años 010 39.5 Tasa de crecmento meda anual de la poblacón a Por cento 005-010 1.8 Densdad de poblacón a Habtantes/km 010 57 Edad medana a Años 010 6 http://www3.neg.org.mx/sstemas/temas/default.aspx?s=est&c=17484 46
La moda representa el valor con la mayor frecuenca de los datos. Sere smple xˆ Valor que más se repte Sere de frecuencas xˆ Valor con la frecuenca más alta Sere de clases y frecuencas xˆ 1 L nf f f 1 1 y * c f ant f post 47
Relacón entre Meda Artmétca, Medana y Moda: Para dstrbucones unmodales que sean poco asmétrcas: X Xˆ 3 X Relacón X X = X X < X < X X ~ Sus poscones relatvas, según la smetría de la dstrbucón de frecuencas es: X X > X Smetría Smétrca Sesgo postvo Sesgo negatvo 48
Y X X 1 Unversdad Autónoma de Estado de Méxco Meda Artmétca Ponderada Meda Geométrca Otras meddas de tendenca central Es el promedo de los datos en donde se le da un peso o mportanca específca a cada observacón. Se calcula: x w n 1 n 1 w x w srve para promedar los crecmentos geométrcos de una varable. S suponemos que Y representa el factor de crecmento geométrco de la varable X, es decr: y x x 1 49
Y X X 1 Unversdad Autónoma de Estado de Méxco Otras meddas de tendenca central Entonces el factor de crecmento geométrco promedo de la varable X será: Sere smple G n n 1 y Sere de frecuencas G n k 1 y f Meda Armónca Se usa cuando los datos a promedarse están meddos en undades expresadas en forma de cocentes (km./hr., $/lt, etc.), 50
Sere smple Sere de frecuencas H n n 1 1 x H n k 1 f x 51
Rango (o Intervalo): Es la dstanca que exste entre el menor y mayor valor de los datos. R max mn Rango Sem-Inter Cuartl (Q): (o Desvacón Cuartl) Mde el rango promedo de una cuarta parte de los datos (evta los valores extremos) Q3 1 Q Q Unversdad Autónoma de Estado de Méxco MEDIDAS DE DISPERSIÓN Desvacón Meda Absoluta (DM): Es la dstanca promedo de los datos a su meda. DM = n 1 X n X DM = k 1 f X n X 5
Muestral ( S Varanza muestral : La suma de las dstancas al cuadrado se dvde entre en número de datos menos uno: 1 n nx n -1 S n -1 x x = S n 1 n 1 x n -1 nx n -1 x f S n -1 x x f = S k 1 k 1 Unversdad Autónoma de Estado de Méxco 53
Varanza poblaconal: Es el promedo del cuadrado de la dstanca de los datos a su meda N 1 N 1 N X N X = k 1 k 1 N *X f N X f = Desvacón Estándar: Mde la varacón de los datos en térmnos absolutos. Es la raíz cuadrada postva de la varanza. S = S Unversdad Autónoma de Estado de Méxco 54
La desvacón estándar se nterpreta construyendo ntervalos alrededor del promedo: a) Teorema de Chebyshev. Unversdad Autónoma de Estado de Méxco S la dstrbucón no es smétrca y unmodal o se desconoce su forma: Al menos el 75% de los valores cae dentro de desvacones estándar alrededor de la meda. Al menos el 89% de los valores caen dentro de 3 desvacones estándar alrededor de la meda. 55
b) Regla Empírca. S la dstrbucón es una curva acampanada, unmodal y smétrca: Aproxmadamente el 68% de los datos (poblacón) se encuentran a una desvacón estándar alrededor de la meda. Aproxmadamente el 95% de los datos (poblacón) se encuentran a desvacones estándar alrededor de la meda. Aproxmadamente el 99% de los datos (poblacón) se encuentran a 3 desvacones estándar alrededor de la meda: 56
Coefcente de Varacón (CV): Mde la varacón relatva de la varable con respecto a su promedo. Mde la magntud de la desvacón estándar en relacón con la magntud de la meda. Se expresa en por centos. CV = S X 100 57
Edades f f% F% 19 4 5.7 5.7 0 13 18.6 4.3 1 19 7.1 51.4 16.9 74.3 3 11 15.7 90.0 4.9 9.9 5 1 1.4 94.3 6 0 0.0 94.3 7 0 0.0 94.3 8 0 0.0 94.3 9.9 97.1 0 0 0.0 97.1 31 0 0.0 97.1 3.9 100.0 70 100.0 0 18 16 14 1 10 8 6 4 0 19 0 1 3 4 5 6 7 8 9 0 31 3 Seres1 58
0 18 16 14 1 10 Seres1 8 6 4 0 19 0 1 3 4 5 6 7 8 9 0 31 3 59
60
61
40 35 LI LS PM f f% 19 1 0 17 4.9 1 3 35 50.00 3 5 4 1 17.14 5 9 7.86 9 31 30.86 31 33 3.86 70 100.0 0 30 5 0 15 10 5 0 0 4 6 8 30 3 Seres1 6
40 35 30 5 0 Seres1 15 10 5 0 0 4 6 8 30 3 63
64
65
66
Edades Meda Error típco 0 Medana 1 Moda 1 Desvacón estándar 3 Varanza de la muestra 6 Curtoss 7 Coefcente de asmetría Rango 13 Mínmo 19 Máxmo 3 Suma 1535 Cuenta 70 CV 11 67
Bblografía Wackerly, D.D.,W. Mendenhall y R. L.Scheaffer (00), Estadístca matemátca con aplcacones, Méxco, Thomson. Mendenhall, W., R.J. Beaver y B. Beaver(007) Introduccón a la probabldad y estadístca. Internaconal Thomson Edtores S. A. de C. V. Freund, J.E., I. Mller y M. Mller (000), Estadístca matemátca con aplcacones, Méxco, Prentce Hall. Canavos, C. George (1998), Probabldad y estadístca: aplcacones y métodos, Méxco, Mc Graw-Hll. 68
69