PROBABILIDAD Y ESTADÍSTICA BÁSICA

Documentos relacionados
Medidas de Tendencia Central

Guía 1 Matemática: Estadística NM 4

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

Estadística Descriptiva

Qué es la estadística?

TEMA 1. ESTADÍSTICA DESCRIPTIVA

Ejercicios y Talleres. puedes enviarlos a

Ejercicios y Talleres. puedes enviarlos a

Tema 2. Medidas descriptivas de los datos

ESTADÍSTICA DESCRIPTIVA

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

ESTADÍSTICA DESCRIPTIVA

PyE_ EF2_TIPO1_

Repaso...Último Contenidos NM 4

Preguntas más Frecuentes: Tema 2

ESTADÍSTICA UNIDIMENSIONAL

Capítulo 3. El modelo de regresión múltiple. Jorge Feregrino Feregrino. Econometría Aplicada Utilizando R

Hacia dónde tienden los datos? Se agrupan en torno a un valor? o, se dispersan? Su distribución se parece a alguna distribución teórica?

Pre-PAES 2016 Media aritmética, moda y mediana.

Slide 1. Slide 2. Slide 3. Universidad Diego Portales Facultad de Economía y Negocios. Capítulo 3 Estadística Descriptiva: Métodos Numéricos

MEDIDAS DE TENDENCIA CENTRAL

DISTRIBUCIONES DE PROBABILIDAD.- DISTRIBUCIÓN BINOMIAL (BERNOULLI) DISTRIBUCIÓN NORMAL (GAUSS)

Importancia de las medidas de tendencia central.

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

SESIÓN 8 DESCRIPCIONES DE UNA RELACIÓN

4.4 Sistemas mal condicionados

Estadística Aplicada a las ciencias Sociales Examen Febrero de 2008 segunda semana

La frecuencia relativa acumulada se suele expresar en forma de % y nos indica el % de datos que hay menores o iguales al valor xi correspondiente.

Métodos de Análisis Cuantitativo

CAPÍTULO I. Conceptos Básicos de Estadística

Trata de describir y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor.

DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS

SEMANA 01. CLASE 01. MARTES 04/10/16

Ejercicios Matemáticas I Pendientes 1 BCT

ANEXO B. Se define como Regresión al estudio de la fuerza, consistencia o grado de asociación de la

Medidas de tendencia central

Topografía 1. II semestre, José Francisco Valverde Calderón Sitio web:

Probabilidad y estadística

Número de personas que se forman en una fila en 1 hora Número de águilas que se obtienen al lanzar una moneda 5 veces.

Determinación del tamaño de una muestra (para dos o más muestras)

República Bolivariana de Venezuela Universidad Nacional Abierta Vicerrectorado Académico Área de Matemática

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

2 Conceptos básicos y planteamiento

Unidad 1: Las Ecuaciones Diferenciales y Sus Soluciones

SESION 15 DISTRIBUCIONES DE MUESTREO


Introducción a la Inferencia Estadística. Material Preparado por Olga Susana Filippini y Hugo Delfino

TEORÍA DE LA ESTIMACIÓN

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

LAS SUCESIONES Y SU TENDENCIA AL INFINITO

Trabajo Especial Estadística

ESTADISTICA UNIDIMENSIONAL

1. QUÉ ES LA ESTADÍSTICA?

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística,, McGraw Hill.

PROBLEMA DEL USO DE FERTILIZANTE EN GRANJAS DE PRODUCCIÓN DE TOMATES.

MEDIDAS DE TENDENCIA CENTRAL. _ xi

Estimación por intervalos

TEMA 6.- INTERVALOS DE CONFIANZA

MODELO DE RESPUESTAS. Lim n. Lim

Prueba Integral Lapso / Área de Matemática Fecha: MODELO DE RESPUESTA (Objetivos del 01 al 11)

EXAMEN DE MATEMÁTICAS APLICADAS I Temas 12 y 13

Universidad Nacional del Litoral Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingenierías RH-Amb-Ag TEORÍA

ORGANIZACIÓN DE LOS DATOS.

2.2. Estadísticos de tendencia central

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

IntroducciónalaInferencia Estadística

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL

Tema 1 Estadística descriptiva: Medidas de centralización y dispersión

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

Se utilizan los datos puntuales de altura de precipitación o intensidades máximas de lluvia registradas en una estación

Práctica 7 CONTRASTES DE HIPÓTESIS

R-SQUARED RESID. MEAN SQUARE (MSE) σˆ 2 ADJUSTED R-SQUARED STANDARD DEVIATION σ ˆ

Introducción. Ejemplos:

Estimación de Parámetros. Estimación de Parámetros

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

Métodos de la Minería de Datos

Curso de Estadística Aplicada a las Ciencias Sociales. Introducción. Introducción (2) Hasta ahora: estadística descriptiva (para describir datos)

EJERCICIO 1. , a partir de las frecuencias observadas, nij. , que se dan en la tabla del ejercicio.

Mg. Ing. Susana Vanlesberg Profesor Titular

ANDALUCÍA / JUNIO 04. LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / EXAMEN COMPLETO OPCIÓN A

ESTADÍSTICA. estadística. Recogida de datos. Las muestras de una población. Las variables estadísticas 03/06/2012

( ) ( ) ( ) ( ) ( ) ( ) ( ( )) ( )

X X. ... n. Medidas de tendencia Central Estadígrafos de tendencia central.

UNIDAD 3.- INFERENCIA ESTADÍSTICA I

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

Tema 1 Estadística descriptiva - II: Medidas de centralización y dispersión

Tema 4. Estimación de parámetros

UNIDAD 4 MODELOS PROBABILÍSTICOS

Curso de Estadística Aplicada a las Ciencias Sociales

Introducción a las medidas de dispersión.

Cálculo II (0252) TEMA 6 SERIES DE POTENCIAS. Semestre

Slide 1. Slide 2. Slide 3. # Categorias. Distribución de Frecuencia. Ejemplo: Taller de Reparaciones Hudson

TEMA 5.-ESTIMACIÓN PUNTUAL.- (16/17) 5.1. Introducción a la Inferencia Estadística Método de los momentos

INTRODUCCIÓN AL ANÁLISIS DE DATOS FEBRERO 2015 Código asignatura: EXAMEN TIPO TEST MODELO B DURACION: 2 HORAS. Soluciones

NOTAS SOBRE INFERENCIA ESTADÍSTICA BAYESIANA. José G. Ríos Alejandro. Abril del 2011.

MEDIDAS DE DISPERSIÓN.

Unidad N 2. Medidas de dispersión

2. Estimación de errores de medidas directas

Transcripción:

PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS Co el soporte de MATLAB para cálculos y gráficos estadísticos Luis Rodríguez Ojeda lrodrig@espol.edu.ec Istituto de Ciecias Matemáticas Escuela Superior Politécica del Litoral, ESPOL Guayaquil, Ecuador 007 MATLAB marca registrada de The Math Works, Ic

CONTENIDO Itroducció 7. Objetivo de la Estadística 8. Orige de la Estadística 8.3 Defiicioes básicas 8.4 Desarrollo de u proyecto estadístico 9 Estadística descriptiva. Recopilació de datos. Descripció de cojutos de datos.3 Tabla de distribució de frecuecia.4 Represetació gráfica de cojutos de datos 5.4. Histograma 5.4. Polígoo de frecuecia 6.4.3 Ojiva 6.4.4 Gráficos de frecuecia co formas especiales 7.5 Medidas de tedecia cetral 0.5. Media muestral 0.5. Moda muestral 0.5.3 Mediaa muestral 0.6 Medidas de dispersió.6. Rago.6. Variaza muestral.6.3 Desviació estádar muestral.7 Medidas de posició.7. Cuartiles.7.8 Deciles 3.7.9 Percetiles 3.8 Coeficiete de variació 3.9 Fórmulas para datos agrupados 6.0 Istrumetos gráficos adicioales 30.0. Diagrama de caja 30.0. Diagrama de putos 30.0.3 Diagrama de Pareto 30.0.4 Diagrama de tallo y hojas 3. Muestras bivariadas 34.. Correlació 35.. Coeficiete de correlació lieal 35..3 Matriz de variazas y covariazas 36..4 Matriz de correlació 36 3 Fudametos de la teoría de la probabilidad 40 3. Experimeto estadístico 40 3. Espacio muestral 40 3.3 Evetos 4 3.4 Sigma-álgebra 4 3.5 Técicas de coteo 4 3.6 Permutacioes 44 3.6. Permutacioes co todos los elemetos 45 3.6. Arreglo circular 45 3.6.3 Permutacioes co elemetos repetidos 45 3.7 Combiacioes 47 3.8 Probabilidad de evetos 50 3.8. Probabilidad de los elemetos de u eveto 5

3.9 Axiomas de probabilidad de evetos 5 3.0 Probabilidad codicioal 56 3. Evetos idepedietes 59 3. Regla multiplicativa de la probabilidad 60 3.3 Probabilidad total 64 3.4 Fórmula de Bayes 66 4 Variables aleatorias discretas 68 4. Distribució de probabilidad 69 4. Distribució de probabilidad acumulada 7 4.3 Valor esperado 74 4.3. Valor esperado de expresioes 75 4.3. Propiedades del valor esperado 76 4.3.3 Corolarios 76 4.4 Variaza 77 4.4. Fórmula altera para calcular la variaza 78 4.4. propiedades de la variaza 78 4.4.3 Corolarios 78 4.5 Mometos 80 4.5. Mometos alrededor del orige 80 4.5. Mometos alrededor de la media 80 4.5.3 Coeficietes 80 4.5.4 Valores refereciales 8 4.5.5 Equivalecia etre mometos 8 4.6 Fució geeradora de mometos 8 4.6. Obteció de mometos 8 4.6. Propiedad de uicidad 83 4.7 Teorema de Chebyshev 83 5 Distribucioes de probabilidad discretas 86 5. Distribució discreta uiforme 86 5.. Media y variaza 86 5. Distribució de Beroulli 87 5.3 Distribució biomial 87 5.3. Parámetros y variable 89 5.3. Distribució de probabilidad acumulada 89 5.3.3 Gráfico de la distribució biomial 90 5.3.4 Media y variaza 9 5.4 Distribució biomial egativa 94 5.4. Media y variaza 95 5.5 Distribució geométrica 95 5.5. Media y variaza 95 5.6 Distribució hipergeométrica 96 5.6. Media y variaza 97 5.7 Aproximació de la distribució hipergeométrica 98 co la distribució biomial 5.8 Distribució de Poisso 0 5.8. Media y variaza de la distribució de Poisso 0 5.9 Aproximació de la distribució biomial mediate la 0 distribució de Poisso 6 Variables aleatorias cotiuas 04 6. Fució de desidad de probabilidad 04 6. Fució de distribució 05 6.3 Media y variaza 08 6.3. Propiedades de la media y la variaza 08 3

6.3. Valor esperado de expresioes co ua variable 09 aleatoria cotiua 6.4 Mometos y fució geeradora de mometos 09 6.5 Teorema de Chebyshev 0 7 Distribucioes de probabilidad cotiuas 7. Distribució discreta uiforme 7.. Media y variaza 7.. Fució de distribució de probabilidad 7. Distribució ormal 4 7.. Distribució ormal estádar 5 7.. Estadarizació de la distribució ormal 7 7..3 Valores refereciales de la distribució ormal 9 7.3 Aproximació de la distribució biomial co 9 la distribució ormal estádar 7.4 Distribució gamma 3 7.4. Media y variaza 4 7.5 Distribució expoecial 5 7.5. Media y variaza 6 7.5. Ua aplicació de la distribució expoecial 7 7.6 Distribució de Weibull 30 7.6. Media y variaza 30 7.7 Razó de falla 3 7.8 Distribució beta 3 7.8. Media y variaza 3 7.9 Distribució de Erlag 33 7.9. Media y variaza 33 7.0 Distribució ji-cuadrado 33 7.0. Media y variaza 33 7. Distribució empírica acumulada 37 8 Distribucioes de probabilidad cojuta 39 8. Caso discreto bivariado 39 8.. Distribució de probabilidad cojuta 39 8.. Distribució de probabilidad acumulada 39 8..3 Distribucioes de probabilidad margial 40 8..4 Distribucioes de probabilidad codicioal 4 8..5 Variables aleatorias discretas idepedietes 43 8. Caso discreto trivariado 44 8.3 Caso cotiuo bivariado 47 8.3. Desidad de probabilidad cojuta 47 8.3. Distribució de probabilidad acumulada cojuta 47 8.3.3 Desidades de probabilidad margial 48 8.3.4 Desidades de probabilidad codicioal 49 8.3.5 Variables aleatorias cotiuas idepedietes 50 8.4 Caso cotiuo trivariado 5 8.5 Distribució multiomial 55 8.5. Media y variaza 55 8.6 Distribució hipergeométrica multivariada 56 8.7 Media para variables aleatorias cojutas bivariadas 59 8.7. Casos especiales 60 8.8 Covariaza para variables aleatorias cojutas bivariadas 60 8.8. Sigos de la covariaza 6 8.8. Matriz de variazas y covariazas 64 8.8.3 Coeficiete de correlació lieal 65 8.8.4 Matriz de correlació 66 4

8.9 Media y variaza para variables aleatorias cojutas trivariadas 66 8.0 Propiedades de las variables aleatorias cojutas 7 9 Distribucioes de muestreo 73 9. Distribució de muestreo de la media muestral 74 9.. Correcció de la variaza 75 9. Teorema del límite cetral 76 9.3 La distribució T 78 9.3. Gráfico de la distribució T 78 9.4 La distribució ji-cuadrado 80 9.4. Gráfico de la distribució ji-cuadrado 80 9.5 Distribució F 8 9.5. Gráfico de la distribució F 8 9.6 Estadísticas de orde 84 9.6. Desidad de probabilidad de las estadísticas de orde 84 0 Estadística iferecial 88 0. Iferecia estadística 88 0. Métodos de iferecia estadística 88 0.. Estimació putual 88 0.. Estimació por itervalo 89 0..3 Prueba de hipótesis 89 0.3 Propiedades de los estimadores 89 0.4 Iferecias relacioadas co la media 97 0.4. Estimació putual (muestras grades) 97 0.4. Tamaño de la muestra (muestras grades) 99 0.4.3 Estimació por itervalo (muestras grades) 00 0.4.4 Itervalos de cofiaza uilaterales (muestras grades) 0 0.4.5 Estimació putual (muestras pequeñas) 03 0.4.6 Estimació por itervalo (muestras pequeñas) 05 0.5 Prueba de hipótesis 08 0.5. Prueba de hipótesis relacioada co la media 09 (muestras grades) 0.5. Prueba de hipótesis relacioada co la media 3 (muestras pequeñas) 0.5.3 Valor-p de ua prueba de hipótesis 5 0.5.4 Cálculo del error tipo I 6 0.5.5 Cálculo del error tipo II 7 0.5.6 Curva característica de operació 8 0.5.7 Potecia de la prueba 8 0.6 Iferecias relacioadas co la proporció (muestras grades) 7 0.6. Estimació putual 7 0.6. Estimació por itervalo 8 0.6.3 Prueba de hipótesis 9 0.7 Iferecias relacioadas co la variaza 3 0.7. Itervalo de cofiaza 3 0.7. Prueba de hipótesis 33 0.8 Iferecias relacioadas co la diferecia de dos medias 36 0.8. Estimació putual e itervalo de cofiaza 36 (muestras grades) 0.8. Prueba de hipótesis (muestras grades) 38 0.8.3 Itervalo de cofiaza (muestras pequeñas) 40 0.8.4 Prueba de hipótesis (muestras pequeñas) 4 0.7 Iferecias para la diferecia etre dos proporcioes 46 (muestras grades) 0.7. Itervalo de cofiaza 47 5

0.7. Prueba de hipótesis 47 0.8 Iferecias para dos variazas 49 0.8. Itervalo de cofiaza 49 0.8. Prueba de hipótesis 50 0.9 Prueba para la diferecia de medias co muestras pareadas 5 0.9. Prueba de hipótesis 5 0.0 Tablas de cotigecia 55 0.0. Prueba de hipótesis 56 0. Pruebas de bodad de ajuste 59 0.. Prueba ji-cuadrado 59 0.. Prueba de Kolmogorov-Smirov 63 0. Aálisis de variaza 67 0.. Tabla ANOVA 68 0.. Prueba de hipótesis 68 Regresió lieal simple 7. Recta de míimos cuadrados 73. Coeficiete de correlació 74.3 Aálisis del modelo de regresió lieal simple 75.4 Aálisis de variaza 76.5 Coeficiete de determiació 77.6 Tabla ANOVA 78.7 Prueba de depedecia lieal del modelo 78.8 Estimació de la variaza 79.9 Iferecias co el modelo de regresió lieal 79.0 Iferecias acerca de la pediete de la recta 80.0. Itervalo de cofiaza 80.0. Prueba de hipótesis 80. Iferecias para la itercepció de la recta 8.. Itervalo de cofiaza 8.. Prueba de hipótesis 8. Prueba de la ormalidad del error 8 Regresió lieal múltiple 87. Método de míimos cuadrados 88. Método de míimos cuadrados para k = 88.3 Regresió lieal múltiple e otació matricial 89.4 Aálisis de variaza 9.5 Coeficiete de determiació 93.6 Tabla ANOVA 93.7 Prueba de depedecia lieal del modelo 94.8 Estimació de la variaza 94.9 Matriz de variazas y covariazas 95.0 Iferecias co el modelo de regresió lieal 96.0. Estadísticos para estimació de parámetros 96.0. Itervalos de cofiaza 96.0.3 Prueba de hipótesis 97. Prueba de la ormalidad del error 98 Aexos Alfabeto griego 30 Tabla de la distribució ormal estádar 303 3 Tabla de la distribució T 305 4 Tabla de la distribució ji-cuadrado 306 5 Tabla de la distribució F 307 6 Tabla para la prueba de Kolmogorov-Smirov 308 7 Descripció de los utilitarios DISTTOOL y RANDTOOL 309 6

PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS Co el soporte de MATLAB para cálculos y gráficos estadísticos INTRODUCCIÓN Esta obra es ua cotribució dedicada a los estudiates que toma u primer curso de Probabilidad y Estadística a ivel uiversitario e las carreras de igeiería. El pre-requisito es el coocimieto del cálculo diferecial e itegral y algua experiecia previa co el programa MATLAB para aprovechar el poder de este istrumeto computacioal como soporte para los cálculos y gráficos estadísticos. El coteido se basa e la experiecia desarrollada e varios años impartiedo el curso de Estadística para estudiates de igeiería de la ESPOL, y especialmete e el curso e modalidad a distacia que ofrece el Istituto de Ciecias Matemáticas como ua opció para los estudiates que por dificultades e el horario de clases o puede tomar los cursos e el horario regular. Esta obra cotiee todo el material del curso de Estadística para las carreras de igeiería e la ESPOL co muchos ejemplos desarrollados basados e temas propuestos e exámees recietes, si embargo solo pretede ser el segudo texto para esta materia pues el primero está por cocluir bajo la resposabilidad del MSc. Gaudecio Zurita profesor pricipal de esta cátedra. Esta obra es u aporte para que los estudiates aprecie el uso de u istrumeto computacioal modero y flexible que e forma itegradora puede ser usado como soporte comú para todos los cursos básicos de matemáticas, icluyedo Álgebra Lieal, Cálculo Diferecial e Itegral, Ecuacioes Difereciales, Aálisis Numérico, y ahora tambié Estadística. Para el maejo estadístico MATLAB dispoe de u amplio repertorio de fucioes especiales. Todos los cálculos e esta obra, icluyedo el maejo matemático simbólico, fuero realizados co estas fucioes, asimismo los gráficos estadísticos. Si embargo por el alcace del curso o se utilizaro las fucioes más importates de este paquete y que e cursos especializados de estadística se debería aprovechar. E este setido la obra es ua itroducció al uso de este extraordiario istrumeto computacioal. MATLAB tiee u sistema de ayuda y documetació exteso. Al fial de esta obra se icluye la descripció de dos istrumetos computacioales iteractivos para experimetar co modelos de probabilidad y co la geeració de muestras aleatorias. El segudo objetivo pricipal de esta obra es cotribuir al desarrollo de textos virtuales e la ESPOL, de tal maera que pueda ser usados frete a u computador pero que tambié pueda imprimirse totalmete o e partes, reduciedo costos y el uso de papel. El texto ha sido compilado e formato pdf. El tamaño del texto e patalla es cotrolable, cotiee dos ídices diámicos para simplificar la avegació y facilidades para agregar y borrar digitalmete resaltadores de texto, cometarios, otas, elaces, revisioes, búsqueda por coteido, etc. Fialmete, debo agradecer a la ESPOL por facilitar a sus profesores desarrollar actividades académicas, y mecioar que esta obra tiee derechos de autor pero es de libre distribució. Luis Rodríguez Ojeda Istituto de Ciecias Matemáticas Escuela Superior Politécica del Litoral, ESPOL Guayaquil, Ecuador 7

. OBJETIVO DE LA ESTADÍSTICA El objetivo fudametal de la estadística es aalizar datos y trasformarlos e iformació útil para tomar decisioes.. ORIGEN DE LA ESTADÍSTICA El orige de la Estadística se remota a épocas e las que los goberates requería técicas para cotrolar a sus propiedades y a las persoas. Posteriormete, el desarrollo de los juegos de azar propició el estudio de métodos matemáticos para su aálisis los cuales co el tiempo diero orige a la Teoría de la Probabilidad que hoy es el susteto formal de la Estadística. El adveimieto de la iformática ha costituido el complemeto adecuado para realizar estudios estadísticos mediate programas especializados que facilita eormemete el tratamieto y trasformació de los datos e iformació útil. La Estadística ha alcazado u ivel de desarrollo muy alto y costituye actualmete el soporte ecesario para todas las ciecias y para la ivestigació cietífica, siedo el apoyo para tomar decisioes e u etoro de icertidumbre. Es importate resaltar que las técicas estadísticas debe usarse apropiadamete para que la iformació obteida sea válida..3 DEFINICIONES PRELIMINARES ESTADÍSTICA Ciecia iductiva que permite iferir características cualitativas y cuatitativas de u cojuto mediate los datos coteidos e u subcojuto del mismo. POBLACIÓN Cojuto total de idividuos u objetos co algua característica que es de iterés estudiar. MUESTRA Subcojuto de la població cuya iformació es usada para estudiar a la població VARIABLE Algua característica observable de los elemetos de ua població y que puede tomar diferetes valores. DATO Es cada valor icluido e la muestra. Se lo puede obteer mediate observació o medició PARÁMETRO Es algua característica de la població e estudio y que es de iterés coocer. EXPERIMENTO ESTADÍSTICO Es u proceso que se diseña y realiza para obteer observacioes. VARIABLE ALEATORIA Es ua variable cuyo valor es el resultado de u experimeto estadístico 8

ESPACIO MUESTRAL Cojuto de todos los posibles resultados que se pudiese obteer de u experimeto estadístico MODELO Descripció simbólica o física de ua situació o sistema que se desea estudiar MODELO DETERMINÍSTICO Represetació exacta de u sistema. Permite obteer respuestas precisas Ejemplo: ua ecuació matemática de la cual se obtiee u resultado para alguos valores asigados a las variables. MODELO PROBABILISTICO Represetació de u sistema que icluye compoetes aleatorios. Las respuestas obteidas se expresa e térmios de probabilidad. Ejemplo: u modelo para predecir el comportamieto de las colas que forma las persoas frete a ua estació de servicio. ESTADÍSTICA DESCRIPTIVA Técicas para recopilar, orgaizar, procesar y presetar datos obteidos e muestras. ESTADÍSTICA INFERENCIAL Técicas para obteció de resultados basados e la iformació coteida e muestras. INFERENCIA ESTADÍSTICA Es la extesió a la població de los resultados obteidos e ua muestra.4 DESARROLLO DE UN PROYECTO ESTADÍSTICO Problema Defiició Estadística Descriptiva Estadística Iferecial Resultados E forma resumida, se describe los pasos para resolver u problema usado las técicas estadísticas PROBLEMA Es ua situació plateada para la cual se debe buscar ua solució. DEFINICIÓN Para el problema propuesto debe establecerse los objetivos y el alcace del estudio a ser realizado cosiderado los recursos dispoibles y defiiedo actividades, metas y plazos. Se debe especificar la població a la cual está dirigido el estudio e idetificar los parámetros de iterés así como las variables que iterviee. Se debe formular hipótesis y decidir el ivel de precisió que se pretede obteer e los resultados. Debe elegirse el tamaño de la muestra y las técicas estadísticas y computacioales que será utilizadas. 9

ESTADÍSTICA DESCRIPTIVA Es el uso de las técicas para obteer y aalizar datos, icluyedo el diseño de cuestioarios e caso de ser ecesarios. Se debe usar u pla para la obteció de los datos. ESTADÍSTICA INFERENCIAL So las técicas estadísticas utilizadas para realizar iferecias estadísticas que permite validar las hipótesis propuestas. RESULTADOS Los resultados obteidos debe usarse para producir iformació que sea útil para la toma de decisioes. NOTA IMPORTANTE La metodología de diseño e otros ámbitos de la ciecia e igeiería usa la retroalimetació para corregir las especificacioes co las que se ejecuta las actividades, hasta que los resultados obteidos cocuerde co las especificacioes y requerimietos iiciales. Si embargo, el uso de retroalimetació e la resolució de u problema estadístico podría iterpretarse como u artificio para modificar los datos o la aplicació de las técicas estadísticas para que los resultados obteidos cocuerde co los requerimietos e hipótesis formuladas iicialmete. E este setido, usar retroalimetació o sería u procedimieto ético. PREGUNTAS Coteste e o más de dos líeas de texto cada preguta ) E que situacioes las técicas estadísticas costituye u soporte importate? ) Cual es el aporte de la iformática para el uso de las técicas estadísticas? 3) Por que hay que teer precaució e el uso de los resultados estadísticos? 4) Cual es la diferecia etre població y muestra? 5) Cual es la característica pricipal de u modelo probabilístico? 6) Cual es el objetivo de realizar ua iferecia estadística? 7) Está de acuerdo co el esquema propuesto para realizar u proyecto estadístico? 8) Está de acuerdo co la iterpretació dada para la retroalimetació e la resolució de u problema estadístico? 0

ESTADÍSTICA DESCRIPTIVA Es el estudio de las técicas para recopilar, orgaizar y presetar de datos obteidos e u estudio estadístico para facilitar su aálisis y aplicació.. RECOPILACIÓN DE DATOS Fuetes de datos ) Ivestigació e registros admiistrativos: INEC, Baco Cetral, Cámaras de la Producció, Uiversidades, etc. para obteer ídices de empleo, ídice de precios, datos de salud, datos de eficiecia, etc. ) Obteció de datos mediate ecuestas de ivestigació Ej. Estudios de mercado. Estudios de preferecia electoral, etc 3) Realizació de experimetos estadísticos Criterios para diseñar ua ecuesta de ivestigació ) Defiir el objetivo del estudio ) Defiir la població de iterés 3) Determiar el tamaño de la muestra 4) Seleccioar el tipo de muestreo 5) Elegir temas geerales 6) Elaborar el formulario para la ecuesta: Pregutas cortas, claras y de opcioes. 7) Realizar pruebas 8) Realizar la ecuesta Tipos de datos Los resultados que se obtiee puede ser ) Datos cualitativos: correspode a respuestas categóricas Ej. El estado civil de ua persoa ) Datos cuatitativos: correspode a respuestas uméricas Ej. La edad e años. Los datos cuatitativos puede ser ) Discretos: Se obtiee mediate coteos ) Cotiuos: Se obtiee mediate medicioes. DESCRIPCIÓN DE CONJUNTOS DE DATOS Los datos obteidos se los puede represetar de diferetes formas: ) Tabularmete. ) Gráficamete 3) Mediate úmeros Si la muestra cotiee pocos datos, se los puede represetar directamete, pero si el úmero de datos es grade coviee agruparlos para simplificar su aálisis Ig. Luis Rodríguez Ojeda, MSc

.3 TABLA DE DISTRIBUCIÓN DE FRECUENCIA Es u dispositivo para agrupació de datos y facilitar su iterpretació. Recomedacioes para costruir la Tabla de Frecuecia ) Idetificar la uidad de medida de los datos ) Obteer el rago de los datos, R R = mayor valor meor valor 3) Seleccioar el umero de clases (o itervalos) k, para agrupar los datos. Sugerecia para elegir k Sea : úmero de datos k: Número de clases k Meos de 50 5 a 7 Etre 50 y 00 6 a 0 Etre 00 y 50 7 a Mas de 50 0 a 0 4) Obteer la amplitud de las clases, Amplitud = R/k Se puede redefiir la amplitud, el úmero de clases y los extremos de cada clase de tal maera que las clases tega la misma amplitud, icluya a todos los datos y los valores e los extremos de las clases sea simples 5) Realizar el coteo de datos para obteer la frecuecia e cada clase Notació : úmero de datos k: úmero de clases f i : frecuecia de la clase i, i=,, 3,, k f i /: frecuecia relativa de la clase i F i : frecuecia acumulada de la clase i F i = f +f +f 3 + +f i F i /: frecuecia acumulada relativa de la clase i m i : marca de la clase i (es el cetro de la clase i) Los resultados se los orgaiza e u cuadro deomiado Tabla de Frecuecia Ejemplo.- Los siguietes 40 datos correspode a ua muestra del tiempo que se utilizó para ateder a las persoas e ua estació de servicio: 3. 4.9.8 3.6 4.5 3.5.8 4..9. 3.7 4..7 4. 3.5 3.7 3.8. 4.4.9 5..8.5 6..5 3.6 5.6 4.8 3.6 6. 5. 3.9 4.3 5.7 4.7 4.6 5. 4.9 4. 3. Obteer la tabla de frecuecia Ig. Luis Rodríguez Ojeda, MSc

Solució ) Precisió: u decimal ) Rago: R = mayor valor meor valor = 6..8 = 4.4 3) Número de clases: k=6 4) Amplitud: R/k = 0.7333.. Por simplicidad se redefie la amplitud como y se usa úmeros eteros para los extremos de las clases. 5) Coteo de los datos (puede hacerse e u solo recorrido de los datos co la ayuda de cuadritos para coteo (de 5 e 5) Clase Itervalo Frecuecia [, ) [, 3) 9 3 [3, 4) 4 [4, 5) 5 [5, 6) 5 6 [6, 7) = 40 Tabla de Frecuecia Clase i Itervalo [a, b) Marca de clase m Frecuecia f Frecuecia relativa f/ Frecuecia acumulada F Frecuecia acumulada relativa F/ [, ).5 0.05 0.05 [, 3).5 9 0.5 0 0.50 3 [3, 4) 3.5 0.75 0.55 4 [4, 5) 4.5 0.300 33 0.85 5 [5, 6) 5.5 5 0.5 38 0.950 6 [6, 7) 6.5 0.050 40.000 EJERCICIOS ) Coteste las siguietes pregutas e o más de dos líeas de texto a) E las fuetes de recopilació de datos o se ha mecioado el uso de iteret. Cuales so las vetajas y peligros de su uso? b) Al diseñar el formulario de ua ecuesta de ivestigació. Por que se prefiere pregutas co opcioes para elegir? c) El úmero telefóico de ua persoa. Es u dato cualitativo o cuatitativo? d) El diero es u dato cuatitativo, Discreto o cotiuo? ) Co los resultados obteidos y descritos e la tabla de frecuecia del ejemplo desarrollado e esta secció, coteste las siguietes pregutas a) Cuátas persoas requiriero o más de 4 miutos para ser atedidas? b) Cuátas persoas requiriero etre y 5 miutos? c) Cuátas persoas requiriero al meos 4 miutos? d) Cuál es la duració que ocurre co mayor frecuecia? 3) Costruya la tabla de frecuecia para ua muestra aleatoria co datos del costo por cosumo de electricidad e ua zoa residecial de cierta ciudad. 96 7 0 78 47 0 53 97 7 8 57 85 90 6 7 48 3 30 65 4 49 06 75 3 8 44 68 09 67 95 63 50 54 30 43 87 66 39 49 08 9 83 5 4 35 9 37 9 58 3 Ig. Luis Rodríguez Ojeda, MSc

MATLAB Costrucció de la tabla de frecuecias Vector co los datos >> x=[3. 4.9.8 3.6 4.5 3.5.8 4..9. 3.7 4..7 4. 3.5 3.7 3.8. 4.4.9... 5..8.5 6..5 3.6 5.6 4.8 3.6 6. 5. 3.9 4.3 5.7 4.7 4.6 5. 4.9 4. 3.]; >> m=[.5.5 3.5 4.5 5.5 6.5]; Vector co las marcas de clase >> f=hist(x,m) Obteció de las frecuecias e las marcas de clase f = 9 5 >> fr=f/40 Frecuecias relativas fr = 0.050 0.50 0.750 0.3000 0.50 0.0500 >> F=cumsum(f) Frecuecias acumuladas F = 0 33 38 40 >> Fr=F/40 Frecuecias acumuladas relativas Fr = 0.050 0.500 0.550 0.850 0.9500.0000 4 Ig. Luis Rodríguez Ojeda, MSc

.4 REPRESENTACIÓN GRÁFICA DE CONJUNTOS DE DATOS E esta secció revisamos alguos dispositivos frecuetemete usados para resaltar visualmete las características de grupos de datos..4. HISTOGRAMA Es la maera más comú de represetar gráficamete la distribució de frecuecia de los datos. Se lo costruye dibujado rectágulos cuya base correspode a cada itervalo de clase, y su altura segú el valor de la frecuecia. Puede ser la frecuecia absoluta o la frecuecia relativa. Ejemplo. Costruya el histograma para el ejemplo de la uidad aterior. Use los valores de la frecuecia absoluta : Tabla de Frecuecia Clase Itervalo Marca de clase Frecuecia Frecuecia relativa Frecuecia acumulada Frecuecia relativa acumulada [, ).5 0.05 0.05 [, 3).5 9 0.5 0 0.50 3 [3, 4) 3.5 0.75 0.55 4 [4, 5) 4.5 0.300 33 0.85 5 [5, 6) 5.5 5 0.5 38 0.950 6 [6, 7) 6.5 0.050 40.000 Histograma El histograma permite dar ua primera mirada al tipo de distribució de los datos: ) Si las alturas de las barras so similares se dice que tiee distribució tipo uiforme ) Si las alturas so mayores e la zoa cetral se dice que tiee forma tipo campaa y puede ser simétrica o asimétrica, co sesgo hacia el lado positivo o al lado egativo 3) Si hay barras muy alejadas del grupo, se dice que so datos atípicos. Probablemete estos datos se debe a errores de medició y se los puede descartar pues o perteece al grupo que se desea caracterizar. 5

.4. POLÍGONO DE FRECUENCIA Es ua maera de represetar el perfil de la distribució de los datos. Se obtiee uiedo mediate segmetos de recta los putos (marca de clase, frecuecia) Para cerrar el polígoo se puede agregar u puto a cada lado co frecuecia 0. Polígoo de frecuecia para el ejemplo dado:.4.3 OJIVA Este gráfico se usa para represetar la frecuecia acumulada, absoluta o relativa. Se lo obtiee uiedo segmetos de recta que se extiede etre los extremos de las clases y usado los valores de la frecuecia acumulada. Ojiva para el ejemplo dado: La ojiva permite respoder pregutas tipo cuatos datos so meores que Ejemplo. Cuatos datos tiee u valor meor a 4.5? Respuesta: aproximadamete 7 datos 6

.4.4 GRÁFICOS DE FRECUENCIA CON FORMAS ESPECIALES Los gráficos puede tomar otros aspectos usado barras, colores, efectos tridimesioales, sombreado, etc. o usado ua represetació tipo pastel Diagrama de barras Diagrama de barras co efecto tridimesioal Diagrama tipo pastel 7

EJERCICIOS Se tiee ua muestra aleatoria co datos del costo por cosumo de electricidad e ua zoa residecial de cierta ciudad. 96 7 0 78 47 0 53 97 7 8 57 85 90 6 7 48 3 30 65 4 49 06 75 3 8 44 68 09 67 95 63 50 54 30 43 87 66 39 49 08 9 83 5 4 35 9 37 9 58 Use los resultados de la tabla de frecuecia y dibuje a mao los siguietes gráficos. a) Histograma co las frecuecias relativas b) Polígoo de Frecuecias c) Ojiva MATLAB Obteció de gráficos. Los dibujos obteidos se muestra e las págias ateriores Vector co los datos >> x = [3. 4.9.8 3.6 4.5 3.5.8 4..9. 3.7 4..7 4. 3.5 3.7 3.8. 4.4.9... 5..8.5 6..5 3.6 5.6 4.8 3.6 6. 5. 3.9 4.3 5.7 4.7 4.6 5. 4.9 4. 3.]; Vector co las marcas de clase >> m=[.5.5 3.5 4.5 5.5 6.5]; Graficació del histograma >> hist(x, m); >> grid o Cuadrículas Graficació del polígoo de frecuecias >> mp=[0.5 m 7.5]; Se agrega u puto co frecuecia cero a los lados >> f = hist(x, m); Obteció de las frecuecias e la m marcas de clase >> fp=[0 f 0]; >> clf >> plot(mp,fp,'o') Dibujo de los putos e u uevo gráfico >> hold o Mateer el gráfico aterior >> plot(mp,fp) Trazado de las líeas del polígoo >> grid o Cuadrículas Graficació de la ojiva >> c=[ 3 4 5 6 7]; Vector co los extremos de las seis clases >> F=cumsum(f); Vector co las frecuecias acumuladas >> Fo=[0 F]; Se agrega u puto a la izquierda co frecuecia cero >> clf >> plot(c,fo,'o') Dibujo de los putos e u uevo gráfico 8

>> hold o Para superpoer el siguiete gráfico >> plot(c, Fo) Trazado de las líeas de la ojiva >> grid o Gráfico de diagrama de barras co color verde >> clf >> bar(f, g ) Gráfico de diagrama de barras, horizotal co efecto tridimesioal, color rojo >> clf >> bar3h(f, r ) Gráfico tipo pastel >> clf >> f=hist(x,m); >> pie(f) 9

MEDIDAS DESCRIPTIVAS.5 MEDIDAS DE TENDENCIA CENTRAL So úmeros que defie cual es el valor alrededor del que se cocetra los datos u observacioes. Se idica a cotiuació los más utilizados..5. MEDIA MUESTRAL Si X, X,..., X represeta a los datos, etoces se tiee: Defiició: Media muestral X x + x +... + x = = i = x i Ejemplo. Si los datos so, 6,, 8,, 4, 7, 5 Etoces X = (+6++8++4+7+5)/8 = 6.75 La media muestral es simple y de uso comú. Represeta el promedio aritmético de los datos. Si embargo, es sesible a errores e los datos. U dato erróeo puede cambiar sigificativamete el valor de la media muestral. Para evitar este problema, se puede igorar u pequeño porcetaje de los datos más grades y más pequeños de la muestra ates de calcular la media muestral Ejemplo. Si los datos so, 6,, 8,, 4, 7, 5, 90 Etoces X = (+6++8++4+7+5 + 90)/9 = 6 U sólo dato cambió sigificativamete el valor de la media co respecto al ejemplo aterior.5. MODA MUESTRAL Es el valor que ocurre co mayor frecuecia e ua muestra. Puede ser que o exista la moda y tambié es posible que exista más de ua moda. Defiició: Moda muestral Moda muestral: Mo es el valor que más veces se repite Ejemplo. Si los datos so, 6,, 8,, 4, 7, 5 Etoces Mo =.5.3 MEDIANA MUESTRAL Es el valor que está e el cetro de los datos ordeados Sea X, X,..., X los datos X (), X (),..., X () los datos ordeados e forma creciete El subídice etre parétesis sigifica que el dato X (i) está e la posició i e el grupo ordeado. 0

Defiició: Mediaa muestral x~ = X +, si es impar ( ) (X + X ),si es par ( ) ( + ) Ejemplo: Si los datos so, 6,, 8,, 4, 7, 5 Los datos ordeados:, 4, 5, 6, 7, 8,,, etoces x~ = (6 + 7) = 6.5 Las medidas de tedecia cetral o so suficietes para describir de maera precisa el comportamieto de los datos de ua muestra. Se ecesita otras medidas..6 MEDIDAS DE DISPERSIÓN So úmeros que provee iformació adicioal acerca del comportamieto de los datos, describiedo uméricamete su dispersió..6. RANGO Es la diferecia etre el mayor valor y el meor valor de los datos de la muestra. Defiició: Rago R = X () X (), e dode x (i) es el dato ordeado ubicado e la posició i Ejemplo. Si los datos so, 6,, 8,, 4, 7, 5 Etoces el rago es: R = - = 9.6. VARIANZA MUESTRAL Esta medida se basa e la cuatificació de las distacias de los datos co respecto al valor de la media Defiició: Variaza muestral S S = i= (X X) i X i ( X i) i= i= = ( ) Fórmula para calcular la variaza Fórmula altera para calcular la variaza El motivo que e el deomiador se escriba e lugar de (que parece atural), se justifica formalmete e el estudio de la estadística iferecial. Ambas fórmulas so equivaletes y se lo puede demostrar mediate desarrollo de las sumatorias

Ejemplo. Si los datos so, 6,, 8,, 4, 7, 5 y se tiee que X = 6.75 Etoces la variaza es S ( 6.75) + (6 6.75) +... + (5 6.75) = 7 = 0.43.6.3 DESVIACIÓN ESTÁNDAR MUESTRAL Es la raíz cuadrada positiva de la variacia. La desviació estádar muestral o desviació típica o error muestral, está expresada e las misma uidad de medició que los datos de la muestra Defiició: Desviació estádar muestral S =+ S Ejemplo. Calcule la desviació estádar para el ejemplo aterior. Si la variaza es S = 0.43, etoces, la desviació estádar es S = S = 0.43 = 3.96.7 MEDIDAS DE POSICIÓN So úmeros que divide al grupo de datos ordeados, e grupos de aproximadamete igual catidad de datos co el propósito de resaltar su ubicació..7. CUARTILES So úmeros que divide al grupo de datos e grupos de aproximadamete el 5% de los datos Primer Cuartil (Q ) A la izquierda de Q está icluidos 5% de los datos (aproximadamete) A la derecha de Q está el 75% de los datos (aproximadamete) Segudo Cuartil (Q ) Igual que la mediaa divide al grupo de datos e dos partes, cada ua co el 50% de los datos (aproximadamete) Tercer Cuartil (Q 3 ) A la izquierda de Q 3 está icluidos 75% de los datos (aproximadamete) A la derecha de Q 3 está el 5% de los datos (aproximadamete) Ejemplo. Supoer que ua muestra cotiee 40 datos ordeados: X (), X (),..., X (40). Calcular Q, Q, Q 3 Q : 5% de 40 = 0 Por lo tato: Q = (X (0) + X () )/ Q : 50% de 40 = 0 es igual a la mediaa Q = (X (0) + X () )/ Q 3 : 75% de 40 = 30 Q 3 = (X (30) + X (3) )/

.7. DECILES So úmeros que divide al grupo de datos e grupos de aproximadamete 0% de los datos Primer Decil (D ) A la izquierda de D está icluidos 0% de los datos (aproximadamete) A la derecha de D está el 90% de los datos (aproximadamete) Segudo Decil (D ) A la izquierda de D está icluidos 0% de los datos (aproximadamete) A la derecha de D está el 80% de los datos (aproximadamete) Etc. Ejemplo. Supoer que ua muestra cotiee 40 datos ordeados: X (), X (),..., X (40). Calcular D D : 0% de 40 = 4 Por lo tato: D = (X (4) + X (5) )/.7.3 PERCENTILES (O PORCENTILES) So úmeros que divide al grupo de datos e grupos de aproximadamete % de los datos Primer Percetil (P ) A la izquierda de P está icluidos % de los datos (aproximadamete) A la derecha de P está el 99% de los datos (aproximadamete) Segudo Percetil (P ) A la izquierda de P está icluidos % de los datos (aproximadamete) A la derecha de P está el 98% de los datos (aproximadamete) Etc. Ejemplo. Supoer que ua muestra cotiee 400 datos ordeados: X (), X (),..., X (400). Calcular P, P 8 P : % de 400 = 4 Por lo tato: P = (X (4) + X (5) )/ (Percetil ) P 8 : 8% de 400 = 38 (Percetil 8) P 8 = (X (38) + X (39) )/.8 COEFICIENTE DE VARIACIÓN Es u úmero que se usa para cara comparar la variabilidad de los datos de diferetes grupos. Es ua medida adimesioal defiida de la siguiete maera Defiició: Coeficiete de variació V = S X Ejemplo: Para u grupo de datos X = 0, S = 4, etoces v = 4/0 = 0. = 0% Para u segudo grupo X = 48, S = 6, etoces v = 6/48 = 0.5 =.5% Se cocluye que el primer grupo tiee mayor variabilidad (respecto a su media) 3

EJERCICIOS xi i ) Demuestre mediate propiedades de las sumatoria que (xi x) x = = i i= i= Esto demuestra la equivalecia etre las dos fórmulas defiidas para calcular la variaza. ) Se tiee ua muestra aleatoria co datos del costo por cosumo de electricidad e ua zoa residecial de cierta ciudad. Calcule X, 96 7 0 78 47 57 85 90 6 7 4 49 06 75 3 95 63 50 54 30 08 9 83 5 4 x~, S, S, Q, Q 3, R, D, D 5 3) Se tiee los siguietes datos de la catidad de barriles por día que produce 45 pozos petroleros e u campo: catidad míima: 5; catidad máxima 47; primer cuartil 87; mediaa 63; tercer cuartil 04. Grafique la Ojiva co la mayor precisió que le sea posible. 4) Respecto al problema aterior. Ua compañía está iteresada e comprar solamete los pozos que produzca mas de 00 barriles por día y pagará $50000 por cada uo. Cuato le costaría la iversió aproximadamete? MATLAB Fórmulas para estadística descriptiva >> x=[ 6 8 4 7 5]; Vector co los datos de ua muestra >> xb=mea(x) Media aritmética xb = 6.7500 >> m=media(x) Mediaa m = 6.5000 >> x=0::00; Vector co los primeros 00 úmeros aturales >> xb=mea(x) Media aritmética xb = 50 >> x=[x 000]; Vector co u valor grade agregado al fial >> xb=mea(x) Media aritmética xb = 59.337 >> xb=trimmea(x,0) Media aritmética omitiedo 5% de datos e cada lado xb = 50.5000 >> x=[ 6 8 4 7 5]; Vector co los datos de ua muestra >> r=rage(x) Rago de los datos r = 9 4

>> a=mi(x) El meor valor a = >> b=max(x) El mayor valor b = >> s=var(x) Variaza muestral s = 0.43 >> s=std(x) Desviació estádar muestral s = 3.960 >> rq=iqr(x) Rago itercuartil rq = 5 >> q=prctile(x,5) Primer cuartil (percetil 5) q = 4.5000 >> q3=prctile(x,75) Tercer cuartil (percetil 75) q3 = 9.5000 >> y=sort(x) Datos ordeados e forma creciete y = 4 5 6 7 8 >> x=rad(,400); Vector co ua fila de 400 úmeros aleatorios >> d7=prctile(x,70) Decil 7 (percetil 70) d7 = 0.703 >> p8=prctile(x,8) Percetil 8 p8 = 0.8335 5

.9 FÓRMULAS PARA DATOS AGRUPADOS Si los datos de ua muestra está dispoibles e ua tabla de frecuecia, se puede usar fórmulas para calcular las medidas estadísticas descriptivas, e forma aproximada Supoer que se dispoe de la tabla de frecuecia co valores que se idica e forma simbólica: Clase Itervalo Marca f F f/ F/ [L, U ] m f F f / F / [L, U ] m f F f / F /..................... k [L k, U k ] m k f k F k f k / F k / Defiició: Media de datos agrupados k X = mf i i i = úmero de datos k úmero de clases m i marca de la clase i (es el cetro del itervalo de la clase) frecuecia de la clase i f i Defiició: Variaza de datos agrupados k m i f i S f(m X) k = i i i = úmero de datos úmero de clases marca de la clase i (es el cetro del itervalo de la clase) frecuecia de la clase i Defiició: Mediaa para datos agrupados F i X = L i + A fi i itervalo e el que se ecuetra la mediaa L i Límite iferior del itervalo i Número de observacioes F i- Frecuecia acumulada del itervalo aterior al itervalo i f i frecuecia del itervalo i A Amplitud de la clase Defiició: Moda para datos agrupados Δf a Mo = Li + A Δ fa + Δ fs i itervalo e el que se ecuetra la moda L i Límite iferior del itervalo i Δf a Exceso de la frecuecia sobre la clase iferior imediata Δf s Exceso de la frecuecia sobre la clase superior imediata A Amplitud de la clase Mo o es u dato real pero se supoe que sería el dato más frecuete 6

Defiició: Medidas de posició para datos agrupados i L i F i- f i A j( ) Fi Q 4 j = Li + A, j =,, 3 cuartiles f i itervalo e el que se ecuetra el primer cuartil Límite iferior del itervalo i Número de observacioes Frecuecia acumulada del itervalo aterior al itervalo i frecuecia del itervalo i Amplitud de la clase Ejemplo: La tabla de frecuecia siguiete cotiee los datos del úmero de artículos vedidos por u almacé e 50 días, agrupados e 6 clases Clase Itervalo Marca f F f/ F/ [0, 0) 5 0.04 0.04 [0, 30) 5 0 0. 0.4 3 [30, 40) 35 4 0.4 0.48 4 [40, 50) 45 4 38 0.8 0.76 5 [50, 60) 55 9 47 0.8 0.94 6 [60, 70) 65 3 50 0.06 Calcule la media, variaza, mediaa, moda y los cuartiles Media k X = mf i i= [(5)() + (5)(0) +... + (65)(3)] = 40.4 = 50 i Variaza S k = f(m i i X) i = = [(5 40.4) + 0(5 40.4) +... + 3(65 40.4) ] = 64. 49 Mediaa Para usar la fórmula debe localizarse la clase e la cual está la mediaa Siedo = 50, la mediaa es el promedio etre los datos X (5), X (6) Estos datos se ecuetra e la clase 4, por lo tato 50 F 3 4 X = L 4 + A = 40 + 0 = 40.7 f 4 4 Moda El itervalo e el que se cosidera que se ecuetra la moda correspode a la clase co mayor frecuecia, E el ejemplo, sería la clase 4 Δfa Mo = L4 + A = 40 + 0 = 4.85 (es ua valor supuesto para la moda) Δ f + Δ f + 5 a s 7

Primer Cuartil Q correspode a la observació X (3). Este dato se ecuetra e la clase 3, por lo tato 50 ( ) F ( ) Q 4 = L3 + A = 30 + 4 0 = 30.4 f 3 Para comparar, aotamos los datos origiales de los cuales se obtuvo la tabla de frecuecia: 37 48 48 57 3 63 55 34 48 36 3 47 50 46 8 9 9 33 53 68 49 6 0 63 0 4 35 38 35 5 3 38 43 43 45 54 58 53 49 3 36 45 43 55 50 7 4 4 Los mismos datos pero ordeados e forma creciete 9 0 0 3 4 5 6 7 8 9 3 3 3 33 34 35 35 36 36 37 38 38 4 4 43 43 43 45 45 46 47 48 48 48 49 49 50 50 53 53 54 55 55 57 58 63 63 68 Co los cuales se obtuviero directamete los siguietes resultados X = 40.6 S = 69.8 X = 4.5 Q = 3 Mo = 3, 43, 48 (trimodal) Ejemplo. Se dispoe de los siguietes datos icompletos e ua tabla de frecuecia Clase Itervalo Marca f F f/ F/ [, ) 6 3 0.5 4 0.7 5 8 0.9 6 0.05 7 Completar la tabla de frecuecia Solució Se escribe directamete los itervalos, marcas de clase y alguos valores de frecuecia Clase Itervalo Marca f F f/ F/ [, ).5 [, 3).5 5 6 3 [3, 4) 3.5 0.5 4 [4, 5) 4.5 0.7 5 [5, 6) 5.5 8 0. 0.9 6 [6, 7) 6.5 0.05 0.95 7 [7, 8) 7.5 0.05 8

Para cotiuar usamos la siguiete relació coteida e la tabla: 8/ = 0. De dode se obtiee que = 40. Coocido el valor de, se puede cotiuar desde arriba Clase Itervalo Marca f F f/ F/ [, ).5 0.05 0.05 [, 3).5 5 6 0.5 0.5 3 [3, 4) 3.5 0.5 0.40 4 [4, 5) 4.5 0.3 0.7 5 [5, 6) 5.5 8 0. 0.9 6 [6, 7) 6.5 0.05 0.95 7 [7, 8) 7.5 0.05 Fialmete, co la defiició de frecuecia relativa se puede completar la tabla Clase Itervalo Marca f F f/ F/ [, ).5 0.05 0.05 [, 3).5 5 6 0.5 0.5 3 [3, 4) 3.5 0 6 0.5 0.40 4 [4, 5) 4.5 8 0.3 0.7 5 [5, 6) 5.5 8 36 0. 0.9 6 [6, 7) 6.5 38 0.05 0.95 7 [7, 8) 7.5 40 0.05 Calcular la media, variaza, mediaa, moda y el primer cuartil Co las fórmulas correspodietes se puede calcular las medidas descriptivas idicadas igual que e el ejercicio aterior EJERCICIOS Se dispoe de los siguietes datos icompletos e ua tabla de frecuecia Clase Itervalo Marca f F f/ F/ 0.5 3 [5, 0) 4 0.6 4 5 36 6 0.975 7 Se cooce además que la media calculada co los datos agrupados es 9.7 a) Complete la tabla de frecuecia b) Calcule la media, variaza, mediaa, moda y el tercer cuartil Sugerecia: Al colocar los datos e la tabla quedará dos icógitas e la columa f. Co la fórmula del dato adicioal dado X se obtiee otra ecuació co las mismas icógitas. Estas dos ecuacioes so lieales y luego de resolverlas se puede cotiuar lleado la tabla. 9

.0 INSTRUMENTOS GRÁFICOS ADICIONALES.0. DIAGRAMA DE CAJA Es u dispositivo gráfico que se usa para expresar e forma resumida, alguas medidas estadísticas de posició: El diagrama de caja describe gráficamete el rago de los datos, el rago itercuartílico (Q 3 Q ) los valores extremos y la ubicació de los cuartiles. Es ua represetació útil para comparar grupos de datos. Por ejemplo se resalta el hecho que el 50% de los datos está e la regió cetral etre los valores de los cuartiles Q y Q 3.0. DIAGRAMA DE PUNTOS Si la catidad de datos es pequeña, (alrededor de 0 o meos), se los puede represetar mediate putos directamete si resumirlos e itervalos..0.3 DIAGRAMA DE PARETO Es u gráfico útil para idetificar los efectos importates de u proceso y las causas que los origia. La Ley de Pareto dice que de cualquier cojuto de evetos que puede asociarse a u suceso, solamete uos pocos cotribuye e forma sigificativa mietras que los demás so secudarios. Geeralmete hay úicamete o 3 causas que explica mas de la mitad de las ocurrecias del suceso. Procedimieto para costruir el diagrama de Pareto ) Categorice los datos por tipo de problema ) Determie la frecuecia y ordee e forma decreciete 3) Represete la frecuecia relativa co barras 4) Superpoga la ojiva de la frecuecia relativa acumulada 5) Determie cuales so las causas mas importates que icide e el suceso de iterés Ejemplo U fabricate ha realizado u coteo de los tipos de defectos de sus productos y ha registrado su frecuecia. Los resultados se resume e el siguiete cuadro Tipo de Defecto Frecuecia Frecuecia relativa (%) Frecuecia acumulada Frecuecia acumulada relativa (%) A 66 0.33 66 0.33 B 44 0. 0 0.55 C 34 0.7 44 0.7 D 0 0.0 64 0.8 E 4 0.07 78 0.89 F 0.06 90 0.95 G 0 0.05 00.00 Represetar los datos co u Diagrama de Pareto 30

Diagrama de Pareto Se puede observar que más del 70% de los defectos de producció correspode a los tipos A, B y C. Co esta iformació, ua decisió adecuada sería asigar recursos para solucioar estos tipos de problemas pues so los que ocurre co mayor frecuecia..0.4 DIAGRAMA DE TALLO Y HOJAS Es u dispositivo utilizado cuado la catidad de datos es pequeña. Permite describir la distribució de frecuecia de los datos agrupados pero si perder la iformació idividual de los datos. La logitud de cada fila ayuda a visualizar la frecuecia, e forma parecida a u histograma pero al mismo tiempo se puede observar idividualmete los datos. Se costruye escribiedo verticalmete las primera(s) cifra(s) de los datos (tallo) y escribiedo las restates cifras horizotalmete (hojas) Ejemplo. Los siguietes datos correspode a la catidad de artículos defectuosos producidos e ua fábrica e 0 días: 65, 36, 59, 84, 79, 56, 8, 43, 67, 36, 43, 78, 37, 40, 68, 7, 55, 6,, 8 Dibuje el diagrama de tallo y hojas Se elige la cifra de las deceas como tallo y la cifra de las uidades como las hojas: Tallo Hojas 8 3 6 6 7 4 0 3 3 5 5 6 9 6 5 7 8 7 8 9 8 4 3

EJERCICIOS ) Dibuje u diagrama de caja para los siguietes datos.4.6.0.33.4.00.34.8.4.5.35..8.65.8 ) Dibuje u diagrama de Pareto co los siguietes datos 46 4 6 5 5 5 3) Realice u diagrama de tallo y hojas co los siguietes datos 8.3 4.5 9.5.4 8.6 7.6 4.4 6. 9.5 6.4.4 3.5.8 4.9 4.0 4.6 6. 8.7 3. 6.0.7 6..4 5.8 5.0 4.6 5.4 9.4 3.4 4.0 3.0 4..8 3.9 5.0 7. 3.0. 4.4 4.6 7. 6.6 7..8.6 MATLAB Dibujar u diagrama de Pareto para los siguietes datos >> x = [66 44 34 0 4 0]; Vector co los datos >> ombres = {'A' 'B' 'C' 'D' 'E' 'F','G'}; Nombres para los compoetes e el diagrama >> pareto(x, ombres) Dibujar el diagrama de Pareto >> grid o Agregar cuadrículas El dibujo resultate se muestra e la págia aterior Dibujar u diagrama de caja >> x = [0..7.3 4.4 4.5 4.8 6.0 6. 7.3 7.6 7.9 8. 8.9 9. 9.5]; Vector co datos >> boxplot(x) Diagrama de caja 3

>> boxplot(x,, '', 0) Diagrama de caja horizotal, co muesca 33

. MUESTRAS BIVARIADAS Es comú teer que estudiar muestras co datos que mide dos características, siedo de iterés determiar si hay algua relació etre las dos variables. Para visualizar la relació etre los datos de ua muestra bivariada, es útil graficarlos e ua represetació que se deomia diagrama de dispersió. Ejemplo Se tiee ua muestra de las calificacioes de 0 estudiates de los exámees parcial y fial. Exame Parcial Exame Fial 60 74 66 34 60 66 57 7 39 57 7 8 75 46 73 74 70 8 60 6 Dibuje el diagrama de dispersió. Sea X: Calificació del primer parcial (variable idepediete) Y: Calificació del exame fial (variable depediete) Se observa que los datos está relacioados co ua tedecia lieal co pediete positiva 34 Ig. Luis Rodríguez Ojeda, MSC.

.. CORRELACIÓN Se usa el térmio correlació para describir la relació etre los datos de muestras bivariadas. Gráficos para apreciar la correlació etre dos variables Ejemplo.- Se puede decir que los datos e el ejemplo aterior tiee correlació lieal positiva.. COEFICIENTE DE CORRELACION LINEAL Es ua defiició para cuatificar el grado de correlació lieal etre las variables. Es ua medida adimesioal útil para comparar variables co uidades de medida diferetes. Primero de establece alguas defiicioes impotates Sea X, Y: Variables muestrales : Tamaño de la muestra X, Y : Media aritmética de X, Y, respectivamete S X, S Y : Desviacioes estádar muestrales S XY : Covariaza muestral Defiicioes Medias aritméticas muestrales X = Xi, Y = i i = Y i = Variazas muestrales S X = (xi x), S Y = (yi y) i = i = Covariaza muestral S XY = (xi x)(yi y) = i 35 Ig. Luis Rodríguez Ojeda, MSC.

Defiició: Coeficiete de correlació lieal r S SS XY =, - r X Y Si r está cercao a, etoces X y Y tiee correlació lieal positiva fuerte Si r está cercao a -, etoces X y Y tiee correlació lieal egativa fuerte Si r está cercao a 0, etoces X y Y o está correlacioadas liealmete, o es muy débil Es importate que se mida la correlació etre variables cuya asociació tega algú setido Asmismo, si las variables o está correlacioadas liealmete, pudiera ser que si lo esté mediate ua relació o lieal..3 MATRIZ DE VARIANZAS Y COVARIANZAS Es ua represetació ordeada de las variazas y las covariazas etre las variables Si se usa la otació X = X, S = S X X X = Y, S = S X Defiició: Matriz de variazas y covariazas Y S X S X X S = i j XX SXX S X Es ua matriz simétrica..4 MATRIZ DE CORRELACION Es ua represetació ordeada de los coeficietes de correlació de cada variable co la otra variable y cosigo misma. Si se usa la otació X = X, S = S X X X = Y, SX = SY SXX i j rij = coeficiete de correlació lieal etre X i y X j SXS i Xj Defiició: Matriz de correlació r r,, r ij = r, r, Es ua matriz simétrica. Los valores e la diagoal pricipal so iguales a Las defiicioes de matriz de variazas-covariazas y matriz de correlació, puede extederse directamete a más variables 36 Ig. Luis Rodríguez Ojeda, MSC.

Ejemplo Se tiee ua muestra de las calificacioes de 0 estudiates del primer parcial y del segudo parcial. Primer Parcial 60 74 66 34 60 66 57 7 39 57 Segudo Parcial 7 8 75 46 73 74 70 8 60 6 Ecuetre el coeficiete de correlació lieal e iterprete el resultado Solució Sea: X: Calificació del primer parcial Y: Calificació del segudo parcial i i= x = x = (60+ 74+ 66+ 34+ 60+ 66+ 57+ 7+ 39+ 57) = 58.4 0 s = (x x) = [(60 58.4) + (74 58.4) +... + (57 58.4) ] = 66.4889 X i i= 9 s = s = 66.4889 =.903 x X i i= y = y = (7+ 8+ 75+ 46+ 73+ 74+ 70+ 8+ 60+ 6) = 69.5 0 s = (y y) = [(7 69.5) + (8 69.5) +... + (6 69.5) ] =.8333 Y i i= 9 s = s =.8333 =.0378 Y Y S = (x x)(y y) XY i i i= = [(60 58.4)(7 69.5) + (74 58.4)(8 69.5) +... 9 + (57 58.4)(6 69.5)] = 34. Coeficiete de correlació SXY 34. r = = = 0.946 S S (.903)(.0378) X Y El resultado idica que la correlació es fuertemete positiva Escriba las matrices de variazas-covariazas y de correlació. Sea X = X, SX = S X X = Y, SX = SY Matriz de variazas-covariazas SX S XX 66.4889 34. S XX = = i j S 34..8333 XX S X 37 Ig. Luis Rodríguez Ojeda, MSC.

Matriz de correlació Co la defiició: r ij SXX i = S S r, r, 0.946 r ij = = r, r, 0.946 X i j X j, sustituyedo los valores respectivos se obtiee EJERCICIOS Los siguietes datos represeta el tiempo, e horas, de etreamieto de los trabajadores de ua empresa, y el teimpo que tardaro, e miutos, e realizar la actividad ecomedada Exame Parcial Exame Fial 0 5 8 6 8 4 0 9 8 0 3 8 a) Dibuje el diagrama de dispersió e idique que tipo de correlació parece teer las variables X y Y b) Escriba la matriz de variazas y covariazas c) Escriba la matriz de correlació d) Calcule el coeficiete de correlació e iterprete el resultado 38 Ig. Luis Rodríguez Ojeda, MSC.

MATLAB Vectores co datos de dos variables >> x=[60 74 66 34 60 66 57 7 39 57]; >> y=[7 8 75 46 73 74 70 8 60 6]; Diagrama de dispersió. El gráfico aparece e la primera págia de esta secció >> scatter(x,y,'k') >> grid o Matriz de variazas y covariazas >> v=cov(x,y) v = 66.4889 34. 34..8333 Matriz de correlació >> r=corrcoef(x,y) r =.0000 0.946 0.946.0000 Variaza, covariaza y coeficiete de correlació: >> vx = v(,) Variaza de X vx = 66.4889 >> vy = v(,) Variaza de Y vy =.8333 >> vxy = v(,) Covariaza de X, Y vxy = 34. >> rxy = r(,) Coeficiete de correlació de X, Y rxy = 0.946 >> v=diag(cov(x,y)) Vector co las variazas (es la diagoal de la matriz) v = 66.4889.8333 >> s=sqrt(diag(cov(x,y))) Vector co las desviacioes estádar s =.903.0378 39 Ig. Luis Rodríguez Ojeda, MSC.

3 FUNDAMENTOS DE LA TEORÍA DE LA PROBABILIDAD E esta uidad se escribe alguas defiicioes ecesarias para fudametar el estudio de la teoría de la probabilidad. 3. EXPERIMENTO ESTADÍSTICO Es u procedimieto que se realiza co el propósito de obteer observacioes para algú estudio de iterés. U experimeto requiere realizar pruebas o esayos para obteer resultados. U experimeto estadístico tiee las siguietes características. Se cooce todos los resultados posibles ates de realizar el experimeto estadístico.. No se puede predecir el resultado de cada esayo realizado (propiedad de aleatoriedad) 3. Debe poderse reproducir o repetir el experimeto e codicioes similares. 4. Se puede establecer u patró predecible a lo largo de muchas ejecucioes del experimeto. Esta propiedad se deomia regularidad estadística. Ejemplos ) Lazar u dado y observar el resultado obteido. ) Medir la altura de ua persoa 3) Observar el tipo de defecto de u artículo producido por ua fábrica 3. ESPACIO MUESTRAL El espacio muestral, represetado co la letra S, es el cojuto de todos los resultados posibles de u experimeto. Cada elemeto de S se deomia puto muestral. Segú la aturaleza del experimeto, los putos muestrales puede determiar que S sea discreto o cotiuo. S es discreto si sus elemetos puede poerse e correspodecia co los úmeros aturales. E este caso S puede se fiito o ifiito. S es cotiuo si los resultados correspode a algú itervalo de los úmeros reales. E este caso S es ifiito por defiició. Ejemplos Experimeto: Lazar u dado y observar el resultado Espacio muestral: S={,, 3, 4, 5, 6] Propiedades de S: discreto y fiito Experimeto: Elegir al azar dos artículos de u lote y observar la catidad de artículos defectuosos Espacio muestral: S={0,, } Propiedades de S: discreto y fiito Experimeto: Lazar u dado y cotar la catidad de itetos hasta obteer como resultado el 6 Espacio muestral: S={,, 3,...} Propiedades de S: discreto e ifiito Experimeto: Espacio muestral: Propiedades de S: Medir el peso e gramos de u artículo elegido al azar S={x x>0, x R} cotiuo (ifiito por defiició) 40