INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Documentos relacionados
Técnicas Cuantitativas para el Management y los Negocios

Estadística Descriptiva 2da parte

Módulo de Estadística

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Análisis Exploratorio de Datos Resumen gráfico y numérico

ESTADÍSTICA DESCRIPTIVA EN POCAS PALABRAS (por jmd matetam.com)

Estadística Descriptiva

Estadística Inferencial. Estadística Descriptiva

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

CLASIFICACIÓN DE LA ESTADÍSTICA

Tema 3: Estadística Descriptiva

ESTADÍSTICA DESCRIPTIVA

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

1. Estadística. 2. Seleccionar el número de clases k, para agrupar los datos. Como sugerencia para elegir el k

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

Estadística aplicada al Periodismo

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

ESTADÍSTICA Camerina Laura Ramírez Gallegos

OARI CLASE 19/05/2015. DESCRIPCIÓN CUANTITATIVA DE LOS DATOS. MEDIDAS RESUMEN

ESTADÍSTICA 1.- NOCIONES GENERALES

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

FLORIDA Secundaria. 1º BACH MATEMÁTICAS CCSS -1- BLOQUE ESTADÍSTICA: ESTADÍSTICA VARIABLE UNIDIMENSIONAL. Estadística variable unidimensional

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Tema 2: Estadísticos. Bioestadística. U. Málaga. Tema 2: Estadísticos 1

Tema 1: Análisis de datos univariantes

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Métodos Matemá-cos en la Ingeniería Tema 5. Estadís-ca descrip-va

Exploración de datos

U.D.1: Análisis estadístico de una variable Consideraciones iniciales: Propuesta: 1.1 Distribución de frecuencias. Variables Cualitativas: Ejemplo

MEDIDAS DE DISPERSIÓN Y ASIMETRÍA DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Estadística Descriptiva en SPSS

Tema 9: Estadística descriptiva

Estadística I Tema 2: Análisis de datos univariantes

Estadística Básica 1er Cuatrimestre 2012

x i = n = 35 5 =7 MEDIDAS DE CENTRALIZACIÓN Media aritmética: variables cuantitativas , x 2 Datos no agrupados: x 1 ,...,x n x= x 1 +x

Julio Deride Silva. 18 de agosto de 2010

Estadística aplicada a la comunicación

Instrumentos y matriz de datos

Estadís-ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 1. Estadís-ca descrip-va

UNIDAD 8. ESTADÍSTICA

Estadística Descriptiva. Tema 1: Estadísticos 1

Apuntes de Estadística

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

2.2: Resumen numérico

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

10/02/2015. Ángel Serrano Sánchez de León

3.2. Desviación Media

Conceptos de Estadística

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

NIVELACIÓN DE ESTADISTICA. Carlos Darío Restrepo

Estadística Aplicada. Tema 2: Estadísticos. Universidad Autónoma de Cd. Juarez Tema 2: Estadísticos 1

ESTADÍSTICA. A su vez, las variables pueden ser :

El Método Científico. Metodología de Investigación. Te sifón Parrón

Estadística Descriptiva

ESTADÍSTICA BÁSICA 2016 COMISIÓN 2

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Estadística ESTADÍSTICA

La amplitud del intervalo ( ) se determina considerando un número dado de intervalos ( ) y el rango obtenido, esto es:

Fundamentos de Estadística y Simulación Básica

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

3 ANALISIS DESCRIPTIVO DE LOS DATOS

TEMA: 9 ESTADÍSTICA 4º ESO

Estadística Inga Patricia Juárez, 2017 MEDIDAS DE TENDENCIA CENTRAL

Tema 1. Estadística Unidimensional

ÁREAS DE LA ESTADÍSTICA

Estadística I. Finanzas y contabilidad

Estadística. Análisis de datos.

ESTADÍSTICA. Rincón del Maestro:

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

TEMA 14: ESTADÍSTICA 1. CONCEPTOS ESTADÍSTICOS

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

IMADIL /10/2014

Bioestadística: Estadística Descriptiva

Tema 1 Estadística descriptiva: Medidas de posición

Profesora: Beatriz Ponce Nely TADA- 03

TEMA 1: ESTADISTICA DESCRIPTIVA

1 POBLACIÓN Y MUESTRA

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

Estadística Aplicada a la Educación

ESTADÍSTICA APLICADA. TEMA 1. ESTADÍSTICA DESCRIPTIVA

LECCIÓN PÚBLICA. Tema 2 Medidas de Tendencia Central, Posición y Variabilidad. Profa. María Fátima Dos Santos

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. Parámetros y complementos

TEMA 5 Estadística descriptiva. Análisis de datos

Estadística. Tema 2: Estadísticos. Dagoberto Salgado Horta Tema 2: Estadísticos 1

MEDIDAS. necesita de ciertas medidas (números) representativas que puedan resumirlos. distribuciones de frecuencias de datos univariados:

Estadística Descriptiva 2da parte

Estadística Descriptiva

Origen de la Estadística. Ejercicio de estadística 13/05/2015. Víctor Cuchillac (papá) Definiciones de Estadística. Definiciones de Estadística

Estadística unidimensional

Muestra Una muestra es una parte de la población que elegimos para estudiar la población.

Estadística con R. Nivel Básico

Una vez que tenga la información de la muestra ordenada, se pueden emitir conclusiones finales.

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

Parte I. Estadística Descriptiva

Estadística Administrativa Diplomatura en Gestión y Administración Pública Test de autocomprobación COMP. RESUELTO. Parámetros y complementos

Las técnicas para resumir la información ió contenida en un conjunto de datos x 1, x 2,,x n son: Tablas de frecuencias: por columnas, disponemos los

Transcripción:

ESTADÍSTICA

INTRODUCCIÓN Qué es la estadística?. - Es la rama de las matemáticas que estudia la recolección, análisis e interpretación de datos. Por qué estudiamos estadística? - Aprender sobre fenómenos físicos o naturales con el objetivo de obtener conclusiones y por tanto, poder tomar decisiones. Fenómeno Real Datos Observados Análisis Estadístico Aprendizaje sobre el fenómeno

INTRODUCCIÓN La estadística se divide en dos grandes áreas: 1. ESTADÍSTICA DESCRIPTIVA - Visualización/representación y resumen de datos. 2. ESTADÍSTICA INFERENCIAL. - Creación de modelos en base a los datos observados con el objetivo de poder hacer predicciones.

ESTADÍSTICA DESCRIPTIVA UNIVARIADA

ESTADÍSTICA DESCRIPTIVA UNIVARIADA ÍNDICE DEFINICIONES. REPRESENTACIÓN DE DATOS. - Tabla de frecuencias. - Representaciones gráficas. MEDIDAS DE LOS DATOS. - Centralización y posición. - Dispersión. - Forma.

DEFINICIONES Población: conjunto de seres, medidas u objetos acerca de los que se desea tener información. Elemento/Individuo: cada uno de los miembros de la población. Muestra: subconjunto de individuos de la población.

DEFINICIONES VARIABLE ESTADÍSTICA Característica que se mide/observa en los individuos de una población. Ejemplo: la altura, la edad, el peso, el sexo, número de hermanos, etc Cualitativa: Describe una cualidad. Ejemplo: color de ojos, preferencias, etc. Cuantitativa: Toma valores numéricos. Ejemplo: altura, peso, etc. Discreta: conjunto numerable (enteros) Continua: Valores en un intervalo (toma decimales)

REPRESENTACIÓN DE LOS DATOS OBJETIVO Resumir información contenida en los datos para facilitar su análisis Hay dos maneras equivalentes de presentar la información contenida en un conjunto de datos: TABLAS DE FRECUENCIAS REPRESENTACIONES GRÁFICAS Sexo Frecuencia Hombres 23 Mujeres 32 36 30 24 18 12 6 0 Hombres Mujeres

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA Muestra la frecuencia de cada valor observado. Cuando los Datos son cualitativos o cuantitativos discretos con pocos valores distintos Damos la frecuencia con que aparece en la muestra para cada valor o categoría. Datos cuantitativos continuos o discretos con muchos valores distintos Damos la frecuencia con los datos agrupados en clases o intervalos.

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA Frecuencias absolutas (F i ): Contabilizan el número total de elemento de cada clase. Frecuencias relativas (f i ): Es la proporción (porcentaje) de individuos de cada tipo que pertenecen a cada clase sobre el total de individuos de la muestra. Se obtiene dividiendo la frecuencia absoluta entre el total de individuos. Frecuencias acumuladas (F ac y f ac ): Se obtienen sumando las frecuencias de las clases anteriores.

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA EJEMPLO 1 Se ha contado el número de hijos de 100 matrimonios que llevan casados más de 15 años. Obteniendo los siguientes resultados: 0 0 1 1 2 0 3 0 2 4 2 1 0 5 5 2 2 3 1 1 1 2 2 4 5 0 3 2 2 2 2 4 3 1 1 1 0 0 2 3 1 4 0 0 1 1 2 2 3 2 3 1 1 0 0 1 2 0 2 2 0 0 0 0 1 1 4 3 3 2 1 6 3 1 3 2 1 2 3 0 1 3 0 2 3 2 1 3 4 0 6 2 1 3 0 3 1 0 2 2

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA EJEMPLO 1 Nº de hijos F i f i F ac f ac 0 22 0.22 22 0.22 1 24 0.24 46 0.46 2 26 0.26 72 0.72 3 17 0.17 89 0.89 4 6 0.06 95 0.95 5 3 0.03 98 0.98 6 2 0.02 100 1 100 1

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA Hay muchos valores Se agrupan en clase o intervalos Cuántas clases elegir? Pocas Muchas. Se pierde mucha información de los datos. La frecuencia resultante en cada una puede ser pequeña y poco útil para el estudio Qué longitud elegir para cada clase? Se suelen elegir intervalos de igual longitud

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA EJEMPLO 2 Los siguientes datos muestran los niveles de colesterol en la sangre de 40 estudiantes de primer año de una universidad. 213 173 193 196 220 183 194 200 192 200 200 199 178 183 188 193 187 181 193 205 196 211 202 213 216 206 195 191 171 194 184 191 221 212 221 204 204 191 183 227

REPRESENTACIÓN DE LOS DATOS TABLA DE FRECUENCIA EJEMPLO 2 Tabla de frecuencias de los niveles de colesterol en sangre Intervalo de clase Frecuencia absoluta Frecuencia relativa 170 180 3 0,075 180 190 7 0,175 190 200 13 0,325 200 210 8 0,200 210-220 5 0,125 220 230 4 0,100

frecuencia REPRESENTACIÓN DE LOS DATOS GRÁFICAS 1. Diagrama de Barras Gráficos de frecuencias para datos cualitativos. Barras separadas para cada valor. La altura de las barras representa la frecuencia absoluta o relativa de cada valor. 12 Diagrama de Barras de Dias de baja 10 8 6 4 2 0 0 1 2 3 4 5 7 8 9

REPRESENTACIÓN DE LOS DATOS GRÁFICAS 2. Diagrama de tarta o sectores Gráficos de frecuencias para datos cualitativos. El área de cada sector representa la frecuencia relativa de cada valor. Diagrama de tarta 2,00% 4,00% 16,00% 24,00% 10,00% 10,00% 16,00% 0 días 1 día 2 días 3 días 4 días 5 días 6 días 7 días 8 días 9 días 10,00% 8,00%

REPRESENTACIÓN DE LOS DATOS GRÁFICAS 3. Histograma Gráficos de frecuencias para datos cuantitativos. Cada barra representa una clase. No hay hueco entre barras. Las bases son iguales a la amplitud de cada clase. La altura corresponde a la frecuencia absoluta o relativa de la clase. Marca de clase: Es el valor medio de cada clase. El área que hay bajo el histograma es proporcional a la cantidad de individuos del intervalo.

REPRESENTACIÓN DE LOS DATOS GRÁFICAS El histograma da información sobre: La simetría de los datos y la dispersión de los mismos 30 25 20 15 10 5 0-2,6-1,6-0,6 0,4 1,4 2,4 3,4 Simétricos 20 16 12 8 4 0-0,1 0,3 0,7 1,1 1,5 1,9 2,3 Dispersos

REPRESENTACIÓN DE LOS DATOS GRÁFICAS El histograma da información sobre: La forma de la distribución 18 40 15 12 30 9 20 6 3 10 0-2 3 8 13 18 23 28 0-4 0 4 8 12 16 20 Asimétricos Asimétricos a a la derecha la izquierda

REPRESENTACIÓN DE LOS DATOS GRÁFICAS El histograma da información sobre: Si existen brechas entre los datos poblaciones. posibles dos Si hay valores muy alejados valores atípicos.

REPRESENTACIÓN DE LOS DATOS EJEMPLO 3 La variable representa el peso (en gr.) de 191 monedas de 100 pesetas. TABLAS DE FRECUENCIAS Límite Límite Frecuencia Frecuencia Frecuencia Relat. Clase Inferior Superior Marca Frecuencia Relativa Acumulada Acumulada menor que 8,9 0 0 0 0 1 8,9 8,98 8,95 0 0 0 0 2 8,98 9,07 9,03 4 0,02 4 0,02 3 9,07 9,16 9,12 27 0,14 31 0,16 4 9,16 9,25 9,21 81 0,42 112 0,59 5 9,25 9,34 9,3 57 0,3 169 0,88 6 9,34 9,43 9,39 20 0,1 189 0,99 7 9,43 9,52 9,47 2 0,01 191 1 8 9,52 9,61 9,56 0 0 191 1 9 9,61 9,7 9,65 0 0 191 1 mayor que 9,7 0 0 191 1

porcentaje (%) REPRESENTACIÓN DE LOS DATOS EJEMPLO 3 HISTOGRAMA - Representación de las frecuencias relativas: Histograma 50 40 30 20 10 0 8,9 9,1 9,3 9,5 9,7 Peso

porcentaje (%) REPRESENTACIÓN DE LOS DATOS EJEMPLO 3 - Representación de las frecuencias relativas acumuladas: Histograma 100 80 60 40 20 0 8,9 9,1 9,3 9,5 9,7 Peso

porcentaje (%) REPRESENTACIÓN DE LOS DATOS EJEMPLO 4 Datos correspondientes a las longitudes ( 10 4 m) de 100 clavos del mismo tipo, medidos por dos personas, 50 clavos cada una, que usaron calibres diferentes. Histograma 30 25 20 15 10 5 0 340 344 348 352 356 360 364 Ambos 10 4 m Posible presencia de 2 poblaciones

porcentaje (%) REPRESENTACIÓN DE LOS DATOS EJEMPLO 4 Comparación de los histogramas separando los datos según el calibre utilizado: Calibre1 54 34 14 6 26 46 340 344 348 352 356 360 364 Calibre 2

REPRESENTACIÓN DE LOS DATOS OTRAS REPRESENTACIONES GRÁFICAS Polígono de frecuencias Se representa los puntos medios de cada clase (marcas) frente a la frecuencia de la clase correspondiente y se unen estos puntos por líneas rectas. Útiles para comparar conjuntos de datos. Diagrama de tallos y hojas Para conjunto de datos pequeño o moderado. Los datos se separan en un tallo y hojas Ventaja: no se pierden los datos.

porcentaje porcentaje (%) (%) REPRESENTACIÓN DE LOS DATOS OTRAS REPRESENTACIONES GRÁFICAS EJEMPLO 5 - La variable representa el peso (en gr.) de 191 monedas de 100 pesetas. POLÍGONO DE FRECUENCIAS Histograma Histograma 50 100 40 80 30 60 20 40 10 20 0 8,9 9,1 9,3 9,5 9,7 Peso Polígono de frecuencias relativas 0 8,9 9,1 9,3 9,5 9,7 Peso Polígono de frecuencias acumuladas

REPRESENTACIÓN DE LOS DATOS OTRAS REPRESENTACIONES GRÁFICAS EJEMPLO 5 DIAGRAMA DE TALLOS Y HOJAS

MEDIDAS DE UN CONJUNTO DE DATOS INTRODUCCIÓN Medidas de centralización y posición Valor que representa a todo el conjunto de datos: media, mediana, moda y cuantiles. Medidas de dispersión Valor que cuantifica cómo están distribuidos los datos con respecto a la media: varianza (desviación típica). Medidas de forma Valores que miden lo simétrica o apuntada/picuda que es la distribución de nuestros datos: coeficiente de asimetría, coeficiente de apuntamiento (curtosis)

Para datos no agrupados la media aritmética de un conjunto de datos x 1, x 2, x 3, x n es Para datos agrupados en tablas de frecuencias: n x x = i i i i i i i f x = n F x = n F x = x MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN MEDIA ARITMÉTICA

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN EJEMPLO 1 Una pequeña empresa tiene cinco trabajadores. Sus salarios mensuales son: 510, 560, 575, 600 y 800 Euros. Calcular el salario medio. x 510 560 575 600 800 5 609 Qué ocurriría si el valor 800 fuera 5000?. 510, 560, 575, 600 y 5000 x 510 560 575 600 5000 5 1449 La medida pierde representatividad

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN EJEMPLO 1 Actúa como centro geométrico o como centro de masas del conjunto de datos. Es muy sensible a valores extremos (atípicos). MEDIA MEDIA

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN MEDIANA Es un valor que divide a los datos en dos grupos con el mismo número de individuos. Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Para calcularla: ordenamos los datos de menor a mayor. si el número de datos es impar, la mediana es el dato del medio si el número de datos es par, la mediana es la media de los datos centrales.

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN EJEMPLO 2 13 ovejas comieron una hierba venenosa. Las horas que tardaron en morir fueron: 44, 27, 24, 24, 36, 36, 44, 44, 120, 29, 36, 36 y 36. Calcular la mediana. Ordenamos los valores de menor a mayor: 24, 24, 27, 29, 36, 36, 36, 36, 36, 44, 44, 44, 120 6 6 13 Observaciones

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN MEDIANA Poco sensible a las asimetrías del histograma. 50% 50% Mediana = Media Mediana Media

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN MEDIANA Poco sensible a valores atípicos. Mediana = Media Mediana

porcentaje porcentaje MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE CENTRALIZACIÓN MODA Es el valor más frecuente, el que más se repite. En datos agrupados, es la clase más frecuente. La presencia de varias modas puede indicar la existencia de varios grupos. Histograma Histograma 50 30 40 25 30 20 10 20 15 10 5 0 8,9 9,1 9,3 9,5 9,7 Peso Unimodal 0 1600 2100 2600 3100 3600 4100 4600 Peso Bimodal

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE POSICIÓN (CUANTILES) CUARTILES Son valores no centrales muy importantes de las distribuciones. Son valores de la variable (Q 1, Q 2 y Q 3 ) que dividen a la distribución en 4 partes, cada una de las cuales engloba el 25 % de las mismas. Q 1 = Primer cuartil Q 2 = Segundo cuartil = Mediana Q 3 = Tercer cuartil Q 3 Q 1 = Rango intercuartílico

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN EJEMPLO Menor dispersión Igual media Mayor dispersión Igual media

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN EJEMPLO Los valores 0 y 10 tienen como media 5. Los valores 5 y 5 tienen como media 5. En ambos casos tienen la misma media, sin embargo los conjuntos son diferentes. En ocasiones, conocer sólo la media no nos da una idea de cómo están repartidos el resto de valores entorno a ella. están cerca o lejos de la media?

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN x x i Distancia entre un valor y la media x i x Calculamos la distancia media como el promedio de las distancias de todos los valores al valor medio: 1 D ( xi x) n Problema: La distancia media puede salir 0 sin que los puntos sean todos igual que la media, puesto que los valores se pueden cancelar. Solución: Quitar los signos negativos elevando al cuadrado.

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. Para datos no agrupados la varianza de un conjunto de datos x 1, x 2, x 3, x n es: VARIANZA Distancia cuadrática Una manera fácil de calcular la varianza es utilizar el desarrollo: n σ x 2 = 1 n i=1 n σ x 2 = 1 n i=1 (x i x) ҧ 2 (x i ) 2 xҧ 2

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN VARIANZA Si los datos están agrupados en una tabla de frecuencias: 2 1 2 n F x 2 i 2 2 f x x i i i x 2

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN VARIANZA POBLACIONAL VS MUESTRAL Para datos no agrupados la varianza poblacional de un conjunto de datos x 1, x 2, x 3, x N (toda la población) es: σ 2 = 1 N (x i x) ҧ 2 i=1 Para datos no agrupados la varianza muestral de un conjunto de datos x 1, x 2, x 3, x n (muestra de la población) es: n N s 2 = 1 n 1 (x i x) ҧ 2 i=1 Estimador no sesgado de la varianza poblacional

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE DISPERSIÓN DESVIACIÓN TÍPICA Para lograr una medida de la distancia media calculamos la raíz cuadrada de la varianza: 1 n ( x i x) 2 Tiene las mismas unidades que la variable estadística y es en general más tangible.

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE FORMA COEFICIENTE DE ASIMETRÍA El coeficiente de asimetría mide la simetría de los datos respecto de la media. Se define como: As = 1 N σ N i=1 (x i x) ҧ 3 σ 3 x 1, x 2, x 3, x N constituye toda la población σ es la desviación típica As = 0 As > 0 As < 0

MEDIDAS DE UN CONJUNTO DE DATOS MEDIDAS DE FORMA CURTOSIS El coeficiente de curtosis mide el apuntamiento de los datos. Se define como: K = 1 N σ N i=1 (x i x) ҧ 4 σ 4 x 1, x 2, x 3, x N constituye toda la población σ es la desviación típica Leptocúrtica K>3 Mesocúrtica K=3 Distribución Gaussiana Platicúrtica K<3

MEDIDAS DE UN CONJUNTO DE DATOS DIAGRAMA DE CAJA Y BIGOTES Es una representación gráfica de un conjunto de datos que consta de dos partes, la caja y los bigotes. Ofrece información acerca de: La simetría de los datos. La concentración de los datos. La dispersión de los datos. La presencia de puntos atípicos y su desvío respecto de generalidad. CAJA BIGOTE BIGOTE

MEDIDAS DE UN CONJUNTO DE DATOS DIAGRAMA DE CAJA Y BIGOTES Q 1 = Primer cuartil Q 2 = Segundo cuartil = Mediana Q 3 = Tercer cuartil R = Q 3 Q 1 (Rango intercuartílico) L max de los bigotes = 1.5 x R Valores atípicos: Valores tal que > Q 3 + 1.5 R Valores tal que < Q 1 1.5 R x min x max Extremos del bigote: Máx valor tal que < Q 3 + 1.5 R Mín valor tal que > Q 1 1.5 R