Introducción a la Asignatura Estadística I Profesor Francisco Calderón P.
Conceptos básicos
Qué es la Estadística? La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población. Según se haga el estudio sobre todos los elementos de la población o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadística:
Estadística descriptiva. Es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos con el objetivo de describir las características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos. Además calcula parámetros estadísticos como las medidas de centralización y de dispersión que describen el conjunto estudiado. Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población.
Ejemplo de Estadística descriptiva Método de recolectar, organizar, resumir, analizar e interpretar los datos. Ejemplo 1: Los datos del Censo de población. Ejemplo 2: La cantidad de robos ocurridos el último mes en la capital. Ejemplo 3: La cantidad de pacientes atendidos en el Hospital municipal el último año. Mencionamos algunos procedimientos: Tablas de distribuciones de frecuencia Gráficos de distribución de frecuencias Estadísticos de dispersión
Ejemplo de estadística inferencial Métodos usados para determinar algo acerca de la población, basado en una muestra. Ejemplo 1: Una encuesta desarrollada en marzo 2018, dice que el rating de radio en la capital está encabezado por FM XYZ con un 10.5% seguido por FM ABC con 9.18% Ejemplo 2: De acuerdo con una encuesta desarrollada por APOLO manifiesta que la telefonía celular le ha ganado terreno a la telefonía fija. Ejemplo 3: Una encuesta del mes de mayo de 2018 reportó que la tasa de desempleo ascendió al 5.3% a nivel nacional La estadística inferencial comprende dos áreas importantes: Estimación puntual y por intervalos. Estimar el peso promedio de la muestra usando el peso promedio de la muestra. Prueba de hipótesis estadística. Probar que el peso promedio de la muestra es de 65 kg.
Muestreo Probabilístico: Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de muestreo
Variable Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población. Tipos de variable estadísticas: Variable cualitativa Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: 1. Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Ej: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
2. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden. La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,... Medallas de una prueba deportiva: oro, plata, bronce.
Variable cuantitativa Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos números. La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.
Frecuencias Una vez que hemos realizado el recuento, hay que organizar los datos y expresarlos de forma simplificada para que su interpretación sea fácil y rápida. Esto se hace disponiendo los datos por columnas o filas formando lo que llamamos una tabla estadística. Valores de la variable Número de veces que aparecen x 1 f 1 x 2 f 2...... x n f n N: Número total de datos
En primer lugar la tabla estará formada por estas dos columnas, pero más tarde iremos añadiendo más según los cálculos que necesitemos. Sin hacer muchos cálculos, podemos ir completando la tabla con las frecuencias, que definimos a continuación: Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se representa por f i. En algunos libros de texto nos la encontraremos representada por n i. Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con todos los anteriores. Se representa por F i. Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número de datos (N). Se representa por h i. Al multiplicarla por 100 obtenemos el porcentaje de individuos que presentan esta característica. Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta acumulada y el número total de datos. Se representa por H i.
Gráficos Estadísticos Una vez construida la tabla de frecuencias, vamos a representar mediante distintos gráficos el estudio realizado. Entre los gráficos más utilizado podemos destacar: Diagrama de barras o rectángulos. Consiste en dos ejes perpendiculares y una barra o rectángulo para cada valor de la variable. Normalmente, se suele colocar en el eje horizontal los valores de la variable (aunque también se puede hacer en el vertical). El otro eje se gradúa según los valores de las frecuencias. La representación gráfica consiste en dibujar una barra o un rectángulo para cada uno de los valores de la variable de altura igual a su frecuencia.
Histograma de Frecuencia Es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua. De esta manera podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.
Polígono de frecuencias. Representamos dos ejes perpendiculares y representamos en el horizontal los valores de la variable y en el vertical las frecuencias. Representamos los puntos que tiene por primera coordenada el valor de la variable y por segunda el valor de la frecuencia. Uniendo todos los puntos obtenemos una línea poligonal que es la representación que buscamos.
Diagrama de sectores. Consiste en dividir un círculo en tantos sectores como valores de la variable. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente.
Cartograma. Cuando el estudio estadístico se hace sobre una zona geográfica, la representación gráfica se puede hacer sobre un mapa, coloreando con distintos colores cada una de las regiones representadas en el estudio.
Pictograma. Consiste en la representación gráfica del estudio realizado utilizando dibujos alusivos a los distintos valores de la variable estadística.