Estadística descriptiva con Excel Objetivos: Familiarizar al estudiante con el manejo del programa Excel. Saber la manera en la que en el programa se introducen y se guardan los datos. Como introducir las principales fórmulas estadísticas Utilizar la herramienta de filtrado de datos. Descipción: En esta práctica se introduce al alumno en primer lugar en la hoja de cálculo Excel. Seguidamente se introduce las posibilidades gráficas de Excel. Se aprenderá a calcular resultados de las medidas de tendencia central, medias de dispersión y forma, después explicaremos brevemente la herramienta de excel de analizar datos. Índice: 1. Introducción a la hoja de cálculo 2. Representaciones gráficas 3. Analizar datos calculando fórmulas 4. Aplicar funciones 5. Herramienta analizar datos
1. Introducción a la hoja de cálculo Excel es una hoja de calculo que facilita los cálculos y la obtención de indicadores y estadísticos para estudiar el comportamiento de una o varias variables. Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68. Un conjunto de celdas se denomina rango, y en Excel se expresa como A1:B4. En cada celda se puede recoger: texto, número, fecha, fórmulas, etc. Como su nombre indica, la hoja de cálculo nos permite calcular, hacer operaciones matemáticas, lógicas, estadísticas, financieras, etc.. Con la hoja de cálculo EXCEL (u otras similares) se pueden obtener fácilmente estadísticos y medidas que resuman y caractericen una variable, una distribución de frecuencias, o una distribución bidimensional (n-dimensional) de frecuencias, es decir varias variables conjuntamente. La primera pantalla que aparece en Excel es la siguiente:
Un primer recorrido por la hoja de cálculo nos permite conocer las: - opciones de menú - barra de herramientas - barra de estado... Podemos utilizar la hoja de cálculo: 1. Para obtener representaciones gráficas según el tipo de variable 2. Para ir haciendo los cálculos necesarios para obtener los distintos estadísticos (media, mediana, moda, cuantiles, varianzas, etc). A partir de unos datos (o de una distribución de frecuencias) hacemos los cálculos necesarios para desarrollar una fórmula y paso a paso calcular hasta obtener el resultado final. (Sumas, productos, divisiones, potencias, raíces, etc ) 3. Para obtener fácilmente estadísticos como promedios, varianzas, cuartiles, covarianzas, regresión, etc.., aplicando una lista de funciones previamente programadas en la hoja de cálculo. 4. Para analizar un conjunto de información. Se usará en el menú de Herramientas la opción Analizar Datos. Permite describir un conjunto de información correspondiente a una o varias variables. Los datos de entrada son con frecuencia unitaria ( si un valor se repite varias veces aparece repetido ese número de veces). También permite aplicar técnicas estadísticas más sofisticadas (regresión, contrastes de hipótesis, estimación por intervalos, etc...). 2. Representaciones gráficas Insertar gráfico, o el icono correspondiente a gráficos, y seguimos los pasos que nos sugiere el asistente para gráficos, Elegir tipo de gráfico, Definir rango de datos, Etiquetar ejes y gráfico, leyenda, etc.. Decidir dónde se ha de representar el gráfico (en la hoja, en hoja nueva, etc...) Para cada variable, según sus propiedades de medida, elegimos uno o varios gráficos según los aspectos o detalles que queramos resaltar.
Variables cualitativas: Barras, circular, columnas, anillos,.. Variables cuantitativas: Histograma (que aparece en Herramientas Analizar Datos) 2 variables cuantitativas: Dispersión XY 2 variables cualitativas: columnas en espacio tridimensional Una vez obtenido el gráfico, luego se puede editar y cambiar los aspectos de formato que nos interese: (rótulos, colores, rejillas, escalas, etc...). Incluso se le pueden añadir rótulos de textos, flechas o figuras, etc... Ejercicio 1 Construye un gráfico de sectores de la variable provin del archivo ambiente.xls. Construye un diagrama de barras de la variable edad del archivo alumnos. 3. Excel para analizar datos calculando las fórmulas Es importante rotular y disponer de manera clara y ordenada los cálculos. Esto facilita su posterior uso e incluso la revisión de los procedimientos si se detectan errores. Como ya se ha indicado, una celda puede contener un text, un número o una fórmula. Para crear una fórmula empezamos tecleando en una celda, por ejemplo la C1, el símbolo =, y la operación que deseamos realizar. Puede ser un simple cálculo matemático: =7+5, y nos da un resultado 12. Pero puede ser una fórmula =A1+B1. Si en la celda A1 hay un 7 y en la B1 un 3, aparecerá el mismo resultado 12, sin embargo ya no es un número, sino una fórmula. Esto tiene dos implicaciones importantes: 1.- Si cambian los valores de las celdas A1 y B1, cambia el resultado en C1 obteniendo la suma de los nuevos números. 2.- Cuando copio la celda C1 a otra celda, no copio el valor, sino la fórmula. Aunque aparentemente a la vista sólo veamos un número en la celda, al copiar esa celda lo que copio no es el resultado, sino la fórmula. Al copiar, cuando nos desplazarnos hacia la derecha-izquierda (por columnas manteniéndonos en la misma fila) en la hoja de cálculo, la fórmula se desplaza en letras. Sin embargo, cuando nos desplazarnos hacia la arriba-abajo (por filas manteniéndonos en la misma columna) en la hoja de cálculo, la fórmula se desplaza en números. Podemos indicarle en la fórmula que mantenga fijo la fila, la columna o ambas. Para ello deberemos anteponer el símbolo $ antes de la letra (columna), o antes del número (fila) o antes de las dos (fila y columna, es decir celda) de la identificación de la celda. Algunas de las operaciones matemáticas que puede hacer son: Suma =..+.. División =.. /.. Elevar al cuadrado =..^2 Elevar a potencia n =..^n Raiz =raiz(..) Calcular valor absoluto =abs(..) Calcular raíz n-esima=... ^(1/n) Calcular logaritmos =LN(..) Etc.. Sumar un rango de valores con la autosuma (=suma(..), ó símbolo ) Conviene, en la medida de lo posible, formular los cálculos indicando la posición dentro de la hoja (celdas) y no los valores (números). Eso nos permitirá hacer ejemplos similares con muy poco esfuerzo, cambiando sólo los datos de partida y aprovechando toda la estructura de cálculos a partir de ellos.
Ejercicio 2 Considerar los datos siguientes: 3,4,5,2,3,4,5,6,4,7 Calcula la media, rango, desviación estándar, los cuartiles, rango intercuartílico y los percentiles 30 y 80.. 4. Calculos en excel aplicando funciones. Usando las funciones podremos calcular: máximo y mínimo valor, recuento de frecuencias, promedios, cuantiles, mediana, moda, media armónica, geométrica, media recortada, varianza y desviación típica, medidas de forma, etc... También podemos calcular algunos estadísticos bidimensionales: covarianza, correlación, estimación lineal, estimación logarítmica, tendencia, pronóstico, etc. En el menú insertar, seleccionar la opción función, seleccionar la categoría de Estadísticas y dentro de ellas la que interese. A continuación habrá que rellenar el cuadro de diálogo.
La función promedio, permite calcular la media aritmética. Aparece en la parte inferior del cuadro de diálogo una breve descripción de la función, y permite solicitar más información sobre ella en Ayuda sobre esta función. Ejercicio 3 Crea una nueva variable en la hoja alumnos que tenga las siguientes notas: SUSPENSO, APROBADO, NOTABLE, SOBRESALIENTE, MH Calcula cuantós alumnos hay en cada caso. 5. Uso de la herramienta analizar datos. Es un complemento que no suele instalarse por defecto. Si en el menú Herramientas no aparece; habrá que instalarlo. El proceso sería: Herramienta + Complementos + Análisis de Datos. (Es posible que pida el disco de instalación del Office).
Una vez instalada, permite llevar a cabo análisis estadísticos básicos como: El procedimiento para realizar dichos análisis es rellenar los cuadros de diálogo. Habrá que señalar el rango de entrada, indicarle si está en filas o columnas y si la primera celda corresponde al rótulo de la variable o no. Habrá que señalar también el rango de salida, y seleccionar la opción resumen de estadísticas.
En este caso habrá que señalar el rango de entrada que contiene los valores de la variable (se trata de distribuciones de frecuencias unitarias). El rango de clases que es un conjunto de celdas donde se indican los extremos superiores del intervalo. Pareto, ordena las clases o intervalos por la frecuencia de los mismos. Porcentaje acumulado calcula las frecuencias acumuladas. Todo ello se puede representar gráficamente marcando la opción crear gráfico. El objetivo en este curso no es aprender dominar el programa Excel, sino utilizar Excel como apoyo en los cálculos que requiere la Estadística Descriptiva. Existe abundante bibliografía sobre el programa informático Excel, que puede resultar de utilidad para el estudiante, y también hay libros de ejercicios de estadística descriptiva resueltos con Excel. Ejercicio 4 Crea un histograma de la variable sulfato 4. Ejercicios complementarios 1. Abre el archivo coches.xls y examina sus variables. 2. Calcula la moda, mediana, del consumo medio de todos los coches. 3. Calcula el consumo medio y la mediana de los coches de 4 cilindros. 4. Obtén los percentiles 80,90 y 95 y los cuartiles de los consumos de los coches con 8 cilindros. 5. Construye un diagrama de dispersión de cilindrada (en cc) en abscisas y consumo (litros/100 Km) en ordenadas. 6. Construye un histograma del peso de los coches. Superpón una curva normal. 7. Construye un diagrama de barras de la potencia media (en CV) de los coches según su origen. 8. Construye un gráfico de sectores para ver las proporciones de coches en la muestra según su origen.