M. Wiper Estadística 1 / 17 Datos bivariantes: tablas de doble entrada y resumenes grácos Michael Wiper Departamento de Estadística Universidad Carlos III de Madrid
M. Wiper Estadística 2 / 17 Objetivo Ilustrar como construir la tabla de frecuencias y los métodos grácos más comunes para resumir una muestra de datos bivariantes.
M. Wiper Estadística 3 / 17 Tablas de doble entrada La manera habitual de resumir una muestra de datos bivariantes, cualitativas o discretas es a través de una tabla de doble entrada. n ij representa el número de veces que se observa la pareja X = x i e Y = y j.
M. Wiper Estadística 4 / 17 Tablas de doble entrada La tabla muestra las frecuencias de los distintos tipos de delitos contra la seguridad en las provincias gallegas en 2013. Luego, en Lugo se cometieron 474 delitos contra la seguridad vial.
M. Wiper Estadística 5 / 17 Frecuencias relativas Se puede construir la tabla de doble entrada con frecuencias relativas: Aquí f ij = n ij /n.
M. Wiper Estadística 6 / 17 Frecuencias relativas Luego un 9.2 % de los delitos cometidos en Galicia son delitos contra la seguridad vial en Lugo.
M. Wiper Estadística 7 / 17 Frecuencias condicionadas En muchos casos es más interesante ver las frecuencias condicionales. Aquí f i j = n ij /n.j = f ij /f.j representa la proporción de valores X = x i cuando Y = y j.
M. Wiper Estadística 8 / 17 Frecuencias condicionadas Un 80.9 % de los delitos cometidos en Lugo eran en contra de la seguridad vial.
M. Wiper Estadística 9 / 17 Diagramas de barras agrupadas Si el objetivo es comparar los números de delitos entre las distintas provincias empleamos un diagrama de barras agrupadas a través de las frecuencias originales. Observamos que en Pontevedra y A Coruña, hay más delitos de todos tipos.
M. Wiper Estadística 10 / 17 Diagramas de barras apiladas Si el objetivo es ver si la distribución de los distintos tipos de delitos diere entre provincias, usamos un diagrama de barras apiladas basado en la tabla de frecuencias condicionales. En este caso, la distribución de los distintos tipos de delito es muy parecida en todas las provincias salvo Lugo donde otros delitos contra la seguridad colectiva parece asumir más importancia.
M. Wiper Estadística 11 / 17 Otros grácos estadísticos Diagramas de caja múltiples: para una variable continua y una cualitativa. Diagrama de dispersión: para mostrar el tipo de relación entre dos variables cuantitativas. Grácos para series temporales: para mostrar cambios en una variable en el tiempo. Cartogramas: para mostrar los cambios en una variable en distintas localizaciones geográcas. Mapas de crimenes: para mostrar sitios donde ocurren delitos.
M. Wiper Estadística 12 / 17 Diagramas de caja múltiples Son apropiadas para mostrar la relación entre una variable categórica y una variable continua. El gráco muestra las tasas de los distintos tipos de crimenes (de m = murder a mvt = motor vehicle theft) en los estados del EEUU. El delito más perpetrado es lt = larceny theft.
M. Wiper Estadística 13 / 17 El diagrama de dispersión Para ilustrar la relación entre dos variables cuantitativas, el gráco más natural es el diagrama de dispersión. Aquí se observa la relación entre hectáreas quemadas y tamaño de provincia con alguna observación atípica.
M. Wiper Estadística 14 / 17 Grácos para series temporales A menudo, se observan los valores de una variable cuantitativa en varios momentos distíntos, y se quiere ver si hay una relación de la variable con el tiempo. En este caso, el gráco más natural es un gráco temporal:
M. Wiper Estadística 15 / 17 Cartogramas Son utilizadas para comparar los valores relativos de una variable en distintas regiones geográcas.
M. Wiper Estadística 16 / 17 Mapas de la criminalidad Son mapas indicando los sitios donde crimenes han ocurrido. Abajo se ven las localizaciones donde se han robado turistas en Barcelona. Ayudan en saber dónde colocar más agentes...
M. Wiper Estadística 17 / 17 Resumen y siguiente clase Se han ilustrado algunos de los grácos más utilizados para resumir una muestra de datos bivariantes. En la siguiente sesión, veremos como medir si dos variables están relacionadas de manera lineal.