Qué es la estadística? Objetivos Que deberían saber al terminar esta clase: Que queremos significar por estadística Que entendemos por estadística descriptiva e inferencial. Que es una población y que una muestra. Que es una variable, el dato y los datos Cuando la información se refiere a un parámetro y cuando a una estadística Distinguir cuando una variable es cualitativa y cuando cuantitativa. Distinguir entre una variable discreta y continua. Distinguir las distintas escalas de medición nominal, ordinal, de intervalo y de razón Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 1
Qué es la estadistica? Estadística es la ciencia de: Recolectar Describir Organizar Interpretar Datos para transformarlos en información, para la toma mas eficiente de decisiones. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 2
Quienes usan la estadística? Organismos oficiales. Diarios y revistas. Políticos. Deportes. Marketing. Control de calidad. Administradores. Investigadores científicos. Ingenieros. Médicos etc. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 3
Tipos de Estadística Estadística Descriptiva: Método de recolectar, organizar, resumir y presentar los datos en forma informativa. Ejemplo 1: Los datos del Censo de población de 2001. Ejemplo 2: La cantidad de robos ocurridos el último mes en en el municipio. Ejemplo 3: La cantidad de pacientes atendidos en el Hospital municipal el último año. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 4
Tipos de Estadística Estadística inferencial: Métodos usados para determinar algo acerca de la población, basado en una muestra. Población (1) es la colección, o conjunto, de individuos, objetos o eventos cuyas propiedades serán analizadas. Muestra es un subconjunto de la población de interés. (1) Algunos autores utilizan Universo como sinónimo Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 5
Población y Muestra Población Muestra Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 6
Parámetro y Estadística Parámetro: Valor numérico que resume todos los datos de una población completa. Se utilizan letras griegas para simbolizar un parámetro como ser y. Ejemplos: La calificación promedio del secundario en el momento de admisión de todos los estudiantes que han asistido alguna vez a la Universidad de Lujan o la proporción de estudiantes cuyo lugar de origen era distinto del partido de Lujan. Estadística: Valor numérico que resume los datos de una muestra. Se utilizan letras del alfabeto español para simbolizarlas como ser x y s. Ejemplo: La edad promedio registrada en una encuesta de 150 consumidores de choripanes. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 7
Tipos de Estadística (ejemplos de estadística inferencial) Ejemplo 1: Una encuesta desarrollada por IBOPE, en marzo 2002, dice que el rating de radio en el Gran Buenos Aires esta encabezado por FM 98.3 MEGA con un 1.5% seguido por FM 95.9 ROCK & POP con 1.18% Ejemplo 2: De acuerdo con una encuesta desarrollada por Prince & Cook sobre telefonía residencial en el 2001, el gasto mensual promedio por cliente es de $90.30. A nivel nacional. Ejemplo 3: El INDEC informó que la Encuesta Permanente de Hogares (EPH) del mes de mayo de 2002 reporto la tasa mas alta de desempleo que ascendió al 24.3% a nivel nacional Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 8
Variable Variable: Característica de interés sobre cada elemento individual de una población o muestra. Dato: Valor de la variable asociada a un elemento de la población o muestra. Este valor puede ser un número, una palabra o un símbolo. Ejemplo: La familia González tiene 4 miembros, sus ingresos mensuales son de $685, 2 son de sexo femenino y 2 masculino. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 9
Variable (cont.) Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la población o muestra. Ejemplo1: El conjunto de 54 cantidad de miembros recolectados de 54 familias residentes en Escobar. Ejemplo2: El conjunto de las calificaciones de los 43 estudiantes de estadística de la carrera de Sistemas Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 10
1-7 Tipos de Variables Cualitativa o de Atributos Clasifica o describe un elemento de la población. Los valores que puede asumir no constituyen un espacio métrico, por lo tanto las operaciones aritméticas, como sumar y obtener promedios, no son significativas. Ejemplos: Sexo, Nacionalidad, Marcas de auto, Grado de Satisfacción con la Universidad, etc.. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 11
Tipos de Variables(cont.) Cuantitativa o Numérica Cuantifica un elemento de la población. Los valores que puede asumir constituyen un espacio métrico, por lo tanto las operaciones aritméticas, como sumar y obtener promedios,son significativas. Ejemplos: Cantidad de Habitaciones, Número de hijos, Kilómetros recorridos, Tiempo de vuelo, Ingreso, etc.. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 12
1-9 Tipos de Variables(cont.) Las variables cuantitativas se pueden clasificar a su vez en discretas or continuas. Cuantitativas Discretas: solo pueden asumir ciertos valores y normalmente hay huecos entre ellos. Son conteos normalmente. Ejemplo1: cantidad de materias aprobadas.(1, 2,3...) Ejemplo2: cantidad de hijos (1, 2, 3,4...) Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 13
1-9 Tipos de Variables(cont.) Las variables cuantitativas se pueden clasificar a su vez en discretas or continuas. Cuantitativas Continuas: puede asumir cualquier valor dentro del rango de medición. Normalmente se miden magnitudes como ser longitud, superficie, volumen, peso, tiempo, dinero Ejemplo 1: Peso al nacer. Ejemplo 2: Salario de un empleado Ejemplo 3: Tiempo de viaje en ómnibus entre Escobar y LujanC Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 14
1-12 Escalas de Medición Las variables cualitativas se miden en escala nominal o ordinal. Nominal: los elementos solo pueden ser clasificados en categorías pero no se da un orden o jerarquía Ejemplo 1: Barrio de residencia de los alumnos. Ejemplo 2: Color de ojos Ejemplo 3: Simpatizante de un club de futbol Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 15
1-12 Escalas de Medición Las variables cualitativas se miden en escala nominal o ordinal. Ordinal: los elementos son clasificados en categorías que tienen un orden o jerarquía, la diferencia entre valores no se pueden realizar o no son significativas. Ejemplo 1: Grado de satisfacción en el uso de un servicio público. Ejemplo 2: Ocupación Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 16
Escalas de Medición Las variables cuantitativas se miden en escala de intervalo o razón. Intervalo: los elementos son clasificados en categorías que tienen un orden o jerarquía, la diferencia entre valores se pueden realizar y son significativas. La diferencia entre dos valores consecutivos es de tamaño constante y no existe el 0 absoluto. Ejemplo: Temperatura en grados Celsius Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 17
Escalas de Medición Las variables cuantitativas se miden en escala de intervalo o razón. Razon: los elementos son clasificados en categorías que tienen un orden o jerarquía, la diferencia entre valores se pueden realizar y son significativas. Existe el 0 absoluto, es decir la ausencia de la variable medida. Ejemplo 1: Tiempo de vuelo. Ejemplo 2: Ingresos familiares Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 18
Resumen de Tipos de variables y Escalas de Medición Variables Cualitativa o Atributo Cuantitativa o Númerica Escala de medición Escala de medición Nominal Ordinal Intervalo Razón Discreta Continua Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 19
Análisis exploratorio de datos Objetivos Que deberían saber al terminar esta clase: Que queremos significar por análisis exploratorio de datos Que es una tabla de frecuencias Que es una tabla de doble entrada Que tipos de gráficos hay y como usarlos Como hacer una tabla de distribución de frecuencias y un histograma. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 20
Análisis Exploratorio de Datos El análisis exploratorio es un análisis diferente, ya que el mismo explora datos en lugar de usar análisis estadísticos para confirmar suposiciones hechas acerca de ellos. Para ello utiliza Tablas y Gráficos Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 21
Comparación entre la Estadística tradicional y el Análisis exploratorio Análisis exploratorio de datos Es usado para explorar datos a un nivel preliminar Ninguna o pocas suposiciones son hechas con respecto a los datos Tiende a involucrar cálculos relativamente simples y gráficos Estadística Tradicional Es usado para confirmar conclusiones acerca de los datos Requiere típicamente algunos pocos pero importantes supuestos acerca de los datos Los cálculos son a menudo complejos y los gráficos pueden resultar innecesarios Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 22
Como hacer una tabla o un gráfico Las tablas siguen siendo el primer paso a dar en la organización de datos Dichos datos pueden ser mejor representados mediante gráficos. Título y fuente, no deben faltar nunca. El título responde siempre a las siguientes preguntas: Qué; cómo; dónde y cuándo? Fuente: se debe especificar el origen de los datos Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 23
Tipos de tablas Una tabla es una ordenación de datos en filas y columnas utilizada para documentar o comunicar información Pueden ser: Generales o de referencia Especifica o de resumen. De doble entrada. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 24
Elementos de una tabla Encabezamientode filas Encabezamiento de columnas (Filas) Cuerpo de la * * * tabla (Filas) * * * * (Filas) * * * * Columna Matriz Columna de información Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 25
Tipos de Gráficos El objeto de un gráfico es el de proveer un resumen visual de los datos Pueden ser: Exploratorios Analíticos Instrumentales Ilustrativos Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 26
Tablas vs Gráficos Los gráficos están pensados para que sean más fáciles de leer que las tablas. En general, si se desea comunicar aspectos cuantitativos (la información está expresada en números) los gráficos resultarán de poca utilidad. Si los resultados que se quieren destacar son: Tendencias Relaciones entre distintas variables los gráficos ayudarán más que las tablas. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 27
Caso estudio Los siguientes puntajes representan el número de tomates rechazados en un día en un mercado mayorista. Los puntajes corresponden a 50 días seleccionados aleatoriamente: 29 58 80 35 30 23 88 49 35 97 12 73 54 91 45 28 61 61 45 84 83 23 71 63 47 87 36 8 94 26 95 63 86 42 22 44 88 27 20 33 28 91 87 15 67 10 45 67 26 19 Construya un tabla de frecuencias con 10 clases. Construya un histograma que corresponde a la tabla anterior, Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 28
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 29
Análisis de Datos Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 30
Análisis de Datos Histograma Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 31
Histograma Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 32
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 33
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 34
Prom edio de precio Ejemplos Cotización diaria de las acciones de una multinacional en tres países latinoamericanos en 20 días del mes de Mayo de 2002 Día Cotización de acciones Promedio de los países Desvío Standard de las cotizaciones A B C 1 2 6 7 5,00 2,65 2 1 5 8 4,67 3,51 3 16 1 8 8,33 7,51 4 3 1 7 3,67 3,06 5 1 6 26 11,00 13,23 6 4 5 8 5,67 2,08 7 1 10 2 4,33 4,93 8 6 9 8 7,67 1,53 9 3 12 9 8,00 4,58 10 12 5 8 8,33 3,51 11 9 6 4 6,33 2,52 12 1 8 7 5,33 3,79 13 15 14 9 12,67 3,21 14 3 4 7 4,67 2,08 15 12 15 18 15,00 3,00 16 15 8 7 10,00 4,36 17 16 13 8 12,33 4,04 18 9 7 10 8,67 1,53 19 6 4 8 6,00 2,00 20 3 7 6 5,33 2,08 18.00 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 Gráfico lineal combinado con grafico de medias y error típico de la serie para cada promedio de las cotizaciones de una multinacional en el tiempo 0.00 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Cotización de las distintas acciones Gráfico para explorar tendencia y variabilidad Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 35
Histograma - Diagrama de Pareto Se tienen datos de 20 sucursales en referencia al tiempo de auditoría en días Tiempo de auditorías de fin de año (días) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13 Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 36
Medidas de posición para variables cuantitativas Objetivos Que deberían saber al terminar esta clase: Qué es el valor mínimo y el máximo Qué es la moda o modo y como se interpreta Qué es la mediana y como se interpreta. Qué son los percentiles, deciles, quintiles y cuartiles y como se interpretan. Que queremos significar por media aritmética ó promedio Cuales son las propiedades de media. Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino 37