Introducción a la estadística Profa. Bárbara González COMU
Puerto Rico Características Sociales Seleccionadas en Puerto Rico: 2005-2009 Conjunto de Datos: Encuesta sobre la Comunidad de Puerto Rico del 2005-2009 -- Estimados de 5 Años Encuesta: Encuesta sobre la Comunidad de Puerto Rico Social - Educación, Estado Civil, Parentesco, Fecundidad, Abuelos... Económico - Ingreso, Empleo, Ocupación, Viaje al trabajo... Vivienda - Ocupación y Estructura, Valor de la Vivienda y Costos, Servicios Públicos... Demográfico - Sexo y Edad, Raza, Origen Hispano, Unidades de Vivienda... Narrativo - Perfil con texto y gráficas para análisis fácil http://factfinder.census.gov/ http://www.censo.gobierno.pr/
Definición de estadística La estadística es considerada como un método para tratar datos numéricos. Es un instrumento que se orienta a la recolección, organización, y análisis de datos numéricos o de observaciones. (Haber y Runyon, 1973) Infiere: partiendo de casos particulares, se producen conocimientos generales.
estadística La estadística intenta explicar la variación. Infiere propiedades de la variación a partir de la muestra.
Tipos de estadística La estadística se subdivide en: Estadística Descriptiva: describe y resume un cuerpo de información. Los datos pueden resumirse estadísticamente (moda, media, desviación estándar) o pueden representarse gráficamente(histograma, gráfica de barras, pie chart) Estadística Inferencial: proceso de llegar a generalizaciones acerca del todo (llamado población) examinando una porción (llamada muestra). Le interesa conocer cuán confiable es la magnitud de las diferencias en la variabilidad.
Ejemplos de Tipos de Estadística Descriptiva: la información que se obtiene de una encuesta. (Ej. Un 25% de las personas encuestadas contestó que estaba a favor del cierre de los negocios de bebidas alcohólicas en la madrugada.) Inferencial: Si de esa información se extrapola resultados para Inferencial: Si de esa información se extrapola resultados para todos los ciudadanos(por ejemplo, decir que dada la muestra, un 30% de la población de Puerto Rico apoya el cierre. con unmargendeerrorde.05%yun95%deconfiabilidad).
Quiénes usan la estadística? Organismos gubernamentales. Diarios y revistas. Políticos. Deportes. Marketing. Control de calidad. Administradores. Investigadores científicos. Médicos etc.
Abusos que se pueden cometer con la Estadística Conclusiones erróneas debido a que los datos son numéricamente insuficientes. Representaciones gráficas engañosas (escalas). Datos muestrales no representativos: Muestra que no incluye a elementos de toda la población. Ciertas categorías de personas no responden correctamente. Respuestas voluntarias (sesgadas).
Caso Un investigador concluye que las mujeres en el primer año de universidad tienen un mayor coeficiente intelectual que los hombres. Para esto somete a 5 mujeres y 5 hombres de primer año de universidad a una prueba de IQ y encuentra que la media de las mujeres es de 110 y la de los hombres es de 102. La conclusión del investigador es correcta?, La variabilidad de estos datos es significativa o no?, Se pueden hacer inferencias de muestras no probabilísticas?
Estadísticas Descriptivas Distribuciones: Ordenación de los datos para observar como se distribuyen. Distribución de Frecuencias Número de veces que aparece un valor observado
Tabla 1 Frecuencia de personas que usan el tren urbano provenientes de los pueblos cercanos. Pueblo Frecuencias Por ciento % Bayamón 250 Cantidad 29.24 San Juan 230 de casos 26.90 Toa Baja 200 23.39 Dorado 175 20.47 Total 855 % = Frecuencia / total * 100 250/855*100=29.24%
Ejercicio: Busque la frecuencia para cada alimento y Obtenga el % Arroz Pollo Cerdo Cerdo Ensalada Pasta Arroz Pasta Pollo Cerdo Pollo Cerdo Pasta Pavo Cerdo Pasta Arroz Pollo Arroz Arroz Cerdo Cerdo Pasta Pasta Pollo Arroz Cerdo Pollo
Tablade frecuencias Concepto Frecuencias Por ciento %
Estadísticas Descriptivas: Medidas de Tendencia Central Busca los valores que se ubican en el centro de distribución permitiendo hacer comparaciones. Muestra en qué lugar se ubica la persona promedio o típica del grupo. Sirve como un método para comparar o interpretar una puntuación particular en relación con la puntuación total. Compara el puntaje obtenido por una misma persona en dos diferentes ocasiones. Compara los resultados medios obtenidos por dos o más grupos.
Estadísticas descriptivas
Las medidas de tendencia central más importantes son: Media. Mediana. Moda.
Media aritmética Es la suma de todas las observaciones dividida entre el número total de observaciones. Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia) Toma en consideración todos los valores de la distribución bajo estudio, se afecta por valores extremos.
Cálculo de la media aritmética Con distribuciones de frecuencia agrupadas Ejemplo calificaciones: Puntos del examen 1 = 25/50 = 50% Puntos del examen 2 = 45/50 = 90% Puntos del examen 3 = 35/40 = 88% Total de % 228 dividido por 3 = 76%
Otro ejemplo de la media Frecuencia de los valores de la variable Valores de la variable La media X barra Suma de todas las observaciones Num. calificaciones Ref. Haber/Runyon : Estadística General
Ejercicio: Busca la media de los siguientes números Horas a la semana dedicadas al uso de la computadora: 25 15 28 29 25 26 21 26
Mediana Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente. Divide al conjunto de datos en dos partes iguales. No se afecta por valores extremos, por lo que representa de forma más fiel las características del objeto de estudio en cuanto a la tendencia central.
Para calcular la mediana se ordenan los números de menor a mayor y luego se busca el punto medio. Le mediana sería el valor que ocupa la posición n + 1 / 2
Ejercicio:Calculala mediana de los siguientes números 3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29
Ejercicio:Calculala mediana de los siguientes números 3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12, 56, 23,
Moda Observación o clase que tiene la mayor frecuencia (el mayor número de casos) en un conjunto de observaciones. Es el valor que más se repite. Pueblo Frecuencias Por ciento % Bayamón 250 29.24 Carolina 230 26.90 San Juan 200 23.39 Caguas 175 20.47 Total 855 No se afecta por valores extremos
Ejercicio: Busca la Moda Pepsi Coca Cola Coca Cola Pepsi Sprite Coca Cola Coca Cola Coca Cola Sprite Pepsi Coca Cola Sprite Sprite Pepsi Pepsi
INTERPRETACIÓN DE LOS DATOS
Obama
P.430
Ver video: Asignación Medidas de Tendencia Central y Dispersión Excel http://www.youtube.com/watch?v=jstposlt_y http://www.youtube.com/watch?v=jstposlt_y I&feature=related
Presentación de los datos Género Hombre 4 Frec. 7 6 5 4 3 Mujer 6 2 1 0 Hombre Mujer Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentesde presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.
Tablas de frecuencia Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca). Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas Sexo del encuestado Válidos Hombre Mujer Total Porcentaje Frecuencia Porcentaje válido 636 41,9 41,9 881 58,1 58,1 1517 100,0 100,0 Nivel de felicidad Válidos Perdidos Total Muy feliz Bastante feliz No demasiado feliz Total No contesta Porcentaje Porcentaje Frecuencia Porcentaje válido acumulado 467 30,8 31,1 31,1 872 57,5 58,0 89,0 165 10,9 11,0 100,0 1504 99,1 100,0 13,9 1517 100,0
Tipos de variables Cuantitativas o Numéricas Si sus valores son numéricos (representan las diferencias de los participantes bajo estudio) Discretas: Si toma valores enteros. No tienen punto decimal. Número de hijos, Número de cigarrillos, Num. de cumpleaños Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Por lo regular tienen punto decimal. Altura, Presión intraocular, Dosis de medicamento administrado, edad
Tipos de Escala Nominales: Sus valores no se pueden ordenar porque identifican particularidades y no cantidades. (Cualitativas) Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No), Actitud a favor o en contra Ordinales: Sus valores se pueden ordenar porque refleja el orden de los sujetos bajo estudio, pero no mide la magnitud de las diferencias) Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor, actitud (fuertemente a favor, moderadamente a favor, moderadamente en contra, fuertemente en contra) Deben presentarse de forma ordenada. 38
Tipos de Escalas Intervalos: Sus números reflejan tanto el orden como la magnitud de las diferencias entre los sujetos. Pero carecen de 0 absoluto, lo que impide comparaciones entre sujetos. Ejemplo: IQ, temperatura. Juan tiene un IQ de 50 y Pedro de 100 (Se puede decir que Pedro es más inteligente que Juan, pero no que Pedro es el doble de inteligente que Juan. Razones: Igual a la de intervalo pero estas si tienen 0 absoluto. Ejemplo: peso, tiempo, sonoridad, longitud. Se pueden hacer comparaciones. Juan pesa 100 y Pedro 200, Pedro es el doble de pesado que Juan.
Representación gráfica de los datos: Diagramas barras para v. nominales u ordinales (discretas) Se deja un hueco entre barras. diagramas de barras
Representación gráfica de los datos: Histograma Histogramas para v. continuas (intérvalo) El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Representación gráfica de los datos: Polígono de frecuencias
Representación gráfica de los datos: ojiva
Representación gráfica de los datos: Diagrama circular (Pie Chart) No se usa con variables ordinales
Representación gráfica de los datos: Pictogramas
http://www.spssfree.com/spss/analisis4.html
Aprendiendo con YouTube Estadística Inferencial http://www.youtube.com/watch?v=i0fqjizduo4 Estadística descriptiva http://www.youtube.com/watch?v=lexatrv3tce&feature=cha nnel
Programas para calculosestadisticos http://www.softonic.com/s/calculos-estadistica http://www.openepi.com/menu/openepimenu.htm Estadisticas básicas con Excel http://www.youtube.com/watch?v=q3lr_cfgvs4 Guía de SPSS 15 http://www.um.es/ae/soloumu/pdfs/pdfs_manuales_spss/sps S%20Brief%20Guide%2015.0.pdf
Datos cualitativos Ver: http://www.youtube.com/watch?v=_7txexwpgj Y
Enfoque Cualitativo Busca obtener datos de personas, comunidades, contextos, situaciones Los datos son conceptos, percepciones, imágenes mentales, creencias, emociones, interacciones, pensamientos experiencias. La finalidad de los datos es analizarlos y comprenderlos para responder a la pregunta de investigación. Busca entender significados, razones del comportamiento. No se reducen a números para ser analizados estadísticamente.
Cuál es el instrumento de recolección de datos cualitativos? El propio investigador: recoge los datos, los analiza, genera las respuestas para entender el fenómeno estudiado. No se utilizan pruebas estandarizadas, ni No se utilizan pruebas estandarizadas, ni cuestionarios, ni un sistema de medición.
Tipos de unidades de análisis (Lofland y Lofland, 1995) Significados: definiciones, estereotipos, ideologías, reglas, normas. Prácticas: rituales, hábitos Episodios: eventos críticos como el divorcio, el 11 de sept. Encuentros: una reunión, una consulta médica Papeles: roles de cada cual Relaciones: - vínculos- íntimas, paternales, filiales
Tipos de unidades de análisis Grupos: conjunto de personas con metas y que se consideran así mismos una entidad: familia, redes, equipos de trabajo Organizaciones: Unidades formadas con un fin colectivo, se analiza su origen, cultura, rol, control, jerarquías Comunidades: Asentamientos en territorios reales o virtuales pueblo o ciudad Subculturas: porciones de la comunidad que se organizan bajo una idea particular roqueros, cocolos, cibercultura Estilos de vida: estilos adoptados por la clase social
Rol del investigador Supervisor Lider Amigo Debe minimizar su influencia sobre los participantes. Debe obtener información tal cual los participantes la revelan.
Analisisde datos cualitativos Los datos recolectados hay que interpretarlos Cada estudio requiere de un esquema propio a diferencia de los datos cuantitativos. Hay un plan básico pero en el camino va sufriendo modificaciones de acuerdo a los resultados y la necesidad. Se usan categorías Se buscan semejanzas y diferencias Las observaciones del investigador son tomadas en cuenta. La reflexión continua se hace necesaria. Las observaciones se enfocan en la solución del problema.
Ejercicio: Qué datos puedes obtener del texto? A las 8:30 pm se encontraba a muchos kilómetros del lugar del crimen. Su novia puede manifestarlo, ya que estuvo al cine con ella, aunque no recuerda exactamente el nombre de la sala ni el de la película, pero sí recuerda que era una película de misterio, ya que son sus preferidas. Sobre la ocupación del arma blanca que llevaba en el momento de la detención, mantiene que la compró la semana pasada en el pulguero de los sábados de la localidad de Carolina, ya que le gusta llevar navaja por temor a ser asaltado por atracadores, pues en una ocasión le robó un negro.
Ejemplos http://es.scribd.com/doc/53505901/ejemplo- Analisis-de-Contenido http://www.ejemplode.com/11- escritos/1568- ejemplo_de_analisis_de_contenido.html