Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial

Documentos relacionados
478 Índice alfabético

Asignatura: Metodologías de investigación. Tema 6. Exploración de datos. Exploración de datos

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Técnicas Cuantitativas para el Management y los Negocios

GUIA DOCENTE ESTADISTICA

Análisis de datos y gestión n veterinaria. Tema 1 Estadística descriptiva. Prof. Dr. José Manuel Perea Muñoz

Nota de los autores... vi

U ED Tudela Introducción al Análisis de Datos - Tema 5

ÍNDICE. Prefacio... xi

INDICE. Prologo Introducción El sistema SPSS Análisis estadístico con el SPSS Estadista avanzada Guía de lectura Parte I Programación

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

2. ESTADÍSTICA DESCRIPTIVA 15 Estadística descriptiva.. Variables aleatorias Descripción de variables cuantitativas

Itinerario de la asignatura: Primer curso. Primer Semestre. Curso académico: Créditos: 10,5

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

Repaso Estadística Descriptiva

Estadística Descriptiva II: Relación entre variables

Introducción a la Estadística Aplicada en la Química

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

Información general. Fundamentos de Análisis de datos. Obligatoria básica o de fundamentación X. Obligatoria profesional

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

INDICE. Prólogo a la Segunda Edición

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO

y = 2, entonces: a) x es más dispersa que y. b) son igual de dispersas. 9.- Sean dos variables estadísticas x e y con los siguientes valores x = 5, σ

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

4. Obtén las siguientes tablas de doble entrada para las variables Dispersión y Formación:

9.- Análisis estadísticos con R Commander

El Método Científico. Metodología de Investigación. Te sifón Parrón

Inferencia Estadística. Pruebas paramétricas y no paramétricas. Análisis de datos

1 de 12 15/07/ :49

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

Teoría de la decisión

U ED Tudela Introducción al Análisis de Datos - Tema 4

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

Estadística Descriptiva en SPSS

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

FACULTAD DE MEDICINA Y CIENCIAS DE LA SALUD ESCUELA PROFESIONAL DE TECNOLOGÍA MÉDICA

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Correlaciones bivariadas y parciales

Tema 9: Estadística descriptiva

Prefacio... xvii. 1 La imaginación estadística... 1

Diagnóstico. Dirección de Cómputo para la Docencia. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Dirección General de Servicios de Cómputo Académico

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

Elaboró: Luis Casas Vilchis

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 5) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

SIGNIFICACIÓN ESTADÍSTICA DE LA DIFERENCIA ENTRE 2 MEDIAS

ESTADÍSTICA APLICADA A LA MEDICINA LABORAL

INTRODUCCIÓN. Fenómeno Real. Aprendizaje sobre el fenómeno. Análisis Estadístico. Datos Observados

Variables y Elementos medibles en Estadísticas

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA

Preparación examen PIR Diseños Experimentales, Estadística y Psicometría

TEMA 5 Estadística descriptiva. Análisis de datos

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

Técnicas de Investigación Social

BIOSESTADÍSTICA AMIGABLE

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

UNIDAD DIDACTICA I TEMA 1. LA MEDIDA EN PSICOLOGIA

Part I. Descripción estadística de una variable. Estadística I. Mario Francisco. Conceptos generales. Distribuciones de frecuencias.

Estadística Aplicada a la Educación

Sumario Prólogo Unidad didáctica 1. Introducción a la estadística. Conceptos preliminares Objetivos de la Unidad...

ÍNDICE. Introducción... Capítulo 1. El proceso del control de calidad. Metodologías... 1

Lucila Finkel Temario

Prueba T de Student. Descripción de la Prueba T de student. Proceso de cálculo. Criterios de la prueba T de student

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

LECCIÓN PÚBLICA. Tema 2 Medidas de Tendencia Central, Posición y Variabilidad. Profa. María Fátima Dos Santos

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Fundamentos de Estadística

TEMA 14 ESTADÍSTICA. Cuantitativa: si puede medirse y expresarse con números (es una variable), por ejemplo la talla de calzado.

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

Curso: 4 Créditos ECTS: 6 Tipo de asignatura: Optativa Tipo de formación: Teórico-práctica

3.2. Desviación Media

Estadística Descriptiva 2da parte

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

Estadística Inferencial. Estadística Descriptiva

Julio Deride Silva. 18 de agosto de 2010

Elaboró: Luis Casas Vilchis

Prueba de Evaluación Continua Grupo A 26-XI-14

ALGUNOS CONCEPTOSBÁSICOS DE PROBABILi~TlCA 57

Titulación(es) Titulación Centro Curso Periodo Grado de Fisioterapia FACULTAT DE FISIOTERÀPIA 1 Primer cuatrimestre

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

ESTADÍSTICA Camerina Laura Ramírez Gallegos

--- - R '"

Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

EDUCACIÓN SOCIAL INVESTIGACIÓN EN EDUCACIÓN SOCIAL OBLIGATORIA. 9 CRÉDITOS: (6 teóricos y 3 prácticos)

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

TEMA 1: ESTADISTICA DESCRIPTIVA

Análisis descriptivo y exploratorio de datos

Recopilación: Camerina Laura Ramírez G. ESTADÍSTICA. Recopilación: Camerina Laura Ramírez G.

Fase 2. Estudio de mercado: ESTADÍSTICA

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Transcripción:

Programa de Doctorado Formación en la Sociedad del Conocimiento Seminario de doctorado 13 y 14 de marzo de 2014 Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Dra. Mª José Rodríguez Conde Dra. Dr. Grupo de Evaluación Educativa y Orientación (GE2O) GRupo de investigación en InterAcción y elearning (GRIAL) Instituto Universitario de Ciencias de la Educación (IUCE) Universidad de Salamanca Salamanca, 9 de mayo de 2014

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Estadística descriptiva Gráficos de representación de datos Coeficientes de correlación Regresión lineal simple y múltiple Inferencia estadística

Estadística descriptiva Tendencia central - Media - Mediana - Moda ESTADÍSTICA DESCRIPTIVA Cálculo de los estadísticos de una muestra. Dispersión Forma - Varianza - Desviación típica - Asimetría - Curtosis

Tendencia central Media: Indica el valor promedio de todas las puntuaciones de una variable. Mediana: Puntuación que ocupa la posición central en una variable. Moda: Puntuación más repetida.

Dispersión 210 200 190 180 170 160 150 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0

Dispersión Altura 175 cm 25 cm 60 cm 205 cm Altura 132 cm 125 cm 91.75 cm

Forma Asimetría: Mide el grado de simetría que posee la distribución. Curtosis: Indica el grado de agrupación de las puntuaciones en torno a la media.

Forma ASIMETRÍA Asimétrica negativa Simétrica Asimétrica positiva As<0 As=0 As>0

Forma CURTOSIS Leptocúrtica Mesocúrtica Platicúrtica Curt>0 Curt=0 Curt>0

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Estadística descriptiva Gráficos de representación de datos Coeficientes de correlación Regresión lineal simple y múltiple Inferencia estadística

Diagrama de sectores El diagrama de sectores se emplea principalmente en la representación de variables cualitativas, aunque también es posible representar variables ordinales y cuantitativas discretas. El tamaño de los sectores puede representar frecuencias absolutas o porcentajes. Sexo Hombre Sexo Mujer Mujer Hombre 525 42,7% 705 57,3% n=1230

Diagrama de barras El diagrama de barras se emplea en la representación de variables cualitativas, ordinales y cuantitativas discretas. La altura de las barras puede representar frecuencias absolutas o porcentajes, y cada barra representa una de las categorías o puntuaciones de la variable. Fuente de información Fuente de información 700 600 500 595 100% 90% 80% 70% 400 300 200 100 86 327 175 47 60% 50% 40% 30% 20% 10% 7% 27% 14% 48% 4% 0 Profesores Familia Amigos Solo Otros 0% Profesores Familia Amigos Solo Otros n=1230

Histograma y curva de densidad El histograma se emplea en la representación de variables cuantitativas continuas. A diferencia del diagrama de barras, el histograma presenta las barras unidas. La Curva de densidad puede formar un gráfico por separado o acompañar al histograma en un gráfico conjunto. La altura de la curva representa la frecuencia de observaciones para una puntuación x i determinada. El eje vertical (y) representa frecuencias absolutas o porcentajes, y el eje horizontal la escala de la variable.

Histograma y curva de densidad

Diagrama de cajas El diagrama de cajas se emplea en la representación de variables continuas. Valor máximo Valor atípico P 75 =Q 3 P 50 =Q 2 =D 5 P 25 =Q 1 Valor mínimo

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Estadística descriptiva Gráficos de representación de datos Coeficientes de correlación Regresión lineal simple y múltiple Inferencia estadística

Coeficiente de correlación El coeficiente de correlación mide la relación entre dos variables. Indica el tipo de relación entre dos variables y la intensidad de la relación. TIPO DE RELACIÓN: DIRECTA Valores positivos INVERSA Valores negativos NULA Cero INTENSIDAD DE LA RELACIÓN: ALTA Valores cercanos a 1 o -1 BAJA Valores cercanos a 0

Coeficiente de correlación RELACIÓN DIRECTA Tendencia de que a valores altos en la primera variable (X), corresponden valores altos de la segunda (Y), y viceversa. 20 18 16 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 14

Coeficiente de correlación RELACIÓN INVERSA Tendencia de que a valores altos en la primera variable (X), corresponden valores bajos de la segunda (Y), y viceversa. 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 14

Coeficiente de correlación RELACIÓN NULA No se observa ninguna tendencia lineal. 110 100 90 80 70 60 50 40 0 2 4 6 8 10 12 14

Coeficiente de correlación en función del tipo de variables CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PEARSON (r xy ) SPEARMAN (r s ) BISERIAL PUNTUAL (r bp ) ORDINAL SPEARMAN (r s ) CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA COEFICIENTE FI

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Estadística descriptiva Gráficos de representación de datos Coeficientes de correlación Regresión lineal simple y múltiple Inferencia estadística

Ecuación de regresión y = Valores pronosticados en y para un valor concreto en x a = Ordenada en el origen (punto de corte de la recta con el eje y) b = Pendiente de la recta de regresión ε = Error de la predicción (diferencia entre el valor pronosticado y el real para un sujeto)

Recta de regresión RECTA CRECIENTE: En este caso, a medida que aumenta el valor de x, aumenta el de y. Así, la el valor de b (pendiente) es positivo, al igual que el del coeficiente de correlación. 20 18 16 14 12 b > 0 10 a = 2 8 6 4 2 0 0 2 4 6 8 10 12 14

Recta de regresión RECTA DECRECIENTE: A medida que aumenta el valor de x, el valor de y disminuye. Así, el valor de b (pendiente) es negativo, al igual que el del coeficiente de correlación. 14 12 a = 14 10 8 6 4 2 0 0 2 4 6 8 10 12 14 b < 0

Bondad de ajuste de la ecuación de regresión Para medir la bondad de ajuste de la ecuación de regresión, esto es, el error cometido al predecir los valores de y a partir de un valor x i, se emplea el coeficiente de determinación (R 2 ). R 2 = (r xy ) 2 El coeficiente de determinación tiene valores entre 0 y 1. Indica la proporción de variabilidad explicada por el modelo.

Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Estadística descriptiva Gráficos de representación de datos Coeficientes de correlación Regresión lineal simple y múltiple Inferencia estadística

El proceso de inferencia Estadística

Intervalos de confianza Gracias a la inferencia estadística, partiendo de unas condiciones específicas de las distribuciones de las variables, podré afirmar que, partiendo de una muestra determinada y con un error concreto, el valor de un parámetro poblacional se encuentra dentro de un intervalo dado.

Intervalos de confianza Suponiendo que la muestra es representativa y que la variable es normal y homocedástica: Error= 5% Error= 1% Error= 5% Error= 1%

La hipótesis estadística La inferencia estadística se basa en la formulación de hipótesis acerca de los parámetros, y consiste en contrastar si esa hipótesis es cierta o falsa. Error= 5% Se puede afirmar, con un error del 5%, que la media poblacional de esta variable es 7.5? H 0 : µ = 7.5 H 1 : µ 7.5 NO SE PUEDE AFIRMAR!!! RECHAZO H 0

La hipótesis estadística La inferencia estadística se basa en la formulación de hipótesis acerca de los parámetros, y consiste en contrastar si esa hipótesis es cierta o falsa. Error= 1% Y con un error del 1%, se puede afirmar que la media poblacional es 7.5? H 0 : µ = 7.5 H 1 : µ 7.5 SÍ SE PUEDE AFIRMAR!!! NO RECHAZO H 0

La hipótesis estadística Se observa mejor este procedimiento de manera gráfica: Error= 5% H 0 : µ = 7.5 H 1 : µ 7.5 Rechazo H 0 Rechazo H 0 ZONA DE RECHAZO!!! Zona de Aceptación de H 0 RECHAZO H 0 7.5 8.04 11.96

La hipótesis estadística Se observa mejor este procedimiento de manera gráfica: Error= 1% H 0 : µ = 7.5 H 1 : µ 7.5 Rechazo H 0 Rechazo H 0 ZONA DE ACEPTACIÓN!!! Zona de Aceptación de H 0 ACEPTO H 0 7.5 7.42 12.58

La hipótesis estadística Y si lo que quiero es comparar grupos? Existen diferencias significativas entre hombres y mujeres en la variable X?: Error= 5% H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 Zona de Aceptación de H 0 ZONA DE ACEPTACIÓN!!! ACEPTO H 0 No existen diferencias Significativas entre los grupos 8.08 15.92 14.08 21.92

Condiciones para la inferencia MUESTREO NORMALIDAD La muestra seleccionada debe ser representativa de la población de la que procede. Las variables sobre las que se va a realizar la inferencia deben ajustarse a la distribución normal. HOMOCEDASTICIDAD En el caso de que se contrasten varias variables, estas deben poseer varianzas semejantes.

Normalidad de las variables Distribución de la variable sobre la que se aplica inferencia similar a la distribución de la curva normal CURTOSIS MESOCÚRTICA (Curt=0) SIMETRÍA (As=0) Media=Moda=Mediana» Prueba de Kolmogorov-Smirnov H 0 : La variable se ajusta a la curva normal p α H 1 : La variable no se ajusta a la curva normal p < α

Homocedasticidad de las variables Varianzas similares de las variables sobre las que se contrastan parámetros Estudio de la dispersión de los datos (Diagrama de cajas)» Prueba de Levene H 0 : Las variables tienen varianzas iguales p α H 1 : Las variables no tienen varianzas iguales p < α

Condiciones para la inferencia En el caso del cumplimiento de las condiciones emplearemos las técnicas paramétricas (basadas en la distribución normal de las variables). En el caso de que no se cumplan las condiciones emplearemos técnicas no paramétricas (basadas en otras distribuciones).

Estadística descriptiva ESTADÍSTICA INFERENCIAL Cálculo de los parámetros de una población. PARAMÉTRICA NO PARAMÉTRICA -Prueba T para la media -Prueba T para grupos independientes -Prueba T para grupos relacionados -ANOVA -U de Mann-Whitney para 2 grupos independientes -W de Wilcoxon para 2 grupos relacionados -H de Kruskal-Wallis para k grupos independientes -Prueba de Friedman para k grupos relacionados

Programa de Doctorado Formación en la Sociedad del Conocimiento Seminario de doctorado 13 y 14 de marzo de 2014 Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Dra. Mª José Rodríguez Conde Dra. Dr. Grupo de Evaluación Educativa y Orientación (GE2O) GRupo de investigación en InterAcción y elearning (GRIAL) Instituto Universitario de Ciencias de la Educación (IUCE) Universidad de Salamanca Salamanca, 9 de mayo de 2014