web: http://www.uv.es/friasnav/



Documentos relacionados
TEMA 5 Inferencia no paramétrica. Guía docente:

Tema 8. Contrastes no paramétricos. 8.1 Introducción

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Análisis de Datos CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA

Técnicas de validación estadística Bondad de ajuste

Estadística Avanzada y Análisis de Datos

Tema Correlación. Correlación. Introducción

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

2.5. Asimetría y apuntamiento

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

Técnicas de validación estadística Bondad de ajuste

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

Pruebas de bondad de ajuste

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana

Test de Kolmogorov-Smirnov

REGRESIÓN LINEAL CON SPSS

Nivel socioeconómico medio. Nivel socioeconómico alto SI NO TOTAL

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

3. Análisis univariable y bivariable

Tema II. Las muestras y la teoría paramétrica

Distribuciones de probabilidad. El teorema central del límite

4. Medidas de tendencia central

Distribuciones muestrales. Distribución muestral de Medias

3. VARIABLES ALEATORIAS

Práctica 1: Introducción a SPSS 1

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Teoría de la decisión Estadística

Tema 2: Estadísticos

b) Haz otra distribución en 12 intervalos de la amplitud que creas conveniente.

SnapStat: Análisis de Una Muestra

MEDIDAS DE ASIMETRÍA Y CURTOSIS EMPLEANDO EXCEL

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

Técnicas Cuantitativas para el Management y los Negocios I

Cómo describir e interpretar los resultados de un estudio de investigación quirúrgica? Variables cuantitativas

EJERCICIOS RESUELTOS TEMA 7

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

ESTADÍSTICA APLICADA. PRÁCTICAS CON SPSS. TEMA 2

Practica 2. Cuadro de Diálogo del Análisis Exploratorio. Análisis Exploratorio

ANÁLISIS ESTADÍSTICO. Estadística descriptivos: Tablas, gráficos, estadísticos descriptivos. Jorge Fallas

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

CONCEPTOS FUNDAMENTALES

Análisis estadístico básico (I) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears

Vanesa Berlanga y María José Rubio. Clasificación de pruebas no paramétricas. Cómo aplicarlas en SPSS

ESTADISTICA APLICADA: PROGRAMA

Pruebas de Acceso a Enseñanzas Universitarias Oficiales de Grado (PAEG) Matemáticas aplicadas a las Ciencias Sociales II - Junio Propuesta B

Introducción a la estadística básica, el diseño de experimentos y la regresión

Tema 5. Muestreo y distribuciones muestrales

Estadística inferencial. Aplicación con el SPSS

7. De acuerdo con la gráfica siguiente, el contraste estadístico es:

Tema 1. Modelo de diseño de experimentos (un factor)

ESTADÍSTICA BÁSICA Dirección Redes en Salud Pública

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

Tema 11: Intervalos de confianza.

13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

Pruebas de Bondad de Ajuste

Gráficas: ( Parte I ) Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados

Regresión lineal múltiple

Análisis descriptivo y exploratorio de datos

Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.

Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza.

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

TEMA 11. LA FIABILIDAD DE LOS TESTS

Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual.

SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

Julia García Salinero. Departamento de Investigación FUDEN. Introducción

Inferencia estadística III. Análisis de Correlación. La inferencia estadística también se puede aplicar para:

Análisis descriptivo y exploratorio de datos

Tema 5: Principales Distribuciones de Probabilidad

2. FRECUENCIAS Distribución de Frecuencias.

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

Estadística Inferencial 3.7. Prueba de hipótesis para la varianza. σ gl = n -1. Es decir: Ho: σ 2 15 Ha: σ 2 > 15 (prueba de una cola)

TEMA 4: CONTRASTES DE HIPÓTESIS. CONCEPTOS BÁSICOS

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA

Grado en Química Bloque 1 Funciones de una variable

Universidad de Managua

Estadísticos Descriptivos

Anexo C. Introducción a las series de potencias. Series de potencias

Distribuciones bidimensionales. Regresión.

ESTADÍSTICA INFERENCIAL

Intervalos para la diferencia de medias de dos poblaciones

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

7. Distribución normal

Distribución Normal Curva Normal distribución gaussiana

CUADERNO DE EJERCICIOS

Grupo 4: BUENAS PRÁCTICAS ESTADÍSTICAS

Estadística Inferencial. Sesión 5. Prueba de hipótesis

P (X 5) = P (x = 5) + P (X = 6) + P (X = 7) + P (X = 8) = =

CALIDAD 1 JOSÉ MANUEL DOMENECH ROLDÁN PROFESOR DE ENSEÑANZA SECUNDARIA

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

11. PRUEBAS NO PARAMÉTRICAS

Potencia estadística

Determinación del tamaño muestral para calcular la significación del coeficiente de correlación lineal

TRABAJO PRÁCTICO ESTADISTICA APLICADA (746)

ESTADÍSTICA DESCRIPTIVA Bosqueja o describe las diversas características de un conjunto de datos.

Transcripción:

LAS PRUEBAS PARAMÉTRICAS 1. Se conoce el modelo de distribución de la población objeto de estudio y se desconoce un número finito de parámetros de dicha distribución que hay que estimar con los datos de la muestra. 2. Requieren conocer la distribución de la muestra para poder realizar inferencias sobre la población. LAS PRUEBAS NO PARAMÉTRICAS 1. Son métodos de distribución libre. No requieren conocer la distribución de la muestra. 2. Se utilizan estadísticos cuya distribución se determina con independencia de cuál sea la distribución de la población. 1

LAS PRUEBAS NO PARAMÉTRICAS: Para qué se utilizan? 1. Son una alternativa a las pruebas paramétricas cuando los datos no cumplen los requisitos de las pruebas paramétricas. 2. Permiten conocer cómo es la forma de la distribución de la población de la que se ha extraído la muestra. Contrastes de Bondad de Ajuste para conocer la forma de la población que ha originado la muestra. Las pruebas de bondad de ajuste se utilizan para contrastar si los datos de la muestra pueden considerarse que proceden de una determinada distribución. 2

SUPUESTOS DE LAS PRUEBAS PARAMÉTRICAS 1. Normalidad. Las observaciones se extraen de poblaciones distribuidas según la Normal para cada grupo. Pruebas de bondad de ajuste. 2. Homocedasticidad. Las varianzas de los diferentes grupos tienen que ser iguales. Homogeneidad de varianzas. El numerador y el denominador de la prueba F son estimaciones de la misma varianza poblacional. Prueba de Levéne. Supuesto de esfericidad respecto a la homogeneidad de varianzascovarianzas según la prueba de Mauchley. 3. Respecto a los errores: 1. Los errores son independientes entre sí. 2. Se distribuyen según nanormal dentro de cada población del grupo N(0, σ 2 ). Es decir, con media cero y varianzas equivalentes. 3. La ecuación estructural del modelo refleja una composición aditiva de las fuentes de variación. 3

ACTUACIONES. TOMA DE DECISIONES Cuando se tengan unos datos hay que comprobar en primer lugar los supuestos de las pruebas paramétricas. En concreto se analizará en primer lugar si los datos de la variable tienen una distribución normal. Para ello se utilizarán gráficos y pruebas de contraste de la normalidad. Actuaciones: 1. Si se acepta la normalidad de las observaciones entonces se aplicará el contraste paramétrico adecuado para la hipótesis. 2. Si se rechaza la normalidad de las observaciones entonces se optará por aplicar pruebas no paramétricas donde los test se plantean sobre la mediana de la distribución: 1. Test de los rangos signos de Wilcoxon para una muestra. Contrasta la mediana de la muestra con la mediana poblacional. También permite contrastar la mediana de dos muestras pareadas. 2. Test U de Mann-Whitney para muestras independientes 4

Pruebas de bondad de ajuste Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribución. Pruebas de Normalidad: -pruebas gráficas basadas en gráficos de normalidad como Q-Q plots. -Test de Kolmogorov Smirnovde bondad de ajuste. Es válido sólo para variables aleatorias continuas. -Test de Lillefors. Es el Test de Kolmogorov Smirnovcon la corrección de Lillefors. Sus valores son menores que los de Kolmogorov. -Prueba de Shapiro-Wilks. Cuando se ejecutan las pruebas con el SPSS se obtiene el valor del estadísticoyelvalorpdeprobabilidaddelcontraste. SerechazaH 0 si el valor p de probabilidad es menor que el nivel de significación elegido para ejecutar la prueba de contraste estadístico. 5

DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES Evaluar mediante inspección visualla normalidad de las puntuaciones Los gráficos ayudan al investigador a juzgar si sus datos proceden de una distribución normal. Por ejemplo, si los datos proceden de una distribución normal cabe esperar que la distribución no tendrá una fuerte asimetría. Sin embargo, con pocos datos no es fácil obtener conclusiones consistentes y de ahí que se hayan ideado gráficos concretos para observar la normalidad de las puntuaciones de una variable. 6

Gráficos para observar la normalidad de las puntuaciones de una variable: -Gráficos de probabilidad normal P-P plots -Gráficos de cuantiles normales Q-Q plots Estos gráficos trabajan con los datos estandarizados y ordenados. Cuando los datos se representan frente a los datos esperados de una distribución N (0, 1) se deben obtener puntos alineados en la diagonal de un cuadro. 7

DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES Histograma Gráfico de caja Gráfico Q-Q Observar la simetría de la distribución Evaluar mediante inspección visualla normalidad de las puntuaciones 8

SPSS: Gráficos con pruebas de normalidad: ANALIZAR--ESTADÍSTICOS DESCRIPTIVOS-- EXPLORAR 9

Se puede seleccionar solamente ESTADÍSTICOS, solamente GRÁFICOS o que el SPSS ofrezca AMBOS (estadísticos y gráficos) en su salida de resultados. 10

11

Asimetría de la distribución ASIMETRÍA POSITIVA Examen difícil, Salarios, Tiempo de Reacción Asimetría positiva: concentración de casos en los valores inferiores de la distribución y cola extendida hacia los valores grandes. ASIMETRÍA NEGATIVA Examen fácil Asimetría negativa: concentración de casos en los valores altos y cola alargada hacia los valores inferiores de la distribución. 12

Asimetría de la distribución 13

14

15

Evaluar utilizando la prueba de significación la normalidad de las puntuaciones GRÁFICOS CON PRUEBA DE NORMALIDAD La aplicación de la prueba de normalidad muestra dos gráficos: (1) Normal Probability Plot: (gráfico Q-Q) donde a cada valor observado se le empareja con su valor esperado, procedente éste último de una distribución normal. Si la muestra es extraída de una población normal ambos valores se encontrarán en la misma línea recta. 16

Evaluar utilizando la prueba de significación la normalidad de las puntuaciones GRÁFICOS CON PRUEBA DE NORMALIDAD Normal Probability Plot. Gráfico Q-Q --Se representan los cuantiles empíricos obtenidos en la muestra frente al cuantil correspondiente en la distribución Normal. --Si el gráfico muestra una relación cercana a una línea recta entonces se sugiere que los datos proceden de una distribución Normal. 17

Normal ProbabilityPlot. Gráfico Q-Q Cuando la distribución observada en las puntuaciones se ajusta a la teórica entonces los puntos se representan en línea recta en la diagonal. Si el ajuste no es bueno entonces la distribución de las puntuaciones adopta otras formas: A. Asimétrica a la derecha B. Asimétrica a la izquierda C. Leptocúrtica D. Platicúrtica 18

19

Evaluar utilizando la prueba de significación la normalidad de las puntuaciones GRÁFICOS CON PRUEBA DE NORMALIDAD (2) Detrended Normal Plot donde se muestran las desviaciones de los puntos con relación a una línea recta. Si la muestra ha sido extraída de una población normal los puntos deben situarse alrededor de una línea horizontal con el origen en el punto.00. 20

21

Gráfico de caja y bigotes Q3= Tercer cuartil Inspección visual descriptiva Límite Superior: por encima de ese límite las puntuaciones se consideran atípicas(outliers) Mediana 50% de las puntuaciones 95% de las puntuaciones Límite Inferior: por debajo de ese límite las puntuaciones se consideran atípicas (outliers) Q1= Tercer cuartil 22

Gráfico de caja y bigotes Inspección visual descriptiva --Asimetría positiva: la mediana está más cerca de laparteinferiordelacaja. --Asimetría negativa: la mediana está más cerca de lapartesuperiordelacaja. Cuanto más larga sea la caja y los bigotes mayor variabilidad tienen los datos 23

Gráficos de distribución Las principales ventajas son la sencillez de interpretación, la extensión a cualquier tipo de distribución y, en el caso de la distribución normal, la facilidad de obtener el diagrama ya que está implementado en muchos paquetes estadísticos. Además, no requieren muestras tan numerosas como algunos tests de normalidad. El principal inconveniente es la subjetividad de la interpretación visual, ya que al contrario de los tests de normalidad numéricos no se concluye con una p de probabilidad objetiva. 24

Pruebas de significación para contrastar la hipótesis de la normalidad de las puntuaciones de la población (variables aleatorias continuas): Kolmogorov-Smirnov, Corrección de Lillieforsy ShapiroWilks Los gráficos orientan sobre la procedencia o no de la muestra de una población normal. Sin embargo, es posible trabajar con una prueba estadística que certifique la normalidad o no de las variables. 25

Queremos contrastar, para un determinado nivel de confianza, la hipótesis nula de que los datos proceden de una población con distribución normal. Hipótesis Nula H 0 : es que el conjunto de datos siguen una distribución normal. Hipótesis Alternativa H 1: es que el conjunto de datos no sigue una distribución normal. Si el valor del estadístico supera un determinado valor, que depende del nivel de significación con el que se quiera rechazar la hipótesis nula, entonces esa colección de datos no se distribuye según una distribución normal. 26

Lillierfors tabuló el estadístico de Kolmogorov-Smirnov para el caso más habitual en el que desconocemos la media y la varianza poblacional y se estiman a través de los datos muestrales. ----El SPSS utiliza esta prueba modificada. Los valores críticos se obtienen aplicando la corrección de significación propuesta por Lilliefors. No utilizaremos el de Kolmogorov-Smirnov sin la corrección de Lilliefors por resultar muy conservador (en casi todas las ocasiones semantieneh 0 ) 27

Sin corrección de Lilliefors. SPSS: Pruebas No paramétricas K-S de una muestra 28

El estadístico de prueba Kolmogorov-Smirnov (KS 68 =0.155, p<0.001) con la corrección de Lilliefors presenta un nivel de significación igual a <0,001. En consecuencia se rechaza la hipótesis de normalidad. ACTUACIÓN: Es necesario realizar alguna transformación a la variable ya que no se cumple el supuesto de normalidad de las observaciones de la variable medida. 29

TRANSFORMACIONES DE LA VARIABLE Objetivo: que la variable adopte una distribución normal o, al menos, simétrica El SPSS permite realizar diversas transformaciones de la variable. 1. En primer lugar, debemos recordar que el test K-S nos indicaba si era o no necesaria la transformación. 2. En segundo lugar, los gráficosde tallos y hojas y/o cajas con bigotes representan la dirección de la simetría y, por lo tanto, indican el tipo de transformación que es más adecuada. Las transformaciones se realizan en función de tipo de asimetría de la distribución. Tukey ofrece lo que él llama la Escalera de las transformaciones, donde muestra el tipo de transformación recomendada según sea la intensidad de la asimetríaoladirecciónenlaquevanloscasosextremos. 30

TRANSFORMACIONES DE LA VARIABLE Objetivo: que la variable adopte una distribución normal o, al menos, simétrica Escalera de las transformaciones: Si la distribución es ASIMÉTRICA POSITIVA: es conveniente utilizar 1-raíces cuadradas, 2-logaritmos La corrección de la asimetría positiva será aún mayor con los logaritmos. Si la distribución es ASIMÉTRICA NEGATIVA: 1-elevar al cuadrado (X 2 ) o 2-al cubo (X 3 ). La corrección de los datos será mayor cuanto mayor es la exponenciación. Las transformaciones más comunes son el logaritmo (ln), la raíz cuadrada(sqrt) y potencias(**potencia deseada) 31

TRANSFORMACIONES DE LA VARIABLE SPSS 32

TRANSFORMACIONES DE LA VARIABLE Objetivo: que la variable adopte una distribución normal o, al menos, simétrica --La escalera de transformación de Tukey es orientativa pero es una guía. --Muy raramente se conseguirá la normalidad con la primera transformación. Serán necesarias varias. Después de cada transformación se ejecutan de nuevo los análisis de bondad de ajuste. --Conviene tener en cuenta que con variables que muestran una distribución próxima a la normalidad la aplicación de las transformaciones puede provocar hacerlas más asimétricas. Cuando esto ocurre lo más conveniente es trabajar con los datos de la variable original. 33

DATOS BRUTOS AL CUADRADO AL CUBO LOGARITMO NO 34

El estadístico W de Shapiro-Wilks mide la fuerza del ajuste con una recta. Cuanto mayor sea el valor de este estadístico mayor desacuerdo habrá con la recta de normalidad, por lo que se rechazrá la hipótesis nula. Para muestras pequeñas (entorno a 50 observaciones) se recomienda Shapiro. Para muestras mayores se recomienda Kolmogorov con la corrección de Lilliefors. 35

Ejercicios: Fuente: http://ocw.usal.es/ciencias-sociales-1/control-estadistico-de-la-calidad/materiales-de-clase/ 36

Analizar la variable de Valoración con el SPSS. Examinar su ajuste a la distribución normal. Realizar algún tipo de transformación si fuese necesario. Redactar los resultados. Para el informe de investigación: BaseInformeESTAD.sav -Buscar el modelo teórico que puede representar el proceso de aprendizaje de la estadística para plantear las hipótesis teóricas en el apartado 37Introducción. -Comprueba en los análisis la normalidad de la variable y la homogeneidad de las varianzas de los grupos. -Analiza e interpreta los estadísticos descriptivos que consideres de las variables que se utilizan como variables dependientes. -Estudiar la relación entre las calificaciones y la valoración sobre la confianza en la solución de la pregunta. -Analizar la relación entre aprobados y suspensos y la valoración sobre la confianza en la solución de la pregunta. -Estudiar la relación entre el sexo y las notas académicas. -Haz una interpretación conjunta de todos los datos en el apartado de Discusión 37