CONTRASTES EN ASOCIACIÓN Y PREDICCIÓN
|
|
- Eduardo Revuelta Rivas
- hace 6 años
- Vistas:
Transcripción
1 CONTRASTES EN ASOCIACIÓN Y PREDICCIÓN
2 Contenidos Correlación 75 La correlación lineal de Pearson 78 Correlaciones ordinales 91 Regresión 94 Pruebas de hipótesis para la regresión 95 Análisis de regresión en el SPSS 96 El error de la predicción 98 Asociación entre datos categóricos 106 Ejemplo 107 Las mujeres primero 108 Comparando proporciones o porcentajes directamente 114 Asociación para variables categóricas en el SPSS 117 Pedro Valero Mora-valerop@uv.es 74
3 Correlación CORRELACIÓN Hasta ahora hemos visto técnicas en las que la variable independiente era categórica y la variable dependiente podía ser numérica (pruebas paramétricas) o ordinal (pruebas no paramétricas) - Eso lleva a un resultado del tipo los que están esa categoría tienen una media más alta/baja que los que están en esta otra categoría Por ejemplo, los licenciados tienen unos ingresos mayores que los que tienen estudios elementales Las técnicas basadas en correlación utilizan variables que son de tipo numérico o ordinal - Las técnicas de tipo numérico permiten ver si hay relaciones lineales, de modo que aumentos en una variable están asociados con aumentos en la otra variable - En las técnicas para variables ordinales lo que vemos es si un aumento en una variable está asociado con el aumento en la otra variable de una manera ordinal Esto puede ser más apropiado cuando las relaciones son obviamente no lineales Pedro Valero Mora-valerop@uv.es 75
4 Correlación Veamos este ejemplo de la relación entre el número de pacientes por médico (PeoplePhy) frente a expectativa de vida. - Diríamos que a menos médicos menos expectativa de vida, no? pero la relación es un poco más complicada - A la izquierda valores originales, a la derecha los valores después de transformar en rangos LifeExpec LifeExpec PeoplePhy PeoplePhy Pedro Valero Mora-valerop@uv.es 76
5 Correlación Veremos dos tipos de correlaciones: - La correlación lineal de Pearson, apropiada para relaciones lineales y con variables numéricas - La correlación ordinal de Spearman, apropiada para relaciones no lineales y con variables ordinales Pedro Valero Mora-valerop@uv.es 77
6 Correlación/La correlación lineal de Pearson La correlación lineal de Pearson La fórmula del cálculo de la correlación lineal de Pearson pertenece a la primera parte de Estadística 1 - Recordar que el resultado de esa fórmula está entre -1 y 1 y que valores cercanos a 0 significan ausencia de correlación Cuando se explica este tema en la primera parte, suele ser habitual que haya muchas dudas sobre cómo de grande tiene que ser una correlación para poder decir que hay correlación - La respuesta a eso suele ser un poco vaga - Aquí veremos un método para poder decir que la correlación es diferente de cero, lo cual es equivalente a decir que hay correlación - La fórmula para el estadístico de contraste es esta: r t n 2 = --- e r Pedro Valero Mora-valerop@uv.es 78
7 Correlación/La correlación lineal de Pearson - En esa fórmula nos falta saber e r que es el error típico de la correlación. Se calcula mediante: e 1 r 2 r = n 2 El valor de t n 2 se puede comparar con los valores de la distribución t o si se hace el cálculo con el ordenador se puede mirar si la significación es inferior a 0,05 (como siempre) Pedro Valero Mora-valerop@uv.es 79
8 Contenidos 80 La hipótesis nula El procedimiento anterior tiene como hipótesis: - Hipótesis nula: La correlación es igual a 0 - Hipótesis alternativa: La correlación es diferente de 0 (puede ser mayor o menor) La fórmula anterior se puede adaptar para probar la hipótesis de que la correlación es diferente de un valor concreto pero ese caso no se usa mucho Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/La hipótesis nula
9 Contenidos 81 Ejemplo: La personalidad y el rendimiento Uno de los esquemas de trabajo más habituales entre los psicólogos está basado en hacer algún tipo de diagnóstico utilizando cuestionarios psicológicos para así predecir el funcionamiento en un puesto de trabajo, actividad, estudios, etc. - Que un cuestionario psicológico está relacionado con una actividad concreta a menudo no está demostrado con certeza Los estudios de ese cuestionario pueden haberse aplicado a cosas parecidas pero no exactamente a lo que nosotros necesitamos o de la forma en la que nosotros la aplicamos - Es conveniente siempre que sea posible estudiar el funcionamiento de los cuestionarios cuando los estamos utilizando habitualmente En los datos sobre satisfacción del cuerpo tenemos un ejemplo de estas características niños han rellenado un cuestionario sobre satisfacción corporal, capacidad para soportar esfuerzos (endurance selfefficacy), han hecho una prueba física (number of laps on pacer) y se les ha evaluado la masa corporal Supongamos que como parte de un proceso de selección para formar deportistas, se utilizan todas esas pruebas (el año que viene veréis en psicometría que esto se llama comprobar la validez de las pruebas) Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Ejemplo: La personalidad y el rendimiento
10 Contenidos 82 Correlaciones en el SPSS El cuadro de diálogo es este. Se encuentra en Analizar>Correlaciones>Correlaciones bivariadas Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Correlaciones en el SPSS
11 Contenidos 83 El resultado es el siguiente Correlaciones Total Body Total Endurance Body Mass Index Number of Laps on PACER Satisfaction Score Self-Efficacy Score Body Mass Index Correlación de Pearson ** ** ** Sig. (bilateral) N Number of Laps on PACER Correlación de Pearson ** **.583 ** Sig. (bilateral) N Total Body Satisfaction Correlación de Pearson **.313 ** ** Score Sig. (bilateral) N Total Endurance Correlación de Pearson **.583 **.457 ** 1 Self-Efficacy Score Sig. (bilateral) N **. La correlación es significativa en el nivel 0,01 (2 colas). - Vemos que los resultados se organizan en una tabla de filas y columnas, con el valor correspondiente en el cruce de éstas - Para cada cruce está la correlación, la significación y el número de casos (cuando hay valores perdidos en alguna variable, el número de casos variará según la combinación) - En este caso todas las correlaciones son significativas El índice de masa corporal correlaciona con el número de vueltas negativamente (a más masa menos vueltas) La autoeficacia correlaciona positivamente con las vueltas y también la satisfacción con el cuerpo Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Correlaciones en el SPSS
12 Contenidos 84 - En general, las tres variables que podríamos usar para predecir el número de vueltas (masa corporal, satisfacción con el cuerpo y autoeficacia) correlacionan pero la que más parece ser la autoeficacia Un psicólogo en esa situación tendría justificación para utilizar el cuestionario sobre autoeficacia para seleccionar buenos candidatos para tener un buen rendimiento deportivo No obstante, es necesario evaluar si las relaciones son lineales antes de dar por definitivo un resultado. Esto lo realizaremos a continuación. Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Correlaciones en el SPSS
13 Contenidos 85 Evaluar la linealidad de la relación En el SPSS tenemos que ir a Gráficos>Cuadros de diálogo antiguos>diagramas de dispersión/puntos En la ventana que aparece tenemos Dispersión simple para obtener el siguiente cuadro de diálogo Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Evaluar la linealidad de la relación
14 Contenidos 86 El resultado del cuadro de diálogo anterior se muestra a continuación - Vemos que la relación es bastante lineal en general así que podemos estar tranquilos con respecto a nuestras conclusiones Number of Laps on PACER Total Endurance Self-Efficacy Score 40 Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Evaluar la linealidad de la relación
15 Contenidos 87 En el gráfico anterior vemos dos variables pero en nuestro ejemplo tenemos más de dos variables - Para ver todas las combinaciones podríamos repetir el gráfico varias veces o usar una matriz de diagramas de dispersión Hacemos lo mismo que para el diagrama de dispersión pero elegimos Dispersión matricial Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Evaluar la linealidad de la relación
16 Contenidos 88 - Eso produce el siguiente cuadro de diálogo En donde pone variables de la matriz elegimos todas las variables Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Evaluar la linealidad de la relación
17 Contenidos 89 - El resultado es el siguiente Total Endurance Self-Efficacy Score Total Body Satisfaction Score Number of Laps on PACER Body Mass Index Body Mass Index Number of Laps on PACER Total Body Satisfaction Score Total Endurance Self-Efficacy Score Este gráfico permite ver todas las combinaciones de variables y ver si hay algún caso sospechoso. Por ejemplo, BMI y PACER no parecen muy lineales así que haremos un gráfico para esas dos Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Evaluar la linealidad de la relación
18 Contenidos 90 - El resultado muestra la curvilinealidad con claridad Number of Laps on PACER Body Mass Index A partir de un cierto momento hay un efecto suelo y aunque el BMI sea peor el número de vueltas sigue en los mismos valores aproximadamente En este caso sería interesante ver las correlaciones ordinales Contrastes en Asociación y Predicción Correlación/La correlación lineal de Pearson/Evaluar la linealidad de la relación
19 Correlación/Correlaciones ordinales Correlaciones ordinales Hemos visto que resulta interesante calcular correlaciones ordinales por dos razones: - Cuando las variables no están relacionadas linealmente - Cuando las variables son propiamente ordinales SPSS calcula dos tipos de correlaciones ordinales, Spearman y Kendall. - Nosotros utilizaremos Spearman ya que es más sencilla de entender Spearman no es más que aplicar la fórmula de la correlación de Pearson a los rangos de las variables Eso permite que aunque haya relaciones curvilíneas, la correlación funcione correctamente Pedro Valero Mora-valerop@uv.es 91
20 Correlación/Correlaciones ordinales Para calcular en el SPSS es lo mismo que la correlación de Pearson pero elegimos Spearman en el cuadro de diálogo - También pueden pedirse varios coeficientes de correlación a la vez e imprime varias tablas Pedro Valero Mora-valerop@uv.es 92
21 Correlación/Correlaciones ordinales El resultado se muestra a continuación (arriba es Spearman, abajo Pearson) Body Mass Index Number of Laps on PACER Total Body Satisfaction Score Total Endurance Self-Efficacy Score Body Mass Index Coeficiente de correlación ** ** ** Sig. (bilateral) N Number of Laps on PACER Coeficiente de correlación ** **.609 ** Sig. (bilateral) N Total Body Satisfaction Score Coeficiente de correlación **.312 ** ** Sig. (bilateral) N Total Endurance Self-Efficacy Score Coeficiente de correlación **.609 **.438 ** Sig. (bilateral) N Correlaciones Body Mass Index Number of Laps on PACER Total Body Satisfaction Score Total Endurance Self-Efficacy Score Body Mass Index Correlación de Pearson ** ** ** Sig. (bilateral) N Number of Laps on PACER Correlación de Pearson ** **.583 ** Sig. (bilateral) N Total Body Satisfaction Score Correlación de Pearson **.313 ** ** Sig. (bilateral) N Total Endurance Self-Efficacy Score Correlación de Pearson **.583 **.457 ** 1 Sig. (bilateral) N **. La correlación es significativa en el nivel 0,01 (2 colas). - Los resultados son bastante similares así que podríamos usar Pearson con tranquilidad Pedro Valero Mora-valerop@uv.es 93
22 Regresión REGRESIÓN El análisis de regresión nos permite dar un pequeño paso adicional al de la correlación Además de ver si dos cosas están relacionadas, nos permite calcular qué valor podemos esperar en una variable dado el valor que tenemos en otra variable En nuestro ejemplo del rendimiento en una prueba física, podemos calcular cuántas vueltas dará un niño/a dada su puntuación en BMI o en los resultados de los tests acerca de aguante En realidad, estos cálculos ya se vieron en la primera parte del curso, lo que añadiremos es la posibilidad de calcular pruebas de hipótesis o intervalos de confianza En concreto veremos: - Pruebas de hipótesis para la pendiente de la regresión - Intervalos de confianza para las puntuaciones predichas Pedro Valero Mora-valerop@uv.es 94
23 Regresión/Pruebas de hipótesis para la regresión Pruebas de hipótesis para la regresión Ya vimos que la correlación entre el aguante y el número de vueltas era estadísticamente significativa (superior a 0) - Si lo que nos interesa es predecir el número de vueltas a partir del aguante podemos calcular una línea recta como la mostrada en el gráfico - Ahora bien, cómo de buena es la predicción realizada con esa línea? R 2 Number of Laps on PACER 20 El valor de mostrado en la parte superior es un indicador de ajuste de la recta Valores cercanos a 1 indican buen 0 ajuste, a 0 malo (los valores negativos no son posibles) Ahora veremos como hacer una prueba de hipótesis de la pendiente de la recta R 2 Lineal = 0,339 Total Endurance Self-Efficacy Score Pedro Valero Mora-valerop@uv.es 95
24 Regresión/Análisis de regresión en el SPSS Análisis de regresión en el SPSS Para calcular un análisis de Regresión vamos a Analizar>Regresión>Lineales y tenemos este cuadro de diálogo - La variable a predecir hay que ponerla en dependientes - La variable que predice hay que ponerla en independientes Pedro Valero Mora-valerop@uv.es 96
25 Regresión/Análisis de regresión en el SPSS El resultado es el siguiente (valores importantes en negrita) Resumen del modelo R cuadrado Error estándar de la Modelo R R cuadrado ajustado estimación 1,583 a,339 x,336 13,329 a. Predictores: (Constante), Total Endurance Self-Efficacy Score Suma de ANOVA a Modelo cuadrados gl cuadrática F Sig. 1 Regresión 18070, , ,712,000 b Residuo 35176, ,660 Total 53246, a. Variable dependiente: Number of Laps on PACER b. Predictores: (Constante), Total Endurance Self-Efficacy Score Coeficientes a Coeficientes no estandarizados estandarizados Modelo B Error estándar Beta t Sig. 1 (Constante) 6,527 2,791 2,338,020 Total Endurance Self-Efficacy Score 1,181 y,117,583 10,085,000 z a. Variable dependiente: Number of Laps on PACER - x Este es el valor de que se interpreta como hemos dicho. Es el cuadrado de R y éste a su vez es igual a la correlación sin signo - y En la segunda parte tenemos una prueba de hipótesis pero cuando usamos regresión simple (como es el caso) es redundante con el valor que usaremos así que se puede ignorar - z Este valor es la pendiente de la recta que dividido por el error típico nos permite calcular la significación. Esto nos permite saber si la pendiente es diferente de cero R 2 Pedro Valero Mora-valerop@uv.es 97 Media Coeficientes
26 Regresión/El error de la predicción El error de la predicción El interés de calcular una recta de regresión es poder predecir el valor de los sujetos en una variable dado el valor de otra variable - En el ejemplo de las vueltas, el interés es predecir cuántas vueltas dará un niño partiendo de su puntuación en los tests de aguante, o su masa corporal, etc. El problema de esa predicción es que está sujeta a un cierto error y por tanto debemos de ser conscientes de que no deben tomarse de una manera literal Hay dos posibles valores a predecir: - El valor medio de los sujetos en la variable predicha dado un valor en la predictora Por ejemplo, número de vueltas medio que darán los niños con BMI=22 - El valor individual de un sujeto Cada uno de estos valores no deben tomarse como valores ciertos sino que están dentro de un intervalo Es importante tener conciencia de los intervalos de confianza para los valores predichos Pedro Valero Mora-valerop@uv.es 98
27 Regresión/El error de la predicción Los errores de predicción se ven mejor en el diagrama de dispersión - La línea central es el número de vueltas que predecimos para un niño con un cierto nivel de aguante - Las líneas exteriores corresponden con el intervalo al 95% de las puntuaciones individuales - La líneas interiores son el intervalo al 95% de la media de las puntuaciones individuales Supongamos el gráfico anterior fue calculado el año pasado y que este año tenemos que elegir los 6 mejores niños para una competición sabiendo solamente los resultados del test de aguante Number of Laps on PACER Total Endurance Self-Efficacy Score (de acuerdo, este ejemplo es un poco artificial pero pensar en identificar presos que no reincidirán o alumnos que tendrán éxito en sus estudios) Pedro Valero Mora-valerop@uv.es R R
28 Regresión/El error de la predicción Si elegimos los niños con más puntuación en aguante tendríamos que: - Con una confianza del 95%, la media de esos niños estaría dentro de las dos líneas interiores - El 95% de los niños estaría entre las líneas exteriores Preguntas y respuestas Tenemos garantizado tener a los mejores niños siguiendo este procedimiento? La respuesta es NO. Si miramos en el gráfico podemos ver que hay niños que lo hacen muy bien a pesar de no tener la puntuación más alta en aguante Entonces, sirve este procedimiento para algo? La respuesta es SI. Con este procedimiento tenemos a los niños que van a tener una puntuación media más alta. La media de los niños será la que corresponde con la línea central para un valor de aguante? Estará cerca pero el intervalo de confianza del 95% significa que tenemos una confianza del 95% que la media estará entre las dos líneas interiores en sucesivas muestras tomadas de esa población Veo que el niño que mejor lo hizo está fuera del intervalo de confianza para las puntuaciones individuales, es eso posible? Claro. Pedro Valero Mora-valerop@uv.es 100
29 Contenidos 101 Intervalos de confianza en el SPSS Para conseguir el gráfico con los intervalos de confianza en el SPSS hay que hacer un diagrama de dispersión tal y como vimos previamente - En Gráficos/Cuadros de diálogo Antiguos/Diagramas de dispersión y ahí se elige Simple - Aparece este cuadro de diálogo Se pone la variable dependiente (la que se quiere predecir) en el eje Y y la variable independiente (la predicha) en el eje X Contrastes en Asociación y Predicción Regresión/El error de la predicción/intervalos de confianza en el SPSS
30 Contenidos 102 En el gráfico que aparece se hace doble click para modificarlo y aparece la ventana siguiente - Hay que hacer click en el icono que está arriba del gráfico Contrastes en Asociación y Predicción Regresión/El error de la predicción/intervalos de confianza en el SPSS
31 Contenidos 103 Eso produce el cuadro de dialogo siguiente - En él hay que elegir lineal y luego intervalos de confianza bien para la media o para los individuos Conseguir que aparezcan los dos no es fácil ya que cuando se pone uno se quita el otro pero en los ejercicios se pedirá o uno o el otro Contrastes en Asociación y Predicción Regresión/El error de la predicción/intervalos de confianza en el SPSS
32 Contenidos 104 Obteniendo las puntuaciones - En el cuadro de diálogo de regresión elegimos el botón Guardar - En el cuadro de diálogo que aparece elegimos: Valores pronosticados>no standarizados son las puntuaciones predichas Intervalos de predicción>media e individuos Contrastes en Asociación y Predicción Regresión/El error de la predicción/intervalos de confianza en el SPSS
33 Contenidos 105 El resultado aparece en la hoja de datos del SPSS - Los valores están ordenados de mayor a menor y sólo se muestra una parte Vemos por ejemplo que un niño con un aguante de 36 tiene una puntuación predicha (PRE_1) en número de vueltas de 49 y que el intervalo para la media iría de (LMCI_1) 45,39 a (UMCI_1) 52,67 El intervalo de confianza para las puntuaciones individuales iría de (LICI_1) 22,5 a (UICI_1) 75,57 Contrastes en Asociación y Predicción Regresión/El error de la predicción/intervalos de confianza en el SPSS
34 Asociación entre datos categóricos ASOCIACIÓN ENTRE DATOS CATEGÓRICOS Este apartado introduce la correlación para variables que no son numéricas ni ordinales, sino categóricas - Una variable categórica tiene valores que simplemente son distintos unos de otros pero que no tienen un orden o una magnitud mayor unos que otros - Tener en cuenta que hay ciertas variables ordinales que podemos elegir tratarlas como categóricas Por ejemplo, el nivel socioeconómico (alto, medio, bajo) puede tratarse como una variable categórica pero también como una variable ordinal - En ocasiones las variables numéricas son tratadas como categóricas Por ejemplo, a partir de unos tests de inteligencia puede distinguirse entre nivel alto, medio y bajo usando ciertos valores como punto de corte El objetivo de estas técnicas es ver si existe una asociación entre las categorías de una variable y las categorías de otra variable - Qué significa asociación entre categorías es un poco difícil de definir en abstracto pero con ejemplos es más sencillo Pedro Valero Mora-valerop@uv.es 106
35 Asociación entre datos categóricos/ejemplo Ejemplo Utilizaremos como ejemplo los datos del hundimiento del Titanic acerca del número de sujetos que sobrevivieron o no en función del tipo de billete que tenían (primera, segunda, tercera o tripulación), su género (hombre, mujer) y su edad (adulto, niño) - El hundimiento del Titanic tuvo un gran impacto en el desarrollo de medidas de seguridad marítima y es un buen ejemplo de las consecuencias que los acontecimientos trágicos tienen sobre la sociedad - Uno de los aspectos curiosos (que está reflejado en la película) es que posiblemente podría haberse salvado más gente pero en la urgencia del momento se discriminó a ciertas categorías de viajeros, los cuales no subieron en las lanchas de salvamento, que a veces quedaron medio vacías El análisis de los datos permitirá confirmar esa discriminación Los datos están en el archivo Titanic.sav Pedro Valero Mora-valerop@uv.es 107
36 Asociación entre datos categóricos/las mujeres primero Las mujeres primero La tabla de abajo muestra el género y la supervivencia en el Titanic Gender_*Survive_ tabulación cruzada Recuento Survive_ Died Lived Total Gender_ Fema Male Total Fijaros en que he puesto la variable independiente (género) en las filas y la dependiente (supervivencia) en las columnas Poner las variables siempre de esa manera hace mucho más fácil la interpretación de los resultados Esta tabla nos ofrece un recuento pero que es difícil de valorar a simple vista salvo en casos muy claros. Calcular porcentajes por fila en este caso ayuda. Gender_*Survive_ tabulación cruzada % dentro de Gender_ Survive_ Died Lived Total Gender_ Fema 26.8% 73.2% 100.0% Male 78.8% 21.2% 100.0% Total 67.7% 32.3% 100.0% - Fijaros que las sumas a lo largo de la fila dan 100% pero no a lo largo de las columnas Vemos que un 73% de las mujeres sobrevivieron y sólo un 21% de los hombres Pedro Valero Mora-valerop@uv.es 108
37 Asociación entre datos categóricos/las mujeres primero Otra forma de valorar el resultado anterior es calcular el valor predicho para cada celda bajo el supuesto de independencia para las casillas - Ese valor no es más que el total de fila por el total de columna dividido por el gran total Gender_*Survive_ tabulación cruzada Recuento esperado Survive_ Died Lived Total Gender_ Fema Male Total Ese es el valor esperado dada la cantidad de muertos y de hombres y mujeres. Si el resultado hubiera sido ese, la tabla de porcentajes de antes hubiera sido Gender_*Survive_ tabulación cruzada % dentro de Gender_ Survive_ Died Lived Total Gender_ Fema 67.7% 32.3% 100.0% Male 67.7% 32.3% 100.0% Total 67.7% 32.3% 100.0% Es decir, tendríamos el mismo número de muertos para hombres que para mujeres Pedro Valero Mora-valerop@uv.es 109
38 Asociación entre datos categóricos/las mujeres primero Si cogemos la tabla de esperadas y le restamos a cada celda el número de personas que fallecieron tenemos los residuales o diferencias Gender_*Survive_ tabulación cruzada Residuo Survive_ Died Lived Gender_ Fema Male Esto se interpreta como que murieron 192 mujeres menos de lo que tocaba y 192 más hombres Puesto que había más hombres que mujeres en el barco, la importancia relativa del residuo no es la misma para hombres que para mujeres. Dividiendo por la raíz cuadrada del valor esperado tenemos una medida del efecto relativo Gender_*Survive_ tabulación cruzada Residuo estándar Survive_ Died Lived Gender_ Fema Male Pedro Valero Mora-valerop@uv.es 110
39 Asociación entre datos categóricos/las mujeres primero Elevando al cuadrado cada celda y sumando tenemos el valor de que podemos comparar con una distribución de probabilidad para evaluar su significación. - En el SPSS eso aparece de la siguiente manera: Pruebas de chi-cuadrado Sig. asintótica Significación exacta (2 Significación Valor gl (2 caras) caras) exacta (1 cara) Chi-cuadrado de Pearson a Corrección de continuidad b Razón de verosimilitud Prueba exacta de Fisher Asociación lineal por lineal N de casos válidos 2201 a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es b. Sólo se ha calculado para una tabla 2x2 - Como siempre, el SPSS ofrece más de lo que le pedimos. Tenemos que mirar la línea que pone Chi-cuadrado de Pearson En el nivel de significación vemos si podemos rechazar la hipótesis nula de no asociación entre las variables Si rechazamos la hipótesis nula es que hay asociación, lo que significa que algunas de las casillas difieren de sus valores esperados 2 Pedro Valero Mora-valerop@uv.es 111
40 Asociación entre datos categóricos/las mujeres primero Cómo podemos valorar qué casillas difieren de sus valores esperados? Utilizando la tabla de residuos estandarizados podemos evaluar si están por encima o por debajo de 1.96 ya que estos residuales siguen la distribución normal Gender_*Survive_ tabulación cruzada Residuo estándar Survive_ Died Lived Gender_ Fema Male En este caso, todos los residuales están por encima o por debajo de 1,96 por lo que todas las casillas están por encima de ese límite Pedro Valero Mora-valerop@uv.es 112
41 Contenidos 113 La fórmula Los cálculos anteriores se pueden resumir en una fórmula 2 O E 2 = E - En donde O son las puntuaciones observadas por celda, y E son las esperadas Para calcular las esperadas hacemos E kj = n k n j N n k En donde es el número total de casos en la fila de una casilla, es el número total de casos en la columna de una casilla y N es el total de casos en la tabla Para saber la significación comparamos 2 con los valores de la tabla con k 1 j 1 grados de libertad (en este caso = 1) - Si el valor que hemos calculado es mayor que el de la tabla, se rechaza la hipótesis nula (o si usamos el ordenador y la significación es menor que 0.05 se rechaza la hipótesis nula) de no asociación n j Contrastes en Asociación y Predicción Asociación entre datos categóricos/las mujeres primero/la fórmula
42 Asociación entre datos categóricos/comparando proporciones o porcentajes directamente Comparando proporciones o porcentajes directamente En ocasiones lo que queremos es comparar dos proporciones directamente - Usaremos el ejemplo del titanic pero esta vez compararemos el efecto de la clase del billete: Survive_*Class_ tabulación cruzada Recuento Class_ 1st 2nd 3rd Cre Total Survive_ Died Lived Total Lo que nos interesa es ver el efecto de la clase social sobre la supervivencia. Si calculamos porcentajes ese efecto es más claro Survive_*Class_ tabulación cruzada % dentro de Class_ Class_ 1st 2nd 3rd Cre Total Survive_ Died 37.5% 58.6% 74.8% 76.0% 67.7% Lived 62.5% 41.4% 25.2% 24.0% 32.3% Total 100.0% 100.0% 100.0% 100.0% 100.0% - Vemos que en primera murieron el 37,5%, en segunda el 58,6%, etc. La impresión inicial es que los que viajaban en primera tuvieron ventaja sobre los de segunda, y estos sobre tercera y la tripulación Por otro lado, los que viajaban en tercera y la tripulación en cambio tienen valore similares Pedro Valero Mora-valerop@uv.es 114
43 Asociación entre datos categóricos/comparando proporciones o porcentajes directamente No obstante, esa es una impresión superficial, para decir si hay diferencias hace falta calcular una prueba de hipótesis de diferencias de proporciones (observar que usaremos proporciones en lugar de porcentajes para el cálculo) - La fórmula general es más o menos la de siempre: z = p 1 p ET - Para calcular el error típico hacemos lo siguiente: ET = pˆ qˆ n 1 pˆ qˆ n 2 - En donde pˆ = n ik + n ij + n k n j - y qˆ = 1 pˆ Pedro Valero Mora-valerop@uv.es 115
44 Asociación entre datos categóricos/comparando proporciones o porcentajes directamente Ejemplo: - Hay diferencia en supervivencia entre primera y segunda? pˆ = ; qˆ = = ET = = z = = La respuesta es que sí, ya que 5.7 es mayor que 1.96, el valor de z para una significación del 0.05 Pedro Valero Mora-valerop@uv.es 116
45 Asociación entre datos categóricos/asociación para variables categóricas en el SPSS Asociación para variables categóricas en el SPSS El comando que usaremos está en Analizar>Estadísticos Descriptivos>Tablas Cruzadas y produce el siguiente cuadro de diálogo - Hay que fijarse si tenemos una variable dependiente y una independiente y recordar donde las ponemos, si en filas o en columnas Pedro Valero Mora-valerop@uv.es 117
46 Asociación entre datos categóricos/asociación para variables categóricas en el SPSS - Luego hay que seleccionar Estadísticos para elegir Chi cuadrado - Y Casillas para elegir porc. por fila o por columna (si la variable dependiente está en columnas hay que elegir por filas y si está en filas hay que elegir por columna). También podéis elegir residuales estandarizados. Pedro Valero Mora-valerop@uv.es 118
47 Asociación entre datos categóricos/asociación para variables categóricas en el SPSS Con las opciones anteriores obtendréis el siguiente resultado Survive_*Class_ tabulación cruzada % dentro de Class_ Class_ 1st 2nd 3rd Cre Total Survive_ Died 37.5% 58.6% 74.8% 76.0% 67.7% Lived 62.5% 41.4% 25.2% 24.0% 32.3% Total 100.0% 100.0% 100.0% 100.0% 100.0% Pruebas de chi-cuadrado Sig. asintótica Valor gl (2 caras) Chi-cuadrado de Pearson a Razón de verosimilitud Asociación lineal por lineal N de casos válidos 2201 a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es Para interpretar la tabla de porcentajes hay que fijarse en qué parte suma 100% (en este caso las columnas) y empezar a leer a través de los valores correspondientes. Así: Decir que el 37.5% de los que viajaban en primera murieron es correcto - Decir que el 37.5% de los que murieron viajaban en primera NO ES CORRECTO. Fijaros en los porcentajes calculados por fila (de los que murieron, un 8.2% viajaba en primera) Survive_*Class_ tabulación cruzada % dentro de Survive_ Class_ 1st 2nd 3rd Cre Total Survive_ Died 8.2% 11.2% 35.4% 45.2% 100.0% Lived 28.6% 16.6% 25.0% 29.8% 100.0% Total 14.8% 12.9% 32.1% 40.2% 100.0% Pedro Valero Mora-valerop@uv.es 119
48 Asociación entre datos categóricos/asociación para variables categóricas en el SPSS Para hacer comparaciones de proporciones hay que poner la variable dependiente en filas y la independiente en columnas y entonces elegir comparar las proporciones de columna El resultado se muestra a continuación Survive_*Class_ tabulación cruzada % dentro de Class_ Class_ 1st 2nd 3rd Cre Total Survive_ Died 37.5% a 58.6% b 74.8% c 76.0% c 67.7% Lived 62.5% a 41.4% b 25.2% c 24.0% c 32.3% Total 100.0% 100.0% 100.0% 100.0% 100.0% Cada letra del subíndice denota un subconjunto de Class_ categorías cuyas proporciones de columna no difieren de forma significativa entre sí en el nivel Los subíndices indica la significación, si dos columnas tienen la misma letra es que las diferencias no son significativas (3ª y tripulación por ejemplo), si son diferentes es que las diferencias son significativas Pedro Valero Mora-valerop@uv.es 120
Respuestas CONTRASTES EN ASOCIACIÓN Y PREDICCIÓN
Respuestas CONTRASTES EN ASOCIACIÓN Y PREDICCIÓN 1. Utilizaremos correlaciones de Spearman porque las variables son de tipo ordinal. Los resultados se muestran a continuación. Todas las correlaciones son
Más detallesINFERENCIA CON RECUENTOS
. INFERENCIA CON RECUENTOS PEDRO M. VALERO MORA Inferencia con Recuentos-Pedro M. Valero Mora 2009 1 Parte 1 Análisis con 1 variable 1.1. De dónde vienen las frecuencias?. 1.1. De dónde vienen las frecuencias?
Más detallesCONTRASTES PARAMÉTRICOS
CONTRASTES PARAMÉTRICOS Contenidos Introducción 75 Contraste de dos medias 76 Grupos independientes 77 Grupos dependientes 85 Contraste de dos varianzas independientes 92 ANOVAs Unifactoriales entre e
Más detallesCONTRASTES NO PARAMÉTRICOS
CONTRASTES NO PARAMÉTRICOS Contenidos Encuestas 75 Comprobación de supuestos 79 Pruebas no Paramétricas en el SPSS 80 Contrastes para 2 muestras independientes 81 Contrastes para varias muestras independientes
Más detallesTABLAS DE CONTINGENCIA
Tablas de contingencia 1 TABLAS DE CONTINGENCIA En SPSS, el procedimiento de Tablas de Contingencia crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de
Más detallesINFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS
. Metodología en Salud Pública INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS Autor: Clara Laguna 7.1 INTRODUCCIÓN Los datos categóricos o variables cualitativas son muy frecuentes en
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
Más detallesEjercicio obligatorio seminario 9. Estadística
Ejercicio obligatorio seminario 9. Estadística En una muestra de 8 personas medimos la frecuencia cardíaca (FC) y la edad. 1. Di si en la muestra existe asociación lineal o correlación entre las dos variables
Más detallesCORRELACION Y REGRESION
CORRELACION Y REGRESION En el siguiente apartado se presenta como calcular diferentes índices de correlación, así como la forma de modelar relaciones lineales mediante los procedimientos de regresión simple
Más detallesAYUDA SPSS. TABLA DE CONTINGENCIA y PRUEBA CHI CUADRADO
Ayuda SPSS_Tabla de Contingencia/Prueba Chi Cuadrado AYUDA SPSS TABLA DE CONTINGENCIA y PRUEBA CHI CUADRADO Menú Analizar > Estadísticos Descriptivos>Tablas de Contingencia > Botón Estadísticos > Tildar
Más detallesPrueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya):
Prueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya): Objetivo de la prueba: se utiliza cuando se tienen varias muestras independientes de n individuos que se clasifican
Más detallesAnálisis de varianza de medidas repetidas
Análisis de varianza de medidas repetidas La intervención de los psicólogos en caso de catástrofes es un ámbito que está bien establecido - Son conocidas la participación de los psicólogos en el atentado
Más detallesCONTRASTES DE HIPÓTESES
CONTRASTES DE IPÓTESES 1. Contraste de hipótesis 2. Contrastes de tipo paramétrico 2.1 Contraste T para una muestra 2.2 Contraste T para dos muestras independientes 2.3 Análisis de la varianza 3. Contrastes
Más detallesPRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado
PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesEstructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias
Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesTema: Medidas de Asociación con SPSS
Tema: Medidas de Asociación con SPSS 1.- Introducción Una de las tareas habituales en el análisis de encuestas es la generación y análisis de tablas de contingencia, para las variables y categorías objetivo
Más detallesUna vez realizados estos procesos conviene verificar que han aparecido las dos nuevas variables (columnas) en el archivo de datos.
ECONOMETRÍA 09 PRACTICA 1: REPASO DE SPSS 1. Cuántas variables hay en el fichero? Y cuántas observaciones? Qué representa cada observación? Distingue entre variables cualitativas y cuantitativas. El fichero
Más detallesANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Más detallesEstadísticos Aplicados en el SPSS 2008
PRUEBAS ESTADISTICAS QUE SE APLICAN (SPSS 10.0) PARAMÉTRICAS:... 2 Prueba t de Student para una muestra... 2 Prueba t par muestras independientes... 2 ANOVA de una vía (multigrupo)... 2 ANOVA de dos vías
Más detallesPractica 1. Análisis de Tablas de Contingencia
Practica 1 A n á l i s i s d e T a b l a s d e C o n t i n g e n c i a Análisis de Tablas de Contingencia 1.- Partimos de dos variables, que suponemos relacionadas, entre las que examinaremos si existe
Más detallesEl análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)
El análisis de correspondencias Ana María López Jiménez Dept. Psicología Experimental (USE) 4. El análisis de correspondencias 4.. Introducción 4.2. Tabla de correspondencias 4.3. Dependencia e independencia
Más detallesMétodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
Más detallesEXAMEN Prof. J. Calventus S., 19 julio de 2013
U. S. T. Psicología Estadística Inferencial EXAMEN Prof. J. Calventus S., 19 julio de 2013 NOMBRE: Puntaje: Nota: Para responder esta prueba podrá consultarse todo tipo de material escrito. Utiliza un
Más detalles7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE
ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago
Más detallesEstadísticos para una muestra. Desviación Error típ. de Prueba para una muestra
Preguntas Contraste 1. Mucha gente tiene la convicción de que las parejas actuales buscan tener siempre exactamente dos hijos Dirías que los resultados obtenidos en esta una encuesta en la que se preguntó
Más detallesDISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II
DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 6 Problema 1.- Tengamos las variables sexo, nivel económico y consumo de tabaco. Los datos son los siguientes: Hombre Mujer Alto Bajo Alto Bajo 10 10
Más detallesDISTRIBUCIONES BIDIMENSIONALES
La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento
Más detallesPruebas estadís,cas para evaluar relaciones
Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la
Más detallesComparación de dos grupos independientes Solución no paramétrica. En capítulo 12: Métodos no paramétricos
Comparación de dos grupos independientes Solución no paramétrica En capítulo 12: Métodos no paramétricos Los métodos que hemos visto hasta ahora, asumen como distribución muestral la distribución Normal,
Más detallesUniversidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión
Más detallesLimitaciones de la prueba (las mismas que para la prueba de Independencia):
Prueba Ji-cuadrado de Homogeneidad: Objetivo de la prueba: se utiliza cuando se tienen varias muestras independientes de n individuos que se cl asifican respecto a una variable cualitativa y se desea conocer
Más detalles13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD
13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS Las pruebas estadísticas para analizar la relación entre dos variables cuantitativas,
Más detallesTEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS
TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis
Más detallesPRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1
ESTADÍSTICA CURSO 2012/2013 GRADO EN BIOLOGÍA PRÁCTICA: ESTADÍSTICA DESCRIPTIVA CON SPSS 1 1. Introducción El programa estadístico SPSS está organizado en dos bloques: el editor de datos y el visor de
Más detallesESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple
ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes
Más detalles1. Realice la prueba de homogeneidad de variancias e interprete los resultados.
1ª PRÁCTICA DE ORDENADOR (FEEDBACK) Un investigador pretende evaluar la eficacia de dos programas para mejorar las habilidades lectoras en escolares de sexto curso. Para ello asigna aleatoriamente seis
Más detallesDr. Abner A. Fonseca Livias
UNIVERSIDAD NACIONAL HERMILIO VALDIZAN FACULTAD DE ENFERMERÍA Dr. Abner A. Fonseca Livias 3/21/2015 6:17 AM Dr. Abner Fonseca Livias 1 UNIVERSIDAD NACIONAL HERMILIO VALDIZAN ESCUELA DE POST GRADO Dr. Abner
Más detallesEn las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre.
Prueba Ji-cuadrado de Independencia: Objetivo de la prueba: se utiliza cuando se tiene una muestra de n individuos que se clasifican respecto a dos variables, preferentemente cualitativas (nominales dicotómicas
Más detallesPasos. i Aplicar la prueba X 2 para determinar la significación estadística de las proporciones entre ambas variables (no son iguales)
Relación entre variables cualitativas Pasos Construir una tabla de contingencia Crear una tabla con las frecuencias esperadas f ei (frecuencias teóricas en caso de que X e Y fueran independientes), calculadas
Más detallesPrueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados):
Prueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados): Objetivo de la prueba: se utiliza cuando se tiene una muestra de n individuos que se clasifican respecto a dos variables,
Más detallesINFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón
Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesIntroducción IMADIL /17/2014. Tema 3. Características estadísticas fundamentales (Tercera parte)
IMADIL 0 /7/0 Tema. Características estadísticas fundamentales (Tercera parte) Ignacio Martín y José Luis Padilla IMADIL 0. Introducción. Representación Gráfica. Correlación. Índice Introducción Uno de
Más detallesDISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II
DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 7 Problema 1. Tengamos el siguiente ANOVA obtenido en una investigación con N 15 donde se estudia la relación entre autoeficacia percibida (X y el rendimiento
Más detallesTEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS
TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo
Más detallesDISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II
DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 5 En una determinada investigación se estudió el rendimiento en matemáticas en función del estilo de aprendizaje de una serie de estudiantes de educación
Más detallesSPSS Aplicación práctica: Base de datos del HATCO
Aplicación práctica: Base de datos del HATCO Datos: observaciones de variables obtenidos desde encuentas a clientes de un distribuidor industrial. Variables de interés en la aplicación: Percepciones de
Más detallesDistribuciones Bidimensionales.
Distribuciones Bidimensionales. 1.- Variables Estadísticas Bidimensionales. Las variables estadísticas bidimensionales se representan por el par (X, Y) donde, X es una variable unidimensional, e Y es otra
Más detallesENCUESTA CUATRIENAL DE ESTRUCTURA SALARIAL 2014
ENCUESTA CUATRIENAL DE ESTRUCTURA SALARIAL 2014 Categoría: Bachillerato Grupo: PEPE Alumno: José M. García Arcas Tutora: M. José Calvo Leva IES Rey Carlos III OBJETIVOS. TÉCNICAS USADAS. PROGRAMAS INFORMÁTICOS
Más detalles4. Obtén las siguientes tablas de doble entrada para las variables Dispersión y Formación:
ACTIVIDAD DE INFERENCIA Y ASOCIACIÓN 1. Obtén los estadísticos descriptivos básicos y un intervalo de confianza del 95% para la media del coste en farmacia por habitante. A partir del resultado obtenido
Más detallesTEMA 10 COMPARAR MEDIAS
TEMA 10 COMPARAR MEDIAS Los procedimientos incluidos en el menú Comparar medias permiten el cálculo de medias y otros estadísticos, así como la comparación de medias para diferentes tipos de variables,
Más detallesDISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II
DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II SOLUCIÓN PRACTICA 1 Problema 2-. Para una serie de investigaciones, en las que el tamaño de la muestra era el mismo, se ha calculado la t de Student con objeto
Más detallesGUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS
GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS Se realizó un estudio a partir de una muestra aleatoria de mujeres atendidas por el departamento de obstetricia y ginecología de cierta clínica particular.
Más detallesUniversidad Nacional Abierta Estadística Aplicada (Cód. 746) Vicerrectorado Académico Cód. Carrera: Área de Matemática Fecha:
Segunda Prueba Parcial Lapso 7-746 /6 Universidad Nacional Abierta Estadística Aplicada (Cód. 746) Vicerrectorado Académico Cód. Carrera: 6-6 - 6 Fecha: --8 MODELO DE RESPUESTAS Objetivos 5 al 8 OBJ 5
Más detallesANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Más detallesbáscula 1 báscula 2 Podemos comprobar que en ambos casos el p valor > 0,05, lo cual implica la normalidad de las muestras.
LABORATORIO 2 LABORATORIO INFORMÁTICO Caso 1. En una planta de fabricación de hormigón se quiere comprobar si dos básculas de distintos fabricantes están midiendo lo mismo. Para ello se toman aleatoriamente
Más detallesObjetivo: Proponer modelos para analizar la influencia
TEMA 3: REGRESIÓN LINEAL SIMPLE Objetivo: Proponer modelos para analizar la influencia de una variable cuantitativa sobre un fenómeno que nos interesa estudiar. 1. Modelo lineal l de regresión 2. Estimación
Más detallesSOLUCIÓN PRÁCTICA 3 de SPSS ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
SOLUCIÓ PRÁCTICA 3 de SPSS ESTADÍSTICA DESCRIPTIVA BIDIMESIOAL Ejercicio 1. [PROCEDIMIETOS CORRELACIÓ Y REGRESIÓ] Abra el archivo Coches.sav, que contiene las 5 variables que se describen en el siguiente
Más detallesInferencia en tablas de contingencia
GoBack Inferencia en tablas de contingencia Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 36 Distribución condicionada exacta Intervalo para los odds ratio Intervalo de la diferencia
Más detallesCONTRASTES PARAMÉTRICOS
CONTRASTES PARAMÉTRICOS Contenidos Introducción 75 Contraste de dos medias 76 Grupos independientes 77 Grupos dependientes 85 Contraste de dos varianzas independientes 92 ANOVAs Unifactoriales entre e
Más detallesPRÁCTICA 2: LA RECTA DE REGRESIÓN
PRÁCTICA 2: LA RECTA DE REGRESIÓN Los contenidos están organizados para que pueda avanzar a la vez que hacer los ejercicios propuestos en la práctica 2 del cuadernillo de práticas. Asegúrate de entender
Más detallesDistribución bidimensional. Marginales. Correlación lineal. Rectas de regresión.
REGRESIÓN LINEAL. Distribución bidimensional. Marginales. Correlación lineal. Rectas de regresión. Dada una población, hasta ahora hemos estudiado cómo a partir de una muestra extraída de ella podemos
Más detallesSeminario 10: Correlación
ESTADÍSTICA Y TIC Seminario 10: Correlación Consolación López Sousa 2013 EUNUCIADO 1 A partir de una tabla en el programa spss que exponemos a continuación, debemos realizar los siguientes ejercicios.
Más detallesSoluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 2008 Primera semana
Soluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 008 Primera semana Ejercicio 1. Para analizar la asociación entre el nivel de estudios y la renta calcularemos el estadístico
Más detallesPráctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS
Práctica. Intervalos de confianza 1 Práctica ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS Objetivos: Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza
Más detallesTema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos
Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.
Más detallesQué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)
Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión
Más detallesEstado civil Frecuencia observada Casado 50 Soltero 30 Viudo 15 Divorciado 5 Total 100
Prueba de Ji-cuadrado Bondad de ajuste: Se refiere a la comparación de la distribución de una muestra con alguna distribución teórica que se supone describe a la población de la cual se extrajo la muestra.
Más detallesTEMA 2 Diseño de experimentos: modelos con varios factores
TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial
Más detallesTALLER DE INTRODUCCIÓN A LOS NEGOCIOS
REGRESIÓN LINEAL SIMPLE INTRODUCCIÓN Si sabemos que existe una relación entre una variable denominada dependiente y otras denominadas independientes (como por ejemplo las existentes entre: la experiencia
Más detallesDISTRIBUCIONES UNIDIMENSIONALES:
DISTRIBUCIONES UNIDIMENSIONALES: INTRODUCCIÓN Todo análisis estadístico se inicia con una primera fase descriptiva de los datos. Ésta tiene por objeto sintetizar la información mediante la elaboración
Más detallesESTADÍSTICA BIVARIADA
ESTADÍSTICA BIVARIADA Estadística y Tecnología de la Información y Comunicación ENRIQUE ÍÑIGUEZ CASTRO 1º de Enfermería, grupo 4. Subgrupo 16. Índice 1. Introducción.... 2 2. Objetivos.... 2 3. Metodología...
Más detallesRegresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.
1 DEFINICIONES PREVIAS Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable. Correlación: es la cuantificación del grado de relación existente
Más detallesSoluciones a los nuevos ejercicios propuestos
Soluciones a los nuevos ejercicios propuestos 1 Soluciones a los nuevos ejercicios propuestos 1. Sea X la cantidad de calcio en sangre del paciente (en mg. por cada 100 ml. de sangre). X N(µ, σ 2 ). Tenemos
Más detallesPRUEBA CHI-CUADRADO. Para realizar un contraste Chi-cuadrado la secuencia es:
PRUEBA CHI-CUADRADO Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada
Más detallesNORMAS El examen consta de dos partes: Diez Cuestiones: (tiempo: 60 minutos)
NORMAS El examen consta de dos partes: 0.0.1. Diez Cuestiones: (tiempo: 60 minutos) No se permite ningún tipo de material (libros, apuntes, calculadoras,...). No se permite abandonar el aula una vez repartido
Más detallesANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Correlaciones bivariadas y parciales
ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Correlaciones bivariadas y parciales Francisca José Serrano Pastor Pedro A. Sánchez Rodríguez - Objetivo: conocer la relación entre variables
Más detallesProfesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
Más detallesEstadística II Curso 2011/12
Estadística II Curso 2011/12 Guión de la Práctica 1 Introducción a Statgraphics. Intervalos de confianza y contrastes de hipótesis para una y dos poblaciones 1. Contenidos de la práctica - Introducción
Más detallesANÁLISIS ESTADÍSTICO CORRELACIÓN LINEAL
ANÁLISIS ESTADÍSTICO CORRELACIÓN LINEAL Jorge Fallas jfallas56@gmail.com 2010 1 Temario Concepto de correlación Diagramas de dispersión Correlación: dirección, intensidad Coef. Correlación lineal de Pearson
Más detallesA: Broca B: velocidad A B AB Vibración Totales 1/ ,2 18,9 12,9 14,4 64,4 = (1) 1/ ,2 24,0 22,4 22,5 96,1 = a
LORTORIO 8 - LORTORIO INFORMÁTICO Caso. Interesa estudiar el efecto del tamaño de broca (factor ) y de la velocidad (factor ) sobre la vibración de la ranuradora (respuesta Y). Para ello se decide utilizar
Más detallespeso edad grasas Regresión lineal simple Los datos
Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos
Más detallesAl nivel de confianza del 95%, las puntuaciones típicas son: 2- La hipótesis alternativa es; A) ; B) ; C).
A continuación se presentan 4 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la misma así como de preguntas teóricas generales. SITUACIÓN 1: La empresa SND's de sondeos
Más detallesEstadística Descriptiva Bivariante e Intervalos de Confianza
Estadística Descriptiva Bivariante e Intervalos de Confianza Introducción En este guión se presenta el análisis conjunto de dos variables (análisis bivariante) y una introducción a los intervalos de confianza
Más detallesCAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA
Página 1 de 5 CAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA Descripción entre variables cualitativas Como ya sabemos la metodología estadística depende del tipo de variable(s) que estemos
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)
OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos
Más detallesLaboratorio de Estadística Con Manejo en SPSS.
Laboratorio de Estadística Con Manejo en SPSS. Sesión 1: Importación de Datos, Gráficos y Análisis Bivariado. Desde el 02 de Abril hasta el 06 de Abril del 2018 Patricio Videla J. Profesor Coordinador
Más detallesDISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES RELACION DE DOS CARACTERES Relación entre variables cualitativas
08/11/01 DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES RELACION DE DOS CARACTERES Relación entre variables cualitativas CARACTERES INDEPENDIENTES Respuesta a un tratamiento No Sí Total (marginales por filas)
Más detallesUnidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15
Unidad Temática 3: Estadística Analítica Unidad 9 Regresión Lineal Simple Tema 15 Estadística Analítica CORRELACIÓN LINEAL SIMPLE Indica la fuerza y la dirección de una relación lineal proporcional entre
Más detallesNota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
Más detallesTEMA 4 Modelo de regresión múltiple
TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.
Más detalles9.- Análisis estadísticos con R Commander
Tipos de datos - Cuantitativos: se expresan numéricamente. - Discretos: Toman valores numéricos aislados - Continuos: Toman cualquier valor dentro de unos límites dados - Categóricos o Cualitativos: No
Más detallesREGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
Más detallesPRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.
Más detalles7. De acuerdo con la gráfica siguiente, el contraste estadístico es:
1. Un investigador desea saber si los hombres y las mujeres difieren en flexibilidad cognitiva. Para ello, analiza los datos y obtienen los siguientes resultados. Satisfacen los datos el supuesto de homocedasticidad?
Más detalles