Curso de Estadística no-paramétrica
|
|
- José Antonio Aguilera Soler
- hace 7 años
- Vistas:
Transcripción
1 Curso de Estadística no-paramétrica Sesión 4: Análisis de datos categóricos Facundo Muñoz Grup d Estadística espacial i Temporal Departament d Estadística en Epidemiologia i Medi Ambient i Investigació Operativa Universitat de València Junio 2013 Ejemplo Grupos sanguíneos en regiones de Escocia Ejemplo 2.- Mitchell et al. (1976) estudiaron la distribución de los grupos sanguíneos en varias regiones de Sur-Oeste de Escocia (Annals of Human Biology), obteniendo: A B O AB Eskdale Annandale Nithsdale Se distribuyen los grupos sanguíneos de igual manera en las diferentes regiones? 2 / 26
2 Abstracción Contraste de Homogeneidad En k grupos de individuos (subpoblaciones) se observa una característica X que puede tomar r valores distintos (categorías) Los porcentajes de las r categorías son los mismos en las k subpoblaciones? La variable X se distribuye idénticamente en las k subpoblaciones? Tabla de contingencia: Variable X Categ. 1 Categ. 2 Categ. r Subp. 1 O11 O21 Or 1 O+1 Subp. 2 O12 O22 Or 2 O+2 Subp. k O1k O2k Ork O+k O1+ O2+ Or + N = O++ donde Oij número de observaciones de la categoría i de la variable X que pertenecen a la subpoblación j. Oi+ número de observaciones de la categoría i de la variable X. O+j número de observaciones de la subpoblación j. 3 / 26 Contraste de Homogeneidad Objetivo: contrastar si la variable X se distribuye igual en las k subpoblaciones. Si la hipótesis H0 fuera cierta, podemos estimar las probabilidades de esta distribución a partir de los datos observados: Oi+ pi+ = P(X = i) = N Por lo tanto, el número esperado de observaciones en la celda (i, j), bajo la hipótesis de homogeneidad, y dado que la muestra de la subpoblación j es de tamaño O+j, es Oi+ O+j N Para comparar las frecuencias observadas con las frecuencias esperadas podemos utilizar el estadístico de contraste: Eij = pˆi+ O+j = χ2s = X (Oij Eij )2 ij Eij χ2 ((r 1)(k 1)) 4 / 26
3 Homogeneidad e independencia Contraste de Homogeneidad Implementación SPSS La variable debe ser Nominal, con una codificación numérica Si no es así, utilizar Transformar:Recodificación automática Analizar:Estadísticos descriptivos:tablas de contingencia + Statistics:Chi-square Ejercicio Representar visualmente los datos mediante un diagrama de barras agrupado Gráficos:Generador de gráficos Comprobar las homogeneidad de la distribución de los grupos sanguíneos por regiones de Escocia con el banco de datos grupos-escocia.csv / 26 Homogeneidad e independencia Ejemplo Pendiente del terreno y capa freática Ejemplo 3.- Para analizar la relación de la pendiente del terreno con la capa freática, se tomaron datos de 144 localizaciones en una zona al sur y al este de Cambridge. Los datos recogidos corresponden al ángulo de la pendiente del terreno, clasificado en llana, suave y empinada, y a la altura de la capa freática, según sea alta, media o baja. Estos datos se resumen en la tabla: Pendiente terreno Llana Suave Empinada Altura Alta Capa Media Freática Baja Es independiente la altura de la capa freática de la pendiente del terreno? 6 / 26
4 Abstracción Contraste de Independencia Sean ahora X e Y dos variables aleatorias de las que tenemos una muestra aleatoria de tamaño N. Al igual que en los contrastes de homogeneidad, las observaciones se clasifican en forma de tabla de frecuencias observadas (Oij ). En concreto, clasificamos la muestra aleatoria según las r categorías de la variable categórica X y las k categorías de la variable categórica Y. Variable X Categ. 1 O11 O21 Or 1 O+1 Categ. 1 Categ. 2 Categ. r Variable Y Categ. 2 O12 O22 Or 2 O+2 Categ. k O1k O2k Ork O+k O1+ O2+ Or + N = O++ donde Oij número de observaciones de la categoría i de la variable X que pertenecen a la categoría j de la variable Y. Oi+ número de observaciones de la categoría i de la variable X. O+j número de observaciones de la categoría j de la variable Y. 7 / 26 Contraste de Independencia Si la hipótesis H0 de independencia fuera cierta: pi j = P(X = i Y = j) = P(X = i) = pi+ Como además pi j = P(X = i Y = j) = P(X =i,y =j) P(Y =j) = pij p+j Tenemos que: pij = P(X = i, Y = j) = P(X = i)p(y = j) = pi+ p+j Estas probabilidades podemos estimarlas a partir de los datos, por lo que el número esperado de casos en la celda (i, j), bajo la hipótesis de independencia es: Oi+ O+j Oi+ O+j = N N N Para comparar las frecuencias observadas con las frecuencias esperadas podemos utilizar el estadístico de contraste: Eij = N pˆij = N pˆi+ pˆ+j = N χ2s = X (Oij Eij )2 ij Eij χ2 ((r 1)(k 1)) 8 / 26
5 Test de la razón de verosimilitud El estudio de la independencia o de la homogeneidad se realiza mediante el Estadístico χ2 X (Oi Ei )2 2 χ = celdas Ei Alternativamente se puede realizar mediante el Estadístico de la razón de verosimilitud O X i 2 G =2 Oi log Ei celdas Bajo la hipótesis nula de independencia, también sigue una distribución Ji-cuadrado con ν = (r 1)(k 1) grados de libertad. Basado en la teoría de máxima verosimilitud y, para muestras de tamaño grande, da resultados bastante parecidos al test χ2. Sin embargo, es más potente con muestras pequeñas. SPSS Sale por defecto en los resultados cuando se pide un χ2 9 / 26 Contraste de Independencia Implementación SPSS Idéntica! Ejercicio Comprobar la independencia de la pendiente del terreno y la altura de la capa freática con el banco de datos pendiente-capafreatica.csv Notar que estos datos no corresponden a casos individuales, sino que están agrupados por combinaciones de las categorías. En este caso se debe ponderar los casos Datos:ponderar casos. Representar visualmente los datos mediante un diagrama de barras agrupado (opción de la ventana de Tablas de contingencia) 10 / 26
6 Homogeneidad e independencia Contrastes de Homogeneidad e Independencia Aspectos en común y diferencias Los problemas de homogeneidad e independencia básicamente se diferencian en el tipo de muestreo que ha generado los datos, aunque en general, podemos pensar que el problema es similar: estudiar si existe alguna relación/asociación entre los niveles de las variables consideradas. Ambos problemas comparten el hecho de que tenemos conteos o frecuencias de clasificación observadas en una tabla de contingencia. Observar que en las tablas de contingencia no se suele distinguir entre variable respuesta y explicativas, aunque veremos ahora que dicha distinción puede ser de utilidad a la hora de modelar e interpretar. Observar también que el estadístico de contraste es el mismo en ambas situaciones ya que las frecuencias esperadas bajo las dos hipótesis son las mismas. 11 / 26 Homogeneidad e independencia Condiciones de aplicabilidad del Test Chi-cuadrado Condiciones Las frecuencias esperadas en cada celda deben ser suficientemente grandes (al menos ), ya que el test se basa en una aproximación La muestra o submuestras deben ser aleatorias En el caso del contraste de Homogeneidad, las submuestras deben ser independientes Alternativas para tablas 2 2 El Estadístico χ 2 produce valores artificialmente bajos en tablas 2 2, aumentando la probabilidad del Error tipo I. En este caso, conviene utilizar alguna de las siguientes alternativas. Test exacto de Fisher Corrección de Yates (o corrección por continuidad) Estas medidas alternativas son proporcionadas automáticamente por SPSS cuando la tabla de contingencia es de orden / 26
7 Homogeneidad e independencia Ejemplo Actitud de enfermeros y enfermeras En un pequeño centro de salud se realiza una encuesta para evaluar la actitud de los enfermeros y las enfermeras hacia los pacientes. Finalmente, se reduce la valoración a una actitud positiva o negativa. Actitud - + Sexo Mujer 1 Hombre 1 4 Ejercicio Hay diferencias significativas en la actitud según el sexo? (enfermeros-enfermeras.csv) La tabla es 2 2 y los valores esperados son todos menores que. El Estadístico χ 2 no es válido. 13 / 26 Homogeneidad e independencia Resumen análisis de datos categóricos Cuando disponemos de una o dos variables categóricas nos podemos encontrar básicamente ante tres situaciones: Una variable observada categórica (no necesariamente dicotómica) de la que queremos estudiar si los conteos observados en cada una de sus categorías cumplen unas determinadas proporciones: Contraste de bondad de ajuste. Una variable observada categórica (no necesariamente dicotómica) de la que queremos estudiar si se comporta igual en varias subpoblaciones (o muestras): Contraste de homogeneidad. Dos variables observadas de las que queremos analizar si están relacionadas o son independientes. Es decir, una muestra aleatoria de dos variables categóricas (no necesariamente dicotómicas): Contraste de Independencia 14 / 26
8 Homogeneidad e independencia Medidas de asociación de variables categóricas Ejemplo Si se les pidiera adivinar el grado de solvencia de un cierto país europeo (en una escala de calificación tipo AAA, AA, etc.), cuál sería su estimación? La moda: el grado más común, es el que tiene más chances Ahora, si sabemos que el país está situado en el norte de Europa Cambiarían la estimación? (independencia) En los análisis cuantitativos suele interesar predecir el valor de una variable (dependiente) a partir del conocimiento de una o varias covariables La medida de asociación entre las variables es el grado en que la información adicional permite mejorar la predicción 1 / 26 Homogeneidad e independencia Medidas de asociación de variables categóricas Puntos a destacar Cuantifican el grado de asociación entre dos variables categóricas También pueden utilizarse para valorar la independencia, aunque suelen utilizarse después de establecer la significatividad de la asociación Hay muchas medidas diferentes, cada una más o menos sensible a determinado tipo específico de asociación No hay una medida que sea la mejor para todas las situaciones Elegiremos una u otra en función del tipo de datos, la hipótesis de interés y de las propiedades de cada una de las medidas No es científicamente honesto calcular muchas medidas y elegir a posteriori la que mejor ha funcionado Estas medidas deben considerarse únicamente como una aproximación exploratoria inicial para un análisis posterior 16 / 26
9 Homogeneidad e independencia Variables nominales Medidas basadas en χ 2 Coef. de contingencia (Pearson, 1904) χ C = 2 χ 2 + N V de Cramer (Cramér, 1946) y coeficiente Phi χ V = 2 N(m«ın{r, c} 1) Rango: [0, 1] (desde no asociación hsata asociación completa) Convención sobre el tamaño del efecto: pequeño = 0,1, medio = 0,3, grande = 0, No importa cuál variable es fila y cuál es columna, ni tampoco el orden de las categorías Mientras que C varía con el número de filas y columnas, V está diseñado para comparar tablas con diferentes dimensiones En el caso de dos variables binarias (tabla 2 2), la V de Cramer se reduce a φ = χ 2 N 17 / 26 Homogeneidad e independencia Variables nominales Medidas basadas en la reducción proporcional del error Coeficiente Lambda (Kruskal & Goodman, 194) λ B = E A E A B E A Refleja la reducción relativa en el error de predicción cuando se utilizan los valores de la variable independiente (B) para predecir la dependiente (A) utilizando la moda de la distribución condicional o incondicional. Hay una versión simétrica λ que toma un valor intermedio entre λ A y λ B y es útil cuando las variables son intercambiables SPSS los calcula todos. Hay que usar el adecuado El resultado es una cantidad interpretable, que varía entre 0 y 1 λ B = 0 implica que conocer B no ayuda a reducir en nada el error de predicción de A (e.g., si A y B independientes) λ B = 1 implica asociación perfecta: conocer B determina exactamente la categoría de A 18 / 26
10 Variables nominales Medidas basadas en la reducción proporcional de la entropía Coeficiente de Incertidumbre U= HA HA B HA Refleja la reducción relativa en la entropía de la distribución predictiva cuando se utilizan los valores de la variable independiente (B) para predecir la dependiente (A). La entropía (Shannon, 1963) es una medida inversa de la cantidad de información contenida en una distribución U compara la distribución completa, y no sólo la moda SPSS también calcula las versiones direccionales y simétricas. Hay que usar la adecuada El resultado es una cantidad interpretable, en el mismo sentido que λ, y que también varía entre 0 y 1 19 / 26 Ejemplo Actitud de enfermeros y enfermeras Hasta ahora hemos conseguido determinar la existencia de una relación entre el sexo y la actitud hacia el paciente. Pero el p-valor obtenido en los contrastes de independencia no mide la magnitud de la asociación. Actitud - + Sexo Mujer Hombre EA = 11 6 = EA B = (6 ) + ( 4) = 2 λb = EA EA B EA = 2 = 0,6 El error se reduce en un 60 % Ejercicio Valorar la magnitud del efecto Sexo utilizando medidas adecuadas. Analizar:Estadísticos descriptivos:tablas de contingencia + Estadísticos:(Nominales) 20 / 26
11 Medidas de asociación Variables ordinales Dirección de la asociación Como ahora disponemos del orden de las categorías tiene sentido hablar de la dirección de la asociación. Variables positivamente asociadas: los valores pequeños de A aparecen con los valores pequeños de B. Variables negativamente asociadas: los valores pequeños de A aparecen con los valores grandes de B. Sea un par de observaciones, una perteneciente a la celda (i, j) y la otra a la celda (i, j ). Todas las medidas de asociación ordinales son simples funciones de las siguientes categorías: C = #{parejas tales que: (i > i 0 &j > j 0 ) (i < i 0 &j < j 0 )} D = #{parejas tales que: (i > i 0 &j < j 0 ) (i < i 0 &j < j 0 )} TA = #{parejas tales que: i = i 0 } TB = #{parejas tales que: j = j 0 } 21 / 26 T = #{parejas tales que: i = i 0 &j = j 0 } Medidas de asociación Variables ordinales La asociación es positiva cuando C D > 0 y negativa cuando C D < 0 Gamma γ = CC D +D No tiene encuenta los empates Si los hay, sobreestima la asociación 2(C D) (C +D+TB )(C +D+TA ) (C D) τb = C +D+T B C +D+TA D) m«ın{r,c} τc = 2(C N 2 m«ın{r,c} 1 d de Somers d = τb de Kendall τc de Kendall Todas varían entre 1 y 1 (asociación perfecta negativa o positiva), pasando por 0 (ausencia de asociación) Ejercicio Cuantificar el grado de asociación de las variables education y Loan (nivel de educación y si el banco concedió el préstamos solicitado) del banco de datos Loan.sav 22 / 26
12 Homogeneidad e independencia Ejemplo Visitas al gimnasio y ritmo cardíaco La hipótesis de un estudio es que quienes van al gimnasio más frecuentemente tienen un ritmo cardíaco (en reposo) más bajo. 90 RitmoC Qué clase de variables están en juego? NVisitas En ese caso, cuál sería el método más natural para analizar la relación entre ellas? Pintar los datos (gimnasio-corazon.csv) y calcular la Correlación de Pearson (Analizar:Correlaciones:Bivariadas) 23 / 26 Homogeneidad e independencia Ejemplo (cont.) Visitas al gimnasio y ritmo cardíaco Interpretación de los resultados y replanteamiento del análisis: No hay una correlación lineal significativa entre las variables Sin embargo, la hipótesis es razonable Posibles fallos: 1 La relación existe pero no es lineal (en cuyo caso, podría buscarse una transformación de los datos adecuada) 2 Las hipótesis del test de significatividad (paramétrico) del coeficiente de correlación ρ de Pearson no se cumplen 3 Simplemente hubo mala suerte con la muestra El número de visitas no necesariamente refleja la duración y la intensidad de la actividad El ritmo cardíaco puede tener una gran variabilidad entre personas, debido a otros factores Por tanto, no es raro que la relación lineal no sea muy marcada Las medidas ordinales pueden detectar relaciones no lineales Analizar:Estadísticos descriptivos:tablas de contingencia + Estadísticos:Correlaciones 24 / 26
13 Medidas de asociación Variables ordinales Rho ρs de Spearman Valoración de la correlación entre dos variables, basándose en la ordenación de las categorías. 6 Di2 ρs = 1 N(N 2 1) P donde N es el número de parejas y Di es la diferencia en el orden que ocupa cada observación en los ranking de las dos variables. Detecta asociaciones monótonas, no sólo lineales. Adecuado cuando las variables tiene muchas (+) categorías Cuando son cuantitativas, cada valor observado se categoriza según su orden en el ranking 2 / 26 Spearman vs. Pearson 26 / 26
Análisis descriptivo con SPSS. Favio Murillo García
Análisis descriptivo con SPSS Favio Murillo García Tablas de contingencia Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa
Más detallesTABLAS DE CONTINGENCIA
Tablas de contingencia 1 TABLAS DE CONTINGENCIA En SPSS, el procedimiento de Tablas de Contingencia crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de
Más detallesTema: Medidas de Asociación con SPSS
Tema: Medidas de Asociación con SPSS 1.- Introducción Una de las tareas habituales en el análisis de encuestas es la generación y análisis de tablas de contingencia, para las variables y categorías objetivo
Más detallesCurso de Estadística no-paramétrica
Curso de Estadística no-paramétrica Sesión 3: Regresión no paramétrica y Contrastes de Aleatoriedad y bondad de ajuste Facundo Muñoz Grup d Estadística espacial i Temporal Departament d Estadística en
Más detallesAnálisis de datos cualitativos
Capítulo Análisis de datos cualitativos DEFINICIÓN DE VARIABLES CUALITATIVAS Son aquellas variables cuyos valores son un conjunto de cualidades no numéricas a las que se llama categorías o modalidades.
Más detallesLucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Más detallesTEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS
TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo
Más detallesPruebas estadís,cas para evaluar relaciones
Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la
Más detallesINFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón
Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado
Más detallesPractica 1. Análisis de Tablas de Contingencia
Practica 1 A n á l i s i s d e T a b l a s d e C o n t i n g e n c i a Análisis de Tablas de Contingencia 1.- Partimos de dos variables, que suponemos relacionadas, entre las que examinaremos si existe
Más detallesPrueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados):
Prueba Ji-cuadrado de Independencia cuando solo tengo datos en tabla (datos tabulados): Objetivo de la prueba: se utiliza cuando se tiene una muestra de n individuos que se clasifican respecto a dos variables,
Más detallesPrueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya):
Prueba Ji-cuadrado de Homogeneidad cuando tengo los datos tabulados (en tablas resumidos ya): Objetivo de la prueba: se utiliza cuando se tienen varias muestras independientes de n individuos que se clasifican
Más detallesANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación
ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación Francisca José Serrano Pastor Pedro A. Sánchez Rodríguez - Implica siempre a variables
Más detallesEn las tablas 2x2 se emplea la prueba Ji-cuadrado Corrección de Yates siempre.
Prueba Ji-cuadrado de Independencia: Objetivo de la prueba: se utiliza cuando se tiene una muestra de n individuos que se clasifican respecto a dos variables, preferentemente cualitativas (nominales dicotómicas
Más detallesINFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS
. Metodología en Salud Pública INFERENCIA PARÁMETRICA: RELACIÓN ENTRE DOS VARIABLES CUALITATIVAS Autor: Clara Laguna 7.1 INTRODUCCIÓN Los datos categóricos o variables cualitativas son muy frecuentes en
Más detallesÍNDICE INTRODUCCIÓN... 21
INTRODUCCIÓN... 21 CAPÍTULO 1. ORGANIZACIÓN DE LOS DATOS Y REPRESENTACIONES GRÁFICAS... 23 1. ORGANIZACIÓN DE LOS DATOS... 23 1.1. La distribución de frecuencias... 24 1.2. Agrupación en intervalos...
Más detallesINDICE Capitulo 1. Nociones Básicos sobre el SPSS/PC+ Capitulo 2. Nociones Básicos sobre Probabilidad
INDICE Prólogo XIX Introducción XXIII Capitulo 1. Nociones Básicos sobre el SPSS/PC+ 1 1. Qué es y para qué sirve el SPSS/PC+ 1 2. funcionamiento general 1 A. Módulos, comandos y subcomandos 1 B. Estilos
Más detallesEstudiaremos tres tipos de contrastes, cada uno de los cuales trata de responder a la pregunta correspondiente: Bondad del ajuste Proceden los datos
Contrastes 2 χ Estudiaremos tres tipos de contrastes, cada uno de los cuales trata de responder a la pregunta correspondiente: Bondad del ajuste Proceden los datos de una determinada distribución? Homogeneidad
Más detallesDISTRIBUCIONES BIDIMENSIONALES
La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento
Más detallesAnálisis de datos Categóricos
Pruebas Chi-cuadrado para tablas de dos vías Universidad Nacional Agraria La Molina 2017-1 Independencia y Homogeneidad Independencia y Homogeneidad Prueba de Pearson y G 2 Una prueba de independencia
Más detallesDistribuciones de parámetros conocidos
10.3. CONTRASTE DE BONDAD DE AJUSTE PARA DISTRIBUCIONES265 350 300 observaciones esperado(x) 250 Frecuencias esperadas 200 150 100 Frecuencias observadas 50 0 55 60 65 70 75 80 85 90 Figura 10.2: En los
Más detallesINDICE. Prologo Introducción El sistema SPSS Análisis estadístico con el SPSS Estadista avanzada Guía de lectura Parte I Programación
INDICE Prologo Introducción El sistema SPSS Análisis estadístico con el SPSS Estadista avanzada Guía de lectura Parte I Programación 3 1. Una sesión básica con el SPSS para Windows: trabajando con lo distintos
Más detallesCorrelación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Más detallesANEXO VI. DETALLE ESTADÍSTICO
ANEXO VI. DETALLE ESTADÍSTICO El análisis de variables categóricas 8 mediante tablas cruzadas o de contingencia, es uno de los más empleados en ciencias sociales para estudiar la existencia de relación
Más detalles13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD
13A. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS PRUEBAS ESTADÍSTICAS DE CONFORMIDAD RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS Las pruebas estadísticas para analizar la relación entre dos variables cuantitativas,
Más detallesTema B6. Tablas de contingencia. Ejemplo
Ejemplo En esta tabla se representan los mismos datos que en la tabla anterior, pero en términos de frecuencias ( recuento ) Para simplificar la tabla vamos a agrupar variables 1. Juntamos las personas
Más detallesa. Poisson: los totales marginales y el total muestral varían libremente.
TEMA 2º: TABLAS DE CONTINGENCIA BIDIMENSIONALES 1º Distribución de frecuencias observadas El único aspecto cuantificable en el análisis cualitativo es el número de individuos que presenta una combinación
Más detallesInferencia en tablas de contingencia
GoBack Inferencia en tablas de contingencia Guillermo Ayala Gallego Universidad de Valencia 15 de octubre de 2008 1 / 36 Distribución condicionada exacta Intervalo para los odds ratio Intervalo de la diferencia
Más detallesLimitaciones de la prueba (las mismas que para la prueba de Independencia):
Prueba Ji-cuadrado de Homogeneidad: Objetivo de la prueba: se utiliza cuando se tienen varias muestras independientes de n individuos que se cl asifican respecto a una variable cualitativa y se desea conocer
Más detallesSoluciones a los nuevos ejercicios propuestos
Soluciones a los nuevos ejercicios propuestos 1 Soluciones a los nuevos ejercicios propuestos 1. Sea X la cantidad de calcio en sangre del paciente (en mg. por cada 100 ml. de sangre). X N(µ, σ 2 ). Tenemos
Más detallesINFERENCIA ESTADISTICA CUADRADO) CHI-CUADRADO. x i. Variable Aleatoria [N(µ, σ) ] Muestras (N=1) Tipificando. = i σ z 2. = σ
(CHI- CHI-CUADRADO Variable Aleatoria [N(µ, σ) ] Muestras (N1) x i Tipificando z x µ i σ z z x i µ σ χ 1 (CHI- CHI-CUADRADO Variable Aleatoria [N(µ, σ) ] Muestras (N) x 1, x Tipificando z 1 x µ ; σ x 1
Más detallesPRUEBA CHI-CUADRADO. Para realizar un contraste Chi-cuadrado la secuencia es:
PRUEBA CHI-CUADRADO Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada
Más detallesESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía
ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 7) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía VIDEOCLASE: La Correlación. https://www.intecca.uned.es/portalavip/grabacion.php?id_grabacion=56932&id_sala=605
Más detalles4. Obtén las siguientes tablas de doble entrada para las variables Dispersión y Formación:
ACTIVIDAD DE INFERENCIA Y ASOCIACIÓN 1. Obtén los estadísticos descriptivos básicos y un intervalo de confianza del 95% para la media del coste en farmacia por habitante. A partir del resultado obtenido
Más detalles10.5. Contraste de independencia de variables cualitativas
272 Bioestadística: Métodos y Aplicaciones H 0 : La variable X se distribuye igualmente en ambas poblaciones H 1 : La distribución no es homogénea Para ello escribimos la que sería la distribución de frecuencias
Más detallesTema 5. Estadística descriptiva bivariable con variables categóricas y numéricas
Clase 5 Tema 5. Estadística descriptiva bivariable con variables categóricas y numéricas Relaciones entre variables categóricas La relación entre dos variables categóricas se analiza mediante una tabla
Más detallesINDICE. Prólogo a la Segunda Edición
INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.
Más detallesCorrelación. Correlación. Correlación. Correlación
Víctor Cuchillac (padre) Cuando se deba evaluar la asociación entre dos variables cuantitativas, hay que recurrir a las técnicas de Correlacion y Regresion lineal simple La CORRELACIÓN evalúa la fuerza
Más detallesDr. Abner A. Fonseca Livias
UNIVERSIDAD NACIONAL HERMILIO VALDIZAN FACULTAD DE ENFERMERÍA Dr. Abner A. Fonseca Livias 3/21/2015 6:17 AM Dr. Abner Fonseca Livias 1 UNIVERSIDAD NACIONAL HERMILIO VALDIZAN ESCUELA DE POST GRADO Dr. Abner
Más detallesFLACSO / Facultad Latinoamericana de Ciencias Sociales Maestría en Ciencias Políticas & Sociología Metodología de la Investigación Social
FLACSO / Facultad Latinoamericana de Ciencias Sociales Maestría en Ciencias Políticas & Sociología Metodología de la Investigación Social Unidad 3 - Clase 7 y 8 Concepto de covarianza, relaciones bivariadas
Más detallesESTADÍSTICA CÁTEDRA I. Unidad 7
ESTADÍSTICA CÁTEDRA I Unidad 7 UNIDAD 7: La relación entre variables. Contenidos Distribución conjunta de dos variables. Diagrama de dispersión. Distribuciones marginales y condicionales. Correlación.
Más detallesTécnicas de Inferencia Estadística II. Tema 6. Contrastes de independencia
Técnicas de Inferencia Estadística II Tema 6. Contrastes de independencia M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2015/16 Contenidos 1. Introducción 2.
Más detallesTema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos
Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.
Más detallesCLASE 10: RESUMEN DEL CURSO
CLASE 10: RESUMEN DEL CURSO 10.1.-INTRODUCCIÓN Qué debemos valorar al enfrentarnos con el análisis de unos datos estadísticos? 1º TIPO DE ESTUDIO: - Datos Independientes - Datos Apareados 2º TIPO DE VARIABLES:
Más detallesNota de los autores... vi
ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...
Más detallesCAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA
Página 1 de 5 CAPÍTULO 4 (Continuación): ESTADÍSTICA DESCRIPTIVA BIVARIADA Descripción entre variables cualitativas Como ya sabemos la metodología estadística depende del tipo de variable(s) que estemos
Más detallesPrefacio... xvii. 1 La imaginación estadística... 1
ÍNDICE Prefacio... xvii 1 La imaginación estadística... 1 Introducción... 1 Pensamiento proporcional... 3 La imaginación estadística... 8 Enlace de la imaginación estadística con la imaginación sociológica...
Más detallesInferencia Estadística. Pruebas paramétricas y no paramétricas. Análisis de datos
Inferencia Estadística. Pruebas paramétricas y no paramétricas. Análisis de datos VDC Prof. Mª JOSÉ PRIETO CASTELLÓ ANÁLISIS ESTADÍSTICO DE DATOS Estadística Descriptiva: -Cualitativas: frecuencias, porcentajes
Más detallesDISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES RELACION DE DOS CARACTERES Relación entre variables cualitativas
08/11/01 DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES RELACION DE DOS CARACTERES Relación entre variables cualitativas CARACTERES INDEPENDIENTES Respuesta a un tratamiento No Sí Total (marginales por filas)
Más detallesEconometría 1. Karoll GOMEZ Segundo semestre 2017
Econometría 1 Karoll GOMEZ kgomezp@unal.edu.co http://karollgomez.wordpress.com Segundo semestre 2017 I. Introducción Motivación I Econometría: Rama de la disciplina económica que concierne con la estimación
Más detallesCONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN
CONTRASTES NO PARAMÉTRICOS: ALEATORIEDAD Y LOCALIZACIÓN Antonio Morillas A. Morillas: C. no paramétricos (II) 1 1. Contrastes de aleatoriedad. Contraste de rachas. 2. Contrastes de localización 2.1 Contraste
Más detalles478 Índice alfabético
Índice alfabético Símbolos A, suceso contrario de A, 187 A B, diferencia de los sucesos A y B, 188 A/B, suceso A condicionado por el suceso B, 194 A B, intersección de los sucesos A y B, 188 A B, unión
Más detallesMétodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
Más detallesUniversidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Más detallesPasos. i Aplicar la prueba X 2 para determinar la significación estadística de las proporciones entre ambas variables (no son iguales)
Relación entre variables cualitativas Pasos Construir una tabla de contingencia Crear una tabla con las frecuencias esperadas f ei (frecuencias teóricas en caso de que X e Y fueran independientes), calculadas
Más detallesDefinición de Correlación
Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del
Más detallesEstrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis
Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis VDC Prof. Mª JOSÉ PRIETO CASTELLÓ MÉTODOS ESTADÍSTICOS. TÉCNICAS ESTADÍSTICA DESCRIPTIVA TEORÍA DE LA PROBABILIDAD
Más detallesDepartamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 9 DESCRIPTIVOS El submenú Estadísticos descriptivos está en el menú Analizar, y ofrece una serie de opciones para analizar datos de una forma sencilla. En este capítulo serán descritos estos procedimientos.
Más detallesQué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)
Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión
Más detallesASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
Más detallesESTADÍSTICA BIVARIADA
ESTADÍSTICA BIVARIADA Estadística y Tecnología de la Información y Comunicación ENRIQUE ÍÑIGUEZ CASTRO 1º de Enfermería, grupo 4. Subgrupo 16. Índice 1. Introducción.... 2 2. Objetivos.... 2 3. Metodología...
Más detallesAnálisis de datos en CCSS: introducción al análisis descriptivo e inferencial
Programa de Doctorado Formación en la Sociedad del Conocimiento Seminario de doctorado 13 y 14 de marzo de 2014 Análisis de datos en CCSS: introducción al análisis descriptivo e inferencial Dra. Mª José
Más detallesUna primera mediada podría ser la diferencia de porcentajes Para Sánchez Carrión, J. (1995) es la mejor de todos ellas.
Medidas de asociación (variables no métricas) Podemos definir la asociación entre dos variables como la intensidad con la que unas categorías de una variable diferencian las frecuencias obtenidas en el
Más detallesTécnicas de Investigación Social
Licenciatura en Sociología Curso 2006/07 Técnicas de Investigación Social Medir la realidad social (4) La regresión (relación entre variables) El término REGRESIÓN fue introducido por GALTON en su libro
Más detallesTema 9: Relación entre variables categóricas
Tema 9: Relación entre variables categóricas Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 9: Relación entre variables categóricas Curso
Más detallesContrastes basados en el estadístico Ji Cuadrado
Capítulo 10 Contrastes basados en el estadístico Ji Cuadrado 10.1. Introducción Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no pueden cuantificarse
Más detallesInformación general. Fundamentos de Análisis de datos. Obligatoria básica o de fundamentación X. Obligatoria profesional
Guía de asignatura Formato institucional Rev. Abril 2013 Información general Asignatura Fundamentos de Análisis de datos Código Tipo de asignatura Obligatoria X Electiva Tipo de saber Número de créditos
Más detallesINTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)
OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos
Más detallesAnálisis Estadístico. Dra. Adela Del Carpio Rivera Doctor En Medicina
Análisis Estadístico Dra. Adela Del Carpio Rivera Doctor En Medicina ANTE LA GRAN CANTIDAD DE INFORMACIÓN Debemos saber discernir entre: Cuál es la información que necesitamos Si el estudio tiene real
Más detallesANÁLISIS ESTADÍSTICO CORRELACIÓN LINEAL
ANÁLISIS ESTADÍSTICO CORRELACIÓN LINEAL Jorge Fallas jfallas56@gmail.com 2010 1 Temario Concepto de correlación Diagramas de dispersión Correlación: dirección, intensidad Coef. Correlación lineal de Pearson
Más detallesAnálisis de datos Categóricos
Inferencia para tablas de contingencia Universidad Nacional Agraria La Molina 2013-1 Odds ratio Diferencia de proporciones Riesgo relativo Ejemplo Odds ratio El odds ratio muestral es: El estimador modicado
Más detallesEstadística aplicada a la comunicación
Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva b. Análisis bivariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2
Más detallesDESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos
Más detallesEstudio del consumo y los precios al consumo de Frutas y Hortalizas
Conseería de Agricultura y Pesca Estudio del consumo y los precios al consumo de Frutas y Hortalizas Aspectos Metodológicos Marzo 008 Versión 1 SECRETARÍA GENERAL DE AGRICULTURA, GANADERÍA Y DESARROLLO
Más detallesTema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos
7-1 Tema 7 Contrastes de Hipótesis para una Muestra Introducción Metodología del contraste de hipótesis Métodos no paramétricos Test binomial Test de los signos Test de rango con signos de Wilcoxon Test
Más detallesBLOQUE 2 TEMA 7 RELACIÓN ENTRE VARIABLES : CORRELACIÓN Y REGRESIÓN
BLOQUE 2 TEMA 7 RELACIÓ ETRE VARIABLES : CORRELACIÓ REGRESIÓ En los procesos de investigación en Educación, en muchas ocasiones, nos interesa conocer la posible relación que puede manifestarse entre dos
Más detallesCOEFICIENTE JI CUADRADO. Universidad Central de Venezuela Aron, Francisco; Baptista, Andreina; Bracamonte, Karley; Gutiérrez, Alesson; Urbina, Jesmin.
COEFICIENTE JI CUADRADO. Universidad Central de Venezuela Aron, Francisco; Baptista, Andreina; Bracamonte, Karley; Gutiérrez, Alesson; Urbina, Jesmin. Definición. Coeficiente de correlación Ji2, X2 o también
Más detallesTema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Más detallesTécnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste
Técnicas de Inferencia Estadística II Tema 3. Contrastes de bondad de ajuste M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 3. Contrastes de bondad
Más detallesConceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste.
Conceptos básicos de inferencia estadística (III): Inferencia no paramétrica: Contrastes de bondad de ajuste. Tema 1 (III) Estadística 2 Curso 08/09 Tema 1 (III) (Estadística 2) Contrastes de bondad de
Más detallesN T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA
N T E N.. IDO PREFACIO xiv CAPíTULO I LA IMAGINACiÓN ESTADíSTICA Introducción La imaginación estadística 3 Enlace de la imaginación estadística con la imaginación sociológica 4 Normas estadísticas y normas
Más detallesEstadística Descriptiva II: Relación entre variables
Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud MUI Ciencias de la Salud, UEx 25 de octubre de 2010 De qué trata? Descripción conjunto concreto de
Más detallesTema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detalles9.- Análisis estadísticos con R Commander
Tipos de datos - Cuantitativos: se expresan numéricamente. - Discretos: Toman valores numéricos aislados - Continuos: Toman cualquier valor dentro de unos límites dados - Categóricos o Cualitativos: No
Más detallesAYUDA SPSS. TABLA DE CONTINGENCIA y PRUEBA CHI CUADRADO
Ayuda SPSS_Tabla de Contingencia/Prueba Chi Cuadrado AYUDA SPSS TABLA DE CONTINGENCIA y PRUEBA CHI CUADRADO Menú Analizar > Estadísticos Descriptivos>Tablas de Contingencia > Botón Estadísticos > Tildar
Más detallesUniversidad Autónoma de Sinaloa
Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador
Más detallesCONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 1 POR QUÉ SE LLAMAN CONTRASTES NO PARAMÉTRICOS? A diferencia de lo que ocurría en la inferencia paramétrica, ahora, el desconocimiento de la población que vamos
Más detallesEstadísticos Aplicados en el SPSS 2008
PRUEBAS ESTADISTICAS QUE SE APLICAN (SPSS 10.0) PARAMÉTRICAS:... 2 Prueba t de Student para una muestra... 2 Prueba t par muestras independientes... 2 ANOVA de una vía (multigrupo)... 2 ANOVA de dos vías
Más detallesMANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL
MANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL Israel J. Thuissard David Sanz-Rosa IV JORNADAS INVESTIGACIÓN COEM UNIVERSIDADES 4 de marzo de 2016 Escuela de Doctorado e Investigación. Vicerrectorado
Más detallesTema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
Más detallesTécnicas de Inferencia Estadística II. Tema 5. Contrastes de homogeneidad
Técnicas de Inferencia Estadística II Tema 5. Contrastes de homogeneidad M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2015/16 Contenidos 1. Introducción 2.
Más detallesTécnicas de Inferencia Estadística II. Tema 5. Contrastes de homogeneidad
Técnicas de Inferencia Estadística II Tema 5. Contrastes de homogeneidad M. Concepción Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2010/11 Tema 6. Contrastes de homogeneidad
Más detallesUNIDAD DIDACTICA I TEMA 1. LA MEDIDA EN PSICOLOGIA
UNIDAD DIDACTICA I TEMA 1. LA MEDIDA EN PSICOLOGIA 1. Delimitación teórica de la psicometría 2. Los comienzos de la psicometría 3. La orientación psicofísica 4. Los tests mentales 5. Áreas de trabajo de
Más detallesEl Análisis de Correspondencias tiene dos objetivos básicos:
Tema 8 Análisis de correspondencias El Análisis de Correspondencias es una técnica de reducción de dimensión y elaboración de mapas percentuales. Los mapas percentuales se basan en la asociación entre
Más detallesviii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos
Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................
Más detallesUn canal de comunicación puede ser definido como el medio a través del cual la señal del mensaje se propaga desde la fuente hasta el destino.
Un canal de comunicación puede ser definido como el medio a través del cual la señal del mensaje se propaga desde la fuente hasta el destino. Se dice que un canal es ruidoso si la lectura de los datos
Más detalles