Regresión con variables cualitativas
|
|
|
- Purificación Villalba Aranda
- hace 9 años
- Vistas:
Transcripción
1 3 Regresión con variables cualitativas. Introducción Hasta ahora hemos abordado el tema de la correlación y la regresión con variables cuantitativas. Sin embargo, un estudio de regresión similar puede desarrollarse si contamos con una variable -la variable X- que sea cualitativa de dos o más categorías. En esta circunstancia se trata de conocer la regresión de X (una variable que adopta valores cualitativamente diferentes) sobre una variable Y cuya escala de medida es al menos de intervalo. El análisis estadístico del contraste de medias (mediante el análisis de la varianza) puede ser interpretado como un análisis de la regresión en el que la variable X es cualitativa. Es más, enfocar el análisis de la varianza desde el punto de vista de la regresión puede ser una ventaja que proporcione a dicho análisis una mayor generalidad.. Regresión con una variable dicotómica. Supongamos que deseamos conocer en qué medida se relacionan sexo y habilidad manual para realizar una tarea. La variable sexo es una variable cualitativa de dos categorías dicotómica- y puede codificarse de forma arbitraria con los valores y ; por ejemplo, mujer y varón. La variable habilidad se cuantifica a través de un instrumento determinado de forma cuantitativa. Supongamos que se obtienen los siguientes resultados teniendo una muestra total de 8 sujetos, 4 varones y 4 mujeres: Sujetos Sexo (X) Habilidad (Y) XY Sumas
2 .. Correlación y recta de regresión. Como en el estudio de una correlación ordinaria, calculamos los estadísticos descriptivos que nos van a servir para este fin: 4 N ( X X ) X.5 S.53 8 N X 88 N ( Y Y ) Y 36 S.96 8 N Y Y con estos datos calculamos la correlación entre X e Y: r XY N XY XY N S S X Y A partir del valor de correlación calculado y bajo el supuesto que se cumplan los supuestos requeridos, puede estimarse, bajo el mismo procedimiento que en el caso en que ambas variables eran cuantitativas, la recta de regresión que define dicha relación: o bien: Y ˆ a+ bx Y ˆ B + B X donde En nuestro caso, tendríamos: a Y bx b r XY S S.96 b a Y X de donde la ecuación de regresión es: Yˆ 6+ X Nótese que dado que la variable X adopta dos posibles valores, (O para varón y para mujer), las predicciones en Y en estas circunstancias son: 46
3 Y ˆvar ón 6+ 6 Yˆ mujer La interpretación de estas estimaciones es la siguiente: 6 es el valor esperado en Y para un sujeto que tenga sexo varón y 46 el valor esperado para cualquiera de las mujeres. Estos valores (6 y 46) coinciden exactamente con las medias en Y del grupo de varones y de las mujeres, respectivamente. Recordemos los datos: Sujetos Sexo (X) Habilidad (Y) Medias por grupo Y Y Sumas 4 88 Y 36 Por otro lado, la diferencia entre ambas medias (46-6) coincide con el valor de b, es decir, con el cambio esperado en Y al cambiar una unidad (de a ) el valor de X: Y b X 46 6 Y el parámetro a coincide justamente con la media del grupo que se codifica como, en nuestro caso, el de varones. Es decir, la ordenada en el origen de la recta de regresión del modelo pasa por el punto 6 que es el promedio de la habilidad manual en dicho grupo. Gráficamente estas ideas pueden reflejarse si se dibuja la nube de puntos (en realidad dos series de datos alineados verticalmente ver puntos rojos en la gráfica-) y la correspondiente recta de regresión en un eje de coordenadas: 5 4 Y Y 3 Y X HABILIDA,,, SEXO 47
4 Obsérvese que cuando X vale, la recta corta el eje de la Y en el valor medio del grupo de varones ( Y 6) y que el otro punto que la define es precisamente el valor medio de Y en el grupo de mujeres ( Y 46 -cuando X vale -). Además, como hemos indicado, la incremento en Y al cambiar el valor de X de a es precisamente el valor de inclinación de la recta (b): Y b X (46 6) ( ) o lo que es lo mismo: b Y Y Supuestos del modelo. Dado que trabajamos con el mismo modelo de regresión que cuando se trataba de dos variables cuantitativas, los requisitos a los que deben adecuarse los datos para que dicho modelo pueda se aplicado idóneamente deben ser los mismos que en aquel caso. Así pues, debe probarse la adecuación de la nube de puntos a una recta (linealidad), la igualdad de varianzas del error (homocedasticidad) y su normalidad, así como la independencia entre puntuaciones (que es un requisito supuesto de antemano). Teniendo en cuenta la representación gráfica característica cuando X adopta dos únicos valores (dos series alineadas verticales- de puntos que representan la variabilidad de Y para cada uno de los valores de X), puede decirse que la recta constituye una buena representación para unir ambas series, representando el cambio sufrido en la Y estimada en función del cambio (de a de una categoría a otra-) en X. Por otra parte el supuesto de la homocedasticidad quedará satisfecho si la dispersión de la serie de puntos respecto a valor predicho dentro de la condición X es semejante a dicha dispersión en la condición X. Para probar si se cumple o no este supuesto, tal y como en el tema de la regresión anterior, hay que realizar un estudio de los errores. Recuérdese que graficando cuál es la distribución de los mismos en función de los valores de Y predichos puede obtenerse, a nivel gráfico, una primera aproximación a dicho estudio. Formas definidas o características de esta distribución (por ejemplo, de megáfonos o triángulos en cierto grado invertidos-) apuntan a una posible violación de este supuesto. En último término, si deseamos probar mediante alguna prueba estadística si los datos se ajustan o no al supuesto mencionado puede probarse la significación de la correlación entre los errores (absolutos) y los valores de Y predichos. La falta de significación de dicha correlación indica la satisfacción de este supuesto de la homocedasticidad aunque como sabemos este procedimiento no detecta a veces el incumplimiento del supuesto. Por último, la normalidad de las puntuaciones se cumple si la distribución de puntos alrededor de cada una de las dos medias por grupos se ajustan a una distribución tipo campana de Gauss. Este supuesto es más difícil de corroborar cuando existen pocos datos; de cualquier manera la prueba de análisis de la regresión es más robusta al incumplimiento de este supuesto que a la violación de otros. La vía más cómoda y fácil 48
5 de estudiarlo es pidiendo el gráfico de probabilidad normal en el paquete estadístico SPSS..3. Validez del modelo y bondad de ajuste. Para probar la validez del modelo de regresión y ajuste lineal planteado, se procede de manera similar al caso en que ambas variables eran cuantitativas. Como se sabe, puede abordarse esta cuestión mediante tres procedimientos alternativos y coincidentes: a) evaluando la significación de la correlación b) evaluando la significación del coeficiente b c) aplicando la prueba F que evalúa de manera global en qué medida la variación de los datos de la que da cuenta el modelo de regresión sobrepasa aquella parte de la variación de los datos de la que no es responsable dicho modelo. Como decimos, estas tres vías o trayectorias conducen a una misma conclusión. Probemos, por ejemplo, en primer lugar, la validación a través del índice F para los datos anteriores. Recuérdese que: R / k F ( R ) /( N k ) Entonces, para nuestros datos: F.894 / (.894 ) / Por otra parte, la prueba de significación para la correlación: rxy t rxy N En nuestro caso:.894 t Y para el coeficiente b: que sustituyendo: t N b S res ( X X ) t
6 Compruébese la igualdad de los tres resultados teniendo en cuenta que F t Buscando en las tablas pertinentes el valor de p para estos estadísticos, se concluye que la probabilidad de que la explicación de los datos a partir del modelo lineal estimado sea irrelevante es del.3. Es decir, aceptamos el modelo de regresión estimado como una buena aproximación de la explicación de los datos, ya que la probabilidad de que no lo sea es muy pequeña (menor a.5). Por lo tanto, existe relación significativa entre X e Y. A nivel teórico diremos que el sexo explica de forma relevante la diferencia existente en la habilidad manual. El sentido de dicha relación (atendiendo a los promedios correspondiente a cada grupo) es el de que las mujeres muestran significativamente un nivel de habilidad manual superior al de los varones en este tipo de tarea. Por último, resulta conveniente calcular la bondad de ajuste del modelo, esto es, la valoración de la proporción de variación explicada por el mismo respecto a la variación total de los datos. Como se sabe, nos estamos refiriendo a R que es: R r XY Es decir: R O bien. R SC SC expli total N N ( Yˆ Y ) ( Y i Y ) 8.8 lo que indica que el 8% de la variación manifiesta en las puntuaciones de la habilidad manual (Y) se explica por la variable sexo (X), una porcentaje bastante alto..4. Aplicación con el SPSS. Para estimar los diferentes estadísticos y significaciones anteriormente analizados mediante este paquete basta aplicar los mismos comandos que se utilizaban para el caso de dos variables cuantitativas. Así, la sucesión de comandos y salidas correspondientes se exponen a continuación. En primer lugar, el fichero de datos será similar al cuadro que presentamos al principio de estas páginas: 5
7 Si pedimos Analizar/regresión/lineal donde Y funciona como variable dependiente y X como variable independiente, obtenemos. Resumen del modelo R cuadrado Error típ. de la Modelo R R cuadrado corregida estimación,894(a),798,765 5,83 a Variables predictoras: (Constante), SEXO ANOVA(b) Modelo Suma de cuadrados gl Media cuadrática F Sig. Regresión 8, 8, 3,76,3(a) Residual, 6 33,667 Total, 7 a Variables predictoras: (Constante), SEXO b Variable dependiente: HABILIDA Coeficientes(a) Coeficientes no estandarizados Coeficientes estandarizados Modelo B Error típ. Beta t Sig. (Constante) 6,,9 8,96, SEXO, 4,3,894 4,875,3 a Variable dependiente: HABILIDA Como puede observarse, los coeficientes a y b de la última tabla coinciden plenamente con los previamente estimados, al igual que la correlación entre X e Y (que es lo mismo que el coeficiente Beta de la ecuación de la recta o su valor estandarizado..894-). La validez del modelo se prueba reparando en el valor de p correspondiente a la F de la tabla de ANOVA o bien por el de la t correspondiente al coeficiente b o de Beta (iguales a.3) (véase en la segunda y tercera tablas presentadas). 5
8 Para obtener el gráfico de dispersión y recta correspondiente mediante SPSS (de forma similar a como representamos arriba) aplicamos: Gráficos/dispersión/lineal/simple, Una vez dibujada la nube de puntos se pulsa dos veces sobre la misma y se pide al cuadro de diálogo que nos proporcione la recta ajustada total..5. Análisis de la regresión versus contraste de medias. Tal y como hemos indicado al principio, el análisis de la regresión para el caso en que la variable X es de tipo cualitativo es un análisis análogo al de contraste de medias usado tan frecuentemente en el ámbito de la experimentación. El referido contraste de medias se desarrolla en la paquete estadístico SPSS activando el comando ANOVA. A partir de idéntico archivo de datos como el de antes, podríamos ejecutar dicho comando para los datos que nos ocupan aplicando las siguientes órdenes: Analizar/Comparar medias/anova de un factor (especificando cuál es la variable dependiente y cuál la independiente). Los resultados de dicho análisis deben coincidir exactamente con aquellos proporcionados por el análisis de la regresión desarrollado antes. Solicitando algunos estadísticos descriptivos adicionales a dicho comando ANOVA que nos sirven para interpretar y concluir sobre los resultados, las salidas proporcionadas son las siguientes: Estadísticos descriptivos N Mínimo Máximo Suma Media Desv. típ. SEXO 8,, 4,,5,5345 HABILIDA 8, 49, 88, 36,,9643 N válido (según lista) 8 ANOVA Suma de cuadrados gl Media cuadrática F Sig. Inter-grupos 8, 8, 3,76,3 Intra-grupos, 6 33,667 Total, 7 Como observamos, obtenemos un cuadro de resultados idéntico al presentado anteriormente en el caso de la regresión. Además, si dentro de esta vía de análisis hacemos la petición de evaluar el supuesto de la igualdad de varianzas (dentro del comando opciones ), la prueba de Levene nos ofrece la confirmación o no del cumplimiento de este supuesto, tan importante como sabemos para la utilización de los análisis que estamos llevando a cabo (recuérdese que dentro del comando regresión el estudio de dicho supuesto se hacía mediante la graficación de la relación entre los valores predichos y los errores). Pues bien, la petición de la prueba de Levene para nuestros datos nos informa lo siguiente: Prueba de homogeneidad de varianzas Estadístico de Levene Gl gl Sig.,77 6,46 Dados estos resultados, concluimos que efectivamente la homogeneidad de las varianzas de error (homocedasticidad) se cumple puesto que la diferencia entre la 5
9 varianza de los datos en el grupo de mujeres respecto a la de los varones puede explicarse por azar en una proporción alta (.46). 3. Regresión con variable politómica. Cuando la variable X en un análisis de la regresión es cualitativa de más de dos categorías, el análisis es similar al realizado con anterioridad. Sin embargo, puede resultar útil desarrollar a continuación un ejemplo que muestre algunas de sus particularidades. 3.. Codificación. Supongamos que se desea conocer si el tipo de asistencia que reciben los niños de años durante la jornada matinal incide en alguna medida en su nivel evolutivo. Se identifican tres tipos de asistencia diferentes: En guardería (X ), en casa asistido por un cuidador no familiar (X ) y en casa asistido por uno de sus padres (X 3 ). Los resultados obtenidos se ofrecen en la siguiente tabla: Sujeto Tipo de asistencia Nivel evolutivo Medias por grupo Guardería Guardería 3 Guardería Guardería 3 5 Guardería 9 6 C. no familiar 96 7 C. no familiar 87 8 C. no familiar C. no familiar C. no familiar Progenitor 3 Progenitor 3 3 Progenitor Progenitor 5 Progenitor 5 Las puntuaciones medias obtenidas permiten realizar una primera interpretación de los datos a nivel descriptivo respecto al nivel evolutivo de los niños afectados por cada tipo de cuidado. Observamos que la media del grupo de niños cuidado por el progenitor es la más alta seguida por la del grupo de niños cuidados en guardería; por último, los niños de nivel evolutivo inferior parecen ser aquellos cuidados por una persona ajena a la familia. Si existen o no diferencias significativas entre dichos niveles es algo de lo que se encargará de responder los análisis que siguen. Recuérdese que en el caso de una X de tipo dicotómico el archivo de datos contenía una sola columna para dicha X mediante la cual se conocía, utilizando los códigos y, la categoría a la que pertenecía cada uno de los sujetos (la condición de X por la que estaba afectado). Ahora con tres valores de X no es posible agotar todas las posibilidades de asociación sujetos-valores mediante este sistema pues tenemos tres alternativas de pertenencia. Sin embargo, utilizando dos columnas para representar dos de las tres categorías de que consta la variable X es suficiente para conocer toda esta 53
10 información necesaria. En general, podemos decir que se necesitan K- columnas de identificación de la variable cualitativa para tener toda la información sobre qué condición concreta de X afecta a cada sujeto (siendo K el número de categorías que adopta la variable X). Así, por ejemplo, la codificación siguiente para cada una de las dos categorías de X (X guardería) (X cuidador no familiar) sería suficiente para plasmar toda la información sobre la categoría a la que pertenece cada uno de los 5 sujetos que compone la muestra: Sujetos X (guardería) X (no familiar) Y Medias por grupo La lectura de la tabla anterior sería la siguiente: Un valor en la primera columna y un en la segunda indica que el sujeto pertenece a la primera categoría; un valor en la primera y un en la segunda que el sujeto pertenece a esta segunda; por último, ceros en ambas columnas identifica a un sujeto que no pertenece ni a la primera categoría ni a la segunda sino a la tercera (no existente en el archivo que es el cuidado por el progenitor). 3.. Aplicación con SPSS. A partir del siguiente archivo de datos, tal y como ha quedado justificado en el apartado de la codificación anterior, en formato SPSS: Téngase en cuenta que la introducción de una tercera columna para representar la última de las categorías de X contempladas, supondría una redundancia sobre la información precedente, es decir, constituiría una columna colineal (de información totalmente redundante) con las anteriores por lo que los cálculos de las estimaciones del modelo de regresión serían imposibles. 54
11 se activa el comando regresión/lineal de dicho paquete para estimar la ecuación de regresión del modelo así como su significación estadística. En dicho comando se especifica que la variable dependiente es el nivel evolutivo y las independientes las dos X representadas en las columnas del archivo de datos (guardería y cuidado no familiar), obteniendo los siguientes resultados: Modelo Resumen del modelo R cuadrado Error típ. de la R R cuadrado corregida estimación,648 a,4,33 5,3884 a. Variables predictoras: (Constante), casanfamiliar, guardería Como ya sabemos, este cuadro (resumen del modelo) informa que la proporción de variación del nivel evolutivo de los niños por cuenta del tipo de cuidado que reciben en periodo laboral es del.4. Además, la relación analizada es significativa (α.5), puesto que la tabla de ANOVA siguiente proporciona un valor de F 4.34, con una p.38<.5; es decir, el tipo de cuidado en periodo laboral incide significativamente sobre el nivel evolutivo del niño. Modelo Regresión Residual Total ANOVA b Suma de Media cuadrados gl cuadrática F Sig. 963,333 98,667 4,34,38 a 74, 6, ,333 4 a. Variables predictoras: (Constante), casanfamiliar, guardería b. Variable dependiente: nivel Hasta ahora a través de la información expuesta- no puede conocerse si existen diferencias estadísticamente significativas entre unos tipos de condiciones de cuidados respecto a otros, esto es, sólo podemos concluir globalmente que el tipo de cuidado incide en el nivel evolutivo. Para discriminar entre condiciones específicas del nivel evolutivo, estudiamos la tabla de coeficientes de la ecuación de regresión estimada: 55
12 Modelo (Constante) guardería casanfamiliar a. Variable dependiente: nivel Coeficientes a Coeficientes no estandarizados Así pues, tenemos que la ecuación de regresión es: Coeficientes estandarizad os B Error típ. Beta t Sig. 3, 6,76 8,88, -7, 9,5 -,87 -,736,476-7, 9,5 -,7 -,839,5 Yˆ 3. 7.X 7. X La interpretación de cada uno de estos coeficientes es la siguiente: - 3 es el nivel evolutivo esperado para los niños que puntúan tanto en X como en X. Es decir, cuando no han sido cuidados ni en guardería ni por una persona no familiar, por tanto para aquellos que han sido cuidados por el progenitor: Y ˆ () 7.() 3 progenitor - (-7) es el efecto que se espera se produzca sobre 3 cuando el sujeto puntúa en X y en X, es decir, cuando el niño ha sido cuidado en la guardería. De otra forma, es el valor esperado del nivel evolutivo para aquellos niños cuidados en guardería presentando una puntuación en 7 puntos inferior a la esperada en aquellos niños cuidados por el progenitor: Y ˆ () 7.() 6 guardería - (-7) es el efecto que se espera se produzca sobre 3 cuando el sujeto puntúa en X y en X., es decir, cuando el niño ha sido cuidado por una persona no familiar. Por lo tanto, el valor esperado del nivel evolutivo para estos niños es: Y ˆ () 7.() 96 nofamiliar Obsérvese que estas puntuaciones estimadas coinciden con los promedios por grupo calculados arriba en el archivo de datos. Las significaciones que acompañan a cada uno de los coeficientes en la ecuación nos indican (α.5) que: a) el coeficiente de X no resulta significativo (p.476>.5) por lo que podemos afirmar que cuidar a los niños en la guardería (X ) respecto a hacerlo con el progenitor ( Y ˆ b b 3 7) no conlleva una diferencia sustancial en su nivel evolutivo a pesar de la disminución de 7 puntos en su efecto estimado. b) por su parte, el coeficiente de X (p.5<.5) sí resulta significativo por lo que concluimos que cuidar a los niños con una persona no familiar respecto a 56
13 hacerlo con el progenitor hace disminuir significativamente su nivel evolutivo esperado en una cantidad de 7 puntos Y ˆ b b 3 7). ( 57
Regresión con variables independientes cualitativas
Regresión con variables independientes cualitativas.- Introducción...2 2.- Regresión con variable cualitativa dicotómica...2 3.- Regresión con variable cualitativa de varias categorías...6 2.- Introducción.
Regresión con efecto interactivo
4 Regresión con efecto interactivo. Introducción El modelo de regresión múltiple tratado previamente supone la independencia de efectos de las diferentes variables predictoras, En este sentido, es un modelo
Regresión con variables independientes categóricas
Regresión con variables independientes categóricas 1.- Introducción... 2 2.- Regresión y contrate de medias... 2 2.1.- Contrate de medias... 2 2.2.- Regresión... 3 3.- Regresión y análisis de la varianza...
PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado
PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar
Problema 1.- Tengamos las puntuaciones de X, las predichas y las residuales:
DISEÑO Y ANÁLISIS DE DATOS II. ENEO 6. Problema.- Tengamos las puntuaciones de X, las predichas y las residuales:.- Calcular la ecuación de regresión.- Correlación entre X e Y.- Por cada punto que aumenta
Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE
ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago
3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS
TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS FASES EN EL ANÁLISIS DE LOS DATOS DE UNA INVESTIGACIÓN SELECCIÓN HIPÓTESIS DE INVESTIGACIÓN Modelo de Análisis Técnica de Análisis
Tema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias
Estructura de este tema Tema 4 Regresión lineal simple José R. Berrendero Departamento de Matemáticas Universidad utónoma de Madrid Planteamiento del problema. Ejemplos Recta de regresión de mínimos cuadrados
Estadística; 3º CC. AA. Examen final, 23 de enero de 2009
Estadística; 3º CC. AA. Examen final, 3 de enero de 9 Apellidos Nombre: Grupo: DNI. (5 ptos.) En un estudio sobre las variables que influyen en el peso al nacer se han obtenido utilizando SPSS los resultados
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
CONTRASTES DE HIPÓTESES
CONTRASTES DE IPÓTESES 1. Contraste de hipótesis 2. Contrastes de tipo paramétrico 2.1 Contraste T para una muestra 2.2 Contraste T para dos muestras independientes 2.3 Análisis de la varianza 3. Contrastes
peso edad grasas Regresión lineal simple Los datos
Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos
ESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Método de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II
DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II PRÁCTICA 5 En una determinada investigación se estudió el rendimiento en matemáticas en función del estilo de aprendizaje de una serie de estudiantes de educación
TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN
4.5.- En cuál de los siguientes casos se podría utilizar la varianza residual en lugar del coeficiente de determinación para medir la calidad del ajuste? Con el mismo conjunto de datos y dos ajustes distintos.
SPSS Aplicación práctica: Base de datos del HATCO
Aplicación práctica: Base de datos del HATCO Datos: observaciones de variables obtenidos desde encuentas a clientes de un distribuidor industrial. Variables de interés en la aplicación: Percepciones de
A: Broca B: velocidad A B AB Vibración Totales 1/ ,2 18,9 12,9 14,4 64,4 = (1) 1/ ,2 24,0 22,4 22,5 96,1 = a
LORTORIO 8 - LORTORIO INFORMÁTICO Caso. Interesa estudiar el efecto del tamaño de broca (factor ) y de la velocidad (factor ) sobre la vibración de la ranuradora (respuesta Y). Para ello se decide utilizar
Tema 10: Introducción a los problemas de Asociación y Correlación
Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación
TEMA 2: DISTRIBUCIONES BIDIMENSIONALES
TEMA : DISTRIBUCIONES BIDIMENSIONALES 1.- DISTRIBUCIONES BIDIMENSIONALES Cuando estudiamos un solo carácter estadístico, los datos que obtenemos forman una variable estadística unidimensional. También
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL
Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL OBJETIVO Analizar las Diferentes formas de Describir la Relación entre dos variables numéricas Trazar un diagrama de dispersión
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas [email protected] 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
Estadística II Examen final junio - 17/06/16 Curso 2015/16 Soluciones Duración del examen: 2 h. y 45 min.
Estadística II Examen final junio - 17/06/16 Curso 201/16 Soluciones Duración del examen: 2 h. y 4 min. 1. (3, puntos) La publicidad de un fondo de inversión afirma que la rentabilidad media anual del
Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple
ESTDÍSTIC PLICD Grado en Nutrición Humana y Dietética Planteamiento del problema Tema 4: Regresión lineal simple Recta de regresión de mínimos cuadrados El modelo de regresión lineal simple IC y contrastes
Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos
Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.
ANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
TEMA 4 Modelo de regresión múltiple
TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Lección 3. Análisis conjunto de dos variables
Lección 3. Análisis conjunto de dos variables Estadística Descriptiva Parcialmente financiado a través del PIE13-04 (UMA) GARCÍA TEMA 3. ANÁLII CONJUNTO DE DO VARIABLE 3.1 COVARIANZA COEFICIENTE DE CORRELACIÓN
1. Cómo introducir datos en SPSS/PC? - Recordatorio
1 Taller de Estadística Curso 2oo5/2oo6 Descripción de datos bivariantes El objetivo de esta práctica es familiarizarse con las técnicas de descripción de datos bidimensionales y con algunas de las opciones
Tema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante
SOLUCIÓ A LOS EJERCICIOS DEL SPSS Bivariante. a). La media y la varianza de las variables estatura y peso en la escala de medida norteamericana. Peso Peso: Transformar -> Calcular: Libras.4536 Peso libras
15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Análisis de la varianza. Magdalena Cladera Munar Departamento de Economía Aplicada Universitat de les Illes Balears
Análisis de la varianza Magdalena Cladera Munar [email protected] Departamento de Economía Aplicada Universitat de les Illes Balears CONTENIDOS Análisis de la varianza de un factor. Análisis de la varianza
Prácticas Tema 2: El modelo lineal simple
Prácticas Tema 2: El modelo lineal simple Ana J. López y Rigoberto Pérez Departamento de Economía Aplicada. Universidad de Oviedo PRACTICA 2.1- Se han analizado sobre una muestra de 10 familias las variables
Tema 2: Análisis de datos bivariantes
1 Tema 2: Análisis de datos bivariantes En este tema: Tabla de contingencia, tabla de doble entrada, distribución conjunta. Frecuencias relativas, marginales, condicionadas. Diagrama de dispersión. Tipos
ESTADÍSTICA. Individuo. Es cada uno de los elementos que forman la población o muestra.
ESTADÍSTICA La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas). Según el colectivo a
TEMA 2 Diseño de experimentos: modelos con varios factores
TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial
CORRELACIÓN LINEAL SIMPLE
CORRELACIÓN LINEAL SIMPLE ANÁLISIS DE CORRELACIÓN Cuando se trabaja con dos variables, pueden surgir diferentes preguntas como: Existe relación entre lo que una empresa gasta en publicidad y el importe
CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES
TUTORÍA DE INTRODUCCIÓN A LA ESTADÍSTICA (º A.D.E.) CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES 1º) Qué ocurre cuando r = 1: a) Los valores teóricos no
Teoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
CORRELACION Y REGRESION
CORRELACION Y REGRESION En el siguiente apartado se presenta como calcular diferentes índices de correlación, así como la forma de modelar relaciones lineales mediante los procedimientos de regresión simple
1 JESTADIS\REGRES.DOC
CONTENIDOS 1. Introducción 2. Diagrama de dispersión 3. El coeficiente de correlación de Pearson 4. Regresión 1. Introducción Una de las metas frecuentes en la investigación consiste en determinar si existe
Lucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Tema 8: Regresión y Correlación
Tema 8: Regresión y Correlación Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 8: Regresión y Correlación Curso 2008-2009 1 / 12 Índice
Tipo de punta (factor) (bloques)
Ejemplo Diseño Bloques al Azar Ejercicio -6 (Pág. 99 Montgomery) Probeta Tipo de punta (factor) (bloques) 9. 9. 9.6 0.0 9. 9. 9.8 9.9 9. 9. 9.5 9.7 9.7 9.6 0.0 0. ) Representación gráfica de los datos
T2. El modelo lineal simple
T2. El modelo lineal simple Ana J. López y Rigoberto Pérez Dpto Economía Aplicada. Universidad de Oviedo Curso 2010-2011 Curso 2010-2011 1 / 40 Índice 1 Planteamiento e hipótesis básicas 2 Estimación de
ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 22 - Diciembre - 2.006 Primera Parte - Test Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández
Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema
Tema 8. Análisis de dos variables Ejercicios resueltos 1
Tema 8. Análisis de dos variables Ejercicios resueltos 1 Ejercicio resuelto 8.1 La siguiente tabla muestra la distribución del gasto mensual en libros y el gasto mensual en audiovisual en euros en los
1. Realice la prueba de homogeneidad de variancias e interprete los resultados.
1ª PRÁCTICA DE ORDENADOR (FEEDBACK) Un investigador pretende evaluar la eficacia de dos programas para mejorar las habilidades lectoras en escolares de sexto curso. Para ello asigna aleatoriamente seis
Tema 2: Análisis de datos bivariantes
Tema 2: Análisis de datos bivariantes Los contenidos a desarrollar en este tema son los siguientes: 1. Tablas de doble entrada. 2. Diagramas de dispersión. 3. Covarianza y Correlación. 4. Regresión lineal.
Guía docente 2007/2008
Guía docente 2007/2008 Plan 247 Lic.Investigación y Tec.Mercado Asignatura 43579 METODOS CUANTITATIVOS PARA LA INVESTIGACION DE MERCADOS Grupo 1 Presentación Métodos y técnicas cuantitativas de investigación
MÉTODOS ESTADÍSTICOS 4º Biológicas Septiembre 2009 PRIMER EJERCICIO
MÉTODOS ESTADÍSTICOS 4º Biológicas Septiembre 2009 PRIMER EJERCICIO Resultados obtenidos por los hombres ganadores de las medallas de oro en salto de longitud y salto de altura en las olimpiadas desde
Guía de Matemática Segundo Medio
Guía de Matemática Segundo Medio Aprendizaje Esperado:. Analizan la ecuación de la recta; establecen la dependencia entre las variables y la expresan gráfica y algebraicamente.. Identifican e interpretan
Análisis de datos en los estudios epidemiológicos III Correlación y regresión
Análisis de datos en los estudios epidemiológicos III Correlación y regresión Salinero. Departamento de Investigación Fuden Introducción En el capitulo anterior estudiamos lo que se denomina estadística
COEFICIENTE DE CORRELACIÓN PARCIAL
COEFICIENTE DE CORRELACIÓN PARCIAL 1.- Introducción....- Correlación parcial mediante correlación de Pearson.... 4 3.- Correlación parcial mediante el recurso de diagramas de Venn.... 6 4.- Aplicación
Análisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Prueba t para muestras independientes
Prueba t para muestras independientes El procedimiento Prueba t para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente
Definición de Correlación
Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del
1, 2, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 2, 1, 1, 4, 1
8 Estadística 81 Distribuciones unidimensionales Tablas de frecuencias En este tema nos ocuparemos del tratamiento de datos estadísticos uestro objeto de estudio será pues el valor de una cierta variable
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI
PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.
unicoos Funciones lineales Objetivos 1.Función de proporcionalidad directa pág. 170 Definición Representación gráfica
10 Funciones lineales Objetivos En esta lección aprenderás a: Identificar problemas en los que intervienen magnitudes directamente proporcionales. Calcular la función que relaciona a esas magnitudes a
Tema 2: Regresión. Grado en Fisioterapia, 2010/11. Jesús Montanero Fernández. Cátedra de Bioestadística Universidad de Extremadura
Grado en Fisioterapia, 2010/11 Cátedra de Bioestadística Universidad de Extremadura 8 de noviembre de 2010 Índice 1 Regresión lineal simple 2 3 Índice 1 Regresión lineal simple 2 3 Índice 1 Regresión lineal
Estadística aplicada a la comunicación
Estadística aplicada a la comunicación Tema 5: Análisis de datos cuantitativos I: estadística descriptiva b. Análisis bivariante OpenCourseWare UPV/EHU Unai Martín Roncero Departamento de Sociología 2
BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN
BLOQUE 3 TEMA 11 ESTIMACIÓN DE PARÁMETROS. ERRORES DE ESTIMACIÓN Aproximación intutitiva a la inferencia estadística La Estadística es la ciencia que se ocupa de la ordenación y análisis de datos procedentes
GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS
GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS Se realizó un estudio a partir de una muestra aleatoria de mujeres atendidas por el departamento de obstetricia y ginecología de cierta clínica particular.
Práctica 3: Regresión simple con R
Estadística II Curso 2010/2011 Licenciatura en Matemáticas Práctica 3: Regresión simple con R 1. El fichero de datos Vamos a trabajar con el fichero salinity que se encuentra en el paquete boot. Para cargar
Matemáticas. Bioestadística. Correlación y Regresión Lineales
Matemáticas Bioestadística Correlación y Regresión Lineales En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre si. Por ejemplo, si se analiza la
Tema 2: Análisis de datos bidimensionales
Tema : Análisis de datos bidimensionales Variables estadísticas bidimensionales Distribuciones de frecuencias asociadas Regresión y correlación En una población puede resultar interesante considerar simultáneamente
Modelos linealizables.
Modelos linealizables. 1.- Tras 10 años de funcionamiento, una empresa del sector de las telecomunicaciones, quiere estudiar el beneficio obtenido en dicho periodo en función al número de clientes que
4.1 Análisis bivariado de asociaciones
4.1 Análisis bivariado de asociaciones Los gerentes posiblemente estén interesados en el grado de asociación entre dos variables Las técnicas estadísticas adecuadas para realizar este tipo de análisis
ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte
ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso 13 - Septiembre - 2.004 Primera Parte Apellidos y Nombre:... D.N.I. :... Nota : En la realización de este examen sólo esta permitido utilizar calculadoras
Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción
EXTENSIONES DEL MODELO DE REGRESIÓN
EXTENSIONES DEL MODELO DE REGRESIÓN 1. Regresión exponencial 2. Regresión polinómica 3. Regresión con variables cualitativas M. Carmen Carollo, Beatriz Pateiro Página 1 1. Regresión exponencial Al tratar
Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias
Capítulo 13 Contrastes sobre medias: Los procedimientos Medias y Prueba T La opción Comparar medias del menú Analizar contiene varios de los procedimientos estadísticos diseñados para efectuar contrastes
ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL
ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL Msc. Lácides Baleta Octubre 16 Página 1 de 11 REGRESIÓN Y CORRELACIÓN LINEAL Son dos herramientas para investigar la dependencia de una variable dependiente Y
ALTERNATIVAS NO PARAMÉTRICAS A LOS CONTRASTES DE MEDIAS
ALTERNATIVAS NO PARAMÉTRICAS A LOS CONTRASTES DE MEDIAS 1.- Introducción... 2 2.- Prueba U de Mann Whitney para muestras independientes... 3 3.- Prueba t de Wicoxon para muestras apareadas... 8 1.- Introducción
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA) El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de
2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS
2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS Los modelos cuantitativos de pronósticos son modelos matemáticos que se basan en datos históricos. Estos modelos suponen que los
ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS
ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS CONTENIDO 1 Ajuste de Curvas 2 Análisis de Regresión 2.1 Métodos de Mínimos Cuadrados 2.2 Regresión Lineal AJUSTE DE CURVAS Uno de los objetivos en
Estadística de dos variables
Versión: Estadística de dos variables 19 de septiembre de 013 1 Introducción En el Tema 1 se consideran las variables estadísticas unidimensionales, es decir, cada individuo de la muestra se describe de
Capítulo 13 Contrastes sobre medias Los procedimientos Medias y Prueba T
Capítulo 13 Contrastes sobre medias Los procedimientos Medias y Prueba T La opción Comparar medias del menú Analizar contiene varios de los procedimientos estadísticos diseñados para efectuar contrastes
MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN. Tema 9
Métodos de Investigación en Educación 1º Psicopedagogía Grupo Mañana Curso 2009-2010 2010 MÉTODOS DE INVESTIGACIÓN EN EDUCACIÓN Tema 9 La regresión lineal Tema 9: La regresión lineal Objetivos Conocer
ECUACIONES DE RECTAS Y PLANOS
ECUACIONES DE RECTAS Y PLANOS Una recta en el plano está determinada cuando se dan dos puntos cualesquiera de la recta, o un punto de la recta y su dirección (su pendiente o ángulo de inclinación). La
2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)
2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS) La idea principal en este capitulo es el inicio a planear los diseño experimentales y su correspondiente análisis estadístico. En este caso iniciaremos
1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M.
1 Introducción MODELO DE REGRESIÓN SIMPLE Julián de la Horra Departamento de Matemáticas U.A.M. Los modelos de regresión sirven, en general, para tratar de expresar una variable respuesta (numérica) en
DISTRIBUCIONES BIDIMENSIONALES
La estadística unidimensional estudia los elementos de un conjunto de datos considerando sólo una variable o característica. Si ahora incorporamos, otra variable, y se observa simultáneamente el comportamiento
Tema 3. Relación entre dos variables cuantitativas
Tema 3. Relación entre dos variables cuantitativas Resumen del tema 3.1. Diagrama de dispersión Cuando sobre cada individuo de una población se observan simultáneamente dos características cuantitativas
