6. Análisis de la regresión: análisis gráfico

Documentos relacionados
Estadística con Excel Informática 4º ESO ESTADÍSTICA CON EXCEL

En los menús del Editor de datos, elija: Gráficos Generador de gráficos... Bakieva, M.; García-Bellido, R.; González Such, J. y Jornet, J.M.

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

ANÁLISIS DESCRIPTIVO CON SPSS

UNIVERSIDAD CARLOS III DE MADRID MASTER EN CALIDAD TOTAL MANUAL DE SPSS

2 VARIABLES ESTADÍSTICAS BIDIMENSIONALES

CORRELACIÓN Y PREDICIÓN

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Práctica 2. Estadística Descriptiva

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

Capítulo 9. Archivos de sintaxis

Otras medidas descriptivas usuales

Aparece una ventana interactiva que nos permite ver una presentación preliminar del aspecto que tendrá un gráfico al generarlo.

Análisis de Regresión y Correlación con MINITAB

CORRELACIONES CON SPSS

ESTADÍSTICA DESCRIPTIVA CON SPSS

Capítulo 10. Gráficos y diagramas

Roberto Quejido Cañamero

EL PÉNDULO SIMPLE: DETERMINACIÓN DE LA ACELERACIÓN DE LA GRAVEDAD (A) FUNDAMENTO

editor de HTML integrado en Moodle. El contenido se divide en distintas partes llamadas páginas, que se muestran individualmente.

1.1. Introducción y conceptos básicos

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

TEMA 7 ANÁLISIS DE DATOS: INTRODUCCIÓN AL SPSS

Introducción práctica a SPSS (PASW Statistics 18)

Introducción al SPSS/PC. 1. El editor de datos. Taller de Estadística

1 Ejemplo de análisis descriptivo de un conjunto de datos

Covarianza y coeficiente de correlación

Investigación sobre el cambio en la aceleración de un carrito que rueda hacia abajo sobre un plano inclinado

Semana de dieta (X) Peso en Kg (Y)

Indicaciones específicas para los análisis estadísticos.

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

FISICA I Escuela Politécnica de Ingeniería de Minas y Energía AJUSTE POR MÍNIMOS CUADRADOS

SENSOR DE POSICIÓN ULTRASÓNICO. Guía de Uso

Tema 9: Estadística Descriptiva. Distribuciones estadísticas. Representaciones

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

Análisis estadístico con Microsoft Excel

En esta segunda y última parte de la unidad veremos algunas de las funciones

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

1. Análisis de variables cuantitativas (2 a parte)

PANEL DE CONTROL (Zona de Administración) MANUAL DE USO Por conexanet. Revisión 1.1 Fecha

2_trabajar con calc I

WINDOWS. Iniciando Windows. El mouse

Manipulación de vectores en R

Instalación del programa PSPP y obtención de una distribución de frecuencias.

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

17.- PARABRISAS RESOLUCIÓN

Creación de usuarios Acceso a Alexia

Instrucciones básicas de gretl

DIAGRAMA QUE NOS MUESTRA LA CREACION DE UN MAILING O CARTA MODELO COMBINADA

REGISTRAR LOS SITIOS WEB MÁS INTERESANTES

Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:

BLOQUE IV. Funciones. 10. Funciones. Rectas y parábolas 11. Funciones racionales, irracionales, exponenciales y logarítmicas 12. Límites y derivadas

Capítulo 10. Análisis descriptivo: Los procedimientos Frecuencias y Descriptivos

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0])

Audio ::: Copiar y pegar audio Diseño de materiales multimedia. Web Copiar y pegar audio con Audacity

Tema 1: Introducción a la Estadística

FUNCIONES 1. DEFINICION DOMINIO Y RANGO

Creación de un Gráfico con OpenOffice.org Calc Presentación de los Datos Asistente para Gráficos

GENERACIÓN DE TRANSFERENCIAS

Gráficas de caja. El borde derecho de la caja es el tercer cuartil, Q 3, que es la mediana de los valores que están por encima de la mediana.

Funciones más usuales 1

Estacionalidad. Series de tiempo. Modelos econométricos. Modelos econométricos. Q= T Kα Lβ

GENERACIÓN DE ANTICIPOS DE CRÉDITO

MEDIDA DE LA VELOCIDAD DEL SONIDO. TUBO DE RESONANCIA

Introducción a MS Word 2007

Universidad Complutense de Madrid CURSOS DE FORMACIÓN EN INFORMÁTICA. Gráficos de Excel. Hojas de cálculo Tema 4

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales.

Este programa mueve cada motor de forma independiente, y cuando termina una línea pasa a la siguiente.

2. Seleccionar Insertar función:

LibreOffice - curso avanzado

GUIA DE MANEJO DE EXCEL PARA LA ASIGNATURA ESTADÍSTICA DESCRIPTIVA

APLICACIÓN PARA FACILITAR LA GESTIÓN DE LOS CENTROS UNIVERSITARIOS MANUAL

Introducción a la Estadística con Excel

Práctica 3. Explorando datos con Statistix

Guía de aprendizaje Audacity: guía de edición de sonido

Introducción a la Econometría (LE y LADE, mañana) Prof. Magdalena Cladera ANÁLISIS DE REGRESIÓN CON EXCEL Y SPSS

PRESENTACIÓN GRÁFICA DE LOS DATOS

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Tutorial PowerPoint. Crear una nueva presentación

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

7.1. Mandar mensajes privados 7.2. Escribir en la biografía de un amigo 7.3. Chatear

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

LABORATORIO Nº 1 Sistemas de Información asociados a los Formularios en Excel

Estadística; 3º CC. AA. Examen final, 4 de septiembre de 2009

Ajustes de sombras. 1) Añadir localización

Fundamentos de Biología Aplicada I Estadística Curso Práctica 6: Regresión Logística I

Crear Encuestas. Una guía rápida para...

Las bebidas Alcohólicas

La relación entre la altura de caída y el tiempo que tarda en rebotar 6 veces una pelota

Análisis de Datos. Práctica de métodos predicción de en WEKA

Tema 4 Funciones elementales Matemáticas CCSSI 1º Bachillerato 1

Operación de Microsoft Excel

Aplicaciones de Estadística Descriptiva

Centro de Profesorado Luisa Revuelta (Córdoba) TEMA 6 TABLAS Y GRÁFICOS EN IMPRESS

Modelos estadísticos aplicados en administración de negocios que generan ventajas competitivas

Funciones polinomiales de grados cero, uno y dos

Transcripción:

6. Análisis de la regresión: análisis gráfico 6.1. Introducción El papel de SPSS en el análisis de regresión consiste en proporcionar herramientas para representar nubes de puntos, para calcular los parámetros de la función a ajustar y la medida de la bondad del ajuste, así como herramientas de inferencia estadística para la validación del modelo. La representación gráfica de la nube de puntos permite determinar qué tipo de función a ajustar sugieren los datos, detectar valores atípicos, estudiar posibles transformaciones de las variables y determinar si el estudio por subpoblaciones mejoraría los resultados. Para dibujar nubes de puntos, se utiliza la opción DISPERSIÓN del menú GRÁFICOS. Además, esta opción permite dibujar la recta o los polinomios de grado 2 o 3 que mejor se ajustan, calculando el coeficiente de determinación general que sirve como medida de la bondad del ajuste. 6.2. Cómo dibujar diagramas de dispersión El diagrama de dispersión o nube de puntos permite obtener información sobre el tipo de relación existente entre dos variables y sirve para detectar posibles datos atípicos o valores extremos. Para representar nubes de puntos, se selecciona en la barra del menú principal GRÁFICOS>DISPERSIÓN. Aparece el cuadro de diálogo que se muestra en la Figura 6.1, en el que se debe seleccionar el tipo de nube de puntos que se desea dibujar. FIGURA 6.1. Cuadro de diálogo de la opción DISPERSIÓN. La opción SIMPLE permite representar la nube de puntos asociada a una pareja de variables, distinguiendo los puntos según las categorías de una tercera variable. Pulsando el botón DEFINIR, aparece el cuadro de diálogo que se muestra en la Figura 6.2. Variable dependiente o explicada. Variable independiente o explicativa. FIGURA 6.2. Especificar las variables que intervienen en el modelo. Variable que permite distinguir los grupos.

2 Análisis de la regresión: análisis gráfico Ejercicio 6.1: Analiza qué tipo de relación existe entre la concentración anual media de SO 2 y cada una de las variables que pueden influir en ella. (Archivo: POLUCIÓN.SAV) 1. Seleccionar GRÁFICOS>DISPERSIÓN. (i) Si se desea saber la concentración anual media conocida, por ejemplo, la temperatura anual media, debes pasar la variable SO2 al cuadro EJE Y y la variable GRADOS al cuadro EJE X. (ii) La gráfica resultante se muestra en la Figura 6.3. 12 8 Concentración de SO2 4 2 4 5 7 8 Temperatura en ºF FIGURA 6.3. (iii) La gráfica muestra que la polución disminuye cuando aumenta la temperatura con mucha dispersión para los valores bajos de ésta y que posiblemente los valores de la polución mayores de 8 microgramos por metro cúbico son dos valores extremos. 6.3. Cómo dibujar funciones polinómicas sobre la nube de puntos y calcular la bondad del ajuste Una vez dibujada la nube de puntos es posible representar la recta de regresión, la parábola o la cúbica que mejor se ajusta y obtener el valor del coeficiente de determinación general que mide la bondad del ajuste. Dibujar el ajuste sobre la nube de puntos permite determinar si se ha elegido la función de ajuste más adecuada y el valor de coeficiente de determinación representa la proporción de la variabilidad de la variable dependiente explicada por la variable independiente. Además, es posible dibujar la nube de puntos de dos variables según los valores de otra, que debe ser cualitativa o cuantitativa tomando pocos valores distintos. Ejercicio 6.2: Analiza si se puede establecer una relación de tipo lineal entre los pulsos antes y después de hacer ejercicio si se distingue según el sexo del individuo. (Archivo de datos: PULSO.SAV) 2. Selecciona GRÁFICOS>DISPERSIÓN. 3. Pasa la variable DESPUES al cuadro EJE Y y la variable ANTES al cuadro EJE X. Para distinguir según el sexo del individuo, pasa la variable SEXO al cuadro ESTABLECER MARCAS POR. 4. La gráfica que resulta se muestra en la Figura 6.4. Los círculos claros representan los valores correspondientes a las mujeres y los cuadrados oscuros los correspondientes a los hombres.

LICENCIATURA EN MATEMÁTICAS: Prácticas de Estadística 3 28 2 24 22 2 18 1 DESPUES 14 12 7 8 9 SEXO Mujer Hombre ANT ES FIGURA 6.4. 5. Aparentemente parece existir una relación lineal entre los pulsos antes y después del ejercicio tanto en el grupo de hombres como en el de mujeres. Aparece un dato atípico que corresponde al grupo de mujeres. Para representar la función a ajustar y calcular el coeficiente de determinación, una vez creada la gráfica, se procede como sigue: Pulsa dos veces sobre la gráfica para que pase a una nueva ventana que es el EDITOR DE GRÁFICOS. Selecciona en la barra del menú principal DISEÑO>OPCIONES. Si la nube de puntos editada fue creada con la opción SIMPLE, aparece el cuadro de diálogo que se muestra en la Figura 6.5. Distinguir según categorías. Elegir el tipo de ajuste y calcular el coeficiente de determinación. FIGURA 6.5. Opciones del diagrama de dispersión. En el recuadro AJUSTAR LÍNEA: Se selecciona la opción TOTAL, si se busca la función que mejor se ajusta a todos los puntos. Se selecciona la opción SUBGRUPOS, si se desea una función para cada subgrupo definido por la variable especificada en ESTABLECER MARCAS POR. Esta opción requiere que permanezca activada MOSTRAR SUBGRUPOS. Al pulsar el botón OPCIONES DE AJUSTE aparece el cuadro de diálogo que muestra la Figura 6.6.

4 Análisis de la regresión: análisis gráfico Seleccionar la función a ajustar. Activar para obtener el valor del coeficiente de determinación. FIGURA 6.6. Selección de la función a ajustar y obtención de la medida de la bondad del ajuste. Si en el recuadro LÍNEA AJUSTADA se ha activado la opción TOTAL, se representará la función y se calculará el coeficiente de determinación para el total de los puntos. Si se ha activado la opción SUBGRUPOS (junto con la opción MOSTRAR SUBGRUPOS, en el recuadro OP CIONES DE VISUALIZACIÓN), se representará la función y se calculará el coeficiente de determinación para cada grupo establecido por los valores de la variable que los define. Ejercicio 6.3: Dibuja la función lineal para los pulsos antes y después de hacer ejercicio si se distingue según el sexo del individuo. 1. Pulsa dos veces sobre la gráfica. 2. Selecciona en la barra del menú principal DISEÑO>OPCIONES. 3. En el recuadro AJUSTAR LÍNEA, selecciona la opción TOTAL y pulsa el botón OPCIONES DE AJUSTE. 4. Selecciona las opciones REGRESIÓN LINEAL y MOSTRAR R CUADRADO EN LA LEYENDA. 5. Pulsa CONTINUAR y ACEPTAR. 6. El gráfico resultante se muestra en la Figura 6.7. La leyenda del gráfico muestra un valor de R 2 =,3113. Observa cómo afecta el dato atípico a la pendiente de la recta. 28 2 24 22 2 18 DESPUES 1 14 12 7 8 9 SEXO Mujer Hombre Total Population R² =,3113 ANTES FIGURA 6.7. 7. Selecciona de nuevo DISEÑO>OPCIONES. 8. En el recuadro AJUSTAR LÍNEA, selecciona la opción SUBGRUPOS. 9. Pulsa ACEPTAR. 1. El gráfico resultante se muestra en la Figura 6.8. La leyenda del gráfico muestra un valor de R 2 =,1485

LICENCIATURA EN MATEMÁTICAS: Prácticas de Estadística 5 para el grupo de los hombres y de R 2 =,282 para el grupo de las mujeres. Observa que la pendiente de la recta para estas últimas está muy afectada por el dato atípico que atrae a la recta hacia él. 28 2 24 22 2 18 1 SEXO DESPUES 14 12 7 8 9 Mujer R² =,282 Hombre R² =,1485 ANTES FIGURA 6.8. 11. Elimina el dato atípico y observa cómo cambia el aspecto de la nube de puntos perdiendo el carácter lineal, las dos rectas son entonces casi paralelas y el valor de R 2 en el grupo de las mujeres disminuye. El gráfico se muestra en la Figura 6.9. 17 1 15 14 13 SEXO Mujer DESPUES 12 11 7 8 9 R² =,1651 Hombre R² =,1485 ANTES FIGURA 6.9. 6.4. Ejercicios resueltos Ejercicio 6.4: El archivo VIRUS.SAV contiene datos sobre reproducción de virus en diferentes tipos de cultivos. Las variables consideradas son el tiempo de acción del cultivo medida en horas, el número de virus reproducidos en ese tiempo, el tipo de cultivo (1=ácido, 2=básico, 3=neutro) y la temperatura del cultivo. a) Decide cuál es el mejor ajuste para predecir el número de virus reproducidos en función del tiempo. Se mejora el ajuste si se distingue por tipo de cultivo? 1. El número de virus será la variable explicada (Eje Y) y el tiempo la explicativa (Eje X). 2. La nube de puntos distinguiendo por tipo de cultivo (Figura 6.1) indica que lo más adecuado es ensayar un ajuste para cada tipo de cultivo. 3. Parece que el ajuste lineal es el mejor para los cultivos de tipo básico (Figura 6.11). 4. En cambio un ajuste de tipo parabólico (Figura 6.12) parece más adecuado tanto para los cultivos de tipo neutro como ácido. Observa que la rama de parábola ajustada a los cultivos de tipo básico es casi una

6 Análisis de la regresión: análisis gráfico recta. 3 3 2 2 CULT IVO CULT IVO neutro neutro R² =,6497 basico R² =,931 VIRUS 1 2 3 4 5 basico acido VIRUS 1 2 3 4 5 acido R² =,6812 T IEMPO FIGURA 6.1. Número de virus sobre el tiempo según el tipo de cultivo. T IEMPO FIGURA 6.11. Ajuste lineal por tipo de cultivo. 3 3 2 2 CULT IVO CULT IVO neutro R² =,9357 neutro R² =,9357 basico basico R² =,932 R² =,9337 VIRUS 1 2 3 4 5 acido R² =,9179 VIRUS 1 2 3 4 5 acido R² =,9429 T IEMPO T IEMPO (a) Ajuste cuadrático (b) Ajuste cúbico FIGURA 6.12. b) Repite los apartados a) y b) para obtener el mejor ajuste que sirva para predecir el número de virus reproducidos en función de la temperatura. Se mejora el ajuste al distinguir por tipo de cultivo? 6.5. Ejercicios propuestos Ejercicio 6.5: Se ha examinado una serie de soluciones estándar de fluoresceína en un fluorímetro que condujo a las intensidades que se recogen en el archivo FLUORESCENCIA.SAV junto con la concentración de las soluciones en pg/ml. El archivo contiene los resultados de dos experimentos diferentes Es lineal la representación gráfica de la calibración en ambos casos? Ejercicio 6.6: Los datos de la siguiente tabla recogen información referente al peso y a la longitud de 8 insectos: Longitud 1,2 1,8 3,1 4,9 5,7 7,1 8,6 9,8 Peso 4,5 5,9 7, 7,8 7,2 6,8 4,5 2,7 a) Estudia si sería apropiado predecir el peso del insecto conocida la longitud mediante un ajuste lineal.

LICENCIATURA EN MATEMÁTICAS: Prácticas de Estadística 7 b) Qué ajuste sugiere la nube de puntos? Dibújalo y determina si es el más adecuado.

6.3 Dibujar funciones polinómicas en una nube de puntos. Añadir funciones polinómicas y etiquetas. Editar la nube de puntos(doble click en el gráfico en la hoja de resultados): En la ventana del Editor de Gráficos

Si se presiona alguno de los botones se obtiene el menú: Mientras que en el menú Elementos se encuentra además la opción de Mostrar Etiquetas de Datos.