CASO 5-3 MILAN FOOD COOPERATIVE (B)

Documentos relacionados
Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

CM0244. Suficientable

ESTADÍSTICA. Tema 4 Regresión lineal simple

Teoría de la decisión

INDICE. Prólogo a la Segunda Edición

Tema 2. Descripción Conjunta de Varias Variables

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Métodos Estadísticos Multivariados

Examen de Grado Sección de Econometría Agosto y se obtienen los siguientes resultados. Observe que parte de la información ha sido omitida.

4.1 Análisis bivariado de asociaciones

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Tema 2. Regresión Lineal

Tema 3. Relación entre dos variables cuantitativas

Tercera práctica de REGRESIÓN.

Análisis Probit. StatFolio de Ejemplo: probit.sgp

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA ACADEMICA DIRECCIÓN DE ESTUDIOS PROFESIONALES EN INGENIERÍA Y CIENCIAS FÍSICO MATEMÁTICAS

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

CURSO-TALLER DE ANÁLISIS ESTADÍSTICO BÁSICO CON EXCEL Y SPSS Instructor: Mario Alberto Barajas Malacara

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Regresión y Correlación

Método de cuadrados mínimos

UNIVERSIDAD CENTROAMERICANA JOSE SIMEON CAÑAS FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ADMINISTRACIÓN DE EMPRESAS

POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN

Actividades para el logro de las tareas de desempeño Día:1 Día:2 Día:3 Día:4 Día:5

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

FACULTAD: Facultad de Ciencias de la Educación

3. Correlación. Introducción. Diagrama de dispersión

Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp

4. Regresión Lineal Simple

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

UNIVERSIDAD ALAS PERUANAS FACULTAD DE CIENCIAS DE LA COMUNICACIÓN SILABO POR COMPETENCIA

MATEMÁTICAS 2º DE BACHILLERATO

Números reales. Valor absoluto. Desigualdades. Distancias entre la recta real. Intervalos y entornos.

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Econometría II Grado en finanzas y contabilidad

Análisis de datos del Aguacate Hass (presentación caja 10 kilogramos)

MECÁNICA- INGENIERÍA INDUSTRIAL - EN SISTEMAS DE INFORMACIÓN - CIVIL - ELÉCTRICA - ELECTRÓNICA - NAVAL QUÍMICA - TEXTIL

Bioestadística para Reumatólogos

Scientia Et Technica ISSN: Universidad Tecnológica de Pereira Colombia

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

1.- DATOS DE LA ASIGNATURA. Diseño Asistido por Computadora. Nombre de la asignatura: Ingeniería Industrial. Carrera: Clave de la asignatura: OPN-1307

La asignatura proporciona al alumno los conceptos básicos de estadística. Se organiza el temario en cinco unidades.

Facultad de Ciencias Sociales - Universidad de la República

Regresión con variables independientes cualitativas

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

Teorema Central del Límite (1)

Estadística aplicada a la comunicación

INSTRUMENTOS DE SELECCIÓN

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

DIPLOMADO EN ESTADÍSTICA APLICADA

Práctica 9 REGRESION LINEAL Y CORRELACIÓN

IN Guía de Problemas Resueltos de Geometría de Programación Lineal v1.0

EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.

DIRECCIÓN ACADÉMICA PLANEACIÓN DIDÁCTICA

ESTADÍSTICA, SISTEMAS DE INFORMACIÓN Y NUEVAS TECONOLOGÍAS Código de la Asignatura Créditos

Transformaciones de Box-Cox

Tema 1: Introducción

GUÍA DOCENTE DE LA ASIGNATURA ESTADÍSTICA APLICADA

Estadís5ca. María Dolores Frías Domínguez Jesús Fernández Fernández Carmen María Sordo. Tema 2. Modelos de regresión

CAPITULO ANÁLISIS ESTADÍSTICO MULTIVARIADO /1/ /2/ En el presente capítulo se realiza el análisis estadístico multivariado de los

Funciones de Regresión No Lineales (SW Cap. 6)

Análisis de regresión lineal simple

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

USO HERRAMIENTAS EXCEL PARA LA PREDICCION

UNIVERSIDAD AUTÓNOMA DE QUERÉTARO FACULTAD DE INGENIERÍA. práctica, Total: 85 Horas a la semana: 5 teoría: 4 prácticas: 1 Créditos:

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Relación entre la altura y la distancia del suelo al ombligo

Departamento de Matematicas

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

MATEMÁTICA DE CUARTO 207

Carrera: Ingeniería Civil CIM 0531

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

MATEMÁTICAS 1º DE BACHILLERATO

CONTENIDO PROGRAMÁTICO

T4. Modelos con variables cualitativas

ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA Estadística Descriptiva. Guía y Rubrica. Momento 2

Formato de la información suministrada por el programa informático MINITAB, empleado para el análisis de los datos empíricos.

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

ADMINISTRACION DE OPERACIONES

PROBABILIDAD Y ESTADÍSTICA

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

La desviación típica y otras medidas de dispersión

UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA. CARÁCTER: Obligatoria DENSIDAD HORARIA HT HP HS UCS THS/SEM

CAPITULO RESULTADOS

Argentina Factores asociados TERCE

1. DATOS INFORMATIVOS:

1º CURSO BIOESTADÍSTICA

Repaso Estadística Descriptiva

Resumen teórico de los principales conceptos estadísticos

PROGRAMACIÓN DE LOS CONTENIDOS DE MATEMÁTICAS EN LA PREPARACIÓN DE LA PARTE COMÚN DE LA PRUEBA DE ACCESO A LOS C.F.G.S. (Opción C)

Transcripción:

CASO 5-3 MILAN FOOD COOPERATIVE (B) INTRODUCCIÓN Éste es una continuación del caso Milan Food Cooperative (A), de la parte 4 del texto. Aquí se presentan los resultados del análisis de correlación y regresión y se les solicita a los estudiantes que interpreten varias relaciones, determinen una función predictiva, determinen intervalos de confianza estadística y discutan suposiciones de análisis. OBJETIVOS DEL CASO ) Exponer a los estudiantes a una aplicación de dos técnicas comunes de análisis de datos, correlación y regresión. 2) Que los estudiantes practiquen la interpretación de resultados de correlación y regresión mientras reconocen las diversas suposiciones fundamentales de análisis. PREGUNTAS A ASIGNAR ) Para los resultados de la correlación: a) Qué interpretación puede dar a los resultados mostrados? b) Qué supuestos sustentan sus interpretaciones? c) Cómo podrían probarse estos supuestos?

2) Para los resultados de la regresión: a) Qué interpretación puede dar a estos resultados? b) Qué supuestos sustentan sus interpretaciones? c) Cómo podrían probarse estos supuestos? d) El R 2 bajo implica que nuestras variables independientes son malas predictoras de los gastos en alimentos? e) Fundamente su punto de vista. ANÁLISIS DEL CASO. Matriz de correlación a) Interpretación de los resultados de la matriz de correlación Deben examinarse dos tipos de asociaciones. Primero, estudiar las relaciones entre la variable dependiente (gasto semanal en alimentos) y las variables independientes (número de personas, ingreso, niños -8, niños menores de, educación y edad). La conclusión es que hay una relación razonablemente fuerte entre los gastos y ) personas (.43), 2) ingreso (.38) y 3) niños -8 (.40). Segundo, examine las relaciones entre variables independientes. La correlación es fuerte entre ) personas y niños -8 (.70), 2) personas y niños menores de (.5), 3) ingreso y educación (.48) y 4) niños -8 y niños menores de (.25). Note que no hay relación entre edad de la cabeza de familia y el número de personas. Ya que esto puede ser contraintuitivo para muchos, los estudiantes pueden buscar explicar esto. Aunque no hay una relación lineal, es posible una relación no lineal. La siguiente tabla de tabulación cruzada ilustra este punto. (Véase figura NE.) 2

Esta figura presenta una cuenta de frecuencia del número de encuestados en cada combinación de personas edad/número. Esta figura muestra una relación curvilínea muy fuerte entre edad y número de personas en la familia. En efecto, el sentido común predecirá esto. La gente más joven y la gente mayor tendrá casas más pequeñas que aquellos en los rangos de edad intermedios. La correlación lineal no ha encontrado una relación real. Ésta es una lección importante para que la aprendan los estudiantes. Figura NE Edad No. de personas 9+ 8 7 5 4 3 2 25 34 44 54 4 74 75+ 2 3 8 9 4 43 28 30 0 4 9 4 9 24 2 22 27 5 3 8 2 20 2 8 5 9 9 9 0 3 5 8 2 b) Suposiciones que sustentan las interpretaciones de la matriz de correlación La principal suposición es que las relaciones lineales predominan entre las variables. En la mayor parte de los casos, esto es probablemente del todo correcto, pero existen excepciones como las señaladas antes. 3

c) Probar estas suposiciones La anterior tabla de tabulación cruzada ilustra una violación de esta suposición. Otra forma de examinar si las relaciones son lineales es representándolas en una gráfica. Por ejemplo, la relación entre gastos semanales en alimentos y el número de personas en la familia también es no lineal (figura NE 2). Otras relaciones exhiben una gran cantidad de asociación lineal. 2. Resultados de la regresión a) Interpretar los resultados de la regresión Es posible estimar los gastos semanales en alimentos de una familia al introducir valores en la fórmula de regresión. Sin embargo, los niveles de significancia y los intervalos de confianza sugieren que los coeficientes para ciertas variables no deben tomarse en su valor nominal. Estas variables son: ) niños menores de años, 2) educación, y 3) edad de la cabeza de familia. Las conclusiones incluyen: ) Esta fórmula de estimación explica 29.% de la variabilidad total de los gastos semanales en alimentos; es decir, la varianza del verdadero gasto en alimentos alrededor de la línea de regresión (plana) es de alrededor de 70% de su varianza alrededor de los gastos en alimentos promedio. 2) Error estándar: Dado 5% de error de probabilidad, una estimación de gastos por una familia muestra particular puede estar fuera por US$35.30 o más. 4

3) Intervalos de confianza para los coeficientes: Los errores estándar de los coeficientes dan los siguientes intervalos de confianza de 95% (2 errores estándar) para los coeficientes: Personas 3.5 ±.42 Educación. ±.52 Niños 0- -.87 ± 4.4 Ingreso.77 ±.25 Niños -8 5.30 ± 4.0 Edad.025 ±.4 4) Coeficientes a) Los niños pequeños no comen tanto como los adolescentes y los adultos. b) En las familias donde la cabeza de familia es mayor y más educada, los gastos tiende a ser mayores. c) La significancia de estos tres coeficientes es débil. Por ejemplo, usando la edad aquí hay 7% de probabilidad de decir que el coeficiente de edad es diferente de cero cuando no lo es. 5) a) Usando la ecuación de regresión: 3.78 constante +(3.5 * número de personas) +(-.87 si hay niños menores de ) +(5.30 si hay niños -8) +(. * nivel de educación) +(.78 * ingreso en miles) +(.025 * edad en años) 5

Para una familia de cuatro, sin niños menores de, pero con niños de -8, donde la cabeza de familia es un graduado de universidad de 38 años y el ingreso familiar es US$25,000 el gasto en alimentos estimado es: (3.78) + (3.4 4) + (-.87 0) + (5.30 ) + (. 5) + (.78 25) + (.025 38) = US$58.42/semana R2 = 0.29 error estándar del SSE estimado = 7.5 Los valores de las variables son de Milan Food Cooperative (A). b) Suposiciones que sustentan las interpretaciones de la regresión ) La multicolinealidad no está presente 2) Las interacciones no están presentes 3) Las relaciones entre variables dependientes e independientes son lineales c) Probar estas suposiciones Las figuras NE y 2 ilustran pruebas para relaciones lineales. Análisis similares pueden realizarse en otras variables. La figura NE 3 ilustra la existencia de multicolinealidad entre educación e ingreso mientras que la figura NE 4 ilustra los efectos de la interacción del ingreso en la relación entre el número de personas y el gasto semanal en alimentos. Por tanto, estos datos contienen relaciones no lineales entre la variable dependiente y algunas variables independientes, la multicolinealidad entre variables predictoras, y alguna interacción (efectos no aditivos). Esto demuestra en forma clara el riesgo de correr a ciegas un paquete de regresión enlatado e interpretar de manera directa los coeficientes.

d) y e) El valor bajo de R 2 implica que nuestras variables independientes son malas predictoras de los gastos en alimentos? No necesariamente. Aunque hay otras variables que se relacionan con los gastos en alimentos y quizá puedan mejorar la predicción, pueden resaltarse varios puntos acerca de las variables usadas en esta ecuación de regresión. ) Una transformación a escala logarítmica puede resolver el problema de no linealidad entre gasto y número de personas. 2) Los problemas de interacción (gasto en alimentos/número de personas/ ingreso) pueden ser resueltos por el uso de variables falsas. 3) Los errores de medición sin duda están presentes. Por ejemplo, un encuestado recuerda en forma incorrecta el gasto real en alimentos o no registra una compra rápida de emergencia. 4) El problema de multicolinealidad puede resolverse al dejar fuera variables correlacionadas, o índices formados. 5) Resulta que una ecuación de tres variables usando número de personas, ingreso y niños -8 provee en esencia la misma estimación de gasto en alimentos. 7

ESTRATEGIA DE ENSEÑANZA Si no se hizo el caso Milan Food Cooperative (A), instruya a los estudiantes para que lo lean como antecedente. Si se hizo, un repaso es útil. Ésta es una buena oportunidad para revisar los principios, si no las mecánicas de la covarianza, la correlación, la multicolinealidad, la interacción, la regresión múltiple, etc. Primero, puede examinarse la matriz de correlación con el instructor solicitando a los estudiantes que interpreten varias relaciones correlacionales. Luego puede examinarse del mismo modo la tabla de regresión. Ésta es una buena oportunidad para que el instructor explique o ilustre la regresión gradual. Por lo general, el instructor debe tomar la dirección de esta discusión. Los estudiantes de manera típica no entienden todas las complejidades de la correlación y la regresión. También es útil tener el material en las figuras NE -4 disponibles por medio de un proyector de cuerpos opacos. También note que las pruebas estadísticas realizadas implican que los datos son de una muestra, no de un censo. Los estudiantes no tienen dificultad para hacer esta suposición para la discusión del caso. 8

FIGURA NE 2 RELACIÓN ENTRE GASTOS SEMANALES EN ALIMENTOS Y EL NÚMERO DE PERSONAS EN LA FAMILIA (RELACIÓN NO LINEAL) GASTO PROMEDIO EN ALIMENTOS $ No. TOTAL DE PERSONAS 9

FIGURA NE 3 RELACIÓN ENTRE INGRESO FAMILIAR ANUAL Y EDUCACIÓN DE LA CABEZA DE FAMILIA INGRESO ANUAL PROMEDIO DE $ (000) (MULTICOLINEALIDAD) -8 GRADOS 9- BACHILLE- RATO ALGUNA ESCUELA VOCA- CIONAL UNIVER- SIDAD EDUCACIÓN DE LA CABEZA DE FAMILIA 0

FIGURA NE 4 RELACIÓN ENTRE GASTOS EN ALIMENTOS Y NÚMERO DE PERSONAS EN LA FAMILIA PARA TRES GRUPOS DE INGRESO GASTO SEMANAL EN ALIMENTACIÓN (INTERACCIÓN) INGRESO MAYOR DE $5.000 INGRESO DE $,000-$4,999 INGRESO MENOR DE $,000 No. TOTAL DE PERSONAS O MÁS Ecuaciones de regresión para las líneas: Alta: Gastos en Alim. = $29.5 + 5.70 (personas); N = 0 Media: Gastos en Alim. = $34.5 + 3.7 (personas); N = 247 Baja: Gastos en Alim. = $20.0 + 3.88 (personas); N = 52