Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp
|
|
- Lorena Peña Bustamante
- hace 7 años
- Vistas:
Transcripción
1 Regresión en Cadena Resumen El procedimiento Regresión en Cadena está diseñado para ajustar un modelo de regresión múltiple cuando las variables independientes exhiben multicolinealidad. Multicolinealidad se refiere a la situación en la cual las variables X están correlacionadas entre ellas mismas, lo que frecuentemente conduce a estimaciones imprecisas de los coeficientes de regresión cuando se usan mínimos cuadrados ordinarios. Permitiendo una pequeña cantidad de sesgo en las estimaciones, la regresión en cadena frecuentemente puede reducir la variabilidad de los coeficientes estimados y da un modelo más estable e interpretable. Se proporcionan una traza de cadena y un gráfico de los factores de inflación de la varianza (VIF variance inflation factors) para ayudar a elegir el valor del parámetro de cadena. StatFolio de Ejemplo: ridge reg.sgp Datos de Ejemplo: El archivo bodyfat.sf6 contiene un conjunto de datos de Neter et al. (1998) que describen n = 20 mujeres entre 25 y 35 años de edad. Los datos incluyen medidas de la grasa corporal (bodyfat), grosor del pliegue de la piel del triceps (triceps), circunferencia del muslo (thigh), y circunferencia a la mitad del brazo (midarm). subject bodyfat triceps thigh midarm Se desea construir un modelo que relacione la grasa corporal (Y) con las otras tres variables. Sin embargo, como podría esperarse, las tres variables predictoras están ellas mismas altamente correlacionadas por StatPoint, Inc. Regresión en Cadena - 1
2 Para ilustrar la relación entre todas las variables, considere el siguiente gráfico de matriz: body fat midarm thigh triceps Ambas triceps y thigh muestran una fuerte correlación positiva con bodyfat. Sin embargo, entre ellas también están fuertemente correlacionadas. Los resultados de usar la Regresión Múltiple en estos datos se muestran a continuación: Regresión Múltiple - body fat Variable dependiente: body fat Variables independientes: triceps (Neter, p. 385) thigh midarm Error Estadístico Parámetro Estimación Estándar T Valor-P CONSTANTE triceps thigh midarm Análisis de Varianza Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Modelo Residuo Total (Corr.) R-cuadrada = porciento R-cuadrado (ajustado para g.l.) = porciento Error estándar del est. = Error absoluto medio = Estadístico Durbin-Watson = (P=0.6705) Autocorrelación de residuos en retraso 1 = Advierta que ninguno de los coeficientes tiene un valor de P significativo, aunque el modelo mismo es altamente significativo. Advierta también que el coeficiente de thigh es negativo, a pesar de su fuerte correlación positiva con bodyfat. La regresión en cadena está diseñada para salvar estas imprecisiones, causadas por la multicolinealidad entre las variables predictoras por StatPoint, Inc. Regresión en Cadena - 2
3 Ingreso de Datos La caja de diálogo del ingreso de los datos solicita los nombres de las columnas que contienen la variable dependiente Y y las variables independientes X: Y: columna numérica que contiene las n observaciones de la variable dependiente Y. X: columnas numéricas que contienen los n valores de todas las variables independientes X. Selección: selección de un subgrupo de datos. Pesos: una columna numérica opcional que contiene los pesos que se aplicarán a los residuos cuadrados cuando se realice un ajuste de mínimos cuadrados ponderados por StatPoint, Inc. Regresión en Cadena - 3
4 Resumen del Análisis El Resumen del Análisis muestra información sobre el modelo estimado en un valor elegido del parámetro de cadena λ. El parámetro de cadena controla la cantidad de sesgo permitido en la estimación de los coeficientes, λ = 0 corresponde a los estimadores insesgados de mínimos cuadrados ordinarios. Conforme λ aumenta, el sesgo aumenta, pero disminuye la varianza de los coeficientes. Regresión en Cadena - body fat Variable dependiente: body fat Variables independientes: triceps (Neter, p. 385) thigh midarm Número de casos completos: 20 Resultados del Modelo para el Parámetro de Cadena = 0.02 Factor de Inflación de Parámetro Estimado Varianza CONSTANTE triceps thigh midarm R-Cuadrada = porciento R-Cuadrada (ajustada por g.l.) = porciento Error estándar del est. = Error medio absoluto = Estadístico Durbin-Watson = Autocorrelación residual de retardo 1 = Análisis de Residuos Estimación n 20 CME MAE MAPE ME E-15 MPE Validación Coeficientes: los coeficientes estimados y los factores de inflación de la varianza (VIF). Las estimaciones de los coeficientes del modelo se pueden usar para escribir la ecuación ajustada, que en el ejemplo es body fat = triceps thigh midarm (1) Los factores de inflación de la varianza miden que tan grande es la varianza de los coeficiente comparada con la que tendrían si las variables independientes no estuvieran correlacionadas. Advierta que los VIF están bastante cercanos a 1. (Intente poniendo el parámetro de cadena en 0, que corresponde a los mínimos cuadrados ordinarios. Los factores de inflación de la varianza son 709, 564 y 105, respectivamente!) Análisis de Varianza: descomposición de la variabilidad de la variable dependiente Y en una suma de cuadrados del modelo y una suma de cuadrados residual o del error. De particular interés es la prueba de F y su valor de P asociado, que prueban la significancia 2006 por StatPoint, Inc. Regresión en Cadena - 4
5 estadística del modelo ajustado. Un Valor de P pequeño (menor de 0.05 si se trabaja con un nivel de significancia del 5%) indica que existe una relación significativa de la forma especificada entre Y y las variables independientes. En los datos de muestra, el modelo es altamente significativo. Estadísticas: estadísticas de resumen para el modelo ajustado, incluyendo: R-Cuadrada - representa el porcentaje de la variabilidad de Y que ha sido explica por el modelo de regresión ajustado, que va de 0% a 100%. Para los datos del ejemplo, la regresión ha dado cuenta de alrededor del 77.3% de la variabilidad en la grasa corporal. El restante 22.7% es atribuible a la desviación del modelo, que puede deberse a otros factores, a errores de medición, o a una falla del modelo actual para ajustar los datos adecuadamente. R-Cuadrada Ajustada la estadística R-cuadrada, ajustada para el número de coeficientes en el modelo. Este valor se usa frecuentemente para comparar modelos con diferente número de coeficientes. Error Medio Absoluto el valor absoluto promedio de los residuos. Estadístico Durbin-Watson una medida de la correlación serial en los residuos. Si los residuos varían aleatoriamente, este valor debiera ser cercano a 2. Un valor-p pequeño indica un patrón no aleatorio en los residuos. Para datos registrados en el tiempo, un valor-p pequeño podría indicar que alguna tendencia en el tiempo no ha sido explicada. En el presente ejemplo, el valor de P es mayor que 0.05, así que no hay una correlación significativa al nivel de significancia del 5%. Autocorrelación Residual de retardo 1 la correlación estimada entre residuos consecutivos, en una escala de 1 a 1. Valores alejados del 0 indican que en el modelo queda estructura significativa sin explicar. Análisis de Residuos si un subgrupo de filas en la hoja de datos han sido excluidas del análisis usando el campo Seleccionar en la caja de diálogo de ingreso de datos, el modelo ajustado se usa para hacer predicciones de los valores de Y para estas filas. Esta tabla muestra estadísticas sobre los errores de predicción, definidos por e i = y yˆ (2) i i Se incluyen el cuadrado medio del error (CME), el error medio absoluto (MAE), el error porcentual absoluto medio (MAPE), el error medio (ME), y el error porcentual medio (MPE). Estas estadísticas de validación pueden ser comparadas con las estadísticas del modelo ajustado para determinar qué tan bien el modelo predice las observaciones fuera de los datos usados para ajustarlo. El modelo ajustado tiene ahora más sentido intuitivo, con los coeficientes de triceps y thigh ambos positivos, como se esperaría dadas sus correlaciones positivas con body fat por StatPoint, Inc. Regresión en Cadena - 5
6 Opciones de Análisis STATGRAPHICS Rev. 4/25/2007 Actual: valor del parámetro de cadena λ usado para ajustar el modelo. Mínimo y Máximo: el rango de valores usados en las tablas y gráficos comparativos. Número de Divisiones: el número de divisiones en que se divide el rango de valores cuando se crean las tablas y los gráficos. Traza de Cadena La Traza de Cadena presenta los coeficientes estimados usando varios valores del parámetro de cadena λ: Traza de Cadena para body fat 5 3 Variable triceps thigh midarm Coeficiente Parámetro de cadena En muchos casos, las estimaciones de los coeficientes cambiarán dramáticamente conforme λ se aleja de 0. Eventualmente, los coeficientes se estabilizarán, como lo hacen en la vecindad de λ = 0.02 en el gráfico anterior. Advierta el cambio en signo del coeficiente para thigh, así como el acercamiento a 0 del coeficiente de midarm. Desafortunadamente, ya no aplican las pruebas de significancia estadística, así que es difícil determinar qué coeficientes son estadísticamente significativos. Sin embargo, es probable que el modelo resaltante sea mucho más estable que el modelo ajustado por mínimos cuadrados ordinarios, particularmente cuando se extrapola fuera de la región experimental por StatPoint, Inc. Regresión en Cadena - 6
7 Opciones de Ventana STATGRAPHICS Rev. 4/25/2007 Mostrar: elija entre coeficientes estandarizados o no estandarizados. Los coeficientes estandarizados son los coeficientes del modelo en el cual todas las variables han sido estandarizadas sustrayéndoles sus medias muestrales y dividiéndolas después entre la raíz cuadrada de n 1. Coeficientes de Regresión Esta tabla muestra los coeficientes de regresión en valores elegidos del parámetro de cadena: Coeficientes de Regresión Cadena Parámetro triceps thigh midarm Los coeficientes aplican al modelo en la forma sin estandarizar: Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 (3) 2006 por StatPoint, Inc. Regresión en Cadena - 7
8 Coeficientes de Regresión Estandardizados Esta tabla muestra los coeficientes de regresión estandarizados en valores elegido del parámetro de cadena: Coeficientes de Regresión Estandarizados Cadena Parámetro triceps thigh midarm Los coeficientes estandarizados aplican al modelo en la forma estandarizada: Y = β β (4) 1X 1 + β 2 X X 3 donde Y = 1 Y Y n 1 s Y (5) X j = 1 X j X n 1 s X j j (6) 2006 por StatPoint, Inc. Regresión en Cadena - 8
9 Factores de Inflación de Varianza Los Factores de Inflación de la Varianza (VIF, Variance Inflation Factors) miden que tan grande es la varianza de los coeficientes comparada con cuál sería si las variables independientes no estuvieran correlacionadas. Se muestran en ambos gráfico y tabla: Factores de Inflación de Varianza para body fat Variable triceps thigh midarm VIF Parámetro de cadena Factores de Inflación de Varianza Cadena Parámetro triceps thigh midarm R-Cuadrada Advierta que los VIF también son cercanos a 1.0 en la vecindad de λ = 0.02, lo que mueve a su selección por StatPoint, Inc. Regresión en Cadena - 9
10 Observados versus Predichos La gráfica Observados versus Predichos muestra los valores observados de Y en el eje vertical y los valores predichos Ŷ en el eje horizontal Gráfica de body fat observado predicho Si el modelo ajusta bien, los puntos debieran estar dispersos aleatoriamente alrededor de la línea diagonal. A veces es posible apreciar curvatura en este gráfico, lo que indicaría la necesidad de un modelo curvilíneo más que un modelo lineal. Cualquier cambio en variabilidad de valores bajos de Y a valores altos de Y podría también indicar la necesidad de transformar la variable dependiente antes de ajustar un modelo a los datos. Gráficas de Residuos Al igual que con todos los modelos estadísticos, es una buena práctica examinar los residuos. En una regresión, los residuos se definen por e i = y yˆ (7) i i i.e., los residuos son las diferencias entre los valores de los datos observados y el modelo ajustado. El procedimiento Regresión en Cadena crea varios tipos de gráficas de residuos, dependiendo de las Opciones de Ventana por StatPoint, Inc. Regresión en Cadena - 10
11 Gráfica de Dispersión versus Valor Predicho Esta gráfica es útil para ver si la variabilidad es constante o varía de acuerdo con la magnitud de Y. 4 Gráfica de Residuos 2 residuo predicho body fat Gráfica de Probabilidad Normal Esta gráfica puede emplearse para determinar si la desviación alrededor de la línea sigue o no una distribución normal Gráfica de Probabilidad Normal para body fat porcentaje residuo Si las desviaciones siguen una distribución normal, deben caer aproximadamente a lo largo de una línea recta por StatPoint, Inc. Regresión en Cadena - 11
12 Autocorrelaciones de Residuos Esta gráfica calcula la autocorrelación entre los residuos como una función del número de filas entre ellos en la hoja de datos. 1 Autocorrelaciones Residuales para body fat 0.6 autocorrelación retraso Sólo es relevante si los datos se colectaron secuencialmente. Cualquier barra extendiéndose más allá de los límites de probabilidad indicaría dependencia significativa entre residuos separados por el retraso indicado Opciones de Ventana Graficar: el tipo de residuos a graficar: 1. Residuos los residuos del ajuste de mínimos cuadrados. 2. Residuos Estudentizados la diferencia entre los valores observados y i y los valores predichos ŷ cuando el modelo es ajustado empleando todas las observaciones i 2006 por StatPoint, Inc. Regresión en Cadena - 12
13 excepto la i-ésima, dividida entre el error estándar estimado. Estos residuos a veces son llamados residuos suprimidos externamente, ya que miden que tan lejos está cada valor del modelo ajustado cuando tal modelo se ajusta usando todos los datos excepto el punto considerado. Esto es importante, ya que un gran valor atípico podría de otra forma afectar tanto el modelo que no parecería estar inusualmente alejado de la línea. Tipo: el tipo de gráfico a crear. Se usa un Diagrama de Dispersión para probar curvatura. Se emplea una Gráfica de Probabilidad Normal para determinar si los residuos del modelo provienen de una distribución normal. Se usa una Función de Autocorrelación para probar dependencia entre residuos consecutivos. Graficar Versus: para un Diagrama de Dispersión, la cantidad a graficar en el eje horizontal. Número de Retrasos: para una Función de Autocorrelación, el máximo número de retrasos. Para grupos pequeños de datos, el número de retrasos graficados puede ser menor que este valor. Nivel de Confianza: para una Función de Autocorrelación, el nivel usado para crear los límites de probabilidad. Reportes La ventana Reportes crea predicciones usando el modelo ajustado. Por omisión, la tabla incluye una línea por cada fila en la hoja de datos que tenga información completa en las variables X y un valor faltante para la variable Y. Esto le permite agregar columnas al final de la hoja de datos correspondientes a los niveles a los que quiera tener predicciones sin afectar el modelo ajustado. Por ejemplo, suponga que se desea una predicción para un nuevo sujeto con triceps = 30, thigh = 55, y midarm = 26. El valor para cada variable predictora se agregará a la fila #21 de la hoja de datos, dejando vacía la celda para Body fat. La tabla resultante se muestra a continuación: 2006 por StatPoint, Inc. Regresión en Cadena - 13
14 Resultados de la Regresión para body fat Observado Ajustado Fila Residuo Se incluye en la tabla: Fila el número de la fila en la hoja de datos. Observado el valor observado de Y, si lo hubiera. Ajustado el valor predicho de la variable dependiente usando el modelo ajustado. Residuo el valor observado menos el valor predicho. Para la fila #21, el valor predicho de Body fat es Opciones de Ventana Incluir: las columnas a incluir en la tabla. Si sólo se elige Y ajustada, la tabla incluirá sólo las filas con valores para todas las variables predictoras y un valor faltante para Y por StatPoint, Inc. Regresión en Cadena - 14
15 Salvar Resultados Se puede salvar lo siguiente en la hoja de datos: STATGRAPHICS Rev. 4/25/ Valores Predichos los valores predichos a partir del modelo ajustado para cada fila en la hoja de datos. 2. Residuos los n residuos. 3. Coeficientes los coeficientes del modelo estimado. Cálculos Coeficientes del Modelo Estandarizados 1 ( X X + λi ) X Y ˆ β = (8) usando las variables transformadas definidas previamente, donde I es una matriz identidad por StatPoint, Inc. Regresión en Cadena - 15
Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp
Regresión Polinomial Resumen El procedimiento Regresión Polinomial está diseñado para construir una modelo estadístico que describa el impacto de un solo factor cuantitativo X en una variable dependiente
Más detallesTransformaciones de Box-Cox
Transformaciones de Box-Cox Resumen El procedimiento para las Transformaciones de Box-Cox es diseñado para determinar una transformación optima para Y mientras se estima un modelo de regresión lineal.
Más detallesComparación de Líneas de Regresión
Comparación de Líneas de Regresión Resumen El procedimiento de Comparación de Líneas de Regresión esta diseñado para comparar líneas de regresión relacionas con Y y X en dos o mas niveles de un factor
Más detallesExactitud y Linearidad del Calibrador
Exactitud y Linearidad del Calibrador Resumen El procedimiento Exactitud y Linearidad del Calibrador fue diseñado para estimar la exactitud del sistema de medición. En contraste con los procedimientos
Más detallesDiagrama de Barras Múltiple
Múltiple El procedimiento Múltiple grafica dos o más columnas de totales o frecuencias ya sea utilizando barras horizontales o verticales. Si lo desea, pueden agregarse barras de error para desplegar el
Más detallesPronósticos Automáticos
Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de
Más detallesSnapStat: Análisis de Una Muestra
SnapStat: Análisis de Una Muestra Resumen La SnapStat Análisis de Una Muestra crea un resumen en una hoja de una sola columna de datos numéricos. Calcula estadísticas de resumen e intervalos de confianza,
Más detallesTercera práctica de REGRESIÓN.
Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión
Más detallesViernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo
Viernes 7 de octubre de 2005 Mate 3026 Estadística con Programación Prof. José N. Díaz Caraballo Favor de abrir el navegador Mozilla Firefox y escriba la siguiente dirección http://math.uprag.edu/area.mtw
Más detallesESTADÍSTICA. Tema 4 Regresión lineal simple
ESTADÍSTICA Grado en CC. de la Alimentación Tema 4 Regresión lineal simple Estadística (Alimentación). Profesora: Amparo Baíllo Tema 4: Regresión lineal simple 1 Estructura de este tema Planteamiento del
Más detallesGráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp
Gráfico ARIMA Resumen El procedimiento del Gráfico ARIMA (AutoRegressive Integrated Moving Average - Promedio Móvil Integrado Auto-Regresivo) crea gráficos de control para una sola variable numérica donde
Más detallesANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.
ANEXO 1. CONCEPTOS BÁSICOS Este anexo contiene información que complementa el entendimiento de la tesis presentada. Aquí se exponen técnicas de cálculo que son utilizados en los procedimientos de los modelos
Más detallesCurso de Estadística Básica
Curso de SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez Objetivo Conocer y calcular las medidas de tendencia central y medidas de dispersión
Más detallesAnálisis de Capabilidad (Porcentaje Defectuoso)
Análisis de Capabilidad (Porcentaje Defectuoso) STATGRAPHICS Rev. 9/4/2006 Este procedimiento esta diseñado para estimar el porcentaje de artículos defectuosos en una población basándose en muestra de
Más detallesGráfico de Control de Aceptación
Gráfico de Control de Aceptación Resumen El procedimiento de Gráfico de Control de Aceptación crea gráficos de control con límites de control modificados basándose en la desviación estándar del proceso
Más detallesANOVA Multifactorial. StatFolio Muestra: anova.sgp
ANOVA Multifactorial Resumen El procedimiento ANOVA Multifactorial está diseñado para construir un modelo estadístico describiendo el impacto de dos o más factores categóricos X j de una variable dependiente
Más detallesAgro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos
Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,
Más detallesEste procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:
STATGRAPHICS Re. 4/d/yyyy Pruebas de Hipótesis (Una Muestra) Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros: 1. la media μ de una distribución normal.. la desiación
Más detallesTeorema Central del Límite (1)
Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico
Más detallesHorsepower (Caballos de Fuerza)
Análisis de Factores Resumen El procedimiento Análisis de Factores esta diseñado para extraer factores comunes de un conjunto de p variables cuantitativas X. En muchas situaciones, un número pequeño de
Más detallesTabulación Cruzada. Sample StatFolio: crosstabulation.sgp
Tabulación Cruzada El procedimiento de Tabulación Cruzada esta diseñado para resumir dos columnas de datos. Esta construye una tabla de dos-caminos mostrando las frecuencias de ocurrencia de cada uno de
Más detallesAnálisis de datos Categóricos
Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores
Más detalles15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:
15. Regresión lineal Este tema, prácticamente íntegro, está calacado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón López de la Universidad de Málaga. Te recomiendo
Más detallesREGRESIÓN LINEAL CON SPSS
ESCUELA SUPERIOR DE INFORMÁTICA Prácticas de Estadística REGRESIÓN LINEAL CON SPSS 1.- INTRODUCCIÓN El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre
Más detallesTema 8. Análisis de dos variables Ejercicios resueltos 1
Tema 8. Análisis de dos variables Ejercicios resueltos 1 Ejercicio resuelto 8.1 La siguiente tabla muestra la distribución del gasto mensual en libros y el gasto mensual en audiovisual en euros en los
Más detallesTema 2. Descripción Conjunta de Varias Variables
Tema 2. Descripción Conjunta de Varias Variables Cuestiones de Verdadero/Falso 1. La covarianza mide la relación lineal entre dos variables, pero depende de las unidades de medida utilizadas. 2. El análisis
Más detallesREGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)
1 REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS) 1. EN LA REGIÓN DE DRAKUL DE LA REPÚBLICA DE NECROLANDIA, LAS AUTORIDADES ECONÓMICAS HAN REALIZADO UNA REVISIÓN
Más detallesTipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE
Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE Objetivos 2 Identificar los tipos de gráficas. Definir los conceptos tablas y cuadros Reconocer las partes de una gráfica. Construir
Más detallesRegresión con variables independientes cualitativas
Regresión con variables independientes cualitativas.- Introducción...2 2.- Regresión con variable cualitativa dicotómica...2 3.- Regresión con variable cualitativa de varias categorías...6 2.- Introducción.
Más detallesINSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016
ANEXO ESTADÍSTICO 1 : COEFICIENTES DE VARIACIÓN Y ERROR ASOCIADO AL ESTIMADOR ENCUESTA NACIONAL DE EMPLEO (ENE) INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 9 de Abril de 016 1 Este anexo estadístico es una
Más detallesTema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0
Ignacio Martín Tamayo 11 Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0 ÍNDICE ------------------------------------------------------------- 1. Introducción 2. Frecuencias 3. Descriptivos 4. Explorar
Más detallesMulticolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17
Román Salmerón Gómez Universidad de Granada RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17 exacta: aproximada: exacta: aproximada: RSG Incumplimiento de las
Más detallesUSO HERRAMIENTAS EXCEL PARA LA PREDICCION
USO HERRAMIENTAS EXCEL PARA LA PREDICCION Nassir Sapag Chain MÉTODO DE REGRESIÓN LINEAL SIMPLE El método de Regresión Lineal (o Mínimos cuadrados) busca determinar una recta, o más bien la ecuación de
Más detallesESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua
ESTADÍSTICA Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal Cuantitativa discreta continua DISTRIBUCIÓN DE FRECUENCIAS Frecuencia absoluta: fi Frecuencia relativa:
Más detallesUNIDAD 6. Estadística
Matemática UNIDAD 6. Estadística 2 Medio GUÍA N 1 MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS ACTIVIDAD Consideremos los siguientes conjuntos de valores referidos a las edades de los jugadores de dos
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA
MODELO DE REGRESIÓN LOGÍSTICA Introducción A grandes rasgos, el objetivo de la regresión logística se puede describir de la siguiente forma: Supongamos que los individuos de una población pueden clasificarse
Más detalles1. Necesidades del Consumidor una lista de m necesidades del consumidor. Estas necesidades constituyen las m hileras de la matriz.
Matriz QFD Resumen El procedimiento Matriz QFD crea y presenta una matriz QFD (Quality Function Deployment, Despliegue de la Función de Calidad). QFD es un proceso de planeación dirigido por el cliente
Más detallesDiseño de Experimentos Diseños de Mezclas
Diseño de Experimentos Diseños de Mezclas STATGRAPHICS Rev. 9/14/2006 Resumen Cuando los factores experimentales a ser estudiados son ingredientes o componentes de una mezcla, la función de la respuesta
Más detallesEstadística Descriptiva. SESIÓN 11 Medidas de dispersión
Estadística Descriptiva SESIÓN 11 Medidas de dispersión Contextualización de la sesión 11 En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión,
Más detalles2.1. Introducción Análisis exploratorio Análisis exploratorio para variables con muchas modalidades
Tema 2 Análisis gráfico Contenido 2.1. Introducción............................. 1 2.2. Análisis exploratorio......................... 2 2.2.1. Análisis exploratorio para variables con pocas modalidades
Más detallesMODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo
José María Cara Carmona Adrián López Ibáñez MODELO ECONOMÉTRICO Explicación del desempleo Desarrollaremos un modelo econométrico para intentar predecir el desempleo. Trataremos los diversos problemas que
Más detallesTema 1.- Correlación Lineal
Tema 1.- Correlación Lineal 3.1.1. Definición El término correlación literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una
Más detallesScientia Et Technica ISSN: Universidad Tecnológica de Pereira Colombia
Scientia Et Technica ISSN: 01221701 scientia@utp.edu.co Universidad Tecnológica de Pereira Colombia URRUTIA MOSQUERA, JORGE ANDRÉS; SALAZAR, HEVER DARÍO; CRUZ TREJOS, EDUARDO ARTURO EVALUACIÓN DE LA ROBUSTEZ
Más detalles2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...
Contenidos 1 Introducción al paquete estadístico S-PLUS 19 1.1 Introducción a S-PLUS............................ 21 1.1.1 Cómo entrar, salir y consultar la ayuda en S-PLUS........ 21 1.2 Conjuntos de datos..............................
Más detallesComponentes Principales
Componentes Principales Resumen El procedimiento de Componentes Principal está diseñado para extraer k componentes principales de un conjunto de p variables cuantitativas X. Los componentes principales
Más detallesDiseño de Bloques al azar. Diseño de experimentos p. 1/25
Diseño de Bloques al azar Diseño de experimentos p. 1/25 Introducción En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los resultados. Un factor de ruido es un
Más detallesCapítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal
Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal Introducción El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables. Se
Más detallesEstadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR
Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple Facultad de Ciencias Sociales - UdelaR Índice 7.1 Introducción 7.2 Análisis de regresión 7.3 El Modelo de Regresión
Más detallesDiseño Gráficos de Control
Diseño Gráficos de Control Resumen Este procedimiento esta diseñado para ayudar a determinar el tamaño de muestra apropiado y los parámetros comunes para los gráficos de control. El diseño esta basado
Más detallesENUNCIADOS DE PROBLEMAS
UNIVERSIDAD CARLOS III DE MADRID ECONOMETRÍA I 22 de Septiembre de 2007 ENUNCIADOS DE PROBLEMAS Muy importante: Tenga en cuenta que algunos resultados de las tablas han podido ser omitidos. PROBLEMA 1:
Más detallesRepaso de conceptos de álgebra lineal
MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Repaso
Más detallesINFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón
Metodología de Investigación Tesifón Parrón Contraste de hipótesis Inferencia Estadística Medidas de asociación Error de Tipo I y Error de Tipo II α β CONTRASTE DE HIPÓTESIS Tipos de Test Chi Cuadrado
Más detallesEste programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.
Bases de Estadística Licenciatura en Ciencias Ambientales Curso 2oo3/2oo4 Introducción al SPSS/PC Este programa estadístico está organizado en dos bloques: el editor de datos y el visor de resultados.
Más detallesSESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas
SESIÓN PRÁCTICA 7: REGRESION LINEAL SIMPLE PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria
Más detalles3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS
1. INTRODUCCIÓN Este tema se centra en el estudio conjunto de dos variables. Dos variables cualitativas - Tabla de datos - Tabla de contingencia - Diagrama de barras - Tabla de diferencias entre frecuencias
Más detallesMódulo de Estadística
Módulo de Estadística Tema 2: Estadística descriptiva Tema 2: Estadísticos 1 Medidas La finalidad de las medidas de posición o tendencia central (centralización) es encontrar unos valores que sinteticen
Más detallesMEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro
Más detallesGráfico de Dispersión de Notas en la Prueba 1 versus Notas en la Prueba Final Acumulativa de un curso de 25 alumnos de Estadística en la UTAL
0. Describiendo relaciones entre dos variables A menudo nos va a interesar describir la relación o asociación entre dos variables. Como siempre la metodología va a depender del tipo de variable que queremos
Más detalles1. Practica con la siguiente hoja. Las celdas que contienen las fórmulas son de color rojo. Deberás realizar las indicaciones que se adjuntan:
Práctica 2 1. Practica con la siguiente hoja. Las celdas que contienen las fórmulas son de color rojo. Deberás realizar las indicaciones que se adjuntan: Función suma Esta función tiene preestablecido
Más detallesTUTORIAL PARA CONSTRUIR EL DIAGRAMA DE FASES DE UNA SUSTANCIA
TUTORIAL PARA CONSTRUIR EL DIAGRAMA DE FASES DE UNA SUSTANCIA 1. Empleando la hoja de cálculo de Microsoft Excel 2010, introducir los datos de las líneas de equilibrio sólido-vapor (S-V), líquido-vapor
Más detallesModelos de PERT/CPM: Probabilístico
INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE CÓMPUTO Modelos de PERT/CPM: Probabilístico M. En C. Eduardo Bustos Farías 1 Existen proyectos con actividades que tienen tiempos inciertos, es decir,
Más detallesOtra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza
CARACTERÍSTICAS DE LA POBLACIÓN. Una pregunta práctica en gran parte de la investigación de mercado tiene que ver con el tamaño de la muestra. La encuesta, en principio, no puede ser aplicada sin conocer
Más detallesSelección de fuentes de datos y calidad de datos
Selección de fuentes de datos y calidad de datos ESCUELA COMPLUTENSE DE VERANO 2014 MINERIA DE DATOS CON SAS E INTELIGENCIA DE NEGOCIO Juan F. Dorado José María Santiago . Valores atípicos. Valores faltantes.
Más detallesEstimación con PROBE II
Personal Software Process SM Estimación con PROBE II This material is approved for public release. Distribution is limited by the Software Engineering Institute to attendees. Sponsored by the U.S. Department
Más detallesFORMATO CONDICIONAL EN EXCEL
FORMATO CONDICIONAL EN EXCEL El Formato Condicional es una herramienta muy útil como información gráfica adicional para los datos numéricos que están en celdas o en rangos. Este tipo de formato tiene un
Más detallesMODELO DE REGRESIÓN LINEAL Y MÚLTIPLE ESTADÍSTICA APLICADA AL MEDIO AMBIENTE Grado en Ciencias Ambientales
MODELO DE REGRESIÓN LINEAL Y MÚLTIPLE ESTADÍSTICA APLICADA AL MEDIO AMBIENTE Grado en Ciencias Ambientales 3.1. En algunas reservas naturales se controla el número Y de ejemplares de cierta especie al
Más detalles1. Límites normales de tolerancia: estos límites asumen que los datos son una muestra aleatoria de una distribución normal.
Límites de Tolerancia Los límites de tolerancia proporcionan un rango de valores para X tal que se puede tener 100(1-α) % de confianza que P por ciento de la población, de la cual provienen los datos,
Más detallesCapítulo 18. Análisis de regresión lineal: El procedimiento Regresión lineal. Introducción
Capítulo 18 Análisis de regresión lineal: El procedimiento Regresión lineal Introducción El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables.
Más detallesINTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión
INTERPRETACIÓN DE LA REGRESIÓN Este gráfico muestra el salario por hora de 570 individuos. 1 Interpretación de la regresión. regresión Salario-Estudios Source SS df MS Number of obs = 570 ---------+------------------------------
Más detallesUniversidad de Sonora Departamento de Matemáticas Área Económico Administrativa
Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa Materia: Estadística I Maestro: Dr. Francisco Javier Tapia Moreno Semestre: 015- Hermosillo, Sonora, a 14 de septiembre de
Más detallesCompetencias TIC para profesionales Del Siglo 21
Planilla de Cálculo Nos referiremos a la planilla de cálculo de Microsoft Office, con algunas precisiones a la de OpenOffice. Una vez abierto un libro nuevo de Excel de Microsoft, la interfaz de la planilla
Más detallesPruebas de Hipótesis Multiples
Pruebas de Hipótesis Multiples Cuando queremos hacer comparaciones de mas de dos poblaciones, una alternativa es comparar todos los grupos a la vez con el método de Análisis de Varianza (ANOVA) H o : µ
Más detallesTema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION.
Tema 7 : DATOS BIVARIADOS. CORRELACION Y REGRESION. Distribuciones uni- y pluridimensionales. Hasta ahora se han estudiado los índices y representaciones de una sola variable por individuo. Son las distribuciones
Más detallesUNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE
UNIVERSIDAD INTERAMERICANA DE PUERTO RICO RECINTO DE ARECIBO CENTRO DE SERVICIOS DE APOYO AL ESTUDIANTE Glosario Media: es la puntuación promedio de un grupo de datos. Mediana: la mediana viene a ser la
Más detallesDIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009
Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis
Más detallesOtra forma de enumerar los resultados es en una tabla de frecuencia:
Materia: Matemática de Séptimo Tema: Intervalo de Clases e Histogramas Qué pasa si quisieras matar algo tiempo mientras esperas tu vuelo de conexión en el aeropuerto? Empiezas a contar el número de personas
Más detallesUN PROBLEMA DE OPTIMIZACIÓN CON CABRI: LA REGRESIÓN LINEAL.
UN PROBLEMA DE OPTIMIZACIÓN CON CABRI: LA REGRESIÓN LINEAL. Benjamín R. Sarmiento Lugo. Universidad Pedagógica Nacional bsarmiento@pedagogica.edu.co Esta conferencia está basada en uno de los temas desarrollados
Más detallesSe llama adjunto de un elemento de una matriz A, al número resultante de multiplicar por el determinante de la matriz complementaria
T.3: MATRICES Y DETERMINANTES 3.1 Determinantes de segundo orden Se llama determinante de a: 3.2 Determinantes de tercer orden Se llama determinante de a: Ejercicio 1: Halla los determinantes de las siguientes
Más detallesEVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I.
EVALUACIÓN EXTRAORDINARIA DE SEPTIEMBRE CURSO 2013-2014. Contenidos para la Prueba de Septiembre MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I. UNIDAD 3: POLINOMIOS Y FRACCIONES ALGEBRAICAS Operaciones
Más detallesEconometria de Datos en Paneles
Universidad de San Andres Agosto de 2011 Porque paneles? Ejemplo (Cronwell y Trumbull): Determinantes del crimen y = g(i), y = crimen, I = variables de justicia criminal. Corte transversal: (y i, I i )
Más detallesTécnicas Cuantitativas para el Management y los Negocios
Segundo cuatrimestre - 4 Técnicas Cuantitativas para el Management y los Negocios Mag. María del Carmen Romero 4 romero@econ.unicen.edu.ar Módulo III: APLICACIONES Contenidos Módulo III Unidad 9. Análisis
Más detallesAdministración de la producción. Sesión 9: Hojas de cálculo (Microsoft Excel)
Administración de la producción Sesión 9: Hojas de cálculo (Microsoft Excel) Contextualización Microsoft Excel es un programa de hoja de cálculo electrónica que permite la representación gráfica y el análisis
Más detallesTALLER 1 DE ALGEBRA LINEAL Y GEOMETRÍA INGENIERÍA AMBIENTAL - UNIVERSIDAD DE CÓRDOBA FACTORIZACIÓN LU Y CADENAS DE MARKOV
TALLER 1 DE ALGEBRA LINEAL Y GEOMETRÍA INGENIERÍA AMBIENTAL - UNIVERSIDAD DE CÓRDOBA FACTORIZACIÓN LU Y CADENAS DE MARKOV DESCRIPCIÓN: En el siguiente trabajo se mostrarán algunos métodos para encontrar
Más detallesTRABAJO PRÁCTICO ESTADISTICA APLICADA (746)
UNIVERSIDAD NACIONAL ABIERTA VICERRECTORADO ACADEMICO AREA DE MATEMATICA TRABAJO PRÁCTICO ESTADISTICA APLICADA (746) JOSE GREGORIO SANCHEZ CASANOVA C.I. V-9223081 CARRERA: 610 SECCION Nº 1 SAN CRISTOBAL,
Más detalles18 Experimentos aleatorios. Sucesos y espacio muestral. Frecuencia y probabilidad de un suceso.
PRIMER CURSO DE E.S.O Criterios de calificación: 80% exámenes, 10% actividades, 10% actitud y trabajo 1 Números naturales. 2 Potencias de exponente natural. Raíces cuadradas exactas. 3 Divisibilidad. Concepto
Más detallesVariables aleatorias
Distribuciones continuas Se dice que una variable aleatoria X tiene una distribución continua, o que X es una variable continua, si existe una función no negativa f, definida sobre los números reales,
Más detallesModelo Econométrico sobre el Turismo
Modelo Econométrico sobre el Turismo Ruth Rubio Rodríguez Miriam Gómez Sánchez Mercados 3ºA GMIM Índice Planteamiento del Problema..4 1. Estadísticos Descriptivos...5 2. Matriz Correlaciones 5 3. Gráfico
Más detallesTipo de punta (factor) (bloques)
Ejemplo Diseño Bloques al Azar Ejercicio -6 (Pág. 99 Montgomery) Probeta Tipo de punta (factor) (bloques) 9. 9. 9.6 0.0 9. 9. 9.8 9.9 9. 9. 9.5 9.7 9.7 9.6 0.0 0. ) Representación gráfica de los datos
Más detallesCrear gráficos en Excel Un gráfico es la representación gráfica de los datos de una hoja de cálculo y facilita su interpretación.
CREACIÓN DE GRÁFICOS EN MICROSOFT OFFICE EXCEL Vamos a ver cómo crear gráficos a partir de unos datos introducidos en una hoja de cálculo. Así resultará más sencilla la interpretación de los datos. Terminología
Más detallesEconomía Aplicada. ¾Es importante el tamaño de la clase? Un experimento controlado
Economía Aplicada ¾Es importante el tamaño de la clase? Un experimento controlado Basado en (1999), Experimental Estimates of Education Production Functions, QJE Outline 1 La Idea 2 Proyecto STAR Detalles
Más detallesOTRAS HERRAMIETAS ESTADISTICAS UTILES. Dra. ALBA CECILIA GARZON
OTRAS HERRAMIETAS ESTADISTICAS UTILES Dra. ALBA CECILIA GARZON Que es un Test de Significancia estadística? El término "estadísticamente significativo" invade la literatura y se percibe como una etiqueta
Más detallesCrear una tabla dinámica
Introducción En este manual de referencia se explican los procedimientos para crear, administrar y personalizar tablas dinámicas y gráficos dinámicos. Los ejemplos ilustrativos de este material están basados
Más detallesCAPÍTULO 3: PORCIONES Y NÚMEROS ENTEROS
CAPÍTULO 3: PORCIONES Y NÚMEROS ENTEROS Fecha: Caja de herramientas 2014 CPM Educational Program. All rights reserved. 22 Capítulo 3: Porciones y números enteros Fecha: 23 2014 CPM Educational Program.
Más detallesUNIVERSIDAD AUTONOMA DE SANTO DOMINGO
UNIVERSIDAD AUTONOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONOMICAS Y SOCIALES DEPARTAMENTO DE ESTADISITICA CATEDRA Estadística Especializada ASIGNATURA Estadística Descriptiva Para Psicólogos (EST-225)
Más detallesCONSTRUCCIÓN DE GRÁFICOS CON EXCEL
CONSTRUCCIÓN DE GRÁFICOS CON EXCEL I. Recomendaciones para la utilización de cada gráfico de Excel 1. Gráfico de columna horizontal (figura 1) y vertical (figura 2) Son útiles para comparar categorías,
Más detallesTaller No 1. Laboratorio Estadística con Matlab. Estadística Descriptiva - Análisis exploratorio de datos con Matlab
Taller No 1. Laboratorio Estadística con Matlab Estadística Descriptiva - Análisis exploratorio de datos con Matlab Dos objetivos importantes de Análisis exploratorio de datos son: 1) para determinar un
Más detallesSTATGRAPHICS Centurion XVII Software de análisis de datos estadístico y gráfico. Mejoras de la versión 17.1
STATGRAPHICS Centurion XVII Software de análisis de datos estadístico y gráfico STATGRAPHICS ofrece más de 230 procedimientos de Análisis Exploratorio de Datos, Estadística Descriptiva e Inferencial, Modelos
Más detalles1. Caso no lineal: ajuste de una función potencial
1. Caso no lineal: ajuste de una función potencial La presión (P) y el volumen (V ) en un tipo de gas están ligados por una ecuación del tipo PV b = a, siendo a y b dos parámetros desconocidos. A partir
Más detallesDiseño de Experimentos Diseños de Cribado
Diseño de Experimentos Diseños de Cribado STATGRAPHICS Rev. 9/14/2006 Resumen La sección de Diseño Experimental en STATGRAPHICS contiene un conjunto de procedimientos que soportan el diseño y análisis
Más detalles1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.
MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Abordaremos en este capítulo el modelo de regresión lineal múltiple, una vez que la mayor parte de las
Más detalles