Transformaciones de Box-Cox
|
|
|
- Héctor Aguilar López
- hace 9 años
- Vistas:
Transcripción
1 Transformaciones de Box-Cox Resumen El procedimiento para las Transformaciones de Box-Cox es diseñado para determinar una transformación optima para Y mientras se estima un modelo de regresión lineal. Es muy útil cuando la variabilidad de Y cambia como una función de X. A menudo, una apropiada transformación de Y estabiliza la variabilidad y produce que las desviaciones alrededor del modelo sean más normalmente distribuidas. La clase de transformaciones consideradas son transformaciones de potencia definidas por: λ ( + λ ) Y = Y () en la cual los datos son calculados en una potencia de λ después de cambiarlo a una cierta cantidad λ. Posteriormente, el parámetro de cambio λ se fija igual a 0. Esta clase incluyen raíces cuadradas, logaritmos, recíprocos, y otras transformaciones comunes, que dependen sobre una potencia. Los ejemplos incluyen: Potencia Transformación Descripción λ = Y = Y Cuadrado λ = Y = Y Datos sin Transformar λ = 0.5 Y = Y Raíz Cuadrada λ = Y = 3 Y Raíz Cúbica λ = 0 Y = ln(y ) Logaritmo λ = -0.5 Raíz Cuadrada Inversa Y = Y λ = - Reciproco Y = Y Note que si λ 0, la transformación de potencia se enfoca en un logaritmo. Ejemplo StatFolio: boxcox.sgp 006 por StatPoint, Inc. Transformaciones de Box-Cox -
2 Datos del Ejemplo: El archivo plasma.sf3 contiene datos presentados por Neter et al. (998) que muestran el nivel de plasma de polaminos para n = 5 niños sanos. Una porción de los datos se muestra abajo: Age (Edad) Plasma level (Nivel Plasma) Es deseable determinar un modelo relacionando el nivel de plasma para la edad de los niños. Entrada de Datos La caja de dialogo para la entrada de datos requiere los nombres de las columnas que contienen la variable dependiente Y y la variable independiente X: Y: Columna numérica que contiene las n observaciones para la variable dependiente Y. X: Columna numérica que contiene las n observaciones para la variable independiente X. Selección: Selección de un subconjunto de los datos. 006 por StatPoint, Inc. Transformaciones de Box-Cox -
3 Resumen del Análisis En relación a las dos variables, el procedimiento para estimar un modelo es de la forma W = β 0 + β X + ε () donde la variable dependiente W se relaciona con Y de acuerdo a [( Y + λ ) ] λ + K W = si + K ln( Y + λ ) λ 0 λ = 0 (3) y K n = Y i + ) i= = λ λk / n ( λ (4) K (5) Note que K es la media geométrica de Y+λ. Después de Box y Cox (964), la transformación óptima es la que minimiza el cuadrado medio del error de W. La razón para usar la variable estandarizada W en vez de Y es ajustar la magnitud sobre la suma de cuadrados del error para que haya el efecto de la transformación potencia. El Resumen del Análisis presenta la potencia óptima y el resultado del modelo: Transformaciones Box-Cox - Plasma Level vs. Age Potencia = Camibio = 0.0 Variable dependiente: Plasma Level Variable independiente: Age Error T Parámetro Estimado Estándar Estadístico Valor-P Intercepto Pendiente Análisis de Varianza Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Modelo Residuo Total (Corr.) Coeficiente de Correlación = R-cuadrada = porciento Error Estándard del Est. =.568 Intervalo aproximado del 95% de confianza para la potencia: -.6 a Se incluye en la salida: Parámetros de Potencia y Cambio: Los valores de λ y λ. Por defecto, el parámetro de potencia es optimizado, mientras que el parámetro de cambio es fijado en 0. Esto se puede cambiar usando Opciones del Análisis. También se incluye al final de la pantalla una 006 por StatPoint, Inc. Transformaciones de Box-Cox - 3
4 aproximación de un intervalo de confianza para λ por defecto en el nivel de confianza del sistema. Coeficientes: Los coeficientes estimados, errores estándares, estadístico-t, y valores P. La estimación de los coeficientes del modelo puede utilizarse para escribir la ecuación estimada, lo cuál en el ejemplo es: W = Edad (6) El estadístico-t prueba la hipótesis nula de que los parámetros correspondientes al modelo son iguales a 0, contra la hipótesis alternativa de que no sean iguales a 0. Valores P pequeños (menor que 0.05 si esta operando un nivel de significancia al 5%) indica que un coeficiente del modelo es significativamente diferente de 0. En los datos del ejemplo, ambos el intercepto y la pendiente son estadísticamente significativos. Análisis de Varianza: Es una descomposición de variabilidad en la variable dependiente W dentro de un modelo de sumas de cuadrados y residuales o suma de cuadrados del error. Es de particular interés la prueba F y su valor P asociado, el cual prueba la significancia estadística del modelo estimado. Un valor P pequeño (menor que 0.05 si esta operando un nivel de significancia al 5%) indica que existe una relación lineal significativa entre X y Y. En los datos del ejemplo, el modelo es altamente significativo. Estadísticas: Resumen de estadísticas para el modelo estimado, incluyendo: Coeficiente de Correlación Mide la fuerza de la relación lineal entre W y X oscilando sobre una escala de - (correlación lineal perfecta negativa) a + (correlación lineal perfecta positiva). R-Cuadrada - Representa el porcentaje de la variabilidad en W que puede explicarse por el modelo de regresión estimado, oscilando de 0% hasta 00%. Error Estándar de la Est. La estimación de la desviación estándar de los residuales (las desviaciones alrededor del modelo). Este valor es utilizado para crear límites de predicción para nuevas observaciones. Media del Error Absoluto El promedio de los valores absolutos de los residuales. En los datos del ejemplo, la transformación seleccionada está muy cerca de una raíz cuadrada inversa, implicando que / NivelPlasma es una función lineal de la Edad. Sin embargo, de acuerdo al intervalo de confianza, La transformación optima real puede ser cualquiera entre un reciproco y un logaritmo. 006 por StatPoint, Inc. Transformaciones de Box-Cox - 4
5 Opciones del Análisis STATGRAPHICS Rev. 9/4/006 Potencia: El valor del parámetro de potencia λ. Si Optimizar esta seleccionado, esto sirve como el valor inicial de la búsqueda de optimización cuando se presiona OK. Si Optimizar no esta seleccionado, este es el valor usado para la transformación. Cambio: El valor del parámetro de potencia λ. Este valor se resta de la variable dependiente Y antes que la transformación de potencia sea desarrollada. Optimizar: Cuando se optimiza el parámetro de potencia o se usa el valor especificado. Grafico del Modelo Estimado Este panel muestra el modelo estimado, junto con límites de confianza y predicción si son deseados. 4 Gráfica del Modelo Ajustado Potencia=-0.506, Cambio=0.0 0 Plasma Level Age El gráfico incluye: La línea del mejor ajuste o ecuación de predicción. Esta es la ecuación que será utilizada para predecir valores de la variable dependiente Y dado los valores de la variable independiente X. Note que se realiza un trabajo relativamente bueno al tomar el incremento de la variabilidad del Nivel de Plasma sobre Edades bajas, así como la relación de la curvatura. 006 por StatPoint, Inc. Transformaciones de Box-Cox - 5
6 Intervalos de Confianza para la respuesta media en X. Estos son los límites interiores en el gráfico anterior y describen que tan bien la localización de la línea fue estimada dada la muestra disponible de los datos. Como el tamaño de n incrementa, testos límites llegarán a ser más apretados También debemos notar que la anchura de los límites varia como una función de X, con la línea estimada lo más exacto posible cerca del valor promedio x. Límites de Predicción para nuevas observaciones. Estos son los límites externos del gráfico anterior y describen como exactamente uno podría predecir donde mentiría una nueva observación. Sin importar el tamaño de muestra, las nuevas observaciones varían alrededor de la verdadera línea. La inclusión de los límites de confianza y predicción y su nivel de confianza por defecto esta determinado por la configuración sobre la sección Regresión/ANOVA de la caja de dialogo Preferencias, accesible desde el menú Edición. Opciones del Panel Incluir: Los limites a incluir sobre el gráfico. Nivel de Confianza: El porcentaje del nivel de confianza para los límites. Resolución del Eje X: El número de valores de X en los cuales se determina la línea cuando se grafica. Altas resoluciones dan como resultado gráficos más suaves. Tipo de Límites: Cuando se grafican intervalos de confianza de dos-colas o límites de confianza de una-cola. Gráfico de Comparación CME Al optimizar la transformación, la potencia se reduce al mínimo sobre el cuadrado medio del error del ajuste de W como una función de X. Para ilustrar el resultado de la búsqueda, el Gráfico de Comparación CME presenta el cuadrado medio del error en la vecindad del valor óptimo: 006 por StatPoint, Inc. Transformaciones de Box-Cox - 6
7 Comparación MSE lambda = MSE lambda Las líneas verticales se dibujan en λ calculado y sus límites de confianza. Note que el CME alcanza un mínimo cercano a λ = 0.5, aunque es relativamente plano con una región amplia alrededor del valor óptimo, indicando que la potencia puede cambiarse a otros valores sin afectar sustancialmente el modelo. Opciones del Panel Lamda- Mínimo: El valor más pequeño de λ para incluir en el gráfico. Lamda- Máximo: El valor más grande de λ para incluir en el gráfico. Resolución: Número de diferentes valores de λ en el cuál se calcula el CME. 006 por StatPoint, Inc. Transformaciones de Box-Cox - 7
8 Tabla de Comparación CME Esta tabla tabula los valores graficados por el Gráfico de Comparación CME. Tabla Comparativa MSE Cambio (lambda): 0.0 lambda MSE Las Opciones del Panel son las mismas que para el gráfico. STATGRAPHICS Rev. 9/4/006 Gráfico de Sesgo y Curtosis Este gráfico presenta los valores estandarizados del sesgo y la curtosis como una función del parámetro de potencia λ. 6 4 Gráfica de Sesgo y Curtosis lambda =0.0 sesgo curtosis lambda La estandarización del sesgo y la curtosis se presenta para ambas entre y + para una transformación adecuada a los datos normalizados. El gráfico muestra una línea horizontal entre y +, con la línea vertical indicando el valor óptimo de λ y sus límites de confianza. 006 por StatPoint, Inc. Transformaciones de Box-Cox - 8
9 Claramente, hay un amplio rango de valores para λ que crearía una transformación razonable de los datos. Prueba de Falta de Ajuste Cuando más de una observación se ha registrado en el mismo valor de X, una prueba de falta de ajuste se puede desarrollar para determinar cuando la selección del modelo es adecuado para describir la relación entre X y Y. El panel de Falta-de-Ajuste despliega la siguiente tabla: Análisis de Varianza con Carencia de Ajuste Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Modelo Residuo Carencia de Ajuste Error Puro Total (Corr.) La prueba de Falta-de-Ajuste descompone la suma de cuadrados del error de los valores transformados de W en componentes:. Error Puro: la variabilidad de los valores de W en el mismo valor de X.. Falta-de-Ajuste: la variabilidad del promedio de los valores de W alrededor del modelo estimado. Es de interés primario el valor P para la falta-de-ajuste. Un valor P pequeño (menor que 0.05 si esta operando un nivel de significancia al 5%) indica que el modelo seleccionado no describe adecuadamente la relación observada. Para los datos del ejemplo, el valor P grande indica que el modelo lineal explica adecuadamente la relación entre Nivel de Plasma y Edad. Observado contra Predicho El gráfico de Observado contra Predicho muestra los valores observados de Y sobre el eje vertical y los valores predichos de Yˆ sobre el eje horizontal, en la métrica transformada. 4 0 Gráfica de Plasma Level observados predichos 006 por StatPoint, Inc. Transformaciones de Box-Cox - 9
10 Si el modelo se ajuste bien, los puntos se deben dispersar aleatoriamente alrededor de la línea diagonal. Es posible algunas veces ver curvaturas en este gráfico, lo cual indicará la necesidad de un modelo curvilíneo más que un modelo lineal. En este caso, el cambio de la variabilidad sobre el gráfico anterior si los valores predichos se incrementan no es una preocupación, puesto que fue estabilizado por la transformación de Box-Cox. Gráfico de Residuales Como con todos los modelos estadísticos, es una buena practica examinar los residuales. En una regresión, los residuales están definidos por: e i = W Wˆ (7) i i ej., los residuales son las diferencias entre los valores transformados de los datos y la estimación del modelo de regresión lineal. El procedimiento de Transformaciones de Box-Cox crea 3 gráficos de residuales:. contra X.. contra valores predichos Wˆ. 3. contra número de fila. Residuales contra X Este gráfico es provechoso en la visualización cuando fue buena la transformación considerada para cualquier curvatura en los datos. 3.3 Gráfica de Residuos Residuos Estudentizados Age Los residuales se deben dispersar aleatoriamente alrededor de por StatPoint, Inc. Transformaciones de Box-Cox - 0
11 Residuales contra Predichos Este gráfico es provechoso en la visualización cuando fue bueno el modelo para cualquier heterocedasticidad en los datos. 3.3 Gráfica de Residuos Residuos Estudentizados Plasma Level predicho Si la transformación fue efectiva, la variabilidad puede ser aproximadamente igual por todas partes. Residuales contra Observaciones Este gráfico muestra los residuales contra el número de fila en la base de datos: 3.3 Gráfica de Residuos Residuos Estudentizados número de fila Si los datos fueron arreglados en orden cronológico, cualquier patrón en los dato sindican una influencia extrema. Opciones del Panel Los siguientes residuales pueden graficarse sobre cualquier gráfico residual: 006 por StatPoint, Inc. Transformaciones de Box-Cox -
12 . Residuales Los residuales por estimación de mínimos cuadrados.. Residuales Estandarizados La diferencia entre los valores observados w i y los valores predichos ŵi cuando el modelo es ajustado usando todas las observaciones excepto el i- ésimo, divididos por el error estándar de la estimación. Estos residuales a veces se llaman residuales externamente eliminados, puesto que miden que tan lejos esta cada valor del modelo estimado cuando el modelo es ajustado usando todos los datos excepto el punto inicial considerado. Esto es importante, puesto que un valor atípico muy grande pueden afectar de alguna manera al modelo tanto que no parecería ser inusualmente separado de la línea. Residuales Inusuales Una vez que se ha estimado el modelo, es útil estudiar los residuales para determinar donde existe cualquier valor atípico que deba ser removido de los datos. El panel Residuales Inusuales lista todas las observaciones que tienen un residual estandarizado mayor que.0 en valor absoluto. Residuos Atípicos Y Residual Row X Y Predicha Residual Estudentizado Los residuales estandarizados mayor que 3 en valor absoluto corresponden a puntos a más de 3 desviaciones estándar del modelo estimado, lo cual es un evento extremadamente raro para una distribución normal. Note que la fila 8 es más de.5 desviaciones estándar hacia afuera por la que habría que investigarlo. Los puntos pueden removerse de la estimación mientras se examina con el Gráfico del Modelo Estimado dando clic sobre un punto y presionando el botón Excluir/Incluir sobre la barra de herramientas: 4 Gráfica del Modelo Ajustado Potencia=-0.69, Cambio=0.0 0 Plasma Level Age Los puntos excluidos son marcados con una X. Para los datos del ejemplo, removiendo la fila 8 se tiene poco efecto sobre el modelo estimado o la transformación optima. 006 por StatPoint, Inc. Transformaciones de Box-Cox -
13 Puntos Influyentes En la estimación de un modelo de regresión, todas las observaciones no tienen la misma influencia sobre la estimación de los parámetros en el modelo estimado. En una regresión lineal simple, los puntos localizados con valores muy bajos o altos de X tienen mayor influencia que los que están localizados cerca de la media de X. El panel de Puntos Influyentes despliega cualquier observación que tiene una alta influencia sobre la estimación del modelo: Puntos Influyentes Y Residual Fila X Y Predicha Estudentizado Leverage Valor de influencia promedio de un punto = 0.08 La tabla anterior muestra todos los puntos con palancada igual o mayor a 3 veces sobre un valor promedio de los datos, donde la palancada de una observación es una medida de la influencia sobre la estimación de los coeficientes del modelo. En general, valores con palancada excesiva a 5 veces sobre de un valor promedio de los datos deben ser examinados a detalle, puesto que tienen inusualmente un alto impacto sobre la estimación del modelo. En los datos del ejemplo, no hay observaciones con palancada inusualmente grande. Pronósticos El panel de Pronósticos crea predicciones usando el modelo estimado. Valores Predichos 95.00% 95.00% Predicho Límites de Predicción Límites de Confianza X Y Inferior Superior Inferior Superior Se incluyen en la tabla: X El valor de la variable independiente en la cuál la predicción es realizada. Predicción Y El valor predicho de la variable dependiente usando el modelo estimado. Límites de Predicción Límites de predicción para nuevas observaciones en la selección del nivel de confianza (correspondientes a los límites exteriores sobre el gráfico del modelo estimado). Límites de Confianza Límites de confianza para la media de Y en la selección del nivel de confianza (correspondientes a los límites internos sobre el gráfico del modelo estimado). Por ejemplo, en X = 3, 95% de todos los niños se espera tener niveles de plasma entre 5.47 y por StatPoint, Inc. Transformaciones de Box-Cox - 3
14 Opciones del Panel Nivel de Confianza: Porcentaje de confianza para los intervalos. Tipo de Límites: donde se definen límites de dos-colas o una-cola. Pronósticos en X: Hasta 0 valores de X para realizar predicciones. Grabar Resultados Los siguientes resultados pueden grabarse en la base de datos:. Valores Predichos El valor predicho de Y correspondiente a cada una de las n observaciones.. Limite de Predicción Inferior El límite de predicción inferior para cada valor predicho. 3. Limite de Predicción Superior El límite de predicción superior para cada valor predicho. 4. Limite de Predicción Inferior de la Media El límite de confianza inferior para la media de Y en cada n valores de X. 5. Limite de Predicción Superior de la Media El límite de confianza superior para la media de Y en cada n valores de X. 6. Residuales Los n residuales. 7. Residuales Estandarizados Los n residuales estandarizados. 8. Palancadas Los valores de palancadas correspondientes a n valores de X. 9. Transformación de los Datos Los n valores transformados W. Nota: Si se graban los límites, corresponden a la configuración sobre el panel de Pronósticos. Si los límites de dos-colas son presentados en la tabla de Pronósticos, entonces los límites guardados serán también de dos-colas. Si los límites de una-cola son presentados en la tabla de Pronósticos, entonces los límites guardados serán también de una-cola.. Cálculos La línea de regresión es desarrollada sobre la transformación de valores W. Los límites de predicción son calculados en la métrica transformada y deben invertirse antes de ser presentados. 006 por StatPoint, Inc. Transformaciones de Box-Cox - 4
15 Para más detalle sobre los cálculos, vea la documentación de Regresión Simple. 006 por StatPoint, Inc. Transformaciones de Box-Cox - 5
Modelos de Calibración
Modelos de Calibración Resumen El procedimiento Modelos de Calibración esta diseñado para construir un modelo estadístico que describe la relación entre variables, X y Y, donde construir un modelo es construir
Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp
Regresión Polinomial Resumen El procedimiento Regresión Polinomial está diseñado para construir una modelo estadístico que describa el impacto de un solo factor cuantitativo X en una variable dependiente
Transformaciones de Potencia
Transformaciones de Potencia Resumen El procedimiento Transformaciones de Potencia está diseñado para definir una transformación normalizadora para una columna de observaciones numéricas que no provienen
Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp
Regresión en Cadena Resumen El procedimiento Regresión en Cadena está diseñado para ajustar un modelo de regresión múltiple cuando las variables independientes exhiben multicolinealidad. Multicolinealidad
Exactitud y Linearidad del Calibrador
Exactitud y Linearidad del Calibrador Resumen El procedimiento Exactitud y Linearidad del Calibrador fue diseñado para estimar la exactitud del sistema de medición. En contraste con los procedimientos
Análisis Probit. StatFolio de Ejemplo: probit.sgp
STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo
Análisis de Componentes de la Varianza
Análisis de Componentes de la Varianza Resumen El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la contribución de múltiples factores a la variabilidad de una variable
Gráfico de Desgaste de Herramientas
Gráfico de Desgaste de Herramientas Resumen El procedimiento Gráfico de Desgaste de Herramientas crea cuadros de control para una sola variable numérica donde se espera que cambien las cantidades en un
Comparación de dos Muestras - SnapStat
Comparación de dos Muestras - SnapStat Resumen La Comparación de Dos Muestras usando SnapStat crea un resumen de una página que compara dos muestras independientes de datos de variables. Calcula estadísticos
Regresión No Lineal. StatFolio de ejemplo: nonlinear reg.sgp
Regresión No Lineal Resumen El procedimiento Regresión No Lineal ajusta una función especificada por el usuario relacionando una sola variable dependiente Y con una o más variables independientes X. El
Comparación de Líneas de Regresión
Comparación de Líneas de Regresión Resumen El procedimiento de Comparación de Líneas de Regresión esta diseñado para comparar líneas de regresión relacionas con Y y X en dos o mas niveles de un factor
Mínimos Cuadrados Parciales
Mínimos Cuadrados Parciales Resumen El procedimiento Mínimos Cuadrados Parciales (PLS Partial Least Squares) está diseñado para construir un modelo estadístico que relaciona múltiples variables independientes
Gráficos EWMA. Ejemplo StatFolio: ewmachart.sgp
Gráficos EWMA Resumen El procedimiento del Gráfico EWMA (Exponentially Weighted Moving Average - Promedios Móviles Exponencialmente Ponderados) construye un gráfico de control para una sola variable numérica
Grafico Cusum (Mascara-V)
Grafico Cusum (Mascara-V) Resumen Los gráficos de sumas acumulativas monitorean datos por variables graficando las sumas acumulativas de las desviaciones al valor objetivo. Esto lo hace, incorporando la
Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp
Gráficos X-Bar y S Resumen El procedimiento Gráficos X-Bar y S crea gráficos de control para una simple variable numérica cuando los datos han sido recabados en subgrupos. Crea un Gráfico X-bar para monitorear
Método del Rango y Promedio (Estudio del Calibrador - Variables)
STATGRAPHICS Rev. 9/14/006 Método del Rango y Promedio (Estudio del Calibrador - Variables) Resumen El Método del Rango y Promedio estima la repetibilidad y reproducibilidad de un sistema de medición basado
Método ANOVA (Estudio del Calibrador Variables)
Método ANOVA (Estudio del Calibrador Variables) STATGRAPHICS Rev. 9/14/006 Resumen El Método ANOVA estima la repetibilidad y reproducibilidad de un sistema de medición basándose sobre un estudio en el
Análisis de Capacidad Multivariada
Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos
Pronósticos Automáticos
Pronósticos Automáticos Resumen El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de
Diseño de Experimentos Optimización de Múltiples Respuestas
Diseño de Experimentos Optimización de Múltiples Respuestas Resumen La selección de Optimización de Múltiples Respuestas sobre el menú DDE permite al experimentador determinar las configuraciones de los
Gráfico de Medias Móviles (MA)
Gráfico de Medias Móviles (MA) Resumen El procedimiento Gráfico de Medias Móviles crea cuadros de control para una sola variable numérica donde los datos se han recolectado ya sea individualmente o en
Estadísticas por Filas
Estadísticas por s Resumen El procedimiento Estadísticas por s calcula estadísticas para datos en filas de la hoa de datos. Esto contrasta con la mayoría de los procedimientos de STATGRAPHICS que esperan
Correlaciones Canónicas
STATGRAPHICS Rev. 9/14/006 Correlaciones Canónicas Resumen El procedimiento Correlaciones Canónicas esta diseñado para ayudar a identificar asociaciones entre dos conjuntos de variables. Esto lo hace encontrando
ANÁLISIS DE REGRESIÓN
ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y
Método del Rango (Estudio del Calibrador Variables)
Método del Rango (Estudio del Calibrador Variables) STATGRAPHICS Rev. 9/14/006 Resumen El Método del Rango calcula una estimación aproximada de la repetibilidad y reproducibilidad combinada para un sistema
Gráfico de Control T-Cuadrada Multivariada
Gráfico de Control T-Cuadrada Multivariada STATGRAPHICS Rev. 25/04/2007 Resumen El procedimiento Gráfico de Control T-Cuadrada Multivariada crea diagramas de control para dos o más variables numéricas.
Gráfico de Probabilidad Normal
Gráfico de Probabilidad Normal Resumen El Gráfico de Probabilidad Normal se usa para ayudar a juzgar si una muestra de datos numéricos proviene o no de una distribución normal. De no ser el caso, frecuentemente
Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística
Regresión lineal Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística Universidad Católica del Maule Facultad de Ciencias Básicas Pedagogía en Matemática Estadística I 01 de enero de 2012
Diseño de Experimentos Diseños de un Solo Factor Categórico
Diseño de Experimentos Diseños de un Solo Factor Categórico Resumen La selección de Diseños de un Solo Factor Categórico sobre el menú de Crear un Diseño crea diseños experimentales para situaciones donde
Práctica 4 EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables
EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables Marco elementos atípicos: b) Obtener la recta de regresión y comprobar
Diseño de Experimentos Diseño de Componentes de la Varianza
Diseño de Experimentos Diseño de Componentes de la Varianza Resumen La selección del Diseño de Componentes de la Varianza sobre el menú Crear Diseño construye experimentos diseñados para cuantificar la
REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE
UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE
ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas [email protected] 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por
ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com
ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez [email protected] https://torrezcesar.wordpress.com 0416-2299743 Programa de Estadística II UNIDAD IV: REGRESIÓN Y CORRELACIÓN MÚLTIPLE LINEAL TANTO
Análisis de Capabilidad (Porcentaje Defectuoso)
Análisis de Capabilidad (Porcentaje Defectuoso) STATGRAPHICS Rev. 9/4/2006 Este procedimiento esta diseñado para estimar el porcentaje de artículos defectuosos en una población basándose en muestra de
Gráfico de Control de Aceptación
Gráfico de Control de Aceptación Resumen El procedimiento de Gráfico de Control de Aceptación crea gráficos de control con límites de control modificados basándose en la desviación estándar del proceso
Método de Análisis del Riesgo (Estudio del Calibrador Atributos)
Método de Análisis del Riesgo (Estudio del Calibrador Atributos) Resumen El Método de Análisis del Riesgo cuantifica la incertidumbre de un sistema de medición donde las observaciones consisten de atributos
Método de cuadrados mínimos
REGRESIÓN LINEAL Gran parte del pronóstico estadístico del tiempo está basado en el procedimiento conocido como regresión lineal. Regresión lineal simple (RLS) Describe la relación lineal entre dos variables,
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia
Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia Estudio de Caso: Estudio Morfología Coeficiente de Correlación Considere el archivo Estudio Morfología.sav.
Gráfico Arrhenius. Ejemplo StatFolio: arrhenius.sgp
Gráfico Arrhenius Resumen El procedimiento del Gráfico Arrhenius se diseña para dibujar datos de una prueba de vida acelerada en la cual se ha registrado los tiempos de falla y se estiman percentiles de
Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)
Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
ÍNDICE Modelos de caja gris Calibración de modelos Estimación de parámetros Análisis de la estimación Regresión no lineal 1. Modelos de caja gris Son modelos de un sistema (o proceso), donde: Desarrollados
Objetivo: Proponer modelos para analizar la influencia
TEMA 3: REGRESIÓN LINEAL SIMPLE Objetivo: Proponer modelos para analizar la influencia de una variable cuantitativa sobre un fenómeno que nos interesa estudiar. 1. Modelo lineal l de regresión 2. Estimación
Modelación estadística: La regresión lineal simple
Modelación estadística: La regresión lineal simple Gabriel Cavada Ch. 1 1 División de Bioestadística, Escuela de Salud Pública, Universidad de Chile. Statistical modeling: Simple linear regression Cuando
Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)
Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión
MPG City (MPG en Ciudad)
Gráfica de Matriz Resumen El procedimiento Gráfica de Matriz crea gráficas de matriz para 3 o más variables numéricas. La diagonal de la matriz contiene gráficas de caja y bigotes para cada variable. Las
Método Analítico (Estudio del Calibrador Atributos)
Método Analítico (Estudio del Calibrador Atributos) STATGRAPHICS Rev. 9/4/2006 Resumen El Método Analítico estima la repetibilidad y sesgo de un sistema de medición donde las observaciones consisten de
Método Teoría de la Señal (Estudio del Calibrador Atributos)
Método Teoría de la Señal (Estudio del Calibrador Atributos) Resumen El Método Teoría de la Señal cuantifica la incertidumbre de un sistema de medición donde las observaciones consisten de atributos en
Ing. MSc. Luis Fernando Restrepo Gómez
Ing. MSc. Luis Fernando Restrepo Gómez Introducción a la Valuación Masiva METODOLOGÍA VALUATORIA Sigue los pasos de la metodología científica, y se apoya en el análisis estadístico de datos comparables.
Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A
Regresión lineal REGRESIÓN LINEAL SIMPLE REGRESIÓN LINEAL MÚLTIPLE N A Z IRA C A L L E J A Qué es la regresión? El análisis de regresión: Se utiliza para examinar el efecto de diferentes variables (VIs
Pruebas estadís,cas para evaluar relaciones
Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la
Gráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp
Gráfico ARIMA Resumen El procedimiento del Gráfico ARIMA (AutoRegressive Integrated Moving Average - Promedio Móvil Integrado Auto-Regresivo) crea gráficos de control para una sola variable numérica donde
Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL)
Caso 201: Recta de Calibrado para fosfato 1 Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL) CASO PRÁCTICO Uno de los procedimientos
Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15
Unidad Temática 3: Estadística Analítica Unidad 9 Regresión Lineal Simple Tema 15 Estadística Analítica CORRELACIÓN LINEAL SIMPLE Indica la fuerza y la dirección de una relación lineal proporcional entre
Análisis de regresión y correlación lineal
Análisis de regresión y correlación lineal En las unidades anteriores hemos aplicado metodologías estadísticas para analizar la información de una variable desde una o más muestras utilizando las herramientas
ANOVA Multifactorial. StatFolio Muestra: anova.sgp
ANOVA Multifactorial Resumen El procedimiento ANOVA Multifactorial está diseñado para construir un modelo estadístico describiendo el impacto de dos o más factores categóricos X j de una variable dependiente
ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN
CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)
Gráficos de Probabilidad
Gráficos de Probabilidad Resumen El procedimiento Gráficos de Probabilidad grafica los datos de una sola columna numérica en gráficas con una escala específica tal que, si los datos provienen de una distribución
PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado
PÁCTICA 3. EGESIÓN LINEAL SIMPLE CON SPSS 3.1. Gráfico de dispersión 3.2. Ajuste de un modelo de regresión lineal simple 3.3. Porcentaje de variabilidad explicado 3.4 Es adecuado este modelo para ajustar
Diseño de Experimentos Diseños para Varios Factores Categóricos
Diseño de Experimentos Diseños para Varios Factores Categóricos Resumen La selección de Diseños para Varios Factores Categóricos sobre el menú Crear Diseño construye diseños experimentales para situaciones
Grafico de Cajas y Bigotes
Grafico de Cajas y Bigotes Resumen El procedimiento del Gráfico de Cajas y Bigotes crea un gráfico diseñado para ilustrar propiedades importantes de una columna de datos numérica. El primero en describirlo
Estadística II Ejercicios Tema 5
Estadística II Ejercicios Tema 5 1. Considera los cuatro conjuntos de datos dados en las transparencias del Tema 5 (sección 5.1) (a) Comprueba que los cuatro conjuntos de datos dan lugar a la misma recta
Selección Diseño de Cribado
Selección Diseño de Cribado Resumen La sección diseño experimental del STATGRAPHICS puede crear una amplia variedad de diseños dirigidos a mostrar los factores más importantes que afectan un proceso. Se
Histogramas. Ejemplo StatFolio: histogram.sgp
s Resumen El ilustra la distribución de lo valores de una variable numérica agrupando los datos en intervalos y graficando barras en las cuales la altura es proporcional al numero de observaciones en cada
Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.
TEMA 12 REGRESIÓN LINEAL Mediante la regresión lineal se busca hallar la línea recta que mejor explica la relación entre unas variables independientes o variables de exposición y una variable dependiente
Selección del Modelo de Regresión
Selección del Modelo de Regresión Resumen El procedimiento Selección del Modelo de Regresión está diseñado para ayudar a elegir las variables independientes que se usarán para construir un modelo de regresión
Estadísticas II. M. en E. M. Milagros Eugenia Faci. 15 de julio de 2010
2010 Estadísticas II M. en E. M. Milagros Eugenia Faci 15 de julio de 2010 2 Estadísticas II CONTENIDO UNIDAD III. CORRELACIÓN Y REGRESIÓN...3 III.1 CARACTERÍSTICAS DE UNA CORRELACIÓN...3 METODO DE MÍNIMOS
PRÁCTICA 2: LA RECTA DE REGRESIÓN
PRÁCTICA 2: LA RECTA DE REGRESIÓN Los contenidos están organizados para que pueda avanzar a la vez que hacer los ejercicios propuestos en la práctica 2 del cuadernillo de práticas. Asegúrate de entender
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias
CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña
CORRELACIÓN Y REGRESIÓN Juan José Hernández Ocaña CORRELACIÓN Muchas veces en Estadística necesitamos saber si existe una relación entre datos apareados y tratamos de buscar una posible relación entre
Regresión ponderada y falta de ajuste
Capítulo 4 Regresión ponderada y falta de ajuste 4.1. Introducción En este capítulo se presentan la regresión ponderada y la prueba de falta de ajuste como un conjunto adicional de herramientas usadas
Estadística aplicada al medio ambiente
Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de
Teoría de la decisión
1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia
Tema 3: Análisis de datos bivariantes
Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta
Tercera práctica de REGRESIÓN.
Tercera práctica de REGRESIÓN. DATOS: fichero practica regresión 3.sf3 1. Objetivo: El objetivo de esta práctica es aplicar el modelo de regresión con más de una variable explicativa. Es decir regresión
Determinación del tamaño de muestra (para una sola muestra)
STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto
Lucila Finkel Temario
Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión
Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.
UNIVERSIDAD DE ATACAMA FACULTAD DE CIENCIAS JURÍDICAS / CARRERA DE TRABAJO SOCIAL TECNOLOGÍA INFORMÁTICA I (SPSS) ESTADÍSTICA DESCRIPTIVA CON MÁS DE UNA VARIABLE Profesor: Hugo S. Salinas. Primer Semestre
Modelo de Regresión Lineal
Modelo de Regresión Lineal Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Introducción Un ingeniero, empleado por un embotellador de gaseosas,
Coeficiente de Correlación
Coeficiente de Correlación Al efectuar un análisis de regresión simple (de dos variables) necesitamos hacer las siguientes suposiciones. Que las dos variables son mensurables Que la relación entre las
TEMA 10 Correlación y regresión. El modelo de regresión simple
TEMA 10 Correlación y regresión. El modelo de regresión simple Karl Pearson (1857-1936) 1. Introducción. Modelos matemáticos 2. Métodos numéricos. Resolución de sistemas lineales y ecuaciones no lineales
7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE
ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago
7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño
7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL Jorge Eduardo Ortiz Triviño [email protected] http:/www.docentes.unal.edu.co/jeortizt/ Introducción Los datos frecuentemente son dados para valores
Regresión Lineal Múltiple. Dr. Víctor Aguirre Torres, ITAM. Guión 12.
Regresión Lineal Múltiple 1 Propósito Cuantificar el cambio en el valor esperado de una variable (y) en función del cambio simultáneo otras variables (x 1, x 2,..., x p ). y=variable dependiente (cuantitativa)
Gráfico Múltiple de Caja y Bigotes
Gráfico Múltiple de Caa y Bigotes Resumen El procedimiento Gráfico Múltiple de Caa y Bigotes crea un gráfico diseñado para ilustrar Características importantes de una columna de datos numéricos cuando
Definición de Correlación
Definición de Correlación En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias: Estudiar cómo influye la estatura del padre sobre la estatura del
Análisis de Subconjuntos
Análisis de Subconuntos Resumen El procedimiento de Análisis de Subconuntos calculará estadísticos para datos en una simple columna numérica cuando se agrupan en subconuntos definidos por los identificadores
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10
Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores
Tema 4. Regresión lineal simple
Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias
CLAVE Lab 11 - Regresión Lineal Simple y Polinomial
Escala común CLAVE Lab 11 - Regresión Lineal Simple y Polinomial 1. A mano, construya los siguientes gráficos: a. Grafique la línea recta correspondiente a la ecuación y 2x 1 b. Grafique la línea recta
GUÍA DE STATGRAPHICS 5.1
UNIVERSIDAD POLITÉCNICA DE MADRID ESCUELA UNIVERSITARIA DE ARQUITECTURA TÉCNICA DEPARTAMENTO DE MATEMÁTICA APLICADA A LA ARQUITECTURA TÉCNICA GUÍA DE STATGRAPHICS 5.1 (Versión castellana) GUÍA DE STATGRAPHICS
peso edad grasas Regresión lineal simple Los datos
Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos
