Modelos de Calibración

Documentos relacionados
Ajustando Curva SnapStat

Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp

Transformaciones de Box-Cox

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Comparación de Líneas de Regresión

Regresión No Lineal. StatFolio de ejemplo: nonlinear reg.sgp

Análisis de Componentes de la Varianza

Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp

Comparación de dos Muestras - SnapStat

Gráfico de Desgaste de Herramientas

Transformaciones de Potencia

Gráfico de Control T-Cuadrada Multivariada

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

ANÁLISIS DE REGRESIÓN

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Gráficos de Probabilidad

Mínimos Cuadrados Parciales

Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp

Método de cuadrados mínimos

Unidad Temática 3: Estadística Analítica. Unidad 9 Regresión Lineal Simple Tema 15

PRÁCTICA 2: LA RECTA DE REGRESIÓN

Exactitud y Linearidad del Calibrador

Análisis de Capacidad Multivariada

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Método del Rango (Estudio del Calibrador Variables)

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Estadísticas por Filas

Gráfico de Medias Móviles (MA)

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

REGRESIÓN LINEAL SIMPLE

Práctica 4 EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables

Método Analítico (Estudio del Calibrador Atributos)

Determinación del tamaño de muestra (para una sola muestra)

Análisis de regresión y correlación lineal

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Pronósticos Automáticos

Modelo de Regresión Lineal

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez

Modelación estadística: La regresión lineal simple

Tema 4. Regresión lineal simple

Snapstat: Comparación de Varias Muestras

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Selección Diseño de Cribado

Nota de los autores... vi

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Gráfico Arrhenius. Ejemplo StatFolio: arrhenius.sgp

Regresión Lineal Simple y Múltiple Regresión Logística

Correlaciones Canónicas

Grafico Cusum (Mascara-V)

Gráficos EWMA. Ejemplo StatFolio: ewmachart.sgp

Coeficiente de Correlación

Gráfico de Probabilidad Normal

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Método del Rango y Promedio (Estudio del Calibrador - Variables)

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Método ANOVA (Estudio del Calibrador Variables)

4.1 Análisis bivariado de asociaciones

TEMA 10 Correlación y regresión. El modelo de regresión simple

CLAVE - LAB 13 (Regresión y correlación lineal)

Teoría de la decisión

Ejemplo de Regresión Lineal Simple

MPG City (MPG en Ciudad)

que represente lo mejor posible la relación entre valores X e Y permitiéndonos inferir un valor a partir del otro.

Objetivo: Proponer modelos para analizar la influencia

Tema 2: Análisis de datos bivariantes

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 11

Estadística aplicada al medio ambiente

Estadísticas II. M. en E. M. Milagros Eugenia Faci. 15 de julio de 2010

GUÍA DE STATGRAPHICS 5.1

Pruebas estadís,cas para evaluar relaciones

Diseño de Experimentos Diseños de un Solo Factor Categórico

Tema 5: Calibración de modelos. Modelado y simulación en Ingeniería Química. Manuel Rodríguez

3. RELACION ENTRE DOS CONJUNTOS DE DATOS.

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

Ing. MSc. Luis Fernando Restrepo Gómez

Diseño de experimentos Hugo Alexer Pérez Vicente

Definición de Correlación

Regresión Lineal Múltiple. Dr. Víctor Aguirre Torres, ITAM. Guión 12.

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

ESTADÍSTICA. Tema 4 Regresión lineal simple

Estadística II Ejercicios Tema 5

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Regresión ponderada y falta de ajuste

Método de Análisis del Riesgo (Estudio del Calibrador Atributos)

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE METODOLOGÍAS ANALÍTICAS

4. Regresión Lineal Simple

Caso 201 : Recta de calibrado para análisis de fosfato (Regresión lineal sin pesos estadísticos) (F. J. Burguillo, USAL)

Estadística de dos variables

TEMA 3 Modelo de regresión simple

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño

Transcripción:

Modelos de Calibración Resumen El procedimiento Modelos de Calibración esta diseñado para construir un modelo estadístico que describe la relación entre variables, X y Y, donde construir un modelo es construir una ecuación que puede ser usada para predecir X dada Y. En una aplicación típica, X representa el valor verdadero de alguna cantidad importante, mientras que Y es el valor medido. Inicialmente, un conjunto de muestras con valores conocidos X son usadas para calibrar el modelo. Después, cuando muestras con valores desconocidos X son medidos, el modelo ajustado es usado para hacer una predicción inversa de X de los valores medidos Y. Cualquiera de los 7 modelos lineales y no lineales pueden ser ajustados. Mismos del procedimiento Regresión Simple. Ejemplo StatFolio: calibration.sgp Datos del Ejemplo: El archivo galactose.sf6 contiene datos de un experimento realizado usando un método nuevo para medir la concentración de galactosa en la sangre. Los datos son similares a los reportados por Neter et al (1998). n = 1 muestras con concentraciones de galactosa X en un rango entre 1. y 1. fueron medidas. Los datos son mostrados en seguida: known measured (patrón) (mediciones) 1.8 1.95 1.87 4 4.14 4 4.4 4 4.1 7 7.13 7 6.9 7 6.81 1 9.95 1 1.15 1 1.8 Una muestra adicional de concentración desconocida fue medida, dando Y = 6.5. Un estimador de la concentración actual de la muestra adicional es deseado, con un intervalo de confianza del 95%. 6 por StatPoint, Inc. Modelos de Calibración - 1

Entrada de Datos Los datos de entrada en la caja de dialogo pueden ser usados de maneras: 1. Dadas mediciones muestrales con valores conocidos de X, esto puede ser usado para ajustar el modelo de calibración. Los coeficientes del modelo pueden ser guardados para uso posterior.. Si nuevas mediciones son hechas, los coeficientes almacenados pueden ser usados para predecir el valor verdadero de X. Ajustando el Modelo de Calibración Y (medición): Columna numérica que contiene n valores medidos de la cantidad a ser predicha. X (actual): Columna numérica que contiene n valores conocidos de esta cantidad. Estadísticas del Modelo Ajustado: Dejar en blanco cuando ajustamos un nuevo modelo. Ponderaciones: Columna numérica opcional que contiene ponderaciones para ser aplicadas a los residuos en caso de que se realice un ajuste de mínimos cuadrados ponderados. Si la variabilidad de Y cambia como función de X, estas ponderaciones pueden ser usadas para compensar los diferentes niveles de variabilidad. Selección: Selección de un subconjunto de los datos. 6 por StatPoint, Inc. Modelos de Calibración -

Acción: Selecciona Ajustar Nuevo Modelo para estimar un nuevo modelo de Y y X. Usando un Modelo Almacenado Y (medición): Columna numérica que contiene los valores (o un solo número) medidos de la cantidad que ha de ser predicha. Estadísticas del Modelo Ajustado: Columna que contiene las estadísticas almacenadas de la estimación del modelo original. Esto normalmente habría de ser creado usando la opción Guardar Resultados cuando el modelo fue calibrado. La columna consiste del intercepto estimado, pendiente y otra información relevante. Acción: Selecciona Predecir X de Y. 6 por StatPoint, Inc. Modelos de Calibración - 3

Resumen del Análisis Cuando ajustamos un nuevo modelo de calibración, el Resumen del Análisis mostrara información sobre el modelo ajustado. Modelos de Calibración - measured vs. known Y (medida): measured X (actual): known Modelo Lineal: Y = a + b*x Estimado de Error Estadístico Parámetro Mínimos Cuadrados Estándar T Valor-P Intercepto -.896667.64364-1.39315.1938 Pendiente 1.1433.99998 11.55. Análisis de Varianza Fuente Suma de Cuadrados GL Cuadrado Medio Razón-F Valor-P Modelo 138.898 1 138.898 137.3. Residuo.134757 1.134757 Falta de Ajuste.43433.17117 1.9.11 Error Puro.913333 8.114167 Total (Corr.) 139.3 11 Coeficiente de Correlación =.999515 R-Cuadrada = 99.931 porcentaje R-Cuadrada(ajustada por g.l.) = 99.8934 porcentaje Error Estándar del Est. =.11685 Error medio absoluto =.93889 Estadístico Durbin-Watson = 1.54 (P=.94) Autocorrelación residual de retardo 1 =.6661 Análisis de Residuos Estimación n 1 MSE.134757 MAE.93889 MAPE 3.7549 ME -4.8197E-16 MPE -.9853 Validación Incluida en la salida están: Variables y modelo: Identificación de las variables de entrada y el modelo que fue ajustado. Por defecto, un modelo lineal de la forma Y = a + b X (1) es ajustado, aunque un modelo diferente puede ser seleccionado usando Opciones del Análisis. Coeficientes: Los coeficientes estimados, errores estándar, estadísticas t, y P valores. Los estimadores de los coeficientes del modelo pueden ser usados para escribir la ecuación ajustada, la cual en este ejemplo es: measured = -.896667 + 1.1433 known () 6 por StatPoint, Inc. Modelos de Calibración - 4

En la prueba estadística t la hipótesis nula corresponde al parámetro del modelo igual a, contra la alternativa que corresponde a ser diferente de. P-Valores pequeños (menos que.5 si opera en un nivel de 5% de confianza) indica que el coeficiente del modelo es significativamente diferente de. En los datos muestrales, la pendiente es significativamente diferente de pero el intercepto no. Análisis de Varianza: Descomposición de la variabilidad de una variable dependiente Y en una suma de cuadrados del modelo y una suma de cuadrados de residuos o errores. La suma de cuadrados de residuos es particionada en una componente de falta de ajuste y un componente de error puro. De interés particular son las pruebas F y las asociadas a P-valores. La prueba F en el la línea Modelo prueba la significancia estadística del modelo ajustado. Un P-Valor pequeño (menos que.5 si opera en un nivel de 5% de confianza) indica que una relación significante de la forma especificada existe entre Y y X. En los datos del ejemplo, el modelo es altamente significante. La prueba F en la línea Falta-de-ajuste prueba la adecuación del modelo lineal seleccionado en la descripción de la relación observada entre Y y X. Un P-Valor pequeño indica que el modelo seleccionado no es adecuado en la descripción de la relación. En tales casos, un modelo no lineal podría ser seleccionado usando Opciones del Análisis. Para los datos del ejemplo, el P-Valor grande indica que el modelo lineal es adecuado. Nota: la prueba falta de ajuste es disponible solamente cuando mas que una medida ha sido obtenida en el mismo valor de X. Estadísticas: Resumen de las estadísticas para el modelo ajustado incluyendo: Coeficiente de Correlación Mide la fuerza de la relación lineal entre Y y X en una escala de -1 (correlación lineal negativa perfecta) a +1 (correlación lineal positiva perfecta). En los datos del ejemplo, la correlación es muy fuerte. R-Cuadrada - Representa el porcentaje de la variabilidad en Y el cual ha sido explicado por el modelo de regresión ajustado, el rango va de % a 1%. Para los datos del ejemplo, se tiene un valor de alrededor de 99.9% de la variabilidad entre las medidas. R-Cuadrada Ajustada El estadístico R cuadrada, es ajustado por el número de coeficientes en el modelo. Este valor es frecuentemente usado para comparar modelos con diferentes números de coeficientes. Error Estándar de Est. La desviación estándar estimada de los residuos (las desviaciones alrededor del modelo). Este valor es usado para crear límites de predicción para nuevas observaciones. Media del Error Absoluto El valor absoluto promedio de los residuos. Estadístico Durbin-Watson Una medida de la correlación lineal en los residuos. Si los residuos varían aleatoriamente, este valor debería ser cercano a. Un P-valor pequeño indica un patrón no aleatorio en los residuales. Para los datos recolectados en el tiempo, un P-valor pequeño indicaría que alguna tendencia en el tiempo no ha sido tomada en cuenta. 6 por StatPoint, Inc. Modelos de Calibración - 5

Lag 1 Autocorrelación Residual La correlación estimada entre residuos consecutivos, en una escala de 1 a 1. Valores mas haya de indican que alguna estructura significante permanece sin ser tomada en cuenta por el modelo. Análisis de Residuos Si un subconjunto de renglones en la hoja de datos han sido excluidos del análisis usando el campo Seleccionar en la caja de dialogo de entrada de datos, el modelo ajustado es usado para hacer predicciones de los valores Y para estos renglones. Esta tabla muestra estadísticas en los errores de predicción, definidas por e i = y yˆ (3) i i Incluidos están el error cuadrado medio (MSE), el error absoluto medio (MAE), el error porcentual absoluto medio (MAPE), el error medio (ME), y el error porcentual medio (MPE). Estas estadísticas de validación pueden ser comparadas con las estadísticas del modelo ajustado para determinar que tan bien el modelo predice observaciones fuera de los datos usados para ajustarlo. Opciones del Análisis Tipo de Modelo: El modelo para ser estimado. Todos los modelos mostrados pueden ser linealizados transformando cualquiera X, Y, o ambos. Cuando ajustamos un modelo no lineal, STATGRAPHICS primero transforma los datos, y luego ajusta el modelo, y después invierte la transformación para mostrar los resultados. Incluir Constante: Si se incluye un termino constante o intercepto en el modelo. Si la constante es removida, el modelo ajustado pasara a través del origen en (X,Y) = (,). Los modelos disponibles son mostrados en la siguiente grafica: 6 por StatPoint, Inc. Modelos de Calibración - 6

Modelo Ecuacion Transformación en Y Transformación en X Lineal y = β + β1 x ninguna ninguna y = β + βx Raíz cuadrada ninguna Raíz cuadrada-y ( ) 1 Exponencial ( β+ β1x ) y = e log ninguna Reciproco-Y 1 y = ( β + β x) reciproco ninguna Cuadrada-Y 1 y β1 = β + x cuadrada ninguna Raíz cuadrada-x y = β + β1 x ninguna raíz cuadrada Doble raíz cuadrada raíz cuadrada raíz cuadrada y = ( β + β1 x ) Log-Y raíz cuadrada-x ( β + β1 y = e x ) logarítmica raíz cuadrada Reciproco-Y raíz 1 y = ( β + β1 x ) cuadrada-x reciproco raíz cuadrada Cuadrada-Y raíz y = β + β1 x cuadrada raíz cuadrada cuadrada-x Logarítmica-X y = β + β1ln( x) ninguna logarítmica Raíz cuadrada-y log-x y = ( β + β ln(x ) raíz cuadrada logarítmica 1 ) Multiplicativa y = β x β 1 logarítmica logarítmica Reciproco-Y log-x 1 reciproco logarítmica y = β + β ln( ) 1 x Cuadrada-Y log-x y = β + β ln( ) cuadrada logarítmica Reciproco-X 1 x y = β + / x ninguna reciproco β 1 ( ) Raíz cuadrada-y y = β + β1 / x raíz cuadrada reciproco reciproco- X S-curve ( β+ β1/ x) y = e logarítmica reciproco Doble reciproco 1 y = [ β + β x] reciproco reciproco Cuadrada-Y reciproco-x / y = β + / x cuadrada reciproco β 1 Cuadrada-X y = β + β ninguna cuadrada 1x ( ) Raíz cuadrada-y y = β + β1x raíz cuadrada cuadrada cuadrada-x Log-Y cuadrada-x ( β +β1x y = e ) logarítmica cuadrada Reciproco-Y cuadrada- 1 y = ( β + β1x ) X reciproco cuadrada Doble cuadrada y = β + β cuadrada cuadrada 1x Logístico ( β+ β1x ) e y = ( β+ β1x ) 1+ e [ ] y/(1-y) ninguna Log probit y = ϕ( β + β1 ln( x)) ϕ 1 ( y ) logarítmica (inv. normal) 6 por StatPoint, Inc. Modelos de Calibración - 7

Para determinar que modelo ajusta a los datos, la salida del panel Comparación de Modelos Alternativos descrito abajo puede ser de ayuda, ya que este ajusta todos los modelos y los lista en orden decreciente de su R-cuadrada. Gráfica del Modelo Ajustado Este panel muestra el modelo o los modelos ajustados, junto con límites de confianza y límites de predicción si se desea. 1 Gráfica del Modelo Ajustado measured = -.896667 + 1.1433*known measured 1 8 6 4 6.5 6.5167 (6.535,6.78317) 4 6 8 1 known La gráfica incluye: La línea del mejor ajuste o la ecuación de predicción : yˆ = aˆ + bx ˆ (4) Esta es la ecuación que debería ser usada para predecir valores de la variable dependiente Y dados valores de la variable independiente X, o viceversa. Intervalos de Confianza para la respuesta media en X. Hay límites internos en la anterior grafica y describen que tan bien la localización de la línea ha sido estimada dado el ejemplo de datos disponibles. Como el tamaño de la muestra n se incrementa, estos límites se harán más estrechos. Deberías notar que el ancho de los límites varía como una función de X, con la línea estimada más precisamente cerca del valor promedio x. Limites de Predicción para nuevas observaciones. Hay limites exteriores en la grafica anterior y describen que tan preciso uno podría predecir donde una simple observación debería yacer. A pesar del tamaño de la muestra, nuevas observaciones variaran alrededor de la línea verdadera con una desviación estándar igual a σ. Predicción de un solo valor. Usando Opciones del Panel, una sola dirección pude ser hecha y graficada. Por ejemplo, la anterior grafica predice el valor de X dada una muestra 6 por StatPoint, Inc. Modelos de Calibración - 8

con valor medido Y = 6.5. El valor predicho de X es igual a 6.516, con un de limite de confianza del 95% extendiéndose de 6.5 a 6.783. Opciones del Panel Incluir: Los limites incluidos en la grafica. Nivel de Confianza: El porcentaje de confianza para los límites. Predecir: Si predecir Y o X. Introducir el valor de la otra variable en el campo En Tamaño Medio o Ponderación: Si el valor medido es el promedio de más de una muestra, introducir el número de muestras m usado para calcular el promedio. Valores Predichos El modelo puede ser usado para predecir X dada Y o Y dada X. En el primer caso, la salida es mostrada abajo: Valores Predichos para X 95.% Predicción de Límites de Predicción Y-barra X Inferior Superior 6.5 6.5167 6.535 6.78317 Incluidas en la tabla están: Y El valor medido en el cual la predicción será hecha. X Predichos - El valor predicho de X usando el modelo ajustado. Limites de Predicción - Limites de predicción para X en el nivel de confianza seleccionado. Estos son los mismos valores mostrados en la grafica del modelo ajustado. 6 por StatPoint, Inc. Modelos de Calibración - 9

Opciones del Panel STATGRAPHICS Rev. 9/14/6 Predecir: Si predice Y o X. Nivel de Confianza: El porcentaje de confianza para los límites. Tamaño Medio o Ponderación: Si el valor medido es el promedio de más de una muestra, introducir el número de muestras m usado para calcular el promedio. Predecir En: 1 valores en los cuales se hacen las predicciones. Intervalos de Confianza El panel Intervalos de Confianza muestra el error de estimación potencial asociado con cada coeficiente en el modelo. Intervalos de confianza del 95.% para los estimados de los coeficientes Parámetro Estimado Estándar Límite Inferior Límite Superior CONSTANTE -.896667.64364 -.3375.53741 PENDIENTE 1.1433.99998.997 1.3659 Opciones del Panel 6 por StatPoint, Inc. Modelos de Calibración - 1

Tipo de Intervalo: Cualquier intervalo de confianza de dos colas o un intervalo de confianza de una cola pueden ser creados. Nivel de Confianza: Nivel del porcentaje de confianza para el intervalo. Pruebas de Hipótesis El panel Pruebas de Hipótesis puede ser usado para probar hipótesis sobre los coeficientes del modelo. En cada caso, una prueba t es realizada. Las pruebas por defecto son mostradas abajo: Pruebas de hipótesis Hipótesis nula: intercepto =. Hipótesis alterna: intercepto no igual. Estadístico t calculado = -1.39315 Valor-P =.193765 No rechazar la hipótesis nula para alfa =.5. Hipótesis nula: pendiente = 1. Hipótesis alterna: pendiente no igual 1. Estadístico t calculado = 1.43463 Valor-P =.181919 No rechazar la hipótesis nula para alfa =.5. La primera prueba se refiere a si el intercepto es o no igual a. Si así es, el modelo pasa a través del origen. Un P-Valor pequeño (menos que.5 si se opera en un nivel de 5% de confianza) indicaría que el intercepto no es igual a. En este caso, el resultado no es significante, entonces la línea podría pasar por el origen. Si la pendiente de la línea es igual a 1, un intercepto no-cero seria relacionado a sesgo en las medidas. La segunda prueba se refiere a si la pendiente es igual o no a 1. Para un modelo lineal, una pendiente de 1 indica que cuando el valor conocido cambia, el valor medido cambia por la misma cantidad. Un P-Valor pequeño indicaría que la pendiente fue significantemente diferente de 1. En el caso actual, ninguna hipótesis nula es rechazada, indicando que una posible ecuación de calibración es measured = known. Opciones del Panel Intercepto: El valor del intercepto especificado por la hipótesis nula. Pendiente: El valor de la pendiente especificado por la hipótesis nula. 6 por StatPoint, Inc. Modelos de Calibración - 11

Alternativa: El tipo de hipótesis alternativa. Si No Igual es seleccionado, un P-valor de dos colas es calculado. De otra manera, un P-valor de una cola es calculado. Alfa: La probabilidad del error de Tipo I (rechazar la hipótesis nula cuando es cierta). Esto no afecta el P-valor, solamente la conclusión establece debajo de esta. Observado contra Predicho La grafica de lo Observado contra Predicho muestra los valores observados de Y en el eje vertical y los valores predichos de Yˆ en el eje horizontal. 1 1 Gráfica de measured observado 8 6 4 4 6 8 1 1 predicho Si el modelo ajusta bien, los puntos deberían estar aleatoriamente dispersados alrededor de la línea diagonal. Algunas veces es posible ver curvatura en esta grafica, la cual indicaría la necesidad para un modelo curvilíneo en lugar de un modelo lineal. Cualquier cambio en variabilidad de valores bajos de Y a valores altos de Y podría indicar también la necesidad de transformar la variable dependiente antes de ajustar un modelo a los datos. Gráfica de Residuos Como con todos los modelos estadísticos, es una buena practica examinar los residuos. En una regresión, los residuos son definidos por e i = y i yˆ i (5) i.e., los residuos son la diferencia entre los valores observados y el modelo ajustado. El procedimiento Modelos de Calibración grafica varios tipos de gráficas de residuos, dependiendo de las Opciones del Panel. 6 por StatPoint, Inc. Modelos de Calibración - 1

Dispersión contra X Esta grafica ayuda en la visualización de cualquier necesidad por un modelo curvilíneo..8 Gráfica de Residuos Residuo Estudentizado 1.8.8 -. -1. -. 4 6 8 1 1 predicho measured Grafica de Probabilidad Normal Esta grafica puede ser usada para determinar si las desviaciones alrededor de la línea siguen o no una distribución normal, lo cual es usado como un supuesto para formar los intervalos de predicción. 99.9 Gráfica de Probabilidad Normal para measured porcentaje 99 95 8 5 5 1.1 -. -1. -..8 1.8 Residuo Estudentizado Si las desviaciones siguen una distribución normal, ellas deberían caer a lo largo de la línea recta. 6 por StatPoint, Inc. Modelos de Calibración - 13

Auto-correlaciones de Residuos Esta gráfica calcula la auto-correlación entre los residuos como una función del número de renglones entre ellos en la hoja de datos. 1 Autocorrelaciones Residuales para measured.6 autocorrelación. -. -.6-1 4 6 8 retraso Esto es solamente relevante si los datos han sido coleccionados secuencialmente. Cualquier barra extendiéndose más allá del límite de probabilidad indicaría dependencia significante entre residuos separados por la indicación lag, lo cual violaría el supuesto de independencia hecho cuando se ajusto el modelo de regresión. Opciones del Panel Graficar: el tipo de residuos a graficar: 1. Residuos los residuos del ajuste de mínimos.. Residuos Estandarizados la diferencia entre los valores observados y i y los valores predichos ŷ i cuando el modelo es ajustado usando todas las observaciones excepto la i- 6 por StatPoint, Inc. Modelos de Calibración - 14

ésima, dividida por el error estándar estimado. Estos residuos son algunas veces llamados residuos borrados externamente, ya que ellos miden que tan lejos este cada valor del modelo ajustado cuando este modelo es ajustado usando todos los datos excepto el punto que es considerado. Esto es importante, ya que un valor atípico grande puede afectar el modelo tanto que no parecería estar inusualmente lejos de la línea. Tipo: Tipo de graficas que son creadas. Un Diagrama de Dispersión es usado para probar la curvatura. Un Gráfico de Probabilidad Normal es usado para determinar si los residuos del modelo vienen de una distribución normal. Una Función de Auto-correlación es usada para probar la dependencia entre residuos consecutivos. Graficar Contra: Es un Diagrama de Dispersión, la variable a graficar sobre el eje horizontal. Numero de Lags: Para una Función de Auto-correlación, el máximo numero de lags. Para conjuntos de datos pequeños, el número de lags graficados puede ser menos que este valor. Nivel de Confianza: Para una Función de Auto-correlación, el nivel usado para crear los límites de probabilidad. Comparación de Modelos Alternativos El panel Comparación de Modelos Alternativos muestra los valores R-cuadrados obtenidos cuando ajustamos cada uno de los 7 modelos disponibles: Comparación de Modelos Alternativos Modelo Correlación R-Cuadrada Lineal.9995 99.9% Doble raíz cuadrada.9994 99.88% Doble cuadrado.9993 99.87% Multiplicativo.999 99.79% Doble recíproco.9965 99.3% Raíz cuadrada-y Logaritmo-X.99 98.5% Raíz cuadrada-x.9891 97.83% Raíz cuadrada-y.985 97.% Logaritmo-Y Raíz cuadrada-x.989 96.6% Modelo curva-s.9781 95.67% Y-cuadrada.9697 94.4% X-cuadrada.9697 94.3% Logaritmo-X.9551 91.% Exponencial.9441 89.13% Y-cuadrada Raíz cuadrada-x.96 85.1% Raíz cuadrada-y X-cuadrada.918 84.31% Recíproco-X.868 74.45% Y-cuadrada Logaritmo-X.8539 7.9% Logaritmo-Y X-cuadrada.8431 71.9% Y-cuadrada Recíproco-X.7174 51.47% Recíproco-Y X-cuadrada.711 49.15% Recíproco-Y <sin ajuste> Recíproco-Y Raíz cuadrada-x <sin ajuste> Recíproco-Y Logaritmo-X <sin ajuste> Raíz cuadrada-y Recíproco-X <sin ajuste> Logístico <sin ajuste> Log probit <sin ajuste> 6 por StatPoint, Inc. Modelos de Calibración - 15

Los modelos son listados en orden decreciente de R-cuadrado. Cuando seleccionamos un modelo alternativo, consideraciones deben de ser dadas a aquellos modelos que se encuentran en la parte de arriba. Aunque, ya que las estadísticas R-cuadradas son calculadas después de transformar X y/o Y, el modelo con el mas grande R-cuadrado puede no ser el mejor. Deberías siempre graficar el modelo ajustado para ver si hace un buen trabajo para los datos. Residuos Inusuales Una vez que el modelo ha sido ajustado, es usual estudiar los residuos para determinar si algún valor atípico existe el cual debería ser removido de los datos. El panel Residuos Inusuales lista todas las observaciones que han sido residuos Estandarizados de. o más grandes en valor absoluto. Residuos Atípicos Y Residuo Row X Y Predicha Residuo Estudentizado 9 7. 6.81 7.167 -.667 -.1 Residuos Estandarizados más grandes que 3 en valor absoluto corresponden a puntos con más de 3 desviaciones estándar del modelo ajustado, lo cual es un evento extremadamente raro para una distribución normal. Nota: Puntos pueden ser removidos del ajuste mientras se examina la Gráfica del Modelo Ajustado haciendo clic en un punto y presionando el botón Excluir/Incluir en la barra de herramientas de el análisis. Puntos excluidos son marcados con una X. Puntos Influyentes En el ajuste de un modelo de regresión, todas las observaciones no tienen una influencia igual en la estimación de los parámetros en el modelo ajustado. En una regresión simple, puntos localizados en muy bajos o muy altos valores de X tiene más influencia que aquellos localizados mas cerca de la media de X. el panel Puntos Influyentes muestra cualquier observación que tienen influencia alta en el modelo ajustado: Puntos Influyentes Y Residuo Row X Y Predicha Estudentizado Leverage Leverage promedio de un solo punto =.166667 La tabla muestra cada punto con su ponderación igual a 3 o más veces que de un punto promedio, donde la ponderación de una observación es una medida de su influencia en los coeficientes del modelo estimados. En general valores con ponderación que excede 5 veces el valor promedio de datos será examinado cercanamente, ya que ellos tienen usualmente impactos grandes en el modelo ajustado. 6 por StatPoint, Inc. Modelos de Calibración - 16

Guardar Resultados Los siguientes resultados pueden ser almacenados en una hoja de datos: STATGRAPHICS Rev. 9/14/6 1. Estadísticas del Modelo Una columna de valores numéricos con información sobre el modelo ajustado. Esta columna puede ser usada después para predecir valores de X seleccionando Predecir X de Y en la caja de dialogo.. Valores Predichos - Los valores predichos de Y corresponden a cada uno de las n observaciones. 3. Límites Inferiores de Predicciones Los límites de predicción inferior para cada valor predicho. 4. Límites Superiores de Predicciones Los límites de predicción superior para cada valor predicho. 5. Límites Inferiores para las Medias Pronosticadas los límites de confianza inferior para la media de Y en cada uno de n valores de X. 6. Límites Superiores para las Medias Pronosticadas los límites de confianza superior para la media de Y en cada uno de n valores de X. 7. Residuos Los n residuos. 8. Residuos Estudentizados Los n residuos Estandarizados. 9. Leverages Los valores ponderados correspondientes a n valores de X. 1. Coeficientes los coeficientes del modelo estimados. Cálculos Predicciones Inversas xˆ new y ˆ new β = o (6) ˆ β 1 Limites inferiores y superiores para x new son encontrados usando la aproximación Fieller s, la cual resuelve para los valores de en los limites de predicción xˆnew ( xˆ x) 1 1 new yˆ ± tα /, n MSE + + (7) m n S XX Son iguales a y new, donde m es el tamaño medio o ponderado y n i= 1 ( S = x x) (8) xx i Cálculos adicionales pueden ser encontrados en la documentación Regresión Simple. 6 por StatPoint, Inc. Modelos de Calibración - 17