Análisis Probit. StatFolio de Ejemplo: probit.sgp

Documentos relacionados
Regresión en Cadena. StatFolio de Ejemplo: ridge reg.sgp

Mínimos Cuadrados Parciales

Transformaciones de Potencia

Gráfico de Probabilidad Normal

Regresión Polinomial. StatFolio de Ejemplo: polynomial reg.sgp

Regresión No Lineal. StatFolio de ejemplo: nonlinear reg.sgp

Exactitud y Linearidad del Calibrador

Gráfico de Desgaste de Herramientas

Transformaciones de Box-Cox

Análisis de Componentes de la Varianza

Pronósticos Automáticos

Comparación de Líneas de Regresión

Gráficos de Probabilidad

Método Analítico (Estudio del Calibrador Atributos)

Método del Rango (Estudio del Calibrador Variables)

Método de Análisis del Riesgo (Estudio del Calibrador Atributos)

Selección del Modelo de Regresión

Estadísticas por Filas

Diseño de Experimentos Diseños de un Solo Factor Categórico

ANÁLISIS DE REGRESIÓN

Gráfico de Control T-Cuadrada Multivariada

Análisis de Capacidad Multivariada

Gráficos X-Bar y S. StatFolio de Muestra: xbarschart.sgp

Análisis de Tendencia de los Costos de Calidad

Gráfico de Medias Móviles (MA)

Determinación del tamaño de muestra (para una sola muestra)

Correlaciones Canónicas

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Diseño de Experimentos Diseños Factoriales Multinivel

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Gráficos EWMA. Ejemplo StatFolio: ewmachart.sgp

Gráfico ARIMA. Ejemplo StatFolio: ARIMA charts.sgp

Histogramas. Ejemplo StatFolio: histogram.sgp

Análisis de Capabilidad (Porcentaje Defectuoso)

Tabulación Cruzada. Sample StatFolio: crosstabulation.sgp

SnapStat: Análisis de Una Muestra

Diagrama de Barras Múltiple

Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:

MPG City (MPG en Ciudad)

3. RELACION ENTRE DOS CONJUNTOS DE DATOS.

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Método del Rango y Promedio (Estudio del Calibrador - Variables)

7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Método de cuadrados mínimos

T2. El modelo lineal simple

Ajustando Distribución (Datos Censurados)

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Selección Diseño de Cribado

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

Lucila Finkel Temario

ANOVA Multifactorial. StatFolio Muestra: anova.sgp

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

Diseño de Experimentos Aumentar Diseño

TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA

Tema 10: Introducción a los problemas de Asociación y Correlación

Gráfico Múltiple de Caja y Bigotes

Teoría de la decisión

4.1 Análisis bivariado de asociaciones

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS

Análisis descriptivo con SPSS. Favio Murillo García

USO HERRAMIENTAS EXCEL PARA LA PREDICCION

3 ANALISIS DESCRIPTIVO DE LOS DATOS

Tema 4. Herramientas de representación gráfica

TEMA 4 FASE ESTADÍSTICO-ANALÍTICA: RECURSOS PARA EL ANÁLISIS DE DATOS

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Tercera práctica de REGRESIÓN.

Supuestos y comparaciones múltiples

2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

ANALISIS ESTADISTICO MINISTERIO DE ECONOMIA Y FINANZAS

Regresión Lineal. Dra. Noemí L. Ruiz Limardo 2008 Derechos Reservados, Rev 2010

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

Regresión. Notas. Página 1 13-DEC :24:11. Salida creada Comentarios

INCERTIDUMBRE DE LA MEDIDA

Tema: Medidas de Asociación con SPSS

Grafico de Cajas y Bigotes

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Universidad Nacional Autónoma de México Facultad de Psicología

ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Longitud = Calcular la media, la mediana, la moda y la desviación estándar de la muestra en Matlab.

Ejercicio 1(10 puntos)

Tabulación. StatFolio de muestra: tabulation.sgp. Datos del Ejemplo: Captura de Datos. STATGRAPHICS Rev. 4/25/2007

REGRESIÓN LINEAL SIMPLE

Tema 2. Regresión Lineal

Gráfico X-Y-Z. StatFolio de Muestra: xyzplot.sgp

Diagramas de Dispersión simples

INDICE. Prólogo a la Segunda Edición

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

Tema 2: Análisis de datos bivariantes

El ejemplo: Una encuesta de opinión

Métodos Estadísticos Multivariados

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Transcripción:

STATGRAPHICS Rev. 4/25/27 Análisis Probit Resumen El procedimiento Análisis Probit está diseñado para ajustar un modelo de regresión en el cual la variable dependiente Y caracteriza un evento con sólo dos posibles resultados. Se pueden modelados dos tipos de datos: 1. Datos en los que Y consiste en un conjunto de s y 1 s, donde 1 representa la ocurrencia de uno de los dos resultados. 2. Datos en los cuales Y representa la proporción de veces que ocurre uno de los dos resultados. El modelo de regresión relaciona a Y con una o más variables predictoras X, que pueden ser cuantitativas o categóricas. En este procedimiento, se asume que la probabilidad de un evento está relacionada con los predictores a través de la función probit. El procedimiento Regresión Logística puede usarse para ajustar el mismo tipo de datos pero emplea una forma funcional diferente. El procedimiento ajusta un modelo usando máxima verosimilitud o mínimos cuadrados ponderados. La selección por pasos de variables es una opción. Para probar la significancia de los coeficientes del modelo se realizan pruebas de cociente de verosimilitud. Se puede graficar el modelo ajustado y predicciones generados a partir del mismo. Se identifican y grafican residuos atípicos. Dado que el procedimiento Análisis Probit es análogo al de Regresión Logística, debe remitirse a la documentación de éste último para una descripción detallada de las diferentes opciones. Esta documentación resalta las diferencias entre los dos modelos y cubre un ejemplo simple. StatFolio de Ejemplo: probit.sgp Datos de Ejemplo: El archivo beetles.sf3 contiene un bien conocido conjunto de datos de Bliss (1935) que muestra los resultados de experimentos en los cuales se expusieron escarabajos a diferentes concentraciones de bisulfuro de carbono. El archivo de datos muestra la dosis (dose), el número de escarabajos expuestos (exposed), y el número de escarabajos muertos (killed). Dose Exposed Killed 1.697 59 6 1.7242 6 13 1.7552 62 18 1.7842 56 28 1.8113 63 52 1.8369 59 53 1.861 62 61 1.8839 6 6 26 por StatPoint, Inc. Análisis Probit - 1

STATGRAPHICS Rev. 4/25/27 Para estos datos, la variable dependiente Y es la proporción de escarabajos expuestos a cada dosis que murieron, calculada por Y = Killed / Exposed, es decir, Y = muertos / expuestos. Hay una sola variable predictora X = Dose (dosis). Hay un total de n = 481 sujetos. Ingreso de Datos La caja de diálogo del ingreso de datos solicita información sobre las variables de entrada: Variable Dependiente: una variable numérica que contiene a la variable dependiente Y. Y puede consistir en un conjunto de s proporciones, cada una entre y 1, o un conjunto de n s y 1 s binarios que representan la ocurrencia o no ocurrencia de un resultado. (Tamaño de Muestra): Si Y contiene un conjunto de proporciones, ingrese una columna con los tamaños de muestra correspondientes a cada proporción. Si Y contiene un conjunto de s y 1 s, deje este campo en blanco. Factores Cuantitativos: columnas numéricas que contienen los valores de cualesquiera factores cuantitativos a ser incluidos en el modelo. Factores Categóricos: columnas numéricas o no numéricas que contienen los niveles de cualesquiera factores categóricos a ser incluidos en el modelo. Selección: selección de un subgrupo de datos. 26 por StatPoint, Inc. Análisis Probit - 2

STATGRAPHICS Rev. 4/25/27 Modelo Estadístico El modelo probit relaciona la probabilidad de ocurrencia P del resultado contado por Y con las variables predictoras X. El modelo toma la forma P X ) = Φ ( + X + X +... + ) (1) ( X 1 1 2 2 k k donde Φ(Z) es la función de distribución acumulada normal estándar. Resumen del Análisis El Resumen del Análisis presenta una tabla que muestra el modelo estimado y las pruebas de significancia para coeficientes del modelo. A continuación se muestra una salida típica. Análisis Probit - Killed/Exposed Variable dependiente: Killed/Exposed Tamaños de muestra: Exposed Factores: Dose Modelo Estimado de Regresión (Máxima Verosimilitud) Error Parámetro Estimado Estándar CONSTANTE -34.9349 2.65395 Dose 19.7277 1.4962 Análisis de Desviación Fuente Desviación Gl Valor-P Modelo 274.83 1. Residuo 1.1198 6.1197 Total (corr.) 284.22 7 Porcentaje de desviación explicado por el modelo = 96.4392 Porcentaje ajustado = 95.318 Pruebas de Razón de Verosimilitud Factor Chi-Cuadrada Gl Valor-P Dose 274.83 1. Análisis de Residuos Estimación n 8 MSE.131797 MAE.562163 MAPE 17.4188 ME -.211148 MPE -3.25668 Validación La salida incluye: Resumen de los Datos: un resumen de los datos que fueron ingresados. Modelo Estimado de Regresión: estimaciones de los coeficientes del modelo de regresión, con errores estándar. 26 por StatPoint, Inc. Análisis Probit - 3

STATGRAPHICS Rev. 4/25/27 Análisis de Desviación: descomposición de la desviación de los datos en un componente explicado (Modelo) y un componente no explicado (Residuo). La Desviación compara la función de verosimilitud de un modelo con el valor más grande que puede alcanzar la función de verosimilitud, de tal forma que un modelo perfecto tendría una desviación igual a. Hay tres renglones en la tabla: 1. Total (corr.) la desviación de un modelo que contiene únicamente un término constante, λ( ). 2. Residuo la desviación que queda después de haber ajustado el modelo. 3. Modelo la reducción en la desviación debida a las variables predictoras, λ( 1, 2,, k ), igual a la diferencia entre los otros dos componentes. El Valor de P para el Modelo prueba si el añadir las variables predictoras reduce significativamente la desviación comparada con un modelo que contiene sólo un término constante. Un Valor de P pequeño (menor de.5 si se trabaja con un nivel de significancia del 5%) indica que el modelo ha reducido significativamente la desviación y es así útil para predecir la probabilidad del resultado estudiado. Un Valor de P pequeño indica que una desviación significativa queda aún en los residuos, así que puede haber un mejor modelo. Porcentaje de Desviación el porcentaje de desviación explicada por el modelo, calculada por medio de ( 1, 2,..., k ) λ( ) 2 λ R = (2) Es similar a una estadística R cuadrada en regresión múltiple, en que va de % a 1%. También se calcula una desviación ajustada con R ( 1, 2,..., k ) λ( ) 2 λ 2 adj p = (3) donde p es igual al número de coeficientes en el modelo ajustado, incluyendo al término constante. Es semejante a la estadística R-cuadrada ajustada en que compensa el número de variables en el modelo. Pruebas de Razón de Verosimilitud una prueba de significancia para cada efecto en el modelo ajustado. Estas pruebas comparan la función de verosimilitud del modelo completo con la del modelo en el cual sólo el efecto indicado ha sido removido. Valores de P pequeños indican que el modelo ha mejorado significativamente por el efecto correspondiente. Análisis de Residuos si un subgrupo de filas en la hoja de datos ha sido excluido del análisis usando el campo Seleccionar en la caja de diálogo de ingreso de datos, el modelo ajustado se usa para hacer predicciones de los valores de Y para estas filas. Esta tabla muestra estadísticas sobre los errores de predicción, definidos por 26 por StatPoint, Inc. Análisis Probit - 4

e i STATGRAPHICS Rev. 4/25/27 = y Pˆ( X ) (4) i i Se incluyen el cuadrado medio del error (CME), el error absoluto medio (EAM), el error porcentual absoluto medio (EPAM), el error medio (EM), y el error porcentual medio (EPM). Estas estadísticas de validación pueden ser comparadas con las estadísticas del modelo ajustado para determinar qué tan bien el modelo predice las observaciones fuera de los datos usados para ajustarlo. El modelo ajustado para los datos del ejemplo es (- 34.9349 19.7277 Dose) P ( Killed ) = Φ + (5) La regresión explica alrededor del 96.4% de la desviación de un modelo sin Dose. El valor de P para Dose es muy pequeño, indicando que es un predictor estadísticamente significativo para la proporción de escarabajos muertos (Killed). Advierta que el valor de P para los Residuos no es significativo, indicando que no queda falta de ajuste significativa sin explicar. Gráfico del Modelo Ajustado El Gráfico del Modelo Ajustado presenta la probabilidad estimada de un resultado P ˆ( X ) versus cualquier variable predictora sola, con las otras variables constantes. 1 Gráfica del Modelo Ajustado con intervalos de confianza del 95.%.8 Killed/Exposed.6.4.2 1.6 1.65 1.7 1.75 1.8 1.85 1.9 Dose Se incluyen en el gráfico límites de confianza para P(X). 26 por StatPoint, Inc. Análisis Probit - 5

STATGRAPHICS Rev. 4/25/27 Gráfico Probit El Gráfico Probit es similar al Gráfico del Modelo Ajustado, excepto que el eje vertical está escalado de manera que el modelo ajustado será una línea recta. porcentaje acumulado 99.9 99 95 8 5 2 5 1.1 Probit(Killed/Exposed) con intervalos de confianza del 95.% 1.6 1.65 1.7 1.75 1.8 1.85 1.9 Dose 26 por StatPoint, Inc. Análisis Probit - 6