IBM SPSS Missing Values

Documentos relacionados
IBM SPSS Direct Marketing

IBM SPSS Forecasting. Construya pronósticos como un experto rápidamente. IBM Software Business Analytics IBM SPSS Forecasting 22

IBM SPSS Custom Tables

IBM SPSS Categories. Prediga resultados y revele relaciones en sus datos categóricos. IBM Software Business Analytics IBM SPSS Categories 22

IBM SPSS Amos. Pruebe las relaciones en modelos actitudinales y de comportamiento. Características

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

IBM SPSS Data Preparation

INDICE. Prólogo a la Segunda Edición

IBM SPSS Direct Marketing

Instrucciones para la instalación de IBM SPSS Data Access Pack para Linux

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

IBM SPSS Decision Trees

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Selección de fuentes de datos y calidad de datos

IBM SPSS Missing Values 22

BREVE DESCRIPCIÓN DEL PROGRAMA

INDICE. Introducción Capitulo uno. La idea nace un proyecto de investigación Como se originan las investigaciones? 2 Resumen Conceptos básicos

Roadshow ECM Proyecto Imaging & Workflow Barclays. Miguel Ángel García de la Cruz

CM0244. Suficientable

CAPITULO III METODOLOGÍA

LA CAPACIDAD DE UN PROCESO DE CUMPLIR LOS REQUISITOS DEL CLIENTE DEPENDE DE SU VARIABILIDAD.

Análisis de datos Categóricos

Seguridad en Aplicaciones Críticas; SAT. Carlos Jiménez González

Diplomado en Estadística Aplicada

PROGRAMA DE ESTUDIOS. - Nombre de la asignatura : Taller de herramientas Estadísticas. - Pre requisitos : LCP 219 Estadística

Phone Manager Mobile Guía rápida de referencia ABRIL 2016 DOCUMENT RELEASE 4.3 GUÍA RÁPIDA DE REFERENCIA

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Oracle Document Capture 10gR3 OCR. An Oracle White Paper Mayo 2009

SAP Banking Forum Millennials live. Buenos Aires, Agosto 2014

INGENIERÍA EN TECNOLOGÍAS DE LA INFORMACIÓN

BIOESTADÍSTICA APLICADA EN CIENCIAS DE LA SALUD (I EDICIÓN)

El ejemplo: Una encuesta de opinión

RECOLECCIÓN DE DATOS (ENFOQUE CUANTITATIVO) DRA. MIRIAM RODRÍGUEZ VARGAS Dr. JORGE ALBERTO PÉREZ CRUZ

Hoja de trabajo de configuración de EMC VNXe

IMPORTANCIA DE LOS ENSAYOS DE APTITUD TRATAMIENTO ESTADÍSTICO DE LOS RESULTADOS

1: INTRODUCCIÓN AL USO DE LA HOJA DE CALCULO EXCEL COMO HERRAMIENTA PARA DESARROLLAR PROBLEMAS EN INGENIERÍA. SOLVER, REGRESION LINEAL MULTIPLE

Bachillerato Internacional. Matemáticas Nivel Medio. Programa para el curso 1º ( )

Y accedemos al cuadro de diálogo Descriptivos

Metodología de Implantación Rational en INSA: Objetivo CMMI

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

Servicio de Reclamos Amadeus Guía Rápida

Nivel Intermedio. A comprender de forma activa conceptos fundamentales de estadística. Crear bases de datos estadísticos.

MANEJO DE VARIABLES EN INVESTIGACIÓN CLÍNICA Y EXPERIMENTAL

Escuela Nacional de Estadística e Informática ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO ESCUELA PREPARATORIA TEXCOCO

Universidad Diego Portales

Manual de Usuario. Visualizador Geográfico - SNIESE

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Lidiando con el contenido no estructurado. An Oracle White Paper Junio 2009

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

CARGA HORARIA Horas totales: 80 Horas totales de resolución de problemas de aplicación: 32

ESTADÍSTICA SEMANA 2

Medidas descriptivas I. Medidas de tendencia central A. La moda

Ing. Eduardo Cruz Romero w w w. tics-tlapa. c o m

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

BMW: A toda máquina junto con la tecnología de SAP

ANALISIS DEL CICLO DE VIDA

ESTADÍSTICA DESCRIPTIVA

Consideraciones sobre la alimentación. Guía de instalación y operación Número de referencia Rev. 02. EMC Gabinetes VNXe3300 de CC

Buildtek: La evolución del negocio con SAP

Reproductor multimedia de red, formato pc de ranura NMP711-P10 Equipado con un potente procesador Intel

Microsoft Virtualization para profesionales de Vmware

Gráfico de Desgaste de Herramientas

Instrucciones para la instalación de IBM SPSS Data Access Pack para Windows

Guía docente 2007/2008

INDICE Parte 1. Introducción a la Investigación de Mercados en la Toma de

White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por:

Unidad 5 Control Estadístico de la Calidad. Administración de Operaciones III

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS

Propuesta de posiciones.

Metodología II: Análisis de Datos. Prof. Reinaldo Mayol Derecho

Liberación de Notas de Crédito.

Creación y Actualización de Descuentos.

Manual de usuario MetaTrader 4 TraderNovo:

Fundamentos de Estadística y Simulación Básica

Computación Aplicada. Universidad de Las Américas. Aula virtual de Computación Aplicada. Módulo de Excel 2013 LIBRO 10

Granjas Kaki: Consolidando el control con SAP

INDICE 1. Introducción a la Contabilidad de Costos y la Administración de Costos Parte 1. Conceptos Básicos de la Administración de Costos

CURSO VIRTUAL. Acceso a fuentes de información y manejo de redes sociales. Módulo 2

Hortimex adquiere flexbilidad con SAP

ÍNDICE. Introducción... Capítulo 1. Características, instalación, inicio y entorno de trabajo... 1

PROGRAMA INSTRUCCIONAL ESTADÍSTICA

INDICADORES MULTIVARIADOS DE CAPACIDAD DE PROCESOS. SU EFICIENCIA BAJO DISTRIBUCIONES NORMALES.

Simplifique sus Diseños con Autodesk Inventor Professional 2013

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

LECTURA 01: LA ESTADÍSTICA. TÉRMINOS DE ESTADÍSTICA. RECOLECCIÓN DE DATOS TEMA 1: LA ESTADISTICA: DEFINICION Y CLASIFICACION

Cómo convertirse en un negocio en tiempo real con SAP Business Suite basado en SAP HANA

Gestión del Capital Humano

IBM SPSS Statistics Versión 24. Instrucciones de instalación para Windows (Licencia de usuario autorizado) IBM

Servicio de Reclamos Amadeus Guía Rápida

Líderes Innovadores en Tecnología CAD & GIS. Visítanos en el stand S23. (al costado del ingreso al Salón de Conferencias TIPON)

1. VALORES FALTANTES 2. MECANISMOS DE PÉRDIDA

Universidad Autónoma Metropolitana Unidad Azcapotzalco. División de Ciencias Básicas e Ingeniería. Licenciatura en Ingeniería en Computación

Comesa Ltda.: Comercializa con más precisión y rapidez gracias a SAP

MERCER COLLEGE PROGRAMA DE CAPACITACIÓN EN GESTIÓN DE CAPITAL HUMANO

Transcripción:

IBM SPSS Missing Values Complete datos para construir mejores modelos Los investigadores de mercados, sociales, mineros de datos y muchos otros profesionales confían en IBM SPSS Missing Values para validad sus datos de investigación Características Fácilmente examine datos desde diferentes ángulos Rápidamente diagnostique problemas de datos perdidos Reemplace valores perdidos con estimados Despliegue los tipos de datos perdidos y cualquier valor extremo Cuando ignora o excluye valores perdidos incurre en el riesgo de encontrar resultados inválidos o irrelevantes. Utilice IBM SPSS Missing Values para imputar los valores perdidos y extraer conclusiones válidas. IBM SPSS Missing Values es una herramienta fundamental para quienes se preocupan por la validez de sus datos. Examine reportes de diagnóstico para descubrir patrones de datos omitidos. Entonces, estudie los estadísticos de resumen e impute los valores omitidos mediante algoritmos estadísticos. Por ejemplo, mejore las preguntas de sus encuestas que ha identificado como confusas basándose en los patrones de datos perdidos. Inclusive podrá determinar si los valores perdidos para una variable están relacionados con los valores perdidos de otra con un cruce de porcentajes de patrones en una tabla. Usted tal vez encuentre que los encuestados que omitieron una pregunta sobre el ingreso también omitirán la pregunte sobre el nivel de educación. Utilice esta información para incrementar la calidad de sus encuestas en el futuro. Diagnostique los datos omitidos de forma rápida y sencilla Diagnostique rápidamente la existencia de un problema grave de datos perdidos empleado el reporte sobre patrones de datos que provee una visión general de cada caso. Este reporte le ayuda a determinar el alcance de los datos omitidos, proporcionando una instantánea de cada tipo de valor omitido; así como los valores característicos de cada caso. Utilice la prueba t de varianzas separadas y la tabulación cruzada de categorías para averiguar si existen diferencias significativas entre quienes responden y quienes no lo hacen. Estos reportes le ayudarán a decidir si los datos omitidos pueden causar problemas en el análisis. Reciba un resumen de los patrones de valores perdidos que resalta el conjunto de variables que comprometen los patrones con los reportes de patrones tabulados.

Utilice la imputación múltiple para reemplazar los datos de valores perdidos En IBM SPSS Missing Values, el procedimiento de imputación múltiple le ayudará a comprender los patrones de pérdidas en sus datos y le permitirá reemplazar los valores perdidos con los estimados plausibles. Este módulo le proporciona un modo de imputación automática que selecciona el mejor método de imputación basándose en las características de sus datos, mientras que también le permite personalizar el modelo de imputación. El análisis de los conjuntos de datos individuales y la agrupación de resultados se realiza a través de procedimientos estadísticos de IBM SPSS Statistics como el análisis de regresión. Al momento de utilizar los conjuntos de datos con los valores imputados, procedimientos existentes automáticamente producirán conjuntos de parámetros estimados. Obtenga conclusiones más válidas Reemplazar los valores perdidos con estimados incrementa la oportunidad de obtener resultados estadísticos más significativos. Elimine los métodos ocultos y reemplácelos por valores perdidos con estimados para incluir todos los grupos en sus análisis incluso aquellos con bajos niveles de respuesta. Cada módulo de la familia IBM SPSS Statistics ahora puede ser instalado y funcionar de forma independiente o en conjunto con otros módulos. IBM SPSS Statistics Base ya no es un requerimiento, ya que las capacidades de acceso de datos, administración y graficación han sido incorporadas a cada módulo. Esto le proporciona una gran flexibilidad en la instalación y uso del software. IBM SPSS Statistics Base aún está disponible y sigue siendo la base de varios despliegues ya que contiene pruebas y procedimientos estadísticos que son fundamentales para varios análisis. IBM SPSS Missing Values está disponible para su instalación como cliente; pero para un mayor desempeño y escalabilidad puede ser instalado en un servidor. Varios conjuntos de datos son generados (típicamente, de 3 a 5), cada uno con un conjunto diferente de valores de reemplazo. Después, podrá modelar cada conjunto de datos utilizando técnicas tradicionales, como regresión linear para producir parámetros estimados para cada conjunto de datos. Posteriormente, obtenga los parámetros finales estimados. Esto implica reunir los conjuntos individuales de parámetros estimados obtenidos en el paso 2 y realizar estadísticos inferenciales que consideren la variación entre las imputaciones. Obtenga un valor adicional con colaboración Compartir y re-utilizar sus activos eficientemente, protegerlos de forma tal que se cumplan requerimientos internos y externos, y publicar resultados para que varios usuarios pueden visualizarlos e interactuar con ellos es posible con IBM SPSS Collaboration and Deployment Services.

Características Análisis de patrones Presenta los valores perdidos y casos extremos para todos los casos y variables utilizando los patrones de datos de la tabla - Presenta los valores omitidos del sistema y tres tipos de valores omitidos definidos por el usuario - Ordenación ascendente o descendente - Presenta los valores efectivos de las variables especificadas Presenta patrones de valores omitidos para todos los casos con al menos un valor omitido, mediante la tabla de patrones omitidos - Los patrones de valores omitidos similares se muestran agrupados - Ordenación por patrones omitidos y por variables - Presentación de los valores característicos de las variables especificadas Determina diferencias entre grupos omitidos y no omitidos para una variable relacionada mediante la prueba t de varianzas separadas - Prueba t, grados de libertad, media, valor-p, frecuencia Muestra las diferencias entre los datos presentes y omitidos para las variables categóricas en la tabla de Distribución de categorías - Tabulación cruzada de datos omitidos y presentes para cada categoría de una variable por otras variables Evalúa el volumen de datos omitidos en una variable relacionada con los datos omitidos en otra variable, mediante la tabla de Porcentaje de patrones no coincidentes - Ordena la matriz por patrones o variables de valores omitidos Identifica todos los patrones únicos con la tabla de patrones tabulada, la cual resume todos los patrones de valores perdidos y presenta la frecuencia para cada patrón además de las medias y frecuencias de cada variable - Presenta la frecuencia y media de cada patrón de valor perdido utilizando la sumatoria de la tabla de Patrones de valores perdidos Estadísticos Univariados: cálculo de frecuencia, media, desviación típica y error típico de la media para todos los casos, excluyendo los que contengan valores omitidos y extremos para todas las variables Mediante lista: cálculo de media, matriz de covarianzas y matriz de correlaciones para todas las variables cuantitativas de los casos, excepto los valores omitidos Por parejas: cálculo de frecuencia, media, varianza, matriz de covarianzas y matriz de correlaciones Imputación Múltiple Especifique las variables a imputar y las restricciones de los valores imputados, como los valores mínimo y máximo. También podrá especificar las variables a utilizar como predictoras al momento de imputar valores perdidos de otras variables Impute valores de variables categóricas y continuas. La regresión logística es utilizada para variables categóricas y la regresión lineal para variables continuas. La imputación de la media predictiva es una opción para respuestas continuas; esto asegura que los valores imputados son razonables (entre el rango de los datos originales) El detector del patrón de los datos perdidos le ayuda a determinar cuál es la método de imputación a utilizar Tres métodos de imputación están disponibles: -Monótono: un método eficiente para datos que tienen patrones monótonos de pérdida -Especificación completamente condicional (FCS): un método iterativo de cadenas de Markov Monte Carlo (MCMC) que es apropiado cuando los datos cuentan con patrones de pérdida arbitrario (monótono o no monótono) -Automático: escanea los datos para determinar el mejor método de imputación (monótono o FCS) Especifica: - El número de imputaciones - El rango de valores imputados - Los efectos de interacción utilizados en la imputación - Opcionalmente, cancele la imputación para variables que tienen un porcentaje - Niveles de tolerancia para verificar la singularidad También podrá, especificar una variable que contenga las ponderaciones del análisis. El procedimiento incorpora ponderaciones en los modelos de regresión y en los modelos de clasificación utilizados para imputar valores perdidos. Las ponderaciones de los análisis también se utilizan en los resúmenes de valores imputados (por ejemplo, desviación estándar y error estándar) Despliegue de un resumen total de pérdidas en sus datos, así como también el resumen de imputación y del modelo de imputación para cada variable a la cual se le imputaron valores. Podrá realizar un análisis de valores

perdidos variable por variables, así como también patrones tabulares de estos valores. Opcionalmente, obtenga estadísticos descriptivos para los valores imputados Resumen de gráficos de pérdidas para casos, variables, y valores de celdas Solicitud de un archivo de Statistics que contenga valores imputados y/o un historial de iteraciones FCS Conjuntos de datos de imputaciones múltiples pueden ser analizados utilizando los procedimientos analíticos para obtener estimaciones paramétricas finales (combinadas) que consideran la incertidumbre inherente en los varios conjuntos de valores imputados Sobre IBM SPSS Business Analytics El software de IBM SPSS Business Analytics le proporciona conocimiento a través de sus datos que le ayuda a las organizaciones a trabajar de manera más inteligente y a superar a sus competidores. Este portafolio incluye soluciones para inteligencia de negocios, análisis predictivo, administración de decisiones, del desempeño y del riesgo. Las soluciones Business Analytics le permiten a las empresas identificar y visualizar tendencias y patrones en áreas como análisis de clientes, la cual tiene un efecto importante en el desempeño. Análisis Soporta procedimientos de análisis de imputaciones múltiples (nota: tiene que haber adquirido el módulo apropiado para este análisis) Procedimientos descriptivos: frecuencias, descriptivos, tablas cruzados, correlaciones, correlación no paramétrica, correlación parcial Comparación de medias: medias, pruebas t, pruebas no paramétricas, ANOVA, ANOVA univariada Modelos: Modelo Lineal General, Modelo Lineal Generalizado, regresión lineal, regresión logística multinomial, regresión logística binaria, análisis discriminante, regresión ordinal, modelos lineales mixtos Técnicas de análisis de supervivencia: regresión de Cox Diagnóstico Pooling Diagnóstico Pooling de resultados: los resultados son agrupados utilizando uno de dos niveles de los procedimientos de agrupamiento de parámetros Diagnóstico Pooling - Incremento relativo en la varianza: medida de variabilidad relativa en estimaciones paramétricas a través de las imputaciones - Fracción de información perdida: incremento relativo en la variable de escala como proporción. Una medida de incertidumbre debido a las no respuestas - Eficiencia relativa: estimación de la eficiencia para M imputaciones en relación para un número infinito de imputaciones Obtención del modelo PMML para el cálculo de parámetros agrupados: regresión lineal, Modelos Lineales Generalizados, regresión logística multinomial, regresión logística binaria, análisis discriminante, regresión de Cox

Copyright IBM Corporation 2012 IBM Corporation Software Group Route 100 Somers, NY 10589 IBM, the IBM logo, ibm.com and SPSS are trademarks of International Business Machines Corporation registered in many jurisdictions worldwide. Other product and services names might be trademarks of IBM or other companies. A current list of IBM trademarks is available on the Web at Copyright and trademark information at www.ibm.com/legal/copytrade.shtml BeSmart, antes AMSS Mardoqueo Fernández 207 Providencia Santiago F: +56 224153478 M: conversemos@besmart.cl The content in this document (including currency or printing references which exclude applicable taxes) is current as of the initial date of publication and may be changed by IBM at any time. Not all offerings are available in every country in which IBM operates. THE INFORMATION IN THIS DOCUMENT IS PROVIDED AS IS WITHOUT ANY WARRANTY, EXPRESS OR IMPLIED, INCLUDING WITHOUT ANY WARRANTIES OF MERCHANT ABILITY, FITNESS FOR A PARTICULAR PURPOSE AND ANY WARRANTY OR CONDITION OF NON-INFRIGEMENT. IBM products are warranted according to the terms and conditions of the agreements under which they are provided.