IBM SPSS Modeler Premium Mejorar la exactitud de los modelos con datos estructurados y no estructurados, análisis de entidades y análisis de redes sociales Características principales Resuelva procesos de negocio más rápidamente con técnicas de análisis que ofrecen un conocimiento más profundo. Acceda, prepare e integre fácilmente datos estructurados y datos de texto, web y encuestas. Identifique rápidamente y extraiga conceptos y sentimientos del texto en más de 30 idiomas. Mejore la coherencia y la consistencia de los datos actuales con el análisis de entidades. Transforme la información sobre las relaciones para mostrar el comportamiento social de personas y grupos con el análisis de redes sociales. Realice el análisis en el interior de las bases de datos más importantes. es un entorno de trabajo de análisis predictivo y de texto de alto rendimiento que le ofrece un conocimiento sin precedentes de sus datos. Su organización puede lograr resultados superiores y, en última instancia, un retorno positivo de la inversión, ya que este entorno de trabajo le permite basar sus decisiones de negocio críticas en la inteligencia predictiva. Empresas de todos los tipos han descubierto que pueden utilizar la inteligencia predictiva de SPSS Modeler para atraer a clientes, reforzar su fidelidad, disminuir el abandono de clientes de forma más rentable y disminuir el riesgo. Las organizaciones del sector público se han beneficiado del uso de SPSS Modeler para predecir la capacidad de la fuerza laboral, responder proactivamente a problemas de seguridad pública, gestionar el ciclo de vida de los estudiantes, mejorar el rendimiento escolar y resolver muchos otros problemas operacionales. Por medio de datos históricos, SPSS Modeler le permite predecir resultados confiables y adquirir un conocimiento sobre las relaciones que se ocultan en los datos. Este conocimiento le permite resolver cualquier problema de negocio más rápidamente utilizando potentes y probadas técnicas analíticas que ofrecen información con mayor profundidad de los clientes, alumnos o participantes. Pero, qué sucede si la mayoría de sus datos está atrapada en formatos textuales o no estructurados en comentarios, archivos o en la web? El modelado con datos estructurados solamente puede proporcionar una vista incompleta de sus procesos y resultados de negocio.
SPSS Modeler Premium le permite acceder a la inteligencia predictiva contenida en todas las formas de datos. Va más allá del análisis de datos numéricos estructurados e incluye información de datos no estructurados, como la actividad web, comentarios de clientes, mensajes de correo electrónico, artículos y otros, para descubrir relaciones entre conceptos y sentimientos y crear los modelos predictivos más exactos posibles. Sus capacidades de análisis de entidades le permiten mejorar la coherencia y la consistencia de los datos actuales, resolviendo conflictos de identidad en los propios registros. La resolución de identidades es vital en la gestión de la relación con los clientes, la detección del fraude, el blanqueo de dinero y la seguridad. Las capacidades de redes sociales de SPSS Modeler Premium transforman la información sobre las relaciones en indicadores clave de rendimiento que muestran el comportamiento social de personas y grupos. A continuación, puede identificar líderes sociales que influyan en el comportamiento de los demás en la red. Combine estos resultados con otras medidas y podrá crear perfiles completos de personas en los cuales basar sus modelos predictivos. Aumente la productividad, la calidad y la exactitud SPSS Modeler Premium le permite realizar tanto el análisis de texto como la minería de datos en un entorno visual e interactivo. La interfaz gráfica intuitiva facilita la visualización de cada uno de los pasos del proceso de la minería de datos en forma de flujo. El análisis de texto es directo y eficiente, con gráficos interactivos que le ayuden a explorar y visualizar datos y patrones de texto para el análisis instantáneo, así como potentes técnicas de clasificación y categorización que transforman el texto en un activo analítico. Desde la interfaz visual se puede acceder fácilmente a los datos de muchas fuentes e integrarlos en prácticamente cualquier tipo de base de datos, hoja de cálculo o archivo plano (como los archivos de IBM SPSS Statistics, SAS y Microsoft Excel), datos textuales y datos de fuentes Web 2.0 (como los canales RSS), IBM SPSS Data Collection e IBM Cognos Business Intelligence y sistemas heredados con IBM Classic Federation Server y soporte para zdb2 for z/os. Ninguna otra solución de minería de datos ofrece esta versatilidad. Cuando se combina con SPSS Modeler Premium Server, no hay necesidad de mover datos desde grandes bases de datos, ya que el análisis y la minería tiene lugar en la propia base de datos. Esto se traduce en una mejora significativa en el rendimiento analítico. SQL Pushback permite realizar las tareas de preparación y transformación de datos dentro de la base de datos sin que el usuario tenga que escribir código SQL o programación. Los adaptadores de puntuación de SPSS permiten puntuar rápidamente los modelos dentro de la base de datos, lo que se traduce en unas decisiones más rápidas y un mejor ROI. Adicionalmente, es posible acceder directamente a los algoritmos de las bases de datos más importantes con la interfaz intuitiva de SPSS Modeler, y construir y puntuar estos datos dentro del flujo de Modeler soportado con IBM InfoSphere, Microsoft SQL Server, Oracle e IBM Netezza. Con potentes herramientas de automatización, tales como la preparación automática de datos y el modelado automático, SPSS Modeler Premium facilita la preparación de datos para su análisis, la búsqueda del mejor modelo a utilizar y la rápida producción de resultados coherentes y exactos. SPSS Modeler soporta el estándar CRoss-Industry Standard Process for Data Mining (CRISP-DM), que permite a los analistas focalizarse en la resolución de problemas de negocio en lugar de efectuar tareas de programación, y los proyectos se pueden organizar eficazmente utilizando el gestor de proyectos de CRISP-DM. 2
Adopte una mirada más profunda en Con SPSS Modeler Premium puede ser más ágil y focalizarse más en la planificación y la toma de decisiones diarias, gracias a su combinación única de capacidades. Le permite tener una mejor comprensión de su organización, el entorno en el que opera, sus clientes y otros participantes. Estas funciones incluyen: Análisis de entidades. Las organizaciones con frecuencia combinan múltiples orígenes de datos. Pero, qué sucede si no existe una clara coincidencia entre registros? Las capacidades de análisis de entidades de SPSS Modeler Premium le permiten descubrir estas relaciones y ofrecer conciencia no obvia de identidades y relaciones. Le permite consolidar registros cuando proceda, o mantenerlos separados. El análisis de entidades es crítico para la seguridad de fronteras, la detección del fraude y la correcta identificación de presuntos delincuentes. Pero también es enormemente útil para las empresas que desean evitar la presentación de distintas ofertas a la misma persona en una campaña de marketing o para garantizar la construcción de modelos exactos. Análisis de redes sociales. Descubra las relaciones entre entidades sociales y las implicaciones resultantes de estas relaciones en el comportamiento de cada persona. Las capacidades de análisis de redes sociales de SPSS Modeler Premium son particularmente útiles para sectores como el de telecomunicaciones, preocupados por el abandono de clientes. Puede identificar grupos, líderes de grupos y si otros abandonarán en base a su influencia. Consiste en dos funciones que mejoran en gran medida los modelos para predecir el abandono: Análisis de grupos Identificar grupos en los datos y quiénes son sus líderes. Análisis de difusión Utilizar la información de abandono existente para determinar cuáles son los abandonos actuales y qué les influirá para abandonar. Análisis de Big Data. se integra fácilmente con bases de datos de IBM y de otros proveedores, lo cual permite desplegar modelos y puntuarlos con mayor rapidez y eficiencia. Los datos se pueden puntuar en la base de datos y en tiempo real con datos transaccionales tales como transacciones de ventas de gran volumen, servicio al cliente y reclamaciones. Integración del software de IBM Cognos. Los analistas pueden acceder directamente a datos estructurados a través del software Cognos Business Intelligence para evaluar de forma rápida y fiable la probabilidad de resultados específicos. Puede crear inteligencia predictiva recogida de la opinión de un cliente, que combina datos estructurados y no estructurados disponibles para los usuarios de negocio y todos los participantes que dependen de dashboards de Cognos. Funcionalidad de IBM Netezza. Realice análisis en la base de datos en el dispositivo de Netezza para construir y desplegar aplicaciones de análisis con una escala de tamaño solamente alcanzable por los supercomputadores actuales. Adicionalmente, SPSS Modeler Premium puede extraer conocimientos a partir de los datos de texto, lo que permite a las organizaciones: Recibir resultados más rápidos y más exactos al analizar textos de banca, seguros o publicidad, emoticones y dialectos con nuevos paquetes y plantillas de análisis de texto sectoriales. Crear estructuras de categorización jerárquica para organizar conceptos más lógicamente y con mayor detalle. Importar categorías predefinidas, incluyendo categorías jerárquicas, anotaciones y descriptores de palabras clave, y exportarlas a Excel. Guardar categorías jerárquicas para su reutilización con una técnica mejorada de agrupación de redes semánticas para la construcción de categorías. Extraer textos más rápidamente y con más precisión, especialmente al trabajar con conjuntos de datos grandes, aprovechando las nuevas redes semánticas sensibles sectoriales y el uso más eficiente del hardware. Definir y probar reglas en texto de ejemplo antes de aplicarlas en los datos, utilizando el editor mejorado de reglas de enlaces de texto. 3
Explorar un conjunto más grande de datos. Solamente con SPSS Modeler Premium puede acceder directamente a datos de texto, web y encuestas, e integrar estos tipos adicionales de texto en sus modelos predictivos para la formulación de recomendaciones más útiles y la obtención de mejores resultados y con análisis de entidades para asegurarse de que se están utilizando los mejores datos para el modelado. Mediante un probado proceso de extracción lingüística de procesamiento de lenguaje natural (NLP), SPSS Modeler Premium extrae conceptos clave de numerosos tipos de datos no estructurados y los agrupa en categorías. El entorno de trabajo de minería de texto interactivo le permite ahorrar tiempo y esfuerzo, ayudándole a adquirir una ventaja competitiva. A diferencia de otras herramientas de análisis de texto, no se necesita tener formación lingüística para poder utilizarla. Puede personalizar fácilmente diccionarios de conceptos para un área de conocimiento concreta por medio del Editor de recursos, un recurso integrado para la gestión del proceso de extracción de texto. Esto le permite encontrar conceptos y asociaciones relevantes más rápidamente. Los conceptos, opiniones y categorías extraídos se combinan con los datos estructurados y se aplican en modelos predictivos para desvelar conocimientos valiosos ocultos en acciones, comportamientos, patrones y asociaciones. SPSS Modeler Premium incluye plantillas personalizables y bibliotecas para aplicaciones de negocio específicas. Los recursos lingüísticos soportan una serie de sectores industriales y aplicaciones, incluyendo el análisis de sentimientos, CRM, seguridad e inteligencia, inteligencia de mercado, biotecnología (genoma y MESH) y TI. También soporta varios idiomas, incluyendo textos en Holandés, Inglés, Francés, Alemán, Italiano, Japonés, Portugués y Español. La versión de idioma Inglés también incluye una interfaz que es compatible con las opciones de traducción de terceros. Gran surtido de técnicas SPSS Modeler Premium ofrece un conjunto de técnicas avanzadas de minería de datos, diseñadas para satisfacer las necesidades de cada una de las aplicaciones de minería de datos, incluidos los siguientes algoritmos de minería de datos: Algoritmos de clasificación. Realice predicciones o previsiones en base a datos históricos utilizando técnicas tales como árboles de decisión, redes neuronales, regresión logística, máquinas vectoriales de soporte, regresión de Cox, modelos mixtos lineales generalizados (GLMM), etc. Utilice el modelado de clasificación automática para resultados tanto binarios como numéricos para agilizar la creación de modelos. Algoritmos de segmentación. Agrupe personas o detecte patrones inhabituales con conglomerados automáticos, detección de anomalías y técnicas de redes neuronales de conglomerados. Utilice la clasificación automática para aplicar múltiples algoritmos en un solo paso y eliminar la intuición en la selección de la técnica adecuada. Algoritmos de asociación. Descubra asociaciones, enlaces o secuencias utilizando Apriori, CARMA y la asociación secuencial. Series de tiempo y previsiones. Genere previsiones para una o varias series de tiempo utilizando técnicas de modelado estadístico. Soporte la minería de datos en toda la empresa SPSS Modeler Premium puede analizar eficazmente los volúmenes de datos que habitualmente se generan en las pequeñas y medianas organizaciones. Las organizaciones con requisitos de alto volumen o de minería de datos compleja pueden aprovechar SPSS Modeler Premium Server. Por medio de una arquitectura cliente/servidor, SPSS Modeler Premium Server hace posible que muchos analistas de datos trabajen simultáneamente sin agotar los recursos informáticos. La versión empresarial soporta minería en la base de datos en las principales plataformas de información y procesa eficazmente grandes volúmenes de datos. SPSS Modeler Premium Server también ofrece opciones adicionales de implantación que le ayudan a extender las ventajas del análisis predictivo en las líneas funcionales o geográficas, así como poner rápidamente los resultados en las manos de los responsables de la toma de decisiones. Por ejemplo, para facilitar la gestión de sus activos analíticos y automatizar los procesos analíticos, utilice SPSS Modeler Premium con IBM SPSS Collaboration and Deployment Services. 4
Características de Comprensión de los datos Crear un amplio conjunto de gráficos interactivos con asistencia automática Utilizar el análisis visual de enlaces para ver asociaciones en los datos Interactuar con los datos seleccionando regiones o elementos de un gráfico y visualizando la información seleccionada; o seleccionar datos clave para su uso en el análisis Acceder a gráficos y herramientas de elaboración de informes de SPSS Statistics directamente desde la interfaz de SPSS Modeler Premium Preparación de los datos Algoritmos de modelado incluidos Acceder a datos operacionales desde orígenes de datos Cognos Business Intelligence, IBM DB2, Oracle, Microsoft SQL Server, IBM Informix, IBM Netezza, mysql (Oracle) y Teradata, así como datos de mainframe a través de zdb2 y soporte de IBM Classic Federation Server Importar archivos de texto delimitados y de anchura fija, archivos SPSS Statistics, SAS, orígenes de datos SPSS Data Collection o XML Elegir entre las distintas opciones de limpieza de datos disponibles en SPSS Modeler Premium para eliminar o sustituir datos no válidos, imputar automáticamente valores perdidos y mitigar valores extremos o atípicos Utilice la analítica de entidades para combinar o separar registros, lo que se traduce en unos datos más nítidos para el modelado Aplicar la preparación automática de datos para interrogar y condicionar los datos para su análisis en un solo paso Acceder a la gestión de datos y las transformaciones realizadas en SPSS Statistics directamente en SPSS Modeler Utilizar el filtrado de campos, denominación, derivación, intervalos, recategorización, sustitución de valores y reordenación de campos Aplicar la selección de registros, muestreo (incluyendo el muestreo conglomerado y estratificado), fusión (incluyendo uniones internas, uniones externas completas, uniones externas parciales y anti-uniones) y concatenación; clasificación, agregación y equilibrado. Elegir entre opciones para la reestructuración, el particionamiento y la transposición de datos Selección de amplias funciones de series: creación de series, sustitución, búsqueda y coincidencia, eliminación de espacios en blanco y truncamiento Aplicar puntuación RFM (Recencia, Frecuencia y Monetario): agregar transacciones de cliente para proporcionar puntuaciones y combinarlas para producir un análisis RFM completo Identificar grupos en los datos y los que se consideran que son sus líderes con Análisis de grupos Utilizar información de abandono para determinar a quién más probablemente influirá una persona que abandone, con el análisis de difusión Exportar datos a bases de datos, paquetes IBM Cognos Business Intelligence, SPSS Statistics, SPSS Data Collection, archivos de texto delimitado, Excel, SAS o XML Detección de anomalías Detectar registros inhabituales mediante el uso de un algoritmo de conglomeración Apriori Algoritmo de descubrimiento de asociación popular con funciones avanzadas de evaluación Redes bayesianas Modelos probabilísticos gráficos C&RT, C5.0, CHAID y QUEST Algoritmos de árbol de decisiones que incluyen la construcción de árboles interactivos CARMA Algoritmo de asociación que soporta múltiples consecuencias Regresión de Cox Calcular el momento probable de un evento Lista de decisión Algoritmo de construcción de reglas interactivo Factor/PCA, Selección de características Algoritmos de reducción de datos Algoritmos de minería en base de datos para IBM InfoSphere*: Asociación, conglomerado, árbol de decisiones, regresión logística, Naive Bayes, regresión, secuencia, series de tiempo Algoritmos de minería en base de datos para IBM Netezza*: red Bayes, árboles de decisión, conglomerados divisibles, lineal generalizado, medias K, KNN, regresión lineal, Naive Bayes, PCA, árbol de regresiones, series de tiempo Algoritmos de minería en base de datos para Microsoft SQL Server*: reglas de asociación, conglomerados, árbol de decisiones, regresión lineal, Naive Bayes, red neuronal, conglomerado secuencial, series de tiempo Algoritmos de minería en base de datos para Oracle*: Bayes adaptable, Apriori, inteligencia artificial (AI), árbol de decisión, modelo lineal general (GLM), medias K, longitud de descripción mínima (MDL), Naive Bayes, factorización de matriz no negativa, conglomerados O (conglomerados de particionamiento ortogonal), máquina vectorial de soporte Medias K, Kohonen, dos pasos, discriminante, máquina vectorial de soporte (SVM) Algoritmos de conglomerado y segmentación KNN Algoritmo de modelado y puntuación de elemento afín Regresión logística Para resultados binarios Redes neuronales Perceptrones multicapa con aprendizaje de propagación retrospectiva y redes de función básica radial Regresión, lineal, GenLin (GLM),modelos mixtos lineales generalizados (GLMM) Modelado de ecuaciones lineales Modelo de respuesta de autoaprendizaje (SLRM) Modelo bayesiano con aprendizaje incremental Secuencia Algoritmo de asociación secuencial para el análisis de orden sensible Máquina vectorial de soporte Algoritmo avanzado con rendimiento preciso para conjuntos de datos amplios Series de tiempo Generar y seleccionar automáticamente modelos de previsiones de series de tiempo *Capacidad solamente con Server 5
Características de (continuación) Modelado y evaluación Emplear un amplio conjunto de algoritmos de minería de datos con numerosas funciones avanzadas para obtener los mejores resultados posibles de sus datos. Utilizar la clasificación automática (binaria y numérica) y de conglomerados en lugar de la selección de algoritmos individuales Utilizar examinadores de ecuaciones y modelos interactivos y ver salida estadística avanzada Mostrar el impacto relativo de atributos de datos en los resultados previstos con gráficos de importancia variable Visualizar los resultados analíticos en mapas geográficos Combinar múltiples modelos (modelado conjunto) o utilizar un modelo para analizar un segundo modelo Utilizar SPSS Modeler Component-Level Extension Framework (CLEF) para integrar algoritmos personalizados Utilizar el lenguaje de programación estadística R para extender las opciones de análisis, mediante la integración de SPSS Statistics Despliegue Exportar modelos utilizando SQL o PMML (el formato estándar basado en XML para modelos predictivos) Utilizar IBM SPSS Collaboration and Deployment Services para la gestión de analítica innovadora, la automatización de procesos y las capacidades de despliegue Funciones de comprensión y preparación específicas de texto Extraer datos de texto de archivos, bases de datos operacionales y canales RSS (por ejemplo, blogs, canales web) Seleccionar opciones de extracción de idioma nativo para Holandés, Inglés, Francés, Alemán, Italiano, Portugués, Español o Japonés o traducir prácticamente cualquier idioma utilizando software de traducción de terceros Extraer conceptos específicos de dominio como unitérminos, expresiones, abreviaciones, acrónimos, etc. Calcular sinónimos utilizando sofisticados algoritmos lingüísticos e incorporados o recursos lingüísticos especificados por el usuario Nombrar conceptos por persona, organización, término, producto, ubicación y otros tipos definidos por el usuario Extraer entidades no lingüísticas tales como direcciones, moneda, hora, número de teléfono y número de la Seguridad Social Utilizar y personalizar plantillas predefinidas y bibliotecas para análisis del sentimiento, CRM, seguridad e inteligencia, inteligencia de mercado, biotecnología y TI Aprovechar Paquetes de análisis de texto (TAPs) preempaquetados para las aplicaciones de negocio más comunes, o crear paquetes propios Crear conglomerados basados en la ocurrencia de términos utilizando algoritmos de conglomeración de conceptos, que proporcionan una visión rápida de los temas principales y la forma en que están relacionados entre sí Agrupar inteligentemente documentos de texto y registros en base a contenidos, utilizando algoritmos de clasificación de texto Habilitar la selección y deselección de conceptos avanzados para su uso en el modelado predictivo Utilizar informes visuales y basados en texto para interrogar relaciones, aparición, frecuencia y tipo de conceptos Análisis de enlaces de texto Identificar y extraer sentimientos (por ejemplo, me gusta y no me gusta ) de texto en Holandés, Inglés, Francés, Alemán y Español Identificar enlaces y relaciones entre, por ejemplo, personas y eventos o enfermedades y genes Identificar y extraer contenidos de URLs de blogs Incluir opiniones, relaciones semánticas y eventos enlazados en modelos predictivos desplegables Revelar relaciones complejas mediante gráficos interactivos que muestran múltiples enlaces semánticos entre dos conceptos SPSS Modeler Server* Utilizar la minería en base de datos para construir modelos en la base de datos utilizando tecnologías líderes de base de datos y aprovechar implementaciones de bases de datos de alto rendimiento Utilizar el SQL-pushback para enviar transformaciones de datos y seleccionar algoritmos de modelado directamente en sus bases de datos operacionales Puntuar datos en la base de datos, lo que se traduce en una mejora significativa del rendimiento, mediante adaptadores de puntuación de IBM SPSS Modeler Server Aprovechar hardware de alto rendimiento, incluyendo máquinas IBM System z, para experimentar una resolución más rápida y lograr un mayor ROI mediante la ejecución en paralelo de flujos y múltiples modelos Transmitir datos sensibles de forma segura entre SPSS Modeler Client y SPSS Modeler Server a través del cifrado de capa de sockets segura (SSL) *Capacidad solamente con Server 6
Acerca de IBM El software IBM proporciona conocimientos útiles que necesitan los responsables de la toma de decisiones para lograr un mejor rendimiento del negocio. IBM ofrece un conjunto completo y unificado de Business Intelligence, análisis predictivo y avanzado, gestión del rendimiento financiero y de la estrategia, gobierno, riesgo y cumplimiento normativo y aplicaciones analíticas. Con el software de IBM, las empresas pueden detectar tendencias, patrones y anomalías, comparar escenarios what-if, predecir amenazas y oportunidades potenciales, identificar y gestionar los principales riesgos de negocio, así como planificar, elaborar presupuestos y hacer previsiones de recursos. Con estas profundas capacidades analíticas, nuestros clientes de todo el mundo pueden conocer mejor, anticiparse y dar forma a sus resultados de negocio. Para más información Para obtener más información, visite ibm.com/es/analytics Solicite una llamada Para solicitar una llamada o hacer una pregunta, vaya a ibm.com/es/analytics. Un representante de IBM responderá su pregunta lo antes posible. 7
IBM España, S.A. Tel.: 902 022 002 C/Santa Hortensia, 26-28 28002 Madrid La página de inicio de IBM se encuentra en: ibm.com IBM, logotipo de IBM, ibm.com, Cognos y SPSS son marcas registradas de International Business Machines Corp., registradas en numerosas jurisdicciones de todo el mundo. Otros nombres de productos y servicios pueden ser marcas registradas de IBM o de otras empresas. Encontrará una lista actualizada de las marcas registradas de IBM en la Web en Información de copyright y marcas registradas en: ibm.com/legal/copytrade.shtml Este documento es válido en la fecha inicial de publicación y puede estar sujeto a cambios por parte de IBM en cualquier instante. No todas las ofertas están disponibles en todos los países en los que IBM opera. LA INFORMACIÓN DE ESTE DOCUMENTO SE PROPORCIONA TAL CUAL SIN GARANTÍA DE NINGÚN TIPO, NI EXPLÍCITA NI IMPLÍCITA, INCLUYENDO, PERO NO LIMITÁNDOSE, A LAS DE COMERCIALIZACIÓN, ADECUACIÓN A UN PROPÓSITO DETERMINADO Y A LAS GARANTÍAS O CONDICIONES DE NO INFRACCIÓN. Los productos de IBM se garantizan de acuerdo con los términos y condiciones de los acuerdos bajo los que se proporcionan. Copyright IBM Corporation 2012 Por favor, recicle YTD03133-ESES-00