Analizando patrones de datos

Documentos relacionados
Fundamentos de SQL para Minería de Datos

SISTEMA INTEGRAL PARA LA PROYECCIÓN Y DETECCIÓN DE LA PREVENCIÓN DEL DELITO, MEDIANTE MINERÍA DE DATOS.

Técnicas de Minería de Datos

CL_ Quick Microsoft SQL Server 2012 Analysis Services.

SQL SERVER 2008 R2 BI 07/07/2010 BUSINESS INTELLIGENCE

Temario. Introducción Proyecto de inteligencia de Negocios

Sharepoint - BI. SHAREPOINT COMO HERRAMIENTA PARA DESARROLLADORES Y CLIENTES FINALES EN BI Ana María Bisbé York sp@danysoft.com

Microsoft SQL Server e Inteligencia de Negocio con Excel

Fundamentos de SQL para Minería de Datos

TÓPICOS AVANZADOS DE BASES DE DATOS

Temario. Herramientas Microsoft BI Performance Point Dashboard

Base de datos II Facultad de Ingeniería. Escuela de computación.

Gestión de la Información Práctica 1

Aprendizaje Automatizado

MINERÍA DE DATOS. Teleprocesos y Sistemas Distribuidos Licenciatura en Sistemas de Información FACENA - UNNE. Octubre

DISEÑO E IMPLEMENTACIÓN DE SOLUCIONES BUSINESS INTELLIGENCE CON SQL SERVER 2012

SQL Server Business Intelligence parte 1

FACULTAD DE INGENIERÍA

Modelos Multidimensionales con Analysis Services Primeros Pasos

Anexo 11. Manual de Administración

UNIVERSIDAD DE COSTA RICA SISTEMA DE ESTUDIOS DE POSGRADO POSGRADO EN COMPUTACION E INFORMATICA JUSTIFICACIÓN OBJETIVO GENERAL OBJETIVOS ESPECÍFICOS

Modelado dimensional de datos

Soluciones OLAP con Microsoft Analysis Services

MINERIA DE DATOS Y Descubrimiento del Conocimiento

EPB 603 Sistemas del Conocimiento

XII Encuentro Danysoft en Microsoft Abril Business Intelligence y Big Data XII Encuentro Danysoft en Microsoft Directos al código

30 oct. SAP Fraud Management. El Camino a la transparencia. La necesidad Gestionar en tiempo real. El medio Una plataforma in-memory

Minería de Datos. Índice. Raquel M. Crespo García. Julio Villena Román. Definición y conceptos Técnicas y modelos

POSGRADO EXPERTO DBA INTELIGENCIA DE NEGOCIOS

MS_20467 Designing Business Intelligence Solutions with Microsoft SQL Server 2014

1. INTRODUCCIÓN AL CONCEPTO DE LA INVESTIGACIÓN DE MERCADOS 1.1. DEFINICIÓN DE INVESTIGACIÓN DE MERCADOS 1.2. EL MÉTODO CIENTÍFICO 2.

Finanzas e Investigación de Mercados"

Sistemas de predicción Aprendizaje automático Data Mining & Machine Learning

IBM SPSS Statistics. Orden del día

PowerPivot y Modelo Tabular con SQL Server Analysis Services 2012

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

Técnicas Avanzadas de Análisis Predictivo. En Software R

1. INTRODUCCIÓN. Palabras claves: Clustering, K-means, Morbilidad, CRISP-DM, Data Mining.

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

Introducción. Requisitos para el inicio. Derechos de acceso. Elaboración de informes. Information Server Instrucciones de uso.

Comparación de características entre las ediciones Estándar y Enterprise

Big Data & Machine Learning. MSc. Ing. Máximo Gurméndez Universidad de Montevideo

SQL for Analytics Aplicado al análisis de datos. web

Introducción Definición Procesos Técnicas y Algoritmos Principales Usos Software Metodología CRISP - DM Conclusión

MS SQL Server 2014 y La Plataforma de Datos

Tipos de gráficas y selección según los datos CIENCIA, TECNOLOGIA Y AMBIENTE

Métodos Predictivos en Minería de Datos

Aprendizaje Supervisado Árboles de Decisión

Introducción a la Minería de Datos

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

Información General. Al finalizar el curso el alumno será capaz de:

Instalación e implementación de Microsoft Dynamics CRM 2011

Curso Implementing Data Models and Reports with Microsoft SQL Server 2014 (20466)

SECUENCIA DIDÁCTICA. Nombre de curso: Programación Avanzada de Base de Datos Clave de curso: COM0803A21. Módulo Competencia de Módulo:

MS_80546 Sales Management in Microsoft Dynamics CRM 2013

Minería de datos (Fases de la minería de datos)

LÓGICA DE PROGRAMACIÓN

OPTATIVA I: MINERIA DE DATOS

Temario

Procedimiento "Explorar..."

Querying Microsoft SQL Server 2012

TFG Educational Data Mining & Learning Analytics

Selección de fuentes de datos y calidad de datos

Minería de Datos. Profra. Heidy Marisol Marin Castro Universidad Politécnica de Victoria

Objetivos y Temario CURSO ACCESS NIVEL AVANZADO

Inteligencia Artificial y Seguridad Informática. en plataformas Open Source

Desarrollo de DataMarts y Cubos de Información Business Intelligence con SQL. web

Algoritmos de minería de datos incluidos en SQL Server Algoritmo de árboles de decisión de Microsoft [MIC2009a] Cómo funciona el algoritmo

Microsoft Office 2010 Illustrated. Tipos de Software

DIPLOMADO EN MICROSOFT SQL SERVER 2008

Objetivos y Temario CURSO VISUAL BASIC 2010

ESTADÍSTICA SEMANA 2

EXPERTO EN DATA SCIENCE

Web GIS y Big Data en los análisis de tendencias y comportamientos

MS_20483 Programming in C#

Educación superior desde Curso de Prevención de Fraudes. Auditoría. Duración 6 horas. Conocimiento en acción

Métodos de Búsqueda para juegos humano-maquina. PROF: Lic. Ana María Huayna D.

AlwaysOn en SQL Server Andrei Garzón

Big Data para Inteligencia Criminal

Introducción a selección de. Blanca A. Vargas Govea blanca.vargas@cenidet.edu.mx Reconocimiento de patrones cenidet Octubre 1, 2012

SQL Server 2014 Implementación de una solución de Business Intelligence (SQL Server, Analysis Services, Power BI...)

Curso Querying Microsoft SQL Server 2014 (20461)

Instalación de Microsoft SQL Server 2005

CATÁLOGO DE FORMACIÓN SUBVENCIONADA

INSTITUTO MATEMÁTICO Y ACTUARIAL MEXICANO PROGRAMACIÓN AVANZADA CON SAS

CURSOS CONENTO. Una puerta abierta para que puedas desarrollar tus propios análisis

OBTENCIÓN DE PATRONES Y REGLAS EN EL PROCESO ACADÉMICO DE LA UNIVERSIDAD DE LAS CIENCIAS INFORMÁTICAS UTILIZANDO TÉCNICAS DE MINERÍA DE DATOS

PONTIFICIA UNIVERSIDAD CATOLICA DEL ECUADOR TEMA: AUTOR: DIRECTOR:

FACULTAD DE INGENIERÍA

FORMACIÓN AVANZADA EN MICROSOFT EXCEL Funciones avanzadas de Excel para mejorar la gestión y análisis de la información empresarial

Trabajo final de Ingeniería

Transcripción:

Analizando patrones de datos SQL Server DM, Excel DM, Azure ML y R Ana María Bisbé York @ambynet http://amby.net/

Temario Introducción a Minería de datos MS Office Excel Herramientas de tabla y Minería de datos SQL Server Data Tools Analysis Services SQL Server Management Studio Data Mining Extensions (DMX) Lenguaje R MS Azure Machine Learning 2

Introducción Minería de datos y Machine Learning

Análisis de datos para conocer por qué? Descubrir las razones del éxito y el fracaso de la gestión Entender los productos, clientes, y a nosotros mismos En resumen: Obtener el conocimiento para dirigir el negocio sobre la base del análisis de datos Riesgo de un crédito a un cliente Agrupación de clientes Productos o servicios que se adquieren juntos Previsión de ventas Previsión de clientes potenciales 4

La minería de datos en el proceso de búsqueda de conocimiento http://www.csd.uwo.ca/faculty/ling/cs435/fayyad.pdf - 1997 5

El modelo CRISP https://es.wikipedia.org/wiki/cross_industry_standard_process_for_data_mining 6

Algoritmos Directos o supervisados Variable a predecir Clasificación Estimación Previsión Indirectos o no supervisados Patrones Agrupación por afinidad Clustering Descripción 7

Herramientas http://www.techrepublic.com/blog/big-data-analytics/data-scientists-can-find-big-money-inopen-source/ 8

Explorar con TSQL 9

Papel de las estadísticas Permiten tener una idea de los valores Media, mediana, MIN, MAX Descubrir correlaciones sencillas Validar algunas asunciones Visualizar con precisión Histogramas y gráficos de caja (boxplots) 10

Pasos en un proceso de minería de datos Definir (inicializar) el modelo Entrenar el modelo procesar un % de los casos conocidos Validar modelo para puntuar (score) procesar un % de los casos conocidos Comparar las predicciones con datos reales 11

MS Office Excel Herramientas de tabla y Minería de datos

Minería de datos con MS Excel

Detección fraudes o anomalías con DM Excel

SQL Server Analysis Services Data Tools

Validar modelos

Realizar predicciones en SSAS

SQL Server Management Studio Visores

Naive Bayes en SSAS

Redes neuronales en SSAS

Clustering en SSAS

Árbol de decisión en SSAS

Contenido Genérico del modelo

SQL Server Management Studio Data Mining Extensions (DMX)

Contenido del modelo

Detección de fraudes o anomalías con DMX

Realizar predicciones

Lenguaje R

Lenguaje R Código abierto, gratuito Disponible para Windows, Mac, Unix http://cran.r-project.org Comunidad enorme y muy activa Todo incluido: lenguaje e IDE Más de 5000 paquetes Visible desde Azure ML 29

Explorar datos con R - Raffle

Explorar datos con R - Raffle

Correlación en datos con R - Raffle

Modelado desde R - Rattle

R para desarrollador SQL Paquete dplyr Ejemplos de comandos Filter Select Arrange Mutate Summarise Group_By Base de datos SQL Tabla Columna o campo Fila Programación R Data frame Columna o variable Observación 34

R Estadísticas

R para obtener gráficos Paquete ggplot ggplot (df_dm, aes(región, fill=educación)) + geom_bar() ggplot(df_dm, aes(ocupación) ) + geom_histogram(color = "white") + facet_grid(estadocivil ~.) 36

MS Azure Machine Learning

Algoritmos MS Azure Machine Learning

Microsoft Azure Machine Learning

Azure ML - Cargar datos

Azure ML - Experimento

Azure ML Explorar datos

Azure ML Seleccionar columnas

Azure ML Dividir la muestra

Azure ML Algoritmos de clasificación

Azure ML Entrenar modelos

Azure ML Medir (score)

Azure ML Evaluar modelos

Azure ML Visualizar resultados

Conclusiones Minería de datos Búsqueda de conocimiento Mayor parte del proyecto Exploración de datos Limpieza Definición de atributos o variables Modelado Evaluación Implementación 50

Gracias por su atención Follow @pass24hop Comparta sus opinions con hashtags #pass24hop & #sqlpass

Preguntas?