Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 12 -



Documentos relacionados
Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

EL ANÁLISIS DE CONGLOMERADOS EN LOS ESTUDIOS DE MERCADO

Mineria de datos y su aplicación en web mining data Redes de computadores I ELO 322

Análisis de estados financieros. Sesión 8: Análisis del capital contable

Jose Mª Cervera Casanovas

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

Parte I: Introducción

Reporte Registro de Personas con Discapacidad

EJEMPLO. Práctica de clustering

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

Cultura de Calidad. Técnicas para medir el valor al cliente. Objetivo de aprendizaje del tema

Gestión de Empresas Visual e Interactiva E.R.P.

Habits España Geomarketing y segmentación

El plan de mercadeo. Material de apoyo. El plan de mercadeo

SEGURIDAD Y PROTECCION DE FICHEROS

Presentación del Data Monitor de Sedex Nuestra interesante nueva gama de herramientas de creación de informes

Plan de Estudios Maestría en Marketing

Cómo mejorar Su efectividad en Ventas

CAPÍTULO I 1.1 PLANTEAMIENTO DEL PROBLEMA

Los principales conceptos para mejorar la gestión de Marketing: preguntas clave

Técnicas de planeación y control

Área Planificación y Gestión de Proyectos ACTIVIDAD 3 Y AHORA QUÉ HAGO? Competencia: Desarrollar y gestionar proyectos. Aprendizajes esperados

Tras obtener la información necesaria es preciso identificar los problemas

CADENA DE VALOR. Andalucia Emprende, Fundación Pública Andaluza

QUÉ ES UN PLAN DE EXPORTACIÓN?

1. INFORMACIÓN GENERAL

SEGMENTACIÓN. Debido a que los compradores tienen deseos y necesidades únicos, cada comprador es potencialmente un mercado separado.

CASO 3-5 EUROPEAN ALCOHOL RESEARCH FOUNDATION

Sistemas de Gestión de Calidad. Control documental

PREGUNTAS DE RESPUESTA CORTA SELECTIVIDAD TEMA 4:

POSICIONAMIENTO EN LA WEB (SEM Y SEO)

CURSO/GUÍA PRÁCTICA GESTIÓN EMPRESARIAL DE LA INFORMACIÓN.

Cadena de valor. Cadena de valor genérica. Actividades primarias. Actividades de apoyo Actividades primarias

CRM Gestión de Oportunidades Documento de Construcción Bizagi Process Modeler

La selección del mercado meta es esencialmente idéntica, sin importar si una firma vende un bien o servicio.

PROCEDIMIENTO GENERAL. Elaboración y ejecución de un plan de marketing RAZÓN SOCIAL DE LA EMPRESA. Código PG-25 Edición 0. Índice

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 5 -

Profunda comprensión de que valores son o podrían ser percibidos por los clientes.

ACCESO Y MANEJO DEL PANEL DE CONTROL

tema 2 1. LA GESTIÓN PRESUPUESTARIA EN FUNCIÓN DE SUS ETAPAS FUNDAMENTALES: PREVISIÓN, PRESUPUESTO Y CONTROL

Un nombre de usuario de 30 caracteres o menos, sin caracteres especiales y que inicie con una letra.

CMM - Capability Maturity Model. Estructura de CMM... Componentes de CMM. Estructura de CMM

Realización de Auditoría en Sistemas Informáticos. Auditoría Informática

Estrategias de marketing y comercialización

SISTEMAS DE COORDENADAS SISTEMA COORDENADO UNIDIMENSIONAL

Sistema Inteligente de Exploración

Contabilidad Financiera. SESIÓN 8 Inventarios

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 2 -

Fundamentos de Marketing

Autenticación Centralizada

EN LA LA EMPRESA EMPRESA

Segmentación, targeting, posicionamiento

Operaciones Morfológicas en Imágenes Binarias

SISTEMA DE INFORMACIÓN GEOGRÁFICA CATASTRO VIRTUAL. Gerencia de Desarrollo Urbano y Medio Ambiente Subgerencia de Catastro

w w w. l o c a t i o n - w o r l d. c o m

Coordinación de Matemática I (MAT021) 1 er Semestre de 2013 Semana 3: Lunes 25 - Jueves 28 de Marzo. Contenidos

FAQ Parking PPC de SEDO. NicLine

El Plan de Empresa tiene una doble función: Herramienta de Gestión. Herramienta de Planificación

CONSIDERACIONES GENERALES DEL WEB MINING

Incorpora la localización en tu compañía. Mejora la rentabilidad con la solución Location Analytics de Esri

INVESTIGACIÓN DE MERCADOS

PROCEDIMIENTO DE EVALUACIÓN Y ACREDITACIÓN DE LAS COMPETENCIAS PROFESIONALES CUESTIONARIO DE AUTOEVALUACIÓN PARA LAS TRABAJADORAS Y TRABAJADORES

(Incluye modificaciones según NIF A 5) Material preparado por: C.P. Raúl l H. Vallado Fernández, ndez, M.F.(c) .(c) Rhvf.

Minería de Datos Web. 1 er Cuatrimestre Página Web. Prof. Dra. Daniela Godoy.

Ministerio de educación Dirección de Educación Técnica y Profesional

MINISTERIO DE EDUCACIÓN DIRECCIÓN DE EDUCACIÓN TÉCNICA Y PROFESIONAL PROGRAMA DE LA ASIGNATURA BASE DE DATOS ESPECIALIDAD INFORMÁTICA.

PROCEDIMIENTO DE EVALUACIÓN Y ACREDITACIÓN DE LAS COMPETENCIAS PROFESIONALES CUESTIONARIO DE AUTOEVALUACIÓN PARA LAS TRABAJADORAS Y TRABAJADORES

Marketing One to One e Internet

CI Politécnico Estella

ESCUELA DE CIENCIAS ADMINISTRATIVAS, CONTABLES, ECONÓMICAS Y DE NEGOCIOS

EL MERCADO Y SEGMENTACION

Host. En este texto, entenderemos por host toda máquina - léase computadora. Cuenta. Una cuenta, en general, es un espacio de memoria y de disco que

Cadena de Valor y Estrategias Genéricas 1. Prof. Marcelo Barrios

Unidad 1. Fundamentos en Gestión de Riesgos

Está creado como un organizador y gestor de tareas personalizables para generar equipos de alto desempeño en diferentes rubros de empresas.

CAPÍTULO 5 CONCLUSIONES Y RECOMENDACIONES

Introducción. Tráfico de la web. Análisis de la presencia de Movistar Colombia en Internet

EL SEGURO E INTERNET Impacto limitado

NIVEL: CICLO SUPERIOR DE GESTIÓN COMERCIAL Y MARKETING

CURSO BÁSICO DE MEDIO AMBIENTE

Capítulo 2 Empresa y estrategia de marketing

ESTA MATERIA LA PUEDES CURSAR COMO MATERIA PROPIA DE LA MODALIDAD. Bachillerato de Humanidades y Ciencias Sociales MATERIA OPTATIVA

Unidad 5. Modelo de objetos del dominio del problema. Trimestre 10-I. Universidad Autonomía Metropolitana. Unidad 5

SISTEMAS Y MANUALES DE LA CALIDAD

Diseño orientado al flujo de datos

CONSTRUCCIÓN DEL PROCESO MESA DE AYUDA INTERNA. BizAgi Process Modeler

CRITERIOS DE EVALUACIÓN Y CALIFICACIÓN Administración de Sistemas Gestores de Bases de Datos

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos

CALIDAD 1 JOSÉ MANUEL DOMENECH ROLDÁN PROFESOR DE ENSEÑANZA SECUNDARIA

Cuándo y qué virtualizar? Cuándo y qué virtualizar? 1

GRÁFICAS PARA LA PRESENTACIÓN DE LA INFORMACIÓN.

CAPÍTULO 1 PROYECTO DE TESIS. Proyecto de Tesis. 1.1 Introducción

METODOLOGÍA PARA VINCULAR LA EVALUACIÓN CON LOS OBJETIVOS EN UN CURSO DE PROGRAMACIÓN

CAPÍTULO 1 1. INTRODUCCIÓN. En el capítulo siguiente se presentan los antecedentes de la empresa de

ing Solution La forma más efectiva de llegar a sus clientes.

Capítulo 7. Estrategia de marketing impulsada por el cliente:

Grupo de Evaluación de la Educación Superior

TEMA 2 LA GESTIÓN DE MARKETING EN LAS ORGANIZACIONES

Plan de acceso lingüístico

PROCEDIMIENTO ESPECÍFICO. Código A-VI-02-A-1 Edición 0

Transcripción:

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos - Sesión 12 - Juan Alfonso Lara Torralbo 1

Índice de contenidos Fundamentos de clustering Ejemplo inicial Aplicaciones Características deseables de un método de clustering Medidas de distancia Ejemplo de cálculo de distancia Actividad. Cálculo de distancias 2

Fundamentos de clustering Clustering (también conocido como segmentación o agrupamiento) hace referencia a la tarea de data mining consistente en dividir un conjunto inicial de objetos heterogéneos en grupos de objetos homogéneos A los grupos de objetos similares entre sí se les conoce con el nombre de clusters 3

Ejemplo inicial (I) Datos sobre Longitud y Altura de objetos identificados en una imagen médica 4

Ejemplo inicial (II) Cuántos clústers se aprecian? 5

Aplicaciones (I) Marketing: identificación de los distintos grupos de clientes en la base de datos de una compañía, lo cual puede resultar de gran utilidad para optimizar la política publicitaria y las ofertas. Compañías de Seguros: establecimiento de los grupos de clientes asegurados con características similares (número y tipo de siniestros, recursos económicos, etc.). Con ello se consigue conocer los riesgos de los clientes de forma más precisa. Planificación urbana: identificación de grupos de viviendas según el tipo de éstas (piso, chalet, etc.), valor o localización geográfica. World Wide Web (WWW): determinación de los diferentes tipos de documentos, análisis de ficheros log para descubrir patrones de acceso similares, etc. 6

Aplicaciones (II) Como tarea de preprocesado para otras tareas posteriores de Data Mining Como tarea preliminar que se aplica por defecto para empezar a conocer los datos De gran utilidad ya que permite tener una composición de lugar del dominio que se está analizando y, además, puede arrojar alguna pista sobre la aplicabilidad de otras tareas de data mining. 7

Características deseables Que sea escalable, es decir, que funcione correctamente al tratar con conjuntos de datos, tanto de pocos como de muchos elementos. Que posea la capacidad para operar con distintos tipos de variables. Que permita descubrir clusters con formas arbitrarias. Que sea capaz de tratar datos con ruido (errores, inconsistencias, etc.) y objetos atípicos. Que sea insensible al orden de los registros de la base de datos. Es decir, que el orden en el que los datos están almacenados, no influya en los clusters obtenidos. Que funcione correctamente cuando trabaja con registros de alta dimensionalidad (con muchos atributos). Que los resultados obtenidos sean interpretables por el ser humano. 8

Medidas de distancia (I) Definición formal de clustering: Dada una base de datos D={t 1,t 2,,t n } compuesta por n registros y un valor entero k (número de clusters), la tarea de clustering consiste en establecer una correspondencia: f: D {C 1,..,C k }; donde cada t i se asigna a un cluster C j, 1 j k. Qué se necesita para ello? Medida de distancia entre los elementos a particionar 9

Medidas de distancia (II) Distancia City-Block o Manhattan: = p i j m im jm m= 1 d( t, t ) W t t (1) Distancia Euclídea: ( ) 2 = p i j m im jm m = 1 d ( t, t ) W t t (2) Distancia Minkowski: ( ) λ p i i m im jm m= 1 d ( t, t ) = W t t λ > 0 (3) λ 10

Ejemplo 11

Actividad. Cálculo de distancias Calcular, en grupo, la distancia Euclídea entre los elementos <1,1>, <100,74> y <27,29> con cada elemento de la tabla de ejemplo mostrada por el profesor Poner en común 12