Clasificación Bimodal

Documentos relacionados
Pregunta 1 Suponga que una muestra de 35 observaciones es obtenida de una población con media y varianza. Entonces la se calcula como.

CONTROLADORA PARA PIXELS CONPIX

Programación lineal Optimización de procesos químicos DIQUIMA-ETSII

GRADE 3 MCCSC VOCABULARY. Marking Period 3

Canyon County Existing/Resale

74 Prime Time. conjetura Suposición acerca de un patrón o relación, basada en observaciones.

UNIT 2 DIVISIBILITY 1.- MULTIPLES AND FACTORS Concept of multiple Concept of factor

F. Angulo Brown ESFM-IPN

Repaso de funciones exponenciales y logarítmicas. Review of exponential and logarithmic functions

Problema de cantidad económica de la orden para demanda determinística (Deterministic Demand Economic Order Quantity Problem)

MANUAL DEL PROGRAMA DE TRANSFORMADA Z PARA LAS CALCULADORAS VOYAGE 200 TI-89 TITANIUM

Informe sobre Best Execution IBEX 35

Informe sobre Best Execution IBEX 35

Carlos Cuevas-Covarrubias (Mexico): Mutual Principal Components, reduction of dimensionality in statistical classification

Unit 8: Maximum Likelihood for Location-Scale Distributions. Ramón V. León

(iii) r. (6) (Total 6 marks)

Tendencias educativas oficiales en México

Algoritmos y Estructuras de Datos

Algoritmo de colonia de hormigas para el problema de ruteo de vehículos con dependencia temporal. Santiago Balseiro Irene Loiseau Juan Ramonet

Los números. 0 cero 1 uno / un 2 dos 3 tres 4 cuatro. 6 seis 7 siete 8 ocho 9 nueve 10 diez 5 cinco

TELEVISOR A COLORES MANUAL DE SERVICIO MODELO : CP-29C40P. ATENCIÓN Antes de dar servicio al chasis, lea las PRECAUCIONES DE SEGURIDAD en este manual.

QUICK GUIDE RECORD SETUP CONFIGURACIÓN DE GRABACIÓN English / Español

FICHA DE REPASO: ESTADÍSTICA

No usa una envolvente constante, con cambios de amplitud al cambiar la fase para pasar de un estado a otro.

Capítulo 1 Lección 4. A pesar de todas las dificultades y problemas Dorothy era feliz. Despite all her troubles and problems, Dorothy was happy.

(a) Calculate a point estimate of the mean pull-off force of all connectors in the population. State which estimator you used and why.

ellos= ellas= ustedes=

FORMAT B2 SPEAKING EXAM

Reduciendo el Ancho de Banda de Matrices Dispersas Simétricas con Algoritmos Genéticos

PROBLEMAS PARA LA CLASE DEL 20 DE FEBRERO DEL 2008

Modelos predictivos y de optimización de estructuras de hormigón

Adjectives; Demonstrative

Deterministic Finite Automata And Regular Languages

EPB 603 Sistemas del Conocimiento

CRONOGRAMA DE LA ASIGNATURA TRABAJO DEL ALUMNO DURANTE LA SEMANA. X Choose an Empirical Project to be completed during the course.

UNIVERSIDAD NACIONAL DEL CALLAO

Soluciones Olimpiadas Matemáticas del Nivel Superior Programa de Matemática, DEPR Abril 2015

QUICK GUIDE RECORD SETUP CONFIGURACIÓN DE GRABACIÓN English / Español

Exercise List 3 - Microeconomics II Moral Hazard - Screening- Signaling

Greetings. Lists and TPR Sheets The Enlightened Elephant

Hacia una nomenclatura y clasificacion de formas de fondo transversales generadas porflujos de agua

Práctica de SIMULACIÓN

How can we place ourselves in perspective? Cómo podemos nosotros ponernos en perspectiva?

PROGRAMA PARA ANALIZAR DOCUMENTOS Y DETECTAR

Diseño de Experimentos

ÁMBITO DE COMUNICACIÓN Lengua extranjera: Inglés

Series temporales 27 de octubre de 2009

SOLUBILITY: Reading, Questions, & Inquiry Activity

A MEMETIC ALGORITHM FOR. Zhipeng Lü, Jin-Kao Hao

TX MULTI MANUAL TX MULTI. Mando copiador multifrecuencia 1. PASOS PARA COPIAR UN MANDO CÓDIGO FIJO Y ROLLING ESTÁNDAR:

EL PODER DEL PENSAMIENTO FLEXIBLE DE UNA MENTE RAGIDA A UNA MENTE LIBRE Y ABIERTA AL CAMBIO BIBLIOTECA WALTER

Work Place 1M. Count & Compare Butterflies. 1. Find a partner.

Examen Final. a. Identifique los factores en estudio, y si éstos son fijos o aleatorios.

ANOVA (Análisis de varianza)

Análisis de Clúster con SPSS. Método de las K-Medias

Práctica 4 vgaribay PRÁCTICA 4. CONTRASTE DE HIPOTESIS. 1 ESTUDIO DE NORMALIDAD Plot de normalidad. Camino 1

Los Cuatro Jinetes del Apocalipsis: Cuál es el Verdadero Origen del mal y del Sufrimiento y cómo Podemos Lograr un Mundo Mejor (Spanish Edition)

Brief Introduction to Docking and Virtual Screening with Autodock4 and Autodock Tools

Do Now! Question 1: Pregunta 1

ACTIVIDAD 2: La distribución Normal

PROYECTO FAMILIAR: SUDODDKU PROYECTO FAMILIAR. UCI Math CEO Meeting 4 (FEBRUARY 8, 2017) Estimado estudiante,

Introducción a Data Analysis Expressions (DAX) Marco Tulio Gómez BI Consultant Soluciones Computarizadas

IE12_ CONSOLIDACIÓN Y DESARROLLO DE NUEVAS TÉCNICAS DE EVALUACIÓN INTENSIVAS ON-LINE YA IMPLEMENTADAS POR EL GIE E4

NUTRIBULLET - ALIMENTOS CURATIVOS NATURALES - LIBRO / BOOK - RECARGUE SU SALUD EN TAN SOLO UNOS SEGUNDOS AL DIA! - SPANISH EDITION

Transcripción:

Clasificación Bimodal Metodos clásicos Uso de Metaheurísticas Uso de un índice difuso Experimento de Monte Carlo

Clasificación bimodal B 1 B 2 B 3 A 1 A 2 A 3 Minimizar con g kl = A k 1 W ( P) = B l i A k j B l r m k = 1 l= 1 i A j B x ij k l ( x ij g kl 2 )

Notación

Notación

Criterio

Simplificación

Simplificación We can write: Hence, the criterion is:

Métodos comparados Alternating exchanges (Gaul & Schader 1996) Two-mode K-means (Govaert 83; Baier, Gaul & Schader 1997) Simulated annealing (Trejos & Castillo 2000) Tabu search (Castillo & Trejos 2002) Fuzzy approach (Groenen, Roosmalen, Trejos & Castillo 2008)

Métodos existentes Intercambios alternantes (Gaul & Schader 96): transferencias en cada modo, iteraciones mientras el criterio mejora K-medias (Govaert 83; Baier, Gaul, Schader 97): fases de asignación y representación, hasta estabilización

Notación

Intercambios Alternantes

K-medias Bimodal

Uso de Sob.Sim. Vecindario generado por la transferencia en uno de los dos modos (escogido al azar) Si se escoge el modo fila: escoger al azar (unif.) i, escoger al azar (unif.) k, hacer la transferencia de i de su clase actual a la clase k Idem para columnas

Sobrecalentamiento Simulado

Uso de BT Movimiento: transferencia de un objeto fila o un objeto columna a una nueva clase Lista tabú contiene los valores de W(P) Generar una muestra del vecindario No se aplica un criterio de aspiración

Búsqueda Tabú

Enfoque Difuso

Enfoque Difuso (2)

C-Medias Difuso Bimodal

Pasos difusos

Algunos resultados K-medias # τ Inter Alter. # τ Sob. Sim # τ Cognac 1000 5% 500 10% 150 85% Cigarros 1 1000 12% 500 35% 150 80% Cigarros 2 1000 8% 500 40% 150 100% r = m = 3

Datos de sanitarios (82x25) r=m Int.Alt. k-means SS Fuzzy BT 2 0.2289 0.2289 0.2289 0.2289 0.2289 3 0.3234 0.3234 0.3234 0.3234 0.3234 4 0.3729 0.3729 0.3804 0.3703 0.3804 5 0.4293 0.4293 0.4293 0.4293 0.4293 6 0.4635 0.4579 0.4651 0.4641 0.4651

Estudio de Simulación Simulate P, Q, V, E Generate X = PVQ t + E 4 factors with 3 levels each: 81 combinations We simulate 50 data sets for each combination All 5 methods are performed for each data set Computation time is balanced

Factores 1. Size of data: (n=m=60; n=150,m=30; n=m=120) 2. Number of clusters (K=L=3; K=L=5, K=L=7) 3. Size of error perturbations: elements of E are independent normally distributed with mean 0 and sta dev 0.5, 1 or 2 4. Distribution of the objects over the clusters: Objects divided over the clusters with = probab One cluster contains 10% of the objects One cluster contains 60% of the clusters

Centros Assign randomly the numbers to the elements of V, where Φ(.) is the inverse standard normal cumulative distribution function As a result, the elements of V appear standard normally distributed, and a fixed minimum distance between the cluster centers is ensured

Representación Visual error s.d.=0.5 unif dist over clusters error s.d.=1 10% of obj in 1 cluster error s.d.=2 60% of obj in 1 cluster Easy to recognize Difficult to recognize Impossible to recognize

Parámetros Alt.Exch.: 30 times for every simulated data set Two-mode K-Means: 500 times Sim.Annealing: T = 1, γ = 0.95, t max = 10, R=(n(K 1)+m(L 1))/4 Tabu S.: number of iterations S=3(n(K 1)+m(L 1)) 1/2, length of tabu list = S/3 Fuzzy steps: s 0 = 1.05, γ =0.85, s min = 1.001, run 20 times

Criterios de comparación Variance accounted for (VAF) Adjusted Rand index (ARI) Average CPU time

Variance accounted for where x = 1 nm n m i= 1 j= 1 x ij VAF [0,1] VAF max

Resultados de Simulación

Resultados de Simulación

Resultados de Simulación

Índice Ajustado de Rand

Clasificación Bimodal usando Metaheurísticas de Optimización Combinatoria

Tiempo de CPU

Conclusiones Error variance and relative sizes of the clusters strongly affect how well a clusering structure can be retrieved Two-mode k-means most often had the best performance, especially in favorable conditions When the optimal partition was hard to find, the AE and FS methods often performed well Sim. Annealing was also fairly well Tabu search had an inferior performance