Diseño de Sistemas Difusos para Modelado y Clasificación. Aplicaciones Oscar Cordón

Documentos relacionados

Análisis y cuantificación del Riesgo

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

4. METODOLOGÍA. 4.1 Materiales Equipo

MODELOS DE RECUPERACION

ANALISIS MULTIVARIANTE

Caso práctico de Cuadro de Mando con Tablas Dinámicas

Tratamiento borroso del intangible en la valoración de empresas de Internet

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

EJEMPLO DE REPORTE DE LIBERTAD FINANCIERA

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009

Criterios para seleccionar tecnología de Modelos de Toma de Decisiones

Guía breve para la. Versión abreviada del Manual para la. evaluación de desempeño y potencial

CAPÍTULO 3. ALGORITMOS DE PREVISIÓN BASADOS EN LA EXTRAPOLACIÓN DE LOS DATOS MÁS RECIENTES

Aprendizaje Automatizado

IAP ENTORNOS INFORMATIZADOS CON SISTEMAS DE BASES DE DATOS

Unidad 5 Utilización de Excel para la solución de problemas de programación lineal

CAPITULO 3 REDES HIBRIDAS-COMPLEJAS. 3.1 Descripción de la Red Híbrida Compleja (HCNN)

Aprendizaje Automatizado. Redes Neuronales Artificiales

RECOMENDACIONES DE INVESTIGACIÓN FUTURA.

PRESUPUESTO BASE CERO ORGANISMO PÚBLICO DEL SISTEMA NACIONAL DE COORDINACIÓN FISCAL

TRABAJO COOPERATIVO EN ROBOTS

Las propuestas que deseen licitar a este servicio, deberán presentar:

CAPÍTULO III MARCO TEÓRICO. Cada día cambian las condiciones de los mercados debido a diferentes factores como: el

ASEGURAMIENTO DE LA CALIDAD EN LABORATORIO

La Gestión Operativa: La Clave del Éxito.

Conclusiones. Particionado Consciente de los Datos

Por qué es importante la planificación?

RESUMEN EJECUTIVO. La gestión de riesgos corporativos incluye las siguientes capacidades:

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

2.- Métodos para la medición de la pobreza

TEMA 1. Introducción

Dirección de Operaciones

TEMA 5. MUESTREO PARA LA ACEPTACIÓN.

Capítulo 1. Introducción

Departamento de Informática Universidad de Valladolid Campus de Segovia TEMA 9: CRITERIOS DE CALIDAD DE DISEÑO MODULAR

ESQUEMAS DE SISTEMAS VOIP CON ALTA DISPONIBILIDAD Y ALTO RENDIMIENTO

Líneas de espera. Introducción.

Créditos académicos. Ignacio Vélez. Facultad de Ingeniería Industrial. Politécnico Grancolombiano

CALIDAD TOTAL. Visión estratégica y buena gestión son los ingredientes fundamentales.

1 El plan de contingencia. Seguimiento

CAPÍTULO III 3. MÉTODOS DE INVESTIGACIÓN. El ámbito de los negocios en la actualidad es un área donde que cada vez más

CAPITULO VI ESTRATEGIAS DE OUTSOURCING

TEMA 3: EN QUÉ CONSISTE?

Capítulo 6: Conclusiones

Capítulo 5: Pruebas y evaluación del sistema. A continuación se muestran una serie de pruebas propuestas para evaluar varias

2002 Emerson Process Management. Todos los derechos reservados. Vea este y otros cursos en línea en

Matrices Invertibles y Elementos de Álgebra Matricial

1. Liderar equipos. Liderazgo

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

INDICADORES. PROBLEMAS ASOCIADOS A SU SELECCIÓN PARA MEDIR SUSTENTABILIDAD Y EFICIENCIA AMBIENTAL

Organización como función administrativa Resumen para Administración y Gestión Profesor: Gonzalo V.

Las razones financieras ayudan a determinar las relaciones existentes entre diferentes rubros de los estados financieros

Tema : ELECTRÓNICA DIGITAL

CAPÍTULO 4. DISEÑO CONCEPTUAL Y DE CONFIGURACIÓN. Figura 4.1.Caja Negra. Generar. Sistema de control. Acumular. Figura 4.2. Diagrama de funciones

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

Problemas y ventajas de medir con BIM

TEMA 3 PROFESOR: M.C. ALEJANDRO GUTIÉRREZ DÍAZ 2 3. PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

CAPÍTULO 2 IMPORTANCIA DE LA ASIGNATURA OUTSOURCING EN TECNOLOGÍAS DE INFORMACIÓN

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago.

Ambas componentes del sistema tienen costos asociados que deben de considerarse.

TALLER 2. MEJORA CONTINUA

A. Subcampos basados en el contenido.

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

Geometría Tridimensional

Ejercicios de Programación Lineal

WinHIPE: edición, compilación y ejecución de programas; y generación de animaciones web. Manual de usuario.

Diseño orientado al flujo de datos

ÍNDICE 2. DIRECCIONES DE INTERÉS SOBRE TELETRABAJO Y DISCAPACIDAD BIBLIOGRAFÍA...

1.) Cuál es la diferencia entre creatividad e innovación? 2.) Cuáles son los factores de influencia típicos en la creatividad?

Unidad VI: Supervisión y Revisión del proyecto

Licenciatura en Computación

Inteligencia artificial: todo comienza con una neurona.

La ventana de Microsoft Excel

Estudio Técnico INTRODUCCIÓN

Programación Lineal Continua/ Investigación Operativa. EJERCICIOS DE INVESTIGACIÓN OPERATIVA. Hoja 1

Práctica 7. Problemas de diseño de topologías de red con herramienta Net2Plan

Redes de Kohonen y la Determinación Genética de las Clases

Sistemas Conexionistas

La Evaluación como Proceso Comparación de Costos y Beneficios. Pedro Misle Benítez / Gustavo Briceño Torres

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Universidad Autónoma de Baja California Facultad de Ingeniería Mexicali

TEMA 12: CUALIDADES DE UN BUEN DISEÑO

Bloque I: Conceptos básicos y fundamentos de la Dirección de Proyectos.

FASES DEL PROCESO DE RESOLUCIÓN DE PROBLEMAS

En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.

Carteleras. Elaborar una agenda de conciertos y actividades musicales

Capítulo 11. Conclusiones y trabajo futuro

1. Introducción. Universidad de Cantabria 1-1

Nota Técnica Abril 2014

SESION El comando Integrate 2. Aproximación de integrales definidas 3. Integración de funciones racionales

Primer Hackathon Reto de IA de Google en la UGR Redes neuronales. El perceptrón. Pedro A. Castillo Valdivieso

Desarrollo de un Sistema de Gestión de Proyectos mediante el framework GWT

Lista de la Verificación de la Gestión de la Seguridad y Salud Ocupacional 1

MATEMÁTICAS aplicadas a las Ciencias Sociales II

Capitulo V Administración de memoria

ÍNDICE. Ficha técnica Encuesta y cuestionario Finalidad y resultados de la encuesta Primera parte: conocimiento...

Gestión del equipo de trabajo del almacén

Transcripción:

Diseño de Sistemas Difusos para Modelado y Clasificación. Aplicaciones Oscar Cordón Grupo de Soft Computing y Sistemas de Información Inteligentes Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Granada

Índice Identificación de Sistemas mediante Lógica Difusa 2. Sistemas Basados en Reglas Difusas 3. Diseño de Sistemas Basados en Reglas Difusas Bases de Conocimiento 1

Identificación de Sistemas mediante Lógica Difusa Modelo: esquema teórico de un sistema que se elabora para facilitar su comprensión y el estudio de su comportamiento Los modelos son útiles para realizar simulaciones, analizar un sistema, comprender sus mecanismos subyacentes, diseñar nuevos procesos o controlar automáticamente sistemas Todo modelo debe cumplir dos requisitos básicos: Precisión: Representar con fidelidad la realidad que se está modelando Comprensibilidad: Describir el sistema de forma legible Requisitos contradictorios: un modelo demasiado simple no puede representar adecuadamente las características relevantes del sistema 2

Identificación de Sistemas mediante Lógica Difusa (2) El modelado se puede realizar con Sistemas Basados en Reglas Difusas (SBRDs), que contienen reglas del tipo: EB MB B N A MA EA 0,5 m M Existen distintas clases de modelado con SBRDs: Lingüístico: Atiende al poder descriptivo de los SBRDs Preciso: Atiende al poder aproximativo de los SBRDs 3

Sistema -Modelado -Control -Clasificación Datos Proceso de Modelado Modelo 4

(2) Sistema -Modelado -Control -Clasificación Datos APRENDIZAJE Sistema Basado en Reglas Difusas (SBRD) 5

(3) Variables redundantes o irrelevantes Datos variable 1 variable 2 variable 3... variable k APRENDIZAJE -Modelado -Control -Clasificación Sistema Basado en Reglas Difusas (SBRD) PREPROCESAMIENTO: Selección de características y obtención de datos 6

(4) Variables redundantes o irrelevantes Datos variable 1 variable 2 variable 3... variable k APRENDIZAJE -Modelado -Control -Clasificación Sistema Basado en Reglas Difusas (SBRD) Mejorar la precisión y la interpretabilidad PREPROCESAMIENTO: Selección de características y obtención de datos 7

(5) Variables redundantes o irrelevantes Datos variable 1 variable 2 variable 3... variable k PREPROCESAMIENTO: Selección de características y obtención de datos APRENDIZAJE PROCESOS DE MEJORA DE LA PRECISIÓN -Modelado -Control -Clasificación Sistema Basado en Reglas Difusas (SBRD) Mejorar la precisión y la interpretabilidad 8

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD Existen distintos tipos de reglas difusas en función de: La estructura del consecuente de la regla: etiqueta lingüística/conjunto difuso vs. función polinómica de las entradas. La forma de asociar los conjuntos difusos a las reglas: particiones difusas basadas en rejilla vs. semántica libre. La aplicación a la que están destinadas: control/modelado vs. clasificación El tipo de regla empleado condiciona las características de interpretabilidad y precisión del modelo difuso 9

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas para control/modelado 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 1. REGLA DIFUSA DE TIPO MANDANI Emplea conjuntos difusos en el antecedente y en el consecuente: SI X 1 es A 1 y... y X n es A n ENTONCES Y es B Lo más habitual es que los A i y B sean etiquetas lingüísticas, con un conjunto difuso asociado. Por ejemplo: EB MB B N A MA EA 0,5 m M 10

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas para control/modelado 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 1. REGLA DIFUSA DE TIPO MANDANI (2) En ese caso, se dice que las particiones difusas están basadas en rejilla ya que, al tener cada variable lingüística asociada una partición difusa como la anterior, el espacio de entrada se divide en hipercubos: Partición difusa de la variable de entrada 2 Partición difusa de la variable de entrada 1 Es la estructura de regla más interpretable ya que: el consecuente es una etiqueta lingüística Cada etiqueta tiene asociado un conjunto difuso de forma unívoca (el conjunto de reglas más comprensible) 11

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas para control/modelado 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 1. REGLA DIFUSA DE TIPO MANDANI (3) Otra variante consiste en que los A i y B sean directamente conjuntos difusos sin una interpretabilidad lingüística En ese caso, se dice que las reglas tienen una semántica libre La interpretabilidad del conjunto de reglas es mucho menor, al no existir una semántica global, pero la capacidad de aproximación del sistema es mucho mayor, al tener más grados de libertad 12

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas para control/modelado 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 2. REGLA DIFUSA DE TIPO TSK Emplea conjuntos difusos en el antecedente y una función polinómica en el consecuente: SI X 1 es A 1 y... y X n es A n ENTONCES Y=w 0 +w 1 X 1 +...+w 1 X n La interpretabilidad se reduce significativamente, pero aumenta la capacidad de aproximación Existe una variante basada en un único valor en el antecedente: SI X 1 es A 1 y...yx n es A n ENTONCES Y=w 0, con la misma interpretabilidad que las de Mamdani. Las particiones del antecedente pueden ser de rejilla o libres (con la pérdida adicional de interpretabilidad) 13

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas para clasificación El antecedente de las reglas difusas para clasificación es el mismo que en las anteriores, pero el consecuente pasa a ser una clase: 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD donde: SI X 1 es A 1 y... y X n es A n ENTONCES Y es C Los A i son etiquetas lingüísticas o conjuntos difusos dependiendo de que la partición difusa sea de rejilla o libre. C es una de las clases del problema: C {C 1,..., C M } 14

2. Sistemas Basados en Reglas Difusas: Tipos de reglas difusas para clasificación (2) 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD Además del modelo básico anterior, existen dos variantes más basadas en el uso de grados de certeza: Reglas con un grado de certeza en el consecuente: SI X 1 es A 1 y... y X n es A n ENTONCES Y es C con r donde r es un valor numérico que expresa la confianza de que un patrón situado en el subespacio difuso de entrada de la regla sea realmente de clase C. Reglas con un grado de certeza por clase en el consecuente: SI X 1 es A 1 y... y X n es A n ENTONCES Y es {r 1,..., r M } Estas últimas son una extensión de las anteriores 15

2. Sistemas Basados en Reglas Difusas: Reglas DNF 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD Siempre que se use una partición de rejilla (ya sea en modelado o en clasificación), es posible emplear la estructura de regla de forma normal disyuntiva (DNF) En ella, una variable antecedente puede tomar como valor una disyunción de términos lingüísticos de su dominio. Permiten seleccionar variables a nivel de regla: si una variable toma todos los valores de su dominio, pasa a ser considerada irrelevante como premisa de la regla. Además, permiten realizar agrupamientos de valores que hacen a las reglas más intepertables. Por estas razones, se suelen emplear para clasificación 16

2. Sistemas Basados en Reglas Difusas: Reglas DNF (2): Ejemplo 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD IF Femur_length is (medium or big-medium or big) and Head_diameter is (medium or big) and Foetus_sex is (male or female or unknown) THEN Foetus_weight is normal Femur_length ={small,small-medium, medium, big-medium,big} Head_diameter ={small,medium,big} Foetus_sex ={male,female,unknown} Foetus_weight = {low, normal, high} 17

2. Sistemas Basados en Reglas Difusas: Reglas DNF (3): Selección de Variables 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD REGLA DNF IF Femur_length is (medium or big-medium or big) and Head_diameter is (medium or big) and Foetus_sex is (male or female or unknown) THEN Foetus_weight is normal Femur_length ={small,small-medium, medium, big-medium,big} Head_diameter ={small,medium,big} Foetus_sex ={male,female,unknown} Foetus_weight = {low, normal, high} Dominios de las variables 18

2. Sistemas Basados en Reglas Difusas: Reglas DNF (3): Agrupamiento de valores 2.1. Tipos de reglas difusas REGLAS DNF IF Femur_length is (medium or big-medium or big) and Head_diameter is (medium or big) and THEN Foetus_weight is normal 2.2. Estructura de un SBRD IF Femur_length is (medium or big-medium or big) and Head_diameter is not small THEN Foetus_weight is normal 19

2. Sistemas Basados en Reglas Difusas: Estructura de un Modelo Difuso La estructura genérica de un SBRD para modelado/control es: Base de Reglas Difusas 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 20 La Base de Conocimiento (BC) representa el conocimiento disponible sobre el problema en forma de reglas lingüísticas. Se compone de: La Base de Reglas (BR), que contiene el conjunto de reglas La Base de Datos (BD), que almacena las funciones de escala, los conjuntos de términos lingüísticos y las funciones de pertenencia que definen su semántica En caso de trabajar con semántica libre, no existe BD. La BC pasa a ser únicamente una Base de Reglas Difusas, en la que cada regla incluye su propia semántica.

2. Sistemas Basados en Reglas Difusas: Estructura de un Modelo Difuso (2) 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD El Sistema de Inferencia obtienelasalidadelsbrdalrecibiruna entrada. Para ello, aplica la Regla Composicional de Inferencia sobre cada regla de la base: μ B i (y) = I (h i, μ Bi (y)) R i : SI X i 1 es A i 1 y... y X i n es A i n ENTONCES Y es B i donde: x 0 = (x 1,..., x n ) es la entrada al sistema h i = μ Ai (x 0 ) = T (μ A i 1 (x 1 ), μ A i 2 (x 2 ),... μ A i n (x n )) es el grado de emparejamiento del antecedente de la regla con las entradas al sistema T es el operador de conjunción (habitualmente, el mínimo o el producto) e I es un operador de implicación difuso (hab., el mínimo) 21

2. Sistemas Basados en Reglas Difusas: Estructura de un Modelo Difuso (3) 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD El Interfaz de Defuzzificación agrega las salidas difusas parciales B i obtenidas de aplicar la inferencia sobre cada regla y las transforma en una salida real Existen dos modos de trabajo: Modo A-FATI (Agregar Primero, Defuzzificar Después): En primer lugar, se agregan las salidas parciales {B 1,..., B L } mediante un operador difuso de agregación (habitualmente, el máximo o el mínimo): μ B (y) = G (μ B 1 (y),..., μ B L (y)) Después, el conjunto difuso se transforma en un valor real mediante un método de defuzzificación (habitualmente, el centro de gravedad (CG) o la media de los máximos (MOM)): y 0 = D (μ B (y)) 22

2. Sistemas Basados en Reglas Difusas: Estructura de un Modelo Difuso (4) 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 23 Modo B-FITA (Defuzzificar Primero, Agregar Después): En primer lugar, se transforman los conjuntos difusos de salida {B 1,..., B L } en valores reales mediante un defuzzificador: y i = D (μ B i (y)) Después, los valores numéricos parciales se agregan mediante un operador de agregación numérico (una media, una media ponderada o la selección de un valor concreto): y 0 = A (y 1,..., y M ) El operador más empleado es el CGoMOMponderadopor el grado de emparejamiento: y 0 = i h i i CG h i i y 0 = i h i MOM i h i i

2. Sistemas Basados en Reglas Difusas: Estructura de un SBRD para Clasificación La principal diferencia entre un SBRD para modelado/control y un Sistema de Clasificación Basado en Reglas Difusas (SCBRD) es la ausencia del Interfaz de Defuzzificación: 2.1. Tipos de reglas difusas Base de Conocimiento Base de Datos Base de Reglas 2.2. Estructura de un SBRD entrada real x Interfaz de Fuzzificación Sistema de Inferencia salida clase C Este elemento deja de tener sentido, puesto que las salidas que devuelve el Sistema de Inferencia ya no son conjuntos difusos sino directamente clases Naturalmente, la estructura de este Sistema también cambiará 24

2. Sistemas Basados en Reglas Difusas: Esquema Genérico de Razonamiento Difuso para Clasificación 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 25 Dados un ejemplo e=(e 1,..., e n ) y una BR {R 1,...,R L }={R C 1,...,R C M}: 1. Se calcula el grado de emparejamiento entre el ejemplo y los antecedentes de las reglas R i : h i = T (μ A i 1 (e 1 ), μ A i 2 (e 2 ),... μ A i n (e n )) ; i = 1,..., L 2. Se calcula el grado de asociación entre el ejemplo y cada una de las clases C j, j=1,..., M: b j i = o (h i,r i ) ; j = 1,..., M ; i = 1,..., L 3. Se aplica una función de ponderación sobre los grados de asociación (potenciando los altos y penalizando los bajos): B j i = g (b j i) ; j = 1,..., M ; i = 1,..., L 4. Se calcula el grado de clasificación para cada clase, agregando grados de asociación ponderados: (a 1,..., a sj ) = (B j i >0), i = 1,..., R C j ; j = 1,..., M ; Y j = f (a 1,..., a sj ) 5. Se calcula el grado de clasificación para cada clase, agregando grados de asociación ponderados: C l = clase l / Y l = max {Y j, j = 1,..., M}

2. Sistemas Basados en Reglas Difusas: Método clásico de la regla ganadora Normalmente, el grado de emparejamiento se calcula con el Mínimo yelgrado de asociación con el producto En el método clásico, la clasificación se hace con una única regla, la de mayor grado de asociación con el ejemplo: 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD Ejemplo R1 R2... Rk... Clase RL 26 Esto se debe a que la función f usada para calcular el grado de clasificación en el paso 4 es el máximo: Y j = max (B j i, i = 1,..., R C j y B j i >0) ; j = 1,..., M

2. Sistemas Basados en Reglas Difusas: Métodos basados en múltiples reglas 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD El comportamiento anterior no tiene mucho sentido, ya que desperdicia las capacidad de interpolación de los SBRDs al emplear la información de una única regla de la BR El esquema genérico de razonamiento permite combinar varias reglas para decidir la salida final del sistema: R1 R2... Ejemplo Rk... Clase RL 27

2. Sistemas Basados en Reglas Difusas: Ejemplo de métodos de razonamiento con varias reglas 2.1. Tipos de reglas difusas 2.2. Estructura de un SBRD 28 Para implementar la combinación de los resultados de varias reglas compatibles con el ejemplo, se ha de emplear otra función f para calcular el grado de clasificación en el paso 4: Entre otras muchas, dos posibilidades son: Método de razonamiento del voto máximo (suma normalizada): s j a sc = m= 1 m f1(a1,..., as ) ; f = j 1 max a max f c= 1,...,M 1 max m= 1 m Media aritmética de los grados de asociación ponderados: s f 2 (a 1,..., a s j ) j a m 1 m = = s j

3. Diseño de SBRDs 3.1. Diseño de la BC de un SBRD Un SBRD (ya sea un modelo, un controlador o un clasificador difuso), está formado por dos componentes: La Base de Conocimiento (BC), que almacena el conocimiento sobre el problema en forma de reglas difusas El Sistema de Inferencia, que aplica un método de razonamiento difuso sobre las entradas y las reglas de la BC y devuelve una salida. Por tanto, para obtener un SBRD es necesario diseñar ambas: La BC se obtiene de conocimiento experto o aprendizaje automático El Sistema de Inferencia se obtiene eligiendo los operadores difusos para cada componente (conjunción, implicación, defuzzificador, etc.) A veces, estos operadores incorporan parámetros que también pueden ser estimados por métodos automáticos OBJETIVOS DE DISEÑO: PRECISIÓN + INTERPRETABILIDAD 29

3.1. Diseño de la BC de un SBRD 3. Diseño de SBRDs 3.1. Diseño de la BC de un SBRD El diseño de la BC engloba dos problemas: Aprendizaje de la BD Universos de discurso de las variables Factores o funciones de escala Número de términos lingüísticos (etiquetas) por variable Funciones de pertenencia asociadas a las etiquetas Derivación de la BR: composición de las reglas difusas Existen dos formas de diseñar la BC: A partir de información suministrada por expertos A partir de métodos de aprendizaje automático en base a la información numérica existente 30

3.1. Diseño de la BC de un SBRD (2) Índice 1.Introducción 2. Métodos Ad Hoc 3. Algunos Ejemplos Base de Conocimiento Base de Reglas Base de Datos entrada Interfaz de Fuzzificación Mecanismo de Inferencia Interfaz de Defuzzificación salida Sistema Basado en Reglas Difusas 31

3.1. Diseño de la BC de un SBRD (3) Índice 1.Introducción 2. Métodos Ad Hoc 3. Algunos Ejemplos R1: Si X1 es Alto y X2 es Bajo entonces Y es Medio R2: Si X1 es Bajo y X2 es Medio entonces Y es Alto... Base de Conocimiento Base de Reglas Base de Datos entrada Interfaz de Fuzzificación Mecanismo de Inferencia Interfaz de Defuzzificación salida Sistema Basado en Reglas Difusas 32

3.1. Diseño de la BC de un SBRD (3) Índice 1.Introducción 2. Métodos Ad Hoc 3. Algunos Ejemplos R1: Si X1 es Alto y X2 es Bajo entonces Y es Medio R2: Si X1 es Bajo y X2 es Medio entonces Y es Alto... Base de Conocimiento Base de Reglas Base de Datos Medio Bajo Bajo Medio Bajo Medio Alto Alto Alto X1 X2 Y entrada Interfaz de Fuzzificación Mecanismo de Inferencia Interfaz de Defuzzificación salida Sistema Basado en Reglas Difusas 33

4.1. Métodos Ad-hoc Independientemente del tipo de SBRD, existen distintas técnicas automáticas para el aprendizaje de su BC a partir de ejemplos Las técnicas más comunes son: Métodos ad hoc ideados específicamente para el aprendizaje automático de reglas difusas a partir de ejemplos Algoritmos evolutivos: generalmente para aprendizaje/ajuste off-line de reglas, semántica e inferencia Redes neuronales: generalmente para ajuste off-line de la semántica y diseño on-line Agrupamiento (clustering): generalmente para aprendizaje off-line de la semántica (particiones basadas en rejilla) o de reglas con semántica libre 34

: Soft Computing Computación Flexible (Soft Computing) Lógica Difusa Redes 4.1. Métodos Ad-hoc Diseño SBRDs Computación Evolutiva 35

4.1. Métodos Ad hoc: Introducción Sistema Conjunto de ejemplos Aprendizaje automático Modelo Difuso 4.1. Métodos Adhoc Generalmente con mecanismos complejos como las Redes, Algoritmos Genéticos o Técnicas de Clustering Métodos Específicos de Envoltura de Ejemplos Sin técnicas de búsqueda u optimización Basados en criterios de envoltura de los datos del conjunto de ejemplos 36

4.1. Métodos Ad hoc: Introducción 4.1. Métodos Adhoc Ventajas: Fáciles de entender e implementar Proceso de aprendizaje muy rápido Ideales para integrarlos en procesos de aprendizaje más complejos (aproximación preliminar, soluciones iniciales para refinarlas, meta-aprendizaje, etc.) Inconvenientes: Falta de precisión en algunos casos Grado de automatización más bajo (es necesario fijar a priori más parámetros del modelo) 37

4.1. Métodos Ad hoc: Caracterización 1. Aprendizaje basado en un conjunto de ejemplos que representa el comportamiento del problema 2. Definición previa de la base de datos compuesta por las particiones difusas de las variables de entrada y salida MP P N G MG 4.1. Métodos Adhoc 38 0,5 d 3. Aprendizaje de las reglas lingüísticas haciendo uso de criterios de envoltura de los datos del conjunto de ejemplos 4. Proceso de aprendizaje mediante algoritmos específicos desarrollados para tal fin sin atender a ningún paradigma de búsqueda u optimización i

4.1. Métodos Ad hoc: Caracterización (2) 4.1. Métodos Adhoc 39 Normalmente, se aplican sobre una partición difusa de rejilla En el caso de modelado, existen métodos para generar: Reglas de Mamdani (consecuente=etiqueta lingüística): Wang y Mendel, Cordón y Herrera. Reglas TSK simplificadas (cons.=valor numérico): Ishibuchi Reglas TSK (cons.=función polinómica): Cordón y Herrera Los métodos para clasificación son similares a los de modelado, sólo cambia la derivación del consecuente Permiten generar reglas difusas de clasificación de los tres tipos existentes: clase, clase+grado de certeza, grado de certeza para cada clase Ejemplos: Wang y Mendel para clasificación (Chi y otros), Ishibuchi y otros

4.1. Métodos Ad hoc: Taxonomía 4.1. Métodos Adhoc 40 Guiados por ejemplos Conjunto de Ejemplos 1 e = ( x 1 1, x 1 2, y 1 ) 2 e = ( x 2 1, x 2 2, y 2 ) e N = (, x N 2, y N) x 1N... RC 1 = RC RC Guiados por rejilla difusa A 2 s S s A 1 s 2 N Conjunto de Reglas Candidatas 1 1 SI X 1 es A 1 y X ENTONCES Y es B 1 2 es A 2 2 2 = SI X es A 1 y X es A ENTONCES Y es B 2 2 = SI 1 2 X 1 es A 1 N R s = SI y... X 2 es A 2 N X 1 es A 1 s y ENTONCES Y es B N X 2 es A 2 s Base de Reglas ENTONCES Y es }Base de Reglas S el R 1 e R 2 c R 3 c i ó n B s...

4.1. Métodos Ad hoc: Wang y Mendel (guiado por ejemplos) 1. Considerar una partición difusa del espacio de las variables 2. Generar un conjunto de reglas lingüísticas candidatas Se busca la regla que mejor envuelve cada ejemplo del conjunto de datos. Así, la estructura de la regla RC l se obtiene asignando a cada variable la etiqueta lingüística asociada al conjunto difuso que mejor se empareja con la componente correspondiente del ejemplo e l,esdecir, 4.1. Métodos Adhoc 41 donde 3. Asignar un grado de importancia a cada regla Se obtiene calculando el valor de envoltura de la regla sobre el ejemplo correspondiente de la siguiente forma: 4. Obtener una Base de Reglas final a partir del conjunto de reglas lingüísticas candidatas Para ello, se agrupan las reglas lingüísticas según sus antecedentes y se selecciona en cada grupo la regla con el mayor valor de envoltura

4.1. Métodos Ad hoc: Wang y Mendel (2) Conjunto de Ejemplos e = (0.2, 1.0, 0.3) 1 e = (0.4, 0.8, 1.0) 2 e = (1.0, 1.2, 1.6) 3 e = (1.2, 0.6, 1.4) 4 e = (1.8, 1.8, 2.0) 5 μ P ( 0.2) > { μm (0.2), μg (0.2)} RC 1 : Si X 1 es P y X 2 es M ENTONCES Y es P RC 2 : Si X 1 es P y X 2 es M ENTONCES Y es M RC 3 : Si X 1 es M y X 2 es M ENTONCES Y es G RC 4 : Si X 1 es M y X 2 es M ENTONCES Y es M RC 5 : Si X 1 es G y X 2 es G ENTONCES Y es G VE (RC 1 Π,e1) = 0.373 2 VEΠ (RC,e2 ) = 0.267 3 VEΠ (RC,e3) = 0.267 4 VEΠ (RC,e4 ) = 0.102 5 VEΠ (RC,e5) = 0.479 P G 4.1. Métodos Adhoc 42 X 1 X 2 Y P M G 0 2 P M G 0 2 B 1 B 2 0 2 Base de Datos B 3 P = B 1 (-0.65, 0, 0.65) M = B 2 ( 0.35, 1, 1.65) G= B 3 ( 1.35, 2, 2.65) P M G No hay ejemplos No hay ejemplos No hay ejemplos No hay ejemplos No hay ejemplos No hay ejemplos X 2 P M G X 1 R 1 P R 2 G R 3 G

4.1. Métodos Ad hoc: Wang y Mendel para Clasificación (Chi y otros) 4.1. Métodos Adhoc El único cambio con respecto al de modelado, es el cálculo del consecuente La regla generada a partir de cada ejemplo, tendrá la clase asociada a dicho ejemplo en el consecuente (C j ) En caso de incorporar grado de certeza, se calcula como S j /S, donde: S j es el número de ejemplos de clase C j situados en el subespacio difuso de entrada en cuestión S es el número total de ejemplos de dicho subespacio 43

4.1. Métodos Ad hoc: Ishibuchi y otros (guiado por rejilla) 4.1. Métodos Adhoc Método de Ishibuchi y otros: Reglas TSK simplificadas 1. Considerar una partición difusa del espacio de las variables 2. Para cada subespacio de entrada difuso n-dimensional hacer: 2.a. Construir el conjunto de ejemplos positivos contenidos en el subespacio, es decir, aquellos ejemplos con un grado de pertenencia mayor que cero al conjunto de antecedentes que define el subespacio 2.b. Si existe al menos un ejemplo positivo, calcular la media de los valores de salida de los ejemplos existentes y asignarla como consecuente de la regla. Añadir la regla a la Base de Reglas En otro caso, no generar ninguna regla en este subespacio 44

4.1. Métodos Ad hoc: Cordón y Herrera (guiado por rejilla) 4.1. Métodos Adhoc 45 Método de Cordón y Herrera: Reglas de Mamdani 1. Considerar una partición difusa del espacio de las variables 2. Para cada subespacio de entrada difuso n-dimensional hacer: 2.a. Construir el conjunto de ejemplos positivos contenidos en el subespacio, es decir, aquellos ejemplos con un grado de pertenencia mayor que cero al conjunto de antecedentes que define el subespacio 2.b. Si existe al menos un ejemplo positivo hacer: 2.b.i. Considerar aquellos consecuentes (términos lingüísticos de la variable de salida) que envuelven en un grado mayor que 0 a algún ejemplo positivo 2.b.ii. Calcular el valor de envoltura (VE) de las reglas construidas con estos consecuentes 2.b.iii. Añadir a la Base de Reglas aquella regla que presente el valor más alto de la función de valoración de la regla (FVR) En otro caso, no generar ninguna regla en este subespacio

4.1. Métodos Ad hoc: Cordón y Herrera (2) 4.1. Métodos Adhoc 46 VE(R s k Opciones de FVR: s,e l s l s l s l s ) = Min μ (x ),, (x ), (y ) s 1 K μ s s 1 A n n μ A B k s Grado de envoltura del ejemplo mejor envuelto FVR 1 (R s k s ) max VE(R Grado medio de envoltura sobre el conjunto de ejemplos FVR 2 (R s k s ) Promedio de los dos grados de envoltura anteriores FVR (R ) = = = e l s e E l s FVR s E VE(R s (R E s s k s k s s,e,e l ) FVR l s s ) ) (R s s s 3 s k 1 s k 2 s k )

4.1. Métodos Ad hoc: Cordón y Herrera (3) P M G Conjunto de Ejemplos e = (0.2, 1.0, 0.3) 1 e = (0.4, 0.8, 1.0) 2 e = (1.0, 1.2, 1.6) 3 e = (1.2, 0.6, 1.4) 4 e = (1.8, 1.8, 2.0) 5 P M X 2 X 1 e 4 e2 e 1 e 3 0 Y P M 4.1. Métodos Adhoc 47 X 1 X 2 Y P M G 0 2 P M G 0 2 B 1 B 2 0 2 Base de Datos B 3 P = B 1 (-0.65, 0, 0.65) M = B 2 ( 0.35, 1, 1.65) G= B 3 ( 1.35, 2, 2.65) X 2 P M G X 1 G P M G No hay ejemplos R 2 P No hay ejemplos R 1 M R 3 M No hay ejemplos No hay ejemplos R 4 No hay ejemplos G e 5 FVR (R 3 2 M) = 0,282 3 FVR 2 (RG) = 0,154 2 G

4.1. Métodos Ad hoc: Cordón y Herrera (guiado por rejilla) 4.1. Métodos Adhoc 48 1. Considerar una partición difusa del espacio de las variables 2. Para cada subespacio de entrada difuso n-dimensional hacer: 2.a. Construir el conjunto de ejemplos positivos contenidos en el subespacio, es decir, aquellos ejemplos con un grado de pertenencia mayor que cero al conjunto de antecedentes que define el subespacio 2.b. Si existe al menos un ejemplo positivo: 2.b.i. Método de Cordón y Herrera: Reglas TSK Considerar aquellos ejemplos positivos con mayor grado de pertenencia al antecedente de la regla 2.b.ii. Calcular un consecuente TSK para la regla mediante un método de optimización numérica (en nuestro caso, una EE-(μ,λ)), considerando únicamente esos ejemplos. Añadir la regla obtenida a la Base de Reglas En otro caso, no generar ninguna regla en este subespacio

4.1. Métodos Ad hoc: Ishibuchi y otros (guiado por rejilla) 4.1. Métodos Adhoc 49 Método de Ishibuchi y otros: Reglas de clasificación 1. Considerar una partición difusa del espacio de las variables 2. Para cada subespacio de entrada difuso n-dimensional hacer: 2.a. Construir el conjunto de ejemplos positivos contenidos en el subespacio, es decir, aquellos ejemplos con un grado de pertenencia mayor que cero al conjunto de antecedentes que define el subespacio 2.b. Si existe al menos un ejemplo positivo: 2.b.i. Para cada clase del problema, {C 1,..., C M }, calcular la suma de los grados de pertenencia de los ejemplos de la clase existentes en el subespacio 2.b.ii. En caso de empate en la suma de los grados de pertenencia de dos o más clases, no generar la regla 2.b.iii. Si no hay empate, asociar al consecuente de la regla la clase C j, aquella con mayor valor en la suma de los grados de pertenencia. Añadir la regla obtenida a la Base de Reglas En otro caso, no generar ninguna regla en este subespacio

4.1. Métodos Ad hoc: Relación entre los Dos Enfoques 4.1. Métodos Adhoc 50 Partición difusa de la variable de entrada 2 Guiado por ejemplos (Wang-Mendel) Partición difusa de la variable de entrada 1 Guiado por rejilla difusa (Cordón-Herrera) Partición difusa de la variable de entrada 1 Guiados por ejemplos: un ejemplo sólo participa en la generación de una regla lingüística Guiados por rejilla difusa: un ejemplo puede participar en varias reglas; se genera igual o mayor número de reglas Partición difusa de la variable de entrada 2 1 regla 2 reglas 4 reglas

4.2. Diseño Evolutivo de Sistemas Difusos 4.1. Métodos Ad-hoc Entrada escalada Reglas Difusas Fuzzificación Algoritmos Base de Conocimiento Funciones de escalado Motor de inferencia Procesamiento Difuso Funciones de pertenencia Diseño Evolutivo Defuzzificación Salida escalada 51

4.2. Diseño Evolutivo de Sistemas Difusos: Algoritmos Genéticos 4.1. Métodos Ad-hoc Los Algoritmos Genéticos son algoritmos de optimización, búsqueda y aprendizaje inspirados en los procesos de Evolución Natural y Evolución Genética 52

4.2. Diseño Evolutivo de Sistemas Difusos: Algoritmos Genéticos (2) t reproducción t + 1 selección 4.1. Métodos Ad-hoc mutación Cruce (o recombinación) 53

4.2. Diseño Evolutivo de Sistemas Difusos: Algoritmos Genéticos (3) 4.1. Métodos Ad-hoc Selección POBLACIÓN Reemplazamiento PADRES Cruce Mutación DESCENDIENTES 54

4.2. Diseño Evolutivo de Sistemas Difusos: Algoritmos Genéticos (4) 4.1. Métodos Ad-hoc Algoritmo Genético Básico Inicio (1) t=0 inicializar P(t) evaluar P(t) Mientras (no se cumpla la condición de parada) hacer Inicio(2) t=t+1 seleccionar P (t) desde P(t-1) P (t) cruce P (t) P(t) mutación P (t) evaluar P(t) Final(2) Final(1) 55

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos Objetivo del proceso de aprendizaje de un SBRD Encontrar una BC tal que el SBRD que la incluya resuelva un problema dado. 4.1. Métodos Ad-hoc Qué partes del SBRD se van a optimizar? Procesos de aprendizaje: Diseño de algunos componentes de la Base de Conocimiento o de la Base de Conocimiento al completo. Procesos de ajuste: Optimización de un SBRD existente. 56

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos (2) R1: Si X1 es Alto y X2 es Bajo -> Y es Medio R2: Si X1 es Bajo y X2 es Medio -> Y es Alto... Predefinidos Factores de escala Bajo Medio Alto X1 4.1. Métodos Ad-hoc Base de Conocimiento Base de Reglas Base de Datos Bajo Medio Bajo Medio Alto Alto X2 Y Interfaz de Fuzificación Mecanismo de Inferencia Interfaz de Defuzificación 57

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos (3) Predefinida R1: Si X1 es Alto y X2 es Bajo -> Y es Medio R2: Si X1 es Bajo y X2 es Medio -> Y es Alto... Factores de escala Bajo Medio Alto X1 4.1. Métodos Ad-hoc Base de Conocimiento Base de Reglas Base de Datos Bajo Medio Bajo Medio Alto Alto X2 Y Interfaz de Fuzificación Mecanismo de Inferencia Interfaz de Defuzificación 58

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos (4) Predefinida R1: Si X1 es Alto y X2 es Bajo -> Y es Medio R2: Si X1 es Bajo y X2 es Medio -> Y es Alto... Predefinidos Factores de escala Bajo Medio Alto X1 4.1. Métodos Ad-hoc Base de Conocimiento Base de Reglas Base de Datos Bajo Medio Bajo Medio Alto Alto X2 Y Interfaz de Fuzificación Mecanismo de Inferencia Interfaz de Defuzificación 59

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos (5) R1: Si X1 es Alto y X2 es Bajo -> Y es Medio R2: Si X1 es Bajo y X2 es Medio -> Y es Alto... Factores de escala Bajo Medio Alto X1 4.1. Métodos Ad-hoc Base de Conocimiento Base de Reglas Base de Datos Bajo Medio Bajo Medio Alto Alto X2 Y Interfaz de Fuzificación Mecanismo de Inferencia Interfaz de Defuzificación 60

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos (6) 4.1. Métodos Ad-hoc Según las componentes que se optimicen: Espacio de búsqueda más pequeño Proceso de aprendizaje más sencillo y rápido Las soluciones pueden ser suboptimales Espacio de búsqueda más completo Proceso de aprendizaje más complejo e ineficiente Mayor granularidad en el aprendizaje, mejor consideración de la interdependencia, mayor probabilidad de encontrar soluciones óptimas 61

4.2. Diseño Evolutivo de Sistemas Difusos: Tipos (7) Equilibrio entre completitud y granularidad 4.1. Métodos Ad-hoc Tipos de SBRDs Genéticos: SistemasconajustegenéticodelaBasedeDatos Sistemas con aprendizaje genético de la Base de Reglas Sistemas con aprendizaje genético de la Base de Conocimiento Sistemas con aprendizaje genético del Mecanismo de Inferencia (poco usuales) 62

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la Base de Reglas PROCESO DE APRENDIZAJE 4.1. Métodos Ad-hoc Base de Datos predefinida Base de Reglas (BR) Módulo de evaluación (BR) Aprendizaje genético de la Base de Reglas 63

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la Base de Reglas (2) 4.1. Métodos Ad-hoc El aprendizaje genético de la BR asume la existencia de una definición previa de la BD Esquema de representación: Alternativas: Un cromosoma representa una base de reglas al completo (Enfoque Pittsburgh) Apto para diseño off-line Un cromosoma representa una regla y la población al completo,labasedereglas (Enfoque Michigan) Apto para diseño on-line Operadores: Adaptados al esquema de representación 64

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la Base de Reglas (3) Ejemplo: Problema de control con dos variables de entrada y una de salida. Existe una base de datos definida a través de conocimiento experto, que determina las funciones de pertenencia para las siguientes etiquetas: 1 2 3 4 5 6 7 8 9 Error {N, C, P} Error {N,C,P} Potencia {B, M, A} 4.1. Métodos Ad-hoc 2 6 9 2 6 9 1 6 8 1... (2) (6) R1: Si el Error es Cero y la Variación_Error es Positiva entonces la Potencia es Alta R1 (9) R2 65

4.2. Diseño Evolutivo de Sistemas Difusos: Método de Thrift 4.1. Métodos Ad-hoc En el enfoque Pittsburgh, cada cromosoma codifica una definición completa de la BR Los primeros enfoques, como Thrift, codifican la estructura de tabla de la BR en un vector de consecuentes Se numeran los términos lingüísticos asociados a la variable de salida de 1 a n y pasan a ser los contenidos del vector Se asocia el valor 0 a la ausencia de regla en el subespacio, con lo que el AG es capaz de aprender el número de reglas X 1 X 2 P M G R 1 R 2 R 3 P B M R 4 R 5 R 6 M M G 1 2 3 Y {B, M, A} R 7 R 8 R 9 1 0 2 0 2 0 2 0 3 M A 66

4.2. Diseño Evolutivo de Sistemas Difusos: Longitud fija vs. Longitud variable 4.1. Métodos Ad-hoc El problema de la codificación de Thrift es que es difícil reducir el tamaño de la BR sólo mediante el valor nulo Otra solución es emplear cromosomas de longitud variable: Los cromosomas de la población pueden presentar distinto tamaño, codificando BRs con distinto número de reglas El problema es que el diseño de los operadores genéticos es más complejo 67

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la BC al completo 4.1. Métodos Ad-hoc El proceso de aprendizaje de la BC debe determinar: Funciones de pertenencia Reglas difusas y, algunas veces también Factores (o funciones) de escala Términos lingüísticos Espacio de búsqueda grande y complejo Cromosomas con longitud variable Una regla por cromosoma 68

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la BC al completo (2) 4.1. Métodos Ad-hoc PROCESO DE APRENDIZAJE Base de Conocimiento Base de Datos Base de Reglas Módulo de evaluación (BC) Aprendizaje de la Base de Conocimiento 69

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la BC al completo (3) 4.1. Métodos Ad-hoc Elementos a codificar en un cromosoma: Factores de escala Funciones de pertenencia Reglas difusas Codificación con longitud fija o variable Cada tipo de elemento será una parte independiente del cromosoma Formas de combinar estas partes con los operadores genéticos: Mezclando subestructuras Como dos estructuras no relacionadas Aplicando un proceso secuencial cuando el resultado de cruzar una subestructura afecte al cruce de la segunda subestructura 70

4.2. Diseño Evolutivo de Sistemas Difusos: Aprendizaje de la BC al completo (4) Ejemplo: Problema con dos variables y tres etiquetas por variable Error: {N, C, P} Potencia: {B, M, A} 4.1. Métodos Ad-hoc Error Potencia Reglas 0 0 0.5 0.3 0.5 0.8 0.8 1 1.3 0 0 0.3 0.2 0.5 0.8 0.7 1 1 1 5 9... R1: Si el Error es Negativo entonces Potencia es Alta R2:... 71

4.2. Diseño Evolutivo de Sistemas Difusos: Bibliografía Recomendada O. Cordón, F. Herrera, F. Hoffmann y L. Magdalena. Genetic Fuzzy Systems. Evolutionary Tuning and Learning of Fuzzy Knowledge Bases. World Scientific, 2001. 4.1. Métodos Ad-hoc 72

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes 4.1. Métodos Ad-hoc Redes neuronales artificiales (RNAs): Modelo computacional de las operaciones del cerebro humano Nodos conectados mediante enlaces Pesos como memoria a largo plazo Capacidad de aprendizaje: actualización de los pesos Simple y fácil de aplicar, pero se obtienen modelos de caja negra 73

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes (2) 4.1. Métodos Ad-hoc Componentes: MODELO DE NEURONA Un conjunto de enlaces de entrada desde otros nodos Un conjunto de pesos que ponderan cada entrada Una salida Una función de activación, generalmente no lineal Entrada x 1 x 2 x N w 1 w 2 w N v Salida y f N = f i = 1 y w i x i θ 74

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes (3) Tipos de funciones de activación no lineales +1 f h (v) +1 f r (v) +1 f s (v) 4.1. Métodos Ad-hoc 0 α 0 α 0 α -1 Limitador estricto Rampa Función sigmoide 75

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes (4) RNs hacia delante No existen conexiones hacia atrás Salidas RNs retroalimentadas Se producen ciclos por conexiones hacia atrás No se garantiza la estabilidad Salidas 4.1. Métodos Ad-hoc Entradas Entradas 76

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes (5) 4.1. Métodos Ad-hoc ALGORITMOS DE APRENDIZAJE Aprendizaje supervisado Usa un conjunto de datos de entrenamiento consistente en pares entrada-salida Los pesos se adaptan para aproximarse lo mejor posible a los datos de entrenamiento Aprendizaje no supervisado Se ajustan los pesos en respuesta a patrones de entrada, sin disponer de las respuestas deseadas En este caso se clasifican los patrones de entrada en categorías similares 77

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes (6) 4.1. Métodos Ad-hoc 78 PERCEPTRONES MULTICAPA Redes neuronales hacia delante con varias capas No hay enlaces entre nodos de la misma capa Conexiones sólo con la capa vecina Aprendizaje por retropropagación del error Patrones de salida........ Patrones de entrada

4.3. Diseño de Sistemas Difusos con Redes : Introducción a las Redes (7) 4.1. Métodos Ad-hoc Aprendizaje de los pesos por retropropagación del error Cambiar iterativamente los pesos de los enlaces poco a poco E = 0.5 Minimizando el error Evalúa la derivada de E y cambia w ji en la dirección opuesta a la derivada w ji w ji + Δw ji k ( t k o k donde Δw ) ji 2 E = η w ji 79

4.3. Diseño de Sistemas Difusos con Redes : Sistemas Neuro-Difusos 4.1. Métodos Ad-hoc Son sistemas híbridos que combinan técnicas de redes neuronales y sistemas de inferencia difusa De este modo, se asocia la capacidad de aprendizaje de las RNAs con la tolerancia a fallos, interpretabilidad y robustez de los sistemas difusos Permiten integración de conocimiento (métodos previos, expertos, etc.) También es posible extraer el conocimiento incluido en la RNA en formato de reglas difusas (por eso son considerados modelos de caja gris ) 80

4.3. Sistemas Neuro-Difusos: Arquitectura La arquitectura más común consta de 5 capas: 4.1. Métodos Ad-hoc 1. Entradas 2. Fuzzificación 3. Reglas 4. Consecuentes 5. Defuzzificación 81

4.3. Sistemas Neuro-Difusos: Problemática 4.1. Métodos Ad-hoc Limitaciones de los Sistemas Neuro-Difusos: Número pequeño de entradas (curso de la dimensionalidad: crecimiento geométrico de la complejidad según el número de entradas) Dificultad para aprender la estructura de las reglas. Generalmente, sólo aprenden la forma de las funciones de pertenencia y los coeficientes del consecuente (en TSK) Dificultad para tratar funciones no diferenciables (por ejemplo, la t-norma del mínimo) Problemas de convergencia: caída en óptimos locales Problemas de sobreaprendizaje: Error de aproximación (conjunto de entrenamiento) mucho menor que el de generalización (conjunto de validación) 82

4.3. Sistemas Neuro-Difusos: Ejemplos 4.1. Métodos Ad-hoc Algunos ejemplos de Sistemas Neuro-Difusos: ANFIS (J.-S.R. Jang, 1993) Particionamiento de rejilla Reglas TSK NEFCLASS (D. Nauck, 1994) Particionamiento de rejilla Reglas de clasificación FSOM (P. Vuorimaa, 1996) Particionamiento de semántica libre NFH (F.J. de Soutza, 1997) Particionamiento jerárquico 83

4.3. Sistemas Neuro-Difusos: ANFIS 4.1. Métodos Ad-hoc ANFIS: Adaptive Network based Fuzzy Inference System (Jyh-Shing Roger Jang, 1993) Utiliza variables lingüísticas (particionamiento de rejilla) Únicamente ajusta las funciones de pertenencia Apto sólo para reglas TSK o TSK simplificadas Entrenamiento en dos pasos: Fijar el consecuente y ajustar los parámetros del antecedente (funciones de pertenencia) mediante Gradiente Descendente Fijar el antecedente y ajustar los parámetros del consecuente (coeficientes de los polinomios) mediante Optimización por Mínimos Cuadrados 84

4.3. Sistemas Neuro-Difusos: ANFIS (2) Razonamiento Difuso 4.1. Métodos Ad-hoc Estructura 85

4.3. Sistemas Neuro-Difusos: ANFIS (3) A 1 u 1 AND N u 1,u 2 4.1. Métodos Ad-hoc A 2 B 1 + y u 2 AND N u 1,u 2 B 2 Layer 1 2 3 4 5 86

4.3. Sistemas Neuro-Difusos: ANFIS (4) Pos AND N e Neg AND N W 1 4.1. Métodos Ad-hoc Pos N W 2 W 3 u ce Neg AND N W 4 AND 87

4.4. Diseño de SBRDs mediante Clustering: Introducción 4.1. Métodos Ad-hoc El clustering difuso introduce una gradación en la pertenencia de los elementos a los grupos De este modo, un agrupamiento difuso se caracteriza por una matriz de pertenencia, donde se refleja el grado de pertenencia de cada objeto a cada cluster Se aplica a dos tareas distintas en el diseño de SBRDs: Diseño de la BD mediante el aprendizaje automático de particiones difusas basadas en rejilla: clustering difuso sobre el espacio de cada variable individual Aprendizaje automático de reglas de Mamdani con semántica libre: se aplica el clustering en el espacio (n+1)-dimensional y se obtiene una regla difusa de cada cluster 88

4.4. Diseño de SBRDs mediante Clustering: Aprendizaje de reglas difusas con semántica libre 4.1. Métodos Ad-hoc 89 El proceso incluye dos etapas: 1. Generación de los clusters: se aplica un método de clustering difuso y se calculan los centros de los clusters a partir de la matriz de pertenencia obtenida 1. Identificación de las reglas de Mamdani con semántica libre: cada cluster se transforma en una regla por proyección en las n+1 dimensiones El problema es fijar el número óptimo de clusters, que determina el tamaño de la base de reglas difusas. Hay métodos para ello (Chiu, Sugeno,...), pero no funcionan bien Se pueden diseñar SBRDs TSK y TSK simplificados, con el antecedente de las reglas y creando un consecuente por optimización numérica sobre los ejemplos del subespacio

4.4. Diseño de SBRDs mediante Clustering: Fuzzy C-Means 4.1. Métodos Ad-hoc 90 El algoritmo FCM se basa en minimizar iterativamente la distancia entre los objetos en los clusters y maximizar la distancia entre los centros de éstos. Sea N c el número de clusters y N e el número de ejemplos: 1. Inicializar aleatoriamente la matriz de pertenencia μ c (x i ) 2. Calcular los centros de los clusters v c : (μc(x i) x i) = i= 1 Ne m μ (x ) 3. Actualizar los valores de pertenencia de cada objeto a partir de los nuevos centros: 1 μ c (x ) = 4. Si han cambiado los centros, ir a 2. Si no, terminar i N c k= 1 d(x i,v d(x i,v c k v c ) ) N e i= 1 2/(m 1) c i m

4.4. Diseño de SBRDs mediante Clustering: Identificación de las reglas difusas con semántica libre 4.1. Métodos Ad-hoc 91 Una posibilidad consiste en proyectar los clusters difusos para obtener conjuntos difusos triangulares Sea n el número total de variables del problema y sea v c =(v c1,..., v cj,...,v cn ), c {1,...,N c }, el cluster c-ésimo: 1. Sea X c el conjunto de ejemplos pertenecientes a v c 2. Sean i c j yd c j los dos patrones de X c {v c }conmenorymayor valor en la variable j, respectivamente 3. El conjunto difuso triangular (l c j,m c j,n c j)asociadoalavariablex j de la regla R c se obtiene: c l j cj v, = cj cj c cj μ (i )(v i i - c cj 1 μc(i ) j ), c si i j = vc en otro caso c n j c v = c d j j m c j =v c, cj cj c μ (d )(d - v + c cj 1 μc(d ) = vc en otro caso j ), c si d j

5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar 92 1. Estimación de los costes de mantenimiento de línea eléctrica de baja y media tensión 2. Valoración de la Calidad del Arroz Cocido 3. Predicción del Riesgo de Contraer Enfermedades Cardiovasculares 4. Problema del Sonar

5.1. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Baja y Media Tensión 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar Sistema eléctrico español (antes de 1998): Las compañías eléctricas compartían una empresa, Red Eléctrica Española, que recibía todos los pagos y los distribuía entre ellas La distribución se hacía con respecto a una serie de criterios complejos, que el Gobierno decidió revisar Uno de ellos se refería a los costes de mantenimiento de la línea eléctrica perteneciente a cada compañía Las compañías se encontraron con problemas para calcular los costes de: Las líneasdebajatensión, al estar tendidas en pueblos, no se sabía la longitud real de la línea tendida Las líneas de media tensión, al requerir el gobierno los costes de mantenimiento de la instalación óptima y no la real, que ha sido instalada incrementalmente 93

5.1.1. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Baja Tensión 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar Línea Eléctrica de Baja Tensión en Zonas Rurales Estimación de la longitud total de línea eléctrica de bajo voltaje instalada en una zona rural Dos variables de entrada: número de habitantes y radio de la población Variable de salida: longitud de línea empleada (el coste de mantenimiento es función de dicha longitud) Conjunto de datos de ejemplo con 495 pueblos División aleatoria en 396 y 99 datos para entrenamiento y prueba, respectivamente (80-20%) Siete etiquetas en cada partición difusa 94

5.1.1. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Baja Tensión (2) Se definieron distintos modelos de pueblo en vista de los datos obtenidos 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar 95

5.1.1. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Baja Tensión (3) 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar Comparativa de Resultados de Distintos Métodos Método #R ECM entr ECM prueba Wang-Mendel 24 222,623 240,566 Cordón-Herrera 32 267,923 249,523 Ishibuchi (TSK simp.) 32 173,230 190,808 Thrift 47 185,204 168,060 Shan-Fu 45 1,281,547 1,067,993 ANFIS 49 256,605 268,451 FCM 49 163,615 198,617 Chiu+FCM 37 200,999 222,362 Regresión polinómica 3er orden 49 nodos, 2 par. 235,934 202,991 RN 2-25-1 102 par. 169,399 167,092 96

5.1.1. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Baja Tensión (4) 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar Influencia de la granularidad en las particiones difusas basadas en rejilla: Misma granularidad en todas las variables Método WM Método CH Granul. ECM entr ECM prue ECM entr ECM prue 3 594.276,3 626.566,8 322.227,6 293.986,9 4 301.732,1 270.747,4 292.714,5 270.349,8 5 298.446,1 282.058,1 329.726,2 306.325,7 6 239.563,1 194.842,8 317.516,6 311.065,8 7 222.622,7 240.018,2 267.923,9 249.523,8 8 241.716,7 216.651,6 199.421,3 180.000,4 9 197.613,4 283.645,5 201.272,8 224.805,7 97

5.1.1. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Baja Tensión (5) Influencia de la granularidad en las particiones difusas basadas en rejilla: Distinta granularidad en cada variable 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar Mejor Entr. Mejor Prue. Método WM Método CH Granul. 6 9 9 Granul. 8 8 6 ECM entr 186.904,3 ECM entr 192.498,2 ECM prue 264.896,5 ECM prue 167.731,5 Granul. 9 6 9 Granul. 7 6 7 ECM entr 202.370,9 ECM entr 210.983,1 ECM prue 146.355,1 ECM prue 152.412,4 98

5.1.2. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Media Tensión 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar Línea Eléctrica de Media Tensión en Zonas Urbanas Estimación del costo de mantenimiento de la línea eléctrica de media tensión tendida por una compañía en núcleos urbanos Cuatro variables de entrada: longitudes de las calles, área total, área ocupada por edificios y energía suministrada Variable de salida: costo de mantenimiento de la línea de media tensión Muestra simulada de 1.059 ciudades División en 847 y 212 datos de entrenamiento y prueba, respectivamente (80-20%) Cinco etiquetas en cada partición difusa 99

5.1.2. Estimación de los Costes de Mantenimiento de la Línea Eléctrica de Media Tensión (2) 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar 100 Comparativa de Resultados de Distintos Métodos Método #R ECM entr ECM prueba Wang-Mendel (3 etiq.) 28 197,313 174,400 Wang-Mendel 66 71,294 80,934 Cordón-Herrera +Tun (TSK) 268 11,073 11,836 Thrift 534 34,063 42,116 Shan-Fu ANFIS FCM Chiu+FCM Regresión polinómica 2º orden 77 nodos, 15 par. 103,032 45,332 RN 4-5-1 35 par. 86,469 33,105

5.2. Valoración de la Calidad del Arroz Cocido 5.1. Costes de Mantenimiento Línea Eléctrica 5.2. Calidad Arroz Cocido 5.3. Riesgo Enfermedades Cardiovasculares 5.4. Sonar 101 Descripción del Problema Valoración subjetiva de la calidad del arroz cocido realizado por expertos Cinco variables de entrada: gusto, apariencia, sabor, pegajosidad y dureza Conjunto de ejemplos con 105 datos normalizados Diez particiones de 75 y 30 ejemplos para entrenamiento y prueba, respectivamente Dos etiquetas en cada partición difusa