Un ejemplo de Procesamiento Conexionista: Una Simulación de recuperación de información Tomado (adaptado) de McClelland y Rumelhart. (1988) Parallel Distributed: A Handbook of Models, Pograms and Exercises. Cambridge, MA: MIT Press. DATOS Atlético-Madrid Nombre Equipo Edad Educación Estado Civil Ocupación Antón Atlético 40 Bachiller Soltero Camionero Raúl Madrid 30 Licenciado Divorciado Comercial.................. Rafael Atlético 30 Bachiller Soltero Policía Luis Atlético 20 ESO Casado Albañil Sergio Madrid 20 ESO Soltero Peón Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 1
Antón Rafael 20 30 Raúl Sergio Luis 40 Bachiller ESO Comercial Camionero Peón Policía Albañil Licenciado Atlético Soltero Casado Madrid Divorciado Componentes del Modelo a) La Unidades o nodos. Hay 26 unidades en el modelo: 5 unidades para cada persona. 5 unidades para cada nombre de la persona 16 unidades de las propiedades Las unidades se agrupan en siete clases; dentro de cada grupo las unidades son mutuamente exclusivas. Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 2
b) Activaciones: Cada unidad tiene asociado un valor de activación, activación u, Inicialmente a cada unidad se le da el "valor de reposo" de -0.10. Cuando se ejecuta la simulación, las activaciones varían dinámicamente entre -0.20 y +1.00, reflejando los efectos del input externo, la propagación de las activaciones desde las otras unidades del sistema y la decadencia sobre el tiempo. El input externo es la activación de ciertas unidades por el medio. Sólo las unidades de propiedades y de nombres pueden constituirse en inputs externos, son unidades visibles. Las unidades de personas no son accesibles desde fuera de la red, son unidades ocultas o invisibles. Su única fuente de cambio de activación, además de la degeneración, es la propagación de activación desde otras unidades con las que estén conectadas. c) Conexiones ponderadas: En este tipo de red, todas las conexiones son bidireccionales y tienen asignado un peso binario. Siempre hay una conexión de la unidad i a la unidad u con el peso ui, hay una conexión inversa de la unidad u a la unidad i con peso iu del mismo valor. (Convencionalmente, el orden de los subíndices es el inverso de la dirección de propagación de la activación). Específicamente, para cada unidad de persona hay una conexión excitadora (con peso 1) con el nombre y con cada una de sus propiedades. Así, una unidad de persona propaga la activación a todas sus unidades de propiedad, y una unidad de propiedad a todas las unidades de persona que la poseen. Se usan pesos de -1 para establecer conexiones inhibitorias entre las unidades dentro de su grupo. Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 3
Dinámica del Modelo Recuperación de la Información en la red Para simular una tarea de recuperación de la información se suministra un input a una o más de las unidades visibles. Por ejemplo, Para recuperar los datos de Antón, incrementamos en la unidad Antón (nombre). Las conexiones excitatorias en la red propagarán esta activación primero a la unidad Antón (persona), y desde allí a las unidades de las propiedades de Antón. Esta activación continuará reverberando a través de la red a lo largo de los numerosos ciclos de proceso, durante los cuales las unidades de las propiedades de Antón incrementarán la activación. Al mismo tiempo, cada unidad activa enviará inhibiciones a las otras unidades de su grupo. Cada cambio en la activación produce cambios adicionales en las otras unidades, y este proceso de cambio dinámico en los valores de la activación se puede repetir muchas veces. Después de un número de ciclos, el sistema se estabiliza de modo que el input a cada unidad será el que le permite mantener su activación actual (su atractor). En este momento sólo un subconjunto de las unidades tendrán altos valores de activación. En el ejemplo, las unidades que se estabilizan con alta activación incluyen a : Antón, Atlético, 40, Bachiller, Soltero y Camionero. Así al preguntar a la red por un nombre obtenemos las propiedades de la persona. Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 4
Las ecuaciones Sea u: la unidad para la que se calcula la activación. como índice, es el conjunto de todas las unidades a las que se aplica la ecuación. Sea i: la unidad (o unidades) que alimentan a u. Para propagar la activación, cada unidad i envía un output excitatorio o inhibitorio a cada unidad u con la que está conectada. Función de output: el output es igual a la activación si supera un umbral de cero y es cero en otro caso output i = activacion i si activacion i > 0 y output i = 0 en otro caso Cuando los valores resultantes de i se multiplican por el peso de su conexión con u, el valor resultante sirve como input de u: input ui = peso ui output i Para la red del ejemplo, en la que los pesos son o +1 o -1, el peso simplemente determina el signo del input, si es excitaorio o inhibitorio. input de red: la unidad u recibe un input de todas las unidades con las que está conectada. Usualmente, estos input sencillamente se añaden juntos, y el total multiplicado por su fuerza, es el valor resultante del input de red. Fuerza: la fuerza es un número que se selecciona para escalar al input por debajo de un grado deseado, el valor más bajo es el propio valor del input, y se incrementa según los cambios en los valores de activación. Como si u está en contacto con el medio puede recibir un input externo (es el caso de las unidades nombres), este parámetro permite ajustar la influencia relativa de un input externo frente a uno interno: redinput u = 0.1 peso ui. output i + 0.4 extinput u i Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 5
Sobre la base del input de red, la unidad incrementará o disminuirá su activación de acuerdo con la regla de activación que muestran las siguientes ecuaciones: a u = (max - a u ) (redinput u ) - (tasadecre) (a u - rest) si redinput > 0 a u = (a u - min) (redinput u ) - (tasadecre) (a u - rest) si redinput 0 Donde: a u es la activación actual a u representa el cambio a realizar en activacion u max es el valor máximo de activación que una unidad puede tomar (1 en el ejemplo) tasadecre es una tasa de decremento de la activación. La ecuación tiene dos términos: El primero calcula el cambio debido al input de red (un incremento para valores positivos y un decremento para valores negativos). (max - a u ) (redinput u ) expresa que si tenemos un input de red positivo, lo escalaremos por un multiplicador que depende de cuán lejos está la activación actual de la activación máxima. Así cuanto mayor sea el input de red y menos la activación actual, más se incrementa la activación El segundo es un termino de degradación que disminuye la activación. Con este diseño podemos realizar tareas de recuperación de las propiedades de un nombre, recuperación del nombre desde las propiedades, categorización, formación de prototipo y utilización de regularidades. Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 6
Interpretación Semántica de los sistemas conexionistas Al Diseñar una red conexionista que sirva como modelo de realizaciones humanas en algún dominio, hay que determinar cómo representaremos los conceptos relevantes en la red. Hay dos modos: a) Redes Locales: Cada concepto se asigna a una unidad (el ejemplo anterior es de este tipo). Este manera de representación tienen la ventaja de: La unidades pueden etiquetarse en el lenguaje natural y comprender mejor su funcionamiento. De todas formas esta interpretación es externa, la red no tiene noticia semántica alguna. Adecuadas para: Tareas de satisfacción de restricciones múltiples b) Redes Distribuidas: Cada concepto se representa por un patrón de activación a través de un conjunto de unidades. En este caso las unidades no tienen una interpretación semántica, sino que queda distribuida entre varias unidades. Adecuadas para: investigar los procesos de generalización Carlos Muñoz Gutiérrez. Departamento de Lógica y Filosofía de la Ciencia. 7