Aplicación de la teoría de Agentes al modelo de grafos para la detección de patrones en Textos



Documentos relacionados
Deducción de parámetros y comportamiento

Dasometría / Celedonio L

Ondas y Rotaciones. Colisiones Inelásticas

Conservación del Momento Lineal y de la Energía

Capitalización y descuento simple

EXPERIMENTACIÓN COMERCIAL(I)

TEMA 4 Variables aleatorias discretas Esperanza y varianza

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009

Distancias e Indices Parciales de Medidas Difusas

DEFINICIÓN DE INDICADORES

ONE CLASS SVM para la detección de fraudes en el uso de energía eléctrica

Regresión no lineal mediante la evolución de modelos Híbridos de Redes Neuronales 1

Módulo 3. OPTIMIZACION MULTIOBJETIVO DIFUSA (Fuzzy Multiobjective Optimization)

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó

Trabajo Especial 2: Cadenas de Markov y modelo PageRank


5. DIAGONALIZACIÓN DE MATRICES

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

La predicción de la demanda en la evaluación de proyectos. Anna Matas José Luis Raymond Mar González-Savignat Adriana Ruíz

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

Pruebas Estadísticas de Números Pseudoaleatorios

1. GENERALIDADES DEL ÁLGEBRA GEOMÉTRICA. Definición del álgebra geométrica del espacio-tiempo

Tema I: Introducción a los sistemas de instrumentación

Cifrado de imágenes usando autómatas celulares con memoria

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

ESTRATEGIAS DIDÁCTICAS PARA ABORDAR LA EDUCACIÓN

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

ANÁLISIS DE ACCESIBILIDAD E INTERACCIÓN ESPECIAL:

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

CONTROVERSIAS A LAS BASES TÉCNICO ECONOMICAS PRELIMINARES PROCESO TARIFARIO CONCESIONARIA COMPAÑÍA DE TELÉFONOS DE COYHAIQUE S.A.

12-16 de Noviembre de Francisco Javier Burgos Fernández

Clase 25. Macroeconomía, Sexta Parte

CANTIDADES VECTORIALES: VECTORES

TEMA 3: Dinámica II Capitulo 1. Trabajo y energía

Unidad I Definición de reacción de combustión Clasificación de combustibles

Relaciones entre variables

Un Sistema de Recuperación de Información Estructurada

Marcos Gutiérrez-Dávila

UNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II

ACTIVIDADES INICIALES

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

PROPORCIONAR RESERVA ROTANTE PARA EFECTUAR LA REGULACIÓN PRIMARIA DE FRECUENCIA ( RPF)

DETERMINACIÓN DE ERRORES Y TRATAMIENTO DE DATOS. II. Error en una medida: determinación y expresión de errores.

1.1 Ejercicios Resueltos Tema 1

[1] [1 ] Esta condición evita que haya rotación del sistema Composición de fuerzas paralelas.

Índice de Precios de las Materias Primas

CÁLCULO VECTORIAL 1.- MAGNITUDES ESCALARES Y VECTORIALES. 2.- VECTORES. pág. 1

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

Obtención de mapas de similitud sísmica 2D mediante redes neuronales Oscar Rondón*, PDVSA-Intevep, y Rafael Banchs, PDVSA -Intevep

Ideas Básicas sobre Métodos de Medida

Algoritmo para la ubicación de un nodo por su representación binaria

CAPÍTULO V ANUALIDADES

Diagramas de Heissler para la solución de problemas de conducción transitoria.

TERMODINÁMICA AVANZADA

COMPARADOR CON AMPLIFICADOR OPERACIONAL

APENDICE A. El Robot autónomo móvil RAM-1.

Tema 3: Adaptadores de Señal

Starbridge Networks 305EU Manual

Análisis de Regresión y Correlación

Tablas de vida de decrementos múltiples

Qué es la EN81-28? Atrapado en el ascensor?

TEMA 8: PRÉSTAMOS ÍNDICE

TEMA N 2.- TEORÍA DE REDES (PERT Y CPM)

Tu área reservada Organización Simplicidad Eficiencia

VII Jornadas para el Desarrollo De Grandes Aplicaciones de Red

Manual. Starbridge 305EU. Contenido

TEMA 10. OPERACIONES PASIVAS Y OPERACIONES ACTIVAS.

Gestión de Oportunidades

Unidad Central del Valle del Cauca Facultad de Ciencias Administrativas, Económicas y Contables Programa de Contaduría Pública

RESISTENCIAS EN SERIE Y LEY DE LAS MALLAS V 1 V 2 V 3 A B C

Profesor: Rafael Caballero Roldán

Rendimiento de sistemas paralelos. Arquitectura de Computadoras II Fac. Cs. Exactas UNCPBA Prof. Marcelo Tosini 2015

UNIVERSIDAD DE SANTIAGO DE CHILE DEPARTAMENTO DE FISICA PROGRAMA DE PERFECCIONAMIENTO FUNDAMENTAL ESTATICA

TESIS MAGÍSTER EN INGENIERÍA ELECTRÓNICA BOOSTING SUPPORT VECTOR MACHINES ELKIN EDUARDO GARCÍA DÍAZ COD

Cap. 24 La Ley de Gauss

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

MODELO DE PROCESOS TECNOLOGÍAS DE LA INFORMACIÓN - GESTIÓN DEL SERVICIO

1.- Una empresa se plantea una inversión cuyas características financieras son:

DELTA MASTER FORMACIÓN UNIVERSITARIA C/ Gral. Ampudia, 16 Teléf.: MADRID

LA FINANCIACION DE PROVEEDORES Y LA GESTION DE STOCKS. UNA VISION CONJUNTA.

UNIDAD 6. POLINOMIOS CON COEFICIENTES ENTEROS

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

MÉTODOS PARA PROBAR NUMEROS

wildfire. Tecnología NeoLIDAR

Material realizado por J. David Moreno y María Gutiérrez. Asignatura: Economía Financiera

Guía de ejercicios #1

XIV Congreso de la Asociación Chilena de Control Automático, ACCA 00 Octubre 2000

1.- Elegibilidad de estudiantes. 2.- Selección de estudiantes - 2 -

Apéndice A. Principio de Mínima Acción y Energía Mecánica total.

Tema 1: Estadística Descriptiva Unidimensional Unidad 2: Medidas de Posición, Dispersión y de Forma

GUIAS DE ACTIVIDADES Y TRABAJO PRACTICO Nº 22

Trabajo y Energía Cinética

Respuesta A.C. del FET 1/14

RESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea

Créditos Y Sistemas de Amortización: Diferencias, Similitudes e Implicancias

Tema 7: Variables Ficticias

Puertas Lógicas. Contenidos. Objetivos

Espacios de Búsqueda en un Árbol Binario para Resolver Problemas de Optimización Discreta

EJERCICIO RESUELTO DE RIESGO MORAL

Transcripción:

Facultad de Ingenería de la Unversdad de Buenos Ares Ingenería en Inforátca Tess de Grado Aplcacón de la teoría de Agentes al odelo de grafos para la deteccón de patrones en Textos Tessta: FEDERICO, Fernando Carlos Padrón: 8395 E-al: fernandofederco984@yahoo.co.ar Drector: Dr. Juan M. Ale - Abrl de 2008 -

Resuen Text Mnng puede ser defndo coo el descubrento de conocento en grandes coleccones de textos. Se asoca prncpalente al descubrento de patrones nteresantes coo clusters, asocacones, desvacones, sltudes, y dferencas. Por otro lado, los Attrbuted Relatonal Graphs (ARG) se defnen coo una extensón de los grafos ordnaros asocando atrbutos dscretos o reales a sus vértces y arcos. El uso de los atrbutos perte a los ARG ser posbles de no sólo odelar estructuras topológcas de una entdad sno tabén sus propedades no estructurales, que usualente se pueden representar coo vectores. Estas característcas hacen a esta herraenta un eleento útl a la hora de realzar búsqueda de patrones. En este trabao, se defne un algorto basado en grafos para la deteccón de patrones de textos. Debdo a que el voluen de nforacón que se debe procesar es grande, dcho algorto contepla la aplcacón del odelo de agentes para controlar de anera dnáca el espaco de búsqueda y, en consecuenca, reducr los tepos de procesaento de los textos. Palabras clave: Text Mnng, Attrbuted Relatonal Graphs, Agentes.

Abstract Text nng can be defned as the dscovery of knowledge n very large collectons of docuents. It s assocated to the dscovery of nterestng patterns lke clusters, assocatons, devatons, slartes, and dfferences. On the other hand, the Attrbuted Relatonal Graphs (ARG) are defned as an extenson of the ordnary graphs assocatng dscrete or real attrbutes wth ther vertexes and arcs. The use of the attrbutes allows to the ARG to be possble of not only represent topologcal structures of an entty but also t s not structural propertes, whch usually can be represented as vectors. Ths characterstc akes ARG a useful technque for pattern detecton. In ths work, we defne a pattern detecton algorth based on graphs. Due to the fact that the volue of nforaton that t s necessary to process s bg, the above entoned algorth conteplates the applcaton of the agents to control, n a dynac way, the space of search and, n consequence, to reduce the processng te. Key words: Text Mnng, Attrbuted Relatonal Graphs, Agents. 2

Contendo. Introduccón.. Defncones Generales 5.2. Contrbucones 6.3. Trabaos Relaconados 6.4. Áreas de Aplcacón 7.5. Estructura de la Tess 7 2. Grafos 2.. Defncón de Grafo 9 2.2. Grafos Drgdos 0 2.3. Grafos Ponderados 2.4. Attrbuted Relatonal Graphs (ARG) 2 2.5. Grado de un vértce 3 2.6. Canos y Crcutos 5 2.7. Subgrafos 6 3. Agentes 3.. Defncón de Agente 9 3.2. Clasfcacón de Agentes 20 3.3. Estructura nterna de un Agente 2 3.4. Ssteas Multagentes 22 3.5. Metodologías de odelado de Agentes 22 3.5.. Metodología OO 22 3.5.2. Metodología ICO 23 3.6. Dub Agent 24 3.7. Creencas, Deseos e Intencones (BDI) 24 4. Text Mnng 4.. Introduccón 27 4.2. Defncones báscas 28 4.3. Operacones con palabras 29 4.4. Asocacones 30 4.5. Soporte y Confanza 3 4.6. Vsualzacón de una regla de Asocacón 32 5. Defncón del Modelo 5.. Estructura de Datos 36 3

5... Defncón del Grafo 36 5..2. Funcón Peso 37 5..3. Actualzacón del grafo 38 5..3.a. Aparcón de un nuevo graa en el texto (ANGT) 38 5..3.b. Aparcón graa preexstente (ANE) 40 5.2. Método de Seleccón 5.2.. Obetvo 40 5.2.2. Algorto y Estructura de Datos 4 5.2.3. Defncón del tepo 45 5.2.4. Zona de segurdad 49 5.3. Modelo de Agente 5.3.. Creencas 52 5.3.2. Deseos 53 5.3.3. Plan 53 6. Notas al Modelo 6.. Relacón de w y la poscón del arco en Ω 56 6.2. Recorrdo del grafo y construccón de patrones 59 6.2. a. Construccón de patrones locales 60 6.2. b. Construccón de patrones globales 6 6.2. c. Recorrdo de nodos 64 6.3. Control de cclos en el Grafo 65 7. Resultados Experentales 7.. Estudo de la Influenca del uso de Agentes en la perforance de 67 tepo 7.2. Estacón del orden del algorto 69 7.3. Estudo de la caldad de los patrones obtendos 70 7.3. a. Estadístcas por clase 74 7.3. b. Resuen 77 8. Conclusón y Trabao Futuro 79 Referencas 80 APENDICE 84 4

Introduccón CAPITULO.. Defncones Generales El presente trabao se fundaente sobre tres teas: Text Mnng, Grafos y el concepto de agentes. Text Mnng es un área de nvestgacón eergente que puede ser caracterzada coo el descubrento de conocento en grandes coleccones de docuentos, cobnando étodos de aprendzae con étodos de procesaento de textos. Está asocado prncpalente al descubrento de patrones nteresantes coo clusters, asocacones, desvacones, sltudes, y dferencas [0, 2, 29]. Asso, la búsqueda de patrones en textos es una herraenta útl en aplcacones para reconocento ntelgente de caracteres, ssteas de copresón de texto, traduccones autoátcas, y aplcacones slares en las que un sstea debe elegr el sguente eleento (letra, palabra, fonea, etc...) de entre una lsta de posbles canddatos [25]. Por otro lado, los Attrbuted Relatonal Graphs (ARG) se defnen coo una extensón de los grafos ordnaros asocando atrbutos dscretos o reales a sus vértces y arcos. El uso de los atrbutos perte a los ARG ser posbles de no sólo odelar estructuras topológcas de una entdad sno tabén sus propedades no estructurales, que usualente se pueden representar coo vectores [45]. Estas característcas hacen a esta herraenta un eleento útl a la hora de realzar búsqueda de patrones [39, 40, 44]. Fnalente, exste una gran varedad de defncones de agentes dependendo del uso que el autor le haya dado al térno. Según la defncón de agente de IBM, los agentes son entdades de software que eecutan un conunto de operacones en nobre de un usuaro u otro prograa con certo grado de ndependenca o autonoía, utlzando algún conocento o representacón de las etas y deseos del usuaro [4]. Por otro lado, nvestgadores de la Unversdad de Indana foran parte de una coundad que apoya el enfoque basado en agentes cuyo conocento y capacdad deductva sea ltado. Dcho enfoque propone que un conunto de agentes sples perte la eecucón de un sstea ntelgente de fora ás senclla [2]. Estas dos defncones se fusonan en esta tess con el fn de generar un conunto de agentes que eecuten una varedad de operacones sencllas a partr de una representacón de las etas y deseos del usuaro. Este coportaento se odelza edante la etodología BDI (Belef, Desre and Intentons) [20], que perte representar el acconar de un agente a partr del conocento que posea, las etas y sus ntencones. 5

.2. Contrbucones En el contexto presentado en la seccón anteror, esta tess defne un odelo genérco basado en los ARG para la búsqueda de patrones con la ncorporacón de la teoría de agentes para la reduccón de canos rrelevantes en el grafo. Prncpalente, se obtene: Flexbldad en el tpo de patrón que se desea detectar: El odelo presentado adte un conunto de paráetros que perten confgurar la relacón exstente entre graas de un texto en funcón de la dstanca exstente entre ellos. Dcha confguracón se establece a partr de la defncón de una funcón peso que pondera las dstancas antes enconadas. Control del voluen del grafo con la reduccón de canos rrelevantes. Medante la ncorporacón de la teoría de agentes y en funcón de las creencas, los deseos y las ntencones de los agentes defndos en el odelo, se establece un control sobre el voluen del grafo selecconando aquellos arcos ás relevantes para el so. Velocdad en la deteccón de patrones. A partr de la ncorporacón de los agentes al odelo de grafos se reducen los tepos de búsqueda de patrones. Adconalente para este trabao se desarrolló un software que perte, a partr de la búsqueda de patrones en textos, la categorzacón de los sos y se estudó el pacto en eora y tepo de las ncorporacones enconadas en esta tess..3. Trabaos Relaconados Exsten trabaos en la bblografía actual que utlzan la representacón de textos edante grafos. Por eeplo, en (We Jn, Rohn Srhar [8]) se propone un étodo basado en grafos para capturar la estructura y la seántca del docuento de fora ás efectva. Báscaente el odelo se basa en un grafo que pondera las relacones entre los eleentos del docuento que analza y extrae conclusones estructurales a partr de ellas. En (Tota,Nakawatase, Ish [9]), el artculo se concentra prncpalente en deternar los algortos para obtener subgrafos a partr del grafo orgnal y calcular la sltud entre ellos. Por otro lado, en (Tota,Nakawatase, Ish [26]) se defne una arqutectura para representacón de pagnas Web edante grafos y su posteror alacenaento para el descubrento de conocento en la Web. Fnalente, exsten publcacones, coo (Tsuyosh Ktan[22]) que basan su trabao en un doa en partcular (en el caso de [22], el Japonés). 6

La dferenca de este trabao con los otros es que se presenta un odelo genérco para la búsqueda de patrones en textos que perte al usuaro defnr edante una funcón peso el tpo de patrón que desea buscar y que realza un control sobre el voluen del grafo para obtener ayor velocdad de procesaento. Es decr, lo deternado en este artículo es ndependente del obetvo que tenga el usuaro, el doa o las característcas del procesaento que se le quera dar al texto..4. Área de aplcacón Exste un aplo rango de aplcacones del Text Mnng, y ás partcularente, la búsqueda de patrones en textos. En prer lugar se puede enconar la categorzacón de textos que se puede nterpretar coo la asgnacón a un texto de una o ás categorías que estén relaconadas con su contendo. Por otro lado, el proyecto de la Web Seántca [27], que ntenta esqueatzar la Web a partr de tópcos de fora autoátca. En tercer lugar, la copresón de textos a partr del reconocento de patrones [29]. Y fnalente, el fltrado de als que perte selecconar los sos de acuerdo a su relevanca..5. Estructura de la Tess El presente docuento se organza de la sguente anera: en el segundo captulo se ntroduce el concepto de grafos y los eleentos asocados a la teoría de grafos que serán de relevanca en el desarrollo de la tess. En el capítulo tres se desarrollan los teas relaconados a la teoría de agentes desatacando conceptos coo los dub agents y la etodología BDI que son de portanca para el entendento del odelo presentado en este trabao. En el cuarto capítulo se defnen los conceptos vnculados al Text Mnng y aquellos relaconados con el procesaento de graas. En el qunto y sexto capítulo se desarrolla el odelo basado en grafos que fora la base central de esta tess. En el sexto capítulo, partcularente, se realzan aclaracones vnculadas al odelo que se presenta en el qunto captulo, las sas son de relevanca para tener un entendento global del odelo. En el sépto capítulo se uestran los resultados obtendos edante la corrda del software pleentado y en el octavo capítulo se concluyen los aspectos ás relevantes aportados por esta tess. 7

CAPITULO 2 Grafos Uno de los teas plares en el presente trabao es el estudo de los grafos. En este captulo se pretende nterorzar en los conceptos ás relevantes asocados a los grafos para poder coprender el obeto central de la tess. No se ntenta explcar toda la teoría de grafos sno aquella que será utlzada en este docuento. Debdo a que la ternología de la teoría de grafos no es estándar, el lector puede encontrar algunas dferencas entre los térnos utlzados aquí y en otros textos. No obstante a lo largo del presente captulo se ntenta rearcar las prncpales dferencas encontradas. En la prera seccón, se ntroducen los conceptos ás generales de la teoría de grafos que van a ser utlzados a lo largo del docuento. Teas coo, por eeplo, la defncón de grafos, arcos ncdentes y grafo copleto son analzados en esta prera parte. La segunda y la tercera seccón hacen hncapé en los grafos drgdos y los grafos ponderados respectvaente. Se partcularzan abos teas debdo a la estrecha relacón que guardan con el grafo presentado coo odelo para la tess. Por otro lado, la cuarta seccón trata los teas de grado de un vértce y se deternan las defncones ás relevantes asocadas con este tea. Fnalente, en la qunta seccón se ntroducen los conceptos relaconados con canos y cclos de un grafo y se puntualzan detalles relaconados con los grafos drgdos. Mentras que en la sexta seccón se desarrollan nocones asocadas a los subgrafos y la obtencón de los sos. 8

2. Defncón de grafo Muchas stuacones y probleas de la vda real pueden ser representados edante grafos. El uso de los sos coo odelos de escenaros copleos puede ser uy varado. Báscaente, todo esquea consstente en eleentos que se relaconan entre sí puede ser odelado edante grafos. Eeplos de esto son las redes de telecouncacones, crcutos eléctrcos, personas relaconadas en un ábto laboral, y, coo en el caso de este trabao, graas de un texto. V ( G), E( G), ψ, donde V (G) Foralente un grafo se defne coo una trpla ordenada [ ] representa al conunto de vértces, E (G) dsunto de V (G), defne al conunto de arstas del grafo y la funcón de ncdenca ψ que asoca cada arsta de G con un par de vértces de G [5]. S E(G) G G e y u, v V ( G), tal que ψ ( e) uv, entonces se dce que e une a u y v, y estos son extreos de e. G = Báscaente, la funcón ψ ofrece una noenclatura para representar las arstas del grafo. G ψ Fg. 2.. Grafo V = { A, B, C, D} E = e, e e { } 2, 3 G ( e ) = AB; ψ G ( e2) = AC; ψ G ( e3) = DC En lo referdo a la cardnaldad de estos conuntos E (G) y V (G), el núero de vértces de un grafo se denona orden, y se denota coo v(g), asso, se utlza (G) para sbolzar el núero de arstas. Los grafos pueden ser fntos, nfntos y nuerables dependendo del orden del so. Un grafo es fnto solo sí tanto v (G) coo (G) son fntos [5], en este docuento sepre que se encone el terno grafo se referrá exclusvaente a los grafos fntos salvo que se encone lo contraro. Por otro lado, en el aspecto gráfco, un grafo puede ser representado coo un conunto de puntos undos por líneas. Cada uno de los puntos plca un vértce, entras que las líneas sbolzan las arstas. La topología del so así coo las dstntas característcas de los vértces y arcos, establecen las varadas clasfcacones del grafo. Dchas partculardades no foran parte del alcance de esta prera ntroduccón, sno que serán atenddas en las seccones sguentes. El orden del grafo tabén puede ser representado coo G [4] 9

Fg. 2.2. Grafo V = {,2,3,4,5 } E ( G) = {{,3};{3,4},{5,2};{5,4}} Un vértce v es ncdente con una arsta e s v e. Los dos vértces ncdentes con una arsta se denonan extreos de la arsta. De esta fora, s observaos la fgura 2., el vértce 3 es ncdente con la arsta e = {3,4 34 } y los vértces 3 y 4 son extreos de la arsta e 34. Por otro lado, dos vértces x, y son vecnos o adyacentes s exste e la arsta e xy = { x, y}. En el caso de la fgura 2. los vértces y 3 son adyacentes. De la sa fora, dos arstas se denonan adyacentes s tenen un extreo en coún, en nuestro eeplo las arstas e 3 y e 34. S todos los vértces del grafo son adyacentes de a pares, entonces el grafo se denona copleto [2]. Es decr, S ( a b) E ( b, a) E,. 2.2 Grafos drgdos Supongaos que edante un grafo se desean representar los puntos ás portantes de la cudad y las respectvas calles que los conectan. Coo se puede prever los stos de la cudad serán vértces de nuestro grafo, entras que las calles serán arcos. Es ben conocdo que algunas calles pueden ser transtadas en abos sentdos, entras que otras no. Supongaos que todas las calles de nuestro eeplo son del segundo tpo. De esta fora, s un punto A de la cudad se conecta con un punto B edante una calle y por ella solo se puede transtar en sentdo AB, el arco e AB de nuestro grafo se debe representar coo el par ordenado e AB = { A, B}, pero no al revés. Nuestro grafo es entonces un claro eeplo de un grafo drgdo, o dgrafo. Gráfcaente las arstas de los grafos drgdos se representan edante flechas y se denonan arcos. Foralzando este concepto, se defne a un grafo drgdo D coo una trpla ordenada V ( D), A( D), ψ ) que consste en un conunto V (D) de vértces, un conunto A (D) dsunto de ( D V (D), de arcos, y una funcón de ncdenca ψ D que asoca a cada arco de D un par ordenado de vértces de D. Exste una correlacón entre los grafos drgdos y los grafos, dado un grafo G cualquera se puede obtener un dgrafo de G especfcando para cada vnculo de G una dreccón. El dgrafo resultante se denona orentacón de G. Por otro lado, todo concepto que sea valdo para grafos es valdo para los dgrafos. No obstante, nuevas ternologías y sbologías se asocan exclusvaente a los grafos 0

drgdos. En prncpo, coo se enconó anterorente, un arco es un par ordenado de vértces, lo cual derva en una nueva denotacón para aquellos vértces conectados, supongaos un arco a = { u, v}, u de denona cola de a, entras que v es la cabeza de a 2. En segundo lugar, dos nuevos conuntos se tenen en consderacón para el estudo de los dgrafos, estos se están relaconados con los arcos salentes y los ncdentes a un nodo. Foralente, se sbolza + U v al conunto de arcos salentes de v, entras que U v sbolza al conunto de arcos ncdentes a v 3. La fgura 2.2 eeplfca lo enconado anterorente. Otra defncón relevante para el estudo de dgrafos es el grafo no drgdo asocado. Spleente, éste consste en el reeplazo de los arcos del dgrafo por arstas (par de vértces no ordenado). S se obtene ás de una arsta no drgda de un par de vértces dstntos de, entonces sólo una de estas arstas se dbua en el grafo no drgdo asocado. Fg. 2.3. Dgrafo + U {{ B, D}} U B = B = {{ A, B},{ C, B}} En esta seccón solo se pretende ntroducr el concepto de dgrafo, es por ello que no se desarrollan todos los puntos referdos a este tea, sn ebargo, a lo largo del presente docuento se apuntarán partculardades referdas a los dgrafos en los dversos ítes abordados. 2.3. Grafos Ponderados Sguendo con el eeplo de la seccón anteror, supongaos ahora que deseaos vaar de un punto de la cudad a otro pero tenendo en cuenta el costo del traslado. Deeos de lado el hecho de la posbldad de transtar las calles en abos sentdos y solo focalcéonos en el costo. De esta anera, a cada arco del grafo le corresponde un onto referdo al traslado de un sto a otro de la cudad, es decr una ponderacón. Este grafo recbe la denonacón de grafo ponderado. Foralente, sea un grafo G = ( V, E) y exste, por otro lado, una funcón cualquera del tpo w : E R llaada funcón peso. El grafo G, unto con la funcón w se denona grafo ponderado. 2 Térnos obtendos de [4] 3 Sbología utlzada en [3]

Consdereos el sguente eeplo, Fg. 2.4. Grafo ponderado El grafo se defne coo { V, E) G = con Y w se defne por V = { A, B, C, D, E} E = {{ A, C},{ A, B},{ B, D},{ C, B},{ C, E}} w ({ A, B}) = 3 w ({ A, C}) = 5 w ({ B, D}) = w ({ C, B}) = 2 w ({ C, E}) = 7 Debe dearse claro que s ben no fue consderado en esta seccón, la posbldad de un grafo drgdo y ponderado exste. La defncón del so es análoga a la anteror: sea un grafo drgdo G = ( V, A) y exste, por otro lado, una funcón cualquera del tpo w : A N llaada funcón peso. El dgrafo G, unto con la funcón w se denona dgrafo ponderado. En este caso, la funcón peso consdera el par ordenado de vértces que deternan un arco, por lo que es posble que dos arcos con gual extreos posean una ponderacón dstnta. Es decr, supongaos un arco a AB = { A, B} y un arco a BA = { B, A}, los dos poseen los sos extreos, sn ebargo, el orden del par es lo que varía, por lo que la funcón de ponderacón puede devolver valores dstntos. Los probleas ás relaconados con los grafos ponderados son los de las búsquedas del eor cano. Los conceptos de cano y cclo serán consderados en las seccones venderas. 2.4. Attrbuted Relatonal Graphs (ARG) Los Atrbutted Relatonal Graphs fueron desarrollados para representar tanto nforacón estructural coo seántca de un obeto [38]. Los ARG se defnen coo una extensón de los grafos ordnaros asocando atrbutos dscretos o reales a sus vértces y arcos. El uso de los atrbutos perte a los ARG ser 2

posbles de no sólo odelar estructuras topológcas de una entdad sno tabén sus propedades no estructurales, que usualente se pueden representar coo vectores [45]. En los ARG el grafo en sí representa la estructura global del obeto, entras que los vértces y las arstas deternan característcas locales del so, es decr las propedades de los eleentos que conforan el todo. Los ARG son utlzados para la descrpcón de un obeto que requera ser defndo a partr de las característcas de los eleentos que lo conforan. Supongaos se desea odelzar una bccleta con un grafo, cada parte de la bccleta se encontraría defnda edante un nodo, por otro lado, la relacón exstente entre ellos, coo por eeplo la relacón esta undo a, es odelzada por las arstas. Cada vértce del grafo contene dferentes propedades, por eeplo, las ruedas serán de un ateral deternado y de un dáetro defndo. Sn ebargo, la bccleta en sí solo puede ser descrpta a través de la descrpcón de sus coponentes, esta es la funconaldad que cubren los ARG. Las aplcacones de los ARG son uy dversas, coo por eeplo, reconocento de patrones sntáctcos, análss de escenaros, descrpcón de estructuras quícas, bases de datos relaconales, etc. [39, 40, 46]. 2.5. Grado de un vértce Supongaos que se tene un grafo G = ( V, E), dos vértces u, v V se dcen adyacentes o vecnos s exste una arsta e E tal que u e y v e. De esta anera, se denota al conunto de nodos 4 adyacentes a un vértce v coo N G (v) y se llaa grado o valenca del vértce v, d (v), a la cardnaldad de dcho conunto. S todos los vértces tenen el so grado k, entonces, el grafo se denona k-regular o spleente regular. Coo coloraro se defne a δ (G) y Δ(G) coo la ína y áxa valenca del grafo. Foralente, δ ( G) = n{ d( v) v V} Δ( G) = ax{ d( v) v V} Una edda nteresante para el estudo de grafos es una aproxacón al núero de arstas por vértce, este valor se defne coo el grado proedo de G y se encuentra lgado a la sguente expresón: d ( G) = d( v) v( G) v V Debdo a que s suaos los grados de todos los vértces se obtene dos veces el núero de arstas. Es por ello que el núero de arstas de un grafo G se puede calcular coo: 4 En el presente docuento se utlzan los térnos nodos y vértces coo snónos. 3

( G) = d( v) = d( G). v( G) 2 2 v V Lo dcho hasta aquí es valdo para cualquer grafo, no obstante, para el caso de grafos drgdos se dstnguen dos grados de vértces el grado entrante y el grado salente (n degree y out degree). Báscaente, el grado entrante de un vértce representa el núero de arcos ncdentes al vértce, entras que el grado salente plca el núero de arcos ncdentes exteror del vértce. La sbología para + representar estos conceptos es la utlzada por [34] deg ( v) y deg ( v). Lo expresado anterorente puede resurse en las sguentes expresones: G G degg ( v) = U v + + degg ( v) = U v De fora análoga para grafos drgdos se defne: + + δ ( G) = n{degg ( v) v V}, δ ( G) = n{degg ( v) v V} + + Δ ( G) = ax{degg ( v) v V} Δ, ( G) = ax{degg ( v) v V} Teorea: S ( V, E) G = es un grafo drgdo con (G) cantdad de arcos, entonces: v V deg + G ( v) = v V deg G ( v) = ( G) Prueba: sea e uv = u, v} E {, es claro que: Luego, + Por otro lado e E e ( ) Fnalente, U + u I U v = e uv + U( U v ) = U( U v ) v V / U U v, entonces, v V v V + U( U v ) = U( U v ) = E v V v V + U( U v ) = U( U v ) = E v V v V 4

v V deg + G ( v) = v V deg G ( v) = ( G) 2.6. Canos y Crcutos Volvaos por un oento al eeplo presentado en la seccón 2.2. Quereos ahora, deando de lado todas las ltacones vales y onetaras, recorrer todos los puntos de la cudad en un solo vae. El apa de nuestra cudad es el sguente grafo: Fg. 2.5. Grafo Copleto Coo se puede observar el grafo que se presenta es copleto, es decr, para nuestro eeplo, se puede vaar desde una cudad a la otra sn problea. Supongaos que en nuestro afán de recorrer la cudad partos del punto A, pasando luego por B, D,C, y fnalente por E. De esta anera podeos afrar que nuestro cano fue { A, B, D, C, E}. Sn ebargo, s luego de transtar por todos los stos del apa, se decde retornar al punto de salda ya podeos decr que lo efectuado fue el crcuto { A, B, D, C, E, A}. Es necesaro destacar que nnguno de los dos conceptos esta asocado a el paso por todos los vértces del grafo, sno que los conuntos {, C, E} A y { A, C, E, A}, son tabén cano y crcuto respectvaente. Una vez destacada la prncpal dferenca entre un cano y un crcuto, se procede a la foralzacón de los conceptos: Sea un grafo G = ( V, E), se llaa cano, a una secuenca e,,...} de arstas tal, que la { e 2 extredad ternal de cada arsta concda con la extredad ternal de la arsta sguente. Otra fora de representar un cano es a partr de los vértces que recorre. Un cano puede ser copuesto o sencllo, en el prer caso utlza dos veces una sa arsta, en el segundo no. Asso, se dce que un cano es eleental s no encuentra dos veces el so vértce. Por otro lado, un crcuto es un cano fnto μ = { x, x2,..., xk }, donde x = xk. Dos canos se denonan ndependentes s nnguno de ellos contene un vértce nteror del otro. De esta anera, un cano { A, C, D, E} es ndependente de { A, B, E}. Por otra parte, la longtud de un cano se encuentra referda a la cantdad de arstas o vértces que tenga. Dos vértces se encuentran conectados s exste un cano que los una. Se dce que un grafo no drgdo es fuerteente conexo s para cualquer par de vértces ( x, y) con x y, exste un cano que va de x a y. Por otro lado, un grafo drgdo se dce conexo cuando su grafo no drgdo asocado es conexo. 5

Fnalente, todo lo expresado en esta seccón cabe para los dgrafos y los grafos ponderados, sn ebargo, para los preros es necesaro destacar la rreflexbldad de los canos y cclos. Algunos autores, coo por eeplo [3], hacen la dstncón entre cadena y cano, esta dferenca radca prncpalente en la sa dscrepanca entre un arco y una arsta. Báscaente, una cadena posee el so concepto que un cano, salvo que esta no se copone de arcos sno de arstas. En nuestro caso vaos a hablar de cadena o cano coo snónos, entendendo la exstenca de arcos o arstas a partr de s el grafo que se utlce se declara coo un grafo drgdo o no. Las nocones de cano, arco y crcuto srven para categorzar los dgrafos. Se dce que un dgrafo es sétrco s se tene, Sea G = ( V, A) un dgrafo, s ( x, y) A ( y, x) A De la sa anera se dce que un dgrafo es antsétrco s Sea G = ( V, A) un dgrafo, s ( x, y) A ( y, x) A Por otro lado, para los grafos ponderados, la teoría de los canos y cclos se encuentra estrechaente relaconada a la búsqueda de aquel cano o cclo cuya suatora de pesos sea ína. 2.7. Subgrafos Muchas veces para resolver un problea debeos partr de una estructura general para luego enfocarnos en una parte de esa estructura. Sgaos con el eeplo de los grafos para representar apas. Supongaos que teneos un grafo que odelza todas las calles de la Argentna, sn ebargo, nuestro problea se encuentra referdo a los puntos y calles ás portantes de la Cudad de Buenos Ares. Es por ello que debeos obtener lo que denonaos un subgrafo del grafo prncpal que represente a los eleentos que necestaos para nuestro obetvo. Un grafo H es un subgrafo de G ( G) restrccón de H s V ( H ) V ( G), E( H ) E( G) y ψ H es la ψ para E (H ). Inversaente, s H es un subgrafo de G, entonces G es un G supergrafo de H. S H G, entonces H se denona proper subgraph. S V ( H ) = V ( G), entonces H se denona spannng subgraph de G. Supongaos V ' V. El subgrafo de G cuyos vértces pertenecen a V ' y cuyas arstas tenen abos extreos en V ' se denona subgrafo de G nducdo por V ' y se denota coo G [ V ']. De fora análoga se defnen los subgrafo arco-nducdo de G, coo el subgrafo cuyas arstas pertenecen a un conunto E E ', y se denota coo G [ E' ]. En abos casos, la construccón de un subgrafo nducdo o un subgrafo arco-nducdo corresponde a la elnacón de vértces o arstas, respectvaente. Es decr, para obtener uno de estos subgrafos no se debe agregar al grafo n arstas n vértces. En la fgura 2.7. se uestra un grafo y sus respectvos subgrafo nducdo y arco-nducdo. 6

A B C Fg. 2.6. A) Grafo G. B) Subgrafo de G arco-nducdo. C) Subgrafo de G nducdo Las operacones de nterseccón y unón son realzables sobre los grafos. Supongaos se tenen dos subgrafos H y H 2, se dce que son dsuntos s V ( H ) V ( H 2 ) = 0, y se dce arco-dsuntos s E H ) E( H ) 0. Por otra parte, la unón ( H ) y la nterseccón ( H ), se ( 2 = H 2 H 2 efectúa realzando la unón y la nterseccón de los conuntos de vértces y arstas de los subgrafos. G = V, E y sea el conunto de subgrafos fuerteente conexos de G, Fnalente, Sea un grafo ( ) ' ' ' ' ' ' ' ' ' { G = ( V E ), G = ( V, E ),..., G ( V E )} ' Q = =, con G = 0, 2 2 2 k k, K I ' G Q, s se reeplaza cada eleento de Q por un nuevo vértce, entonces el grafo resultante se denona grafo reducdo de G. Esta defncón tabén es extensble a grafos drgdos. La sguente fgura lustra este concepto: Fg 2.7. a) Grafo G, b) Grafo reducdo de G 7

Agentes CAPITULO 3 En este capítulo se ntroduce la teoría de agentes, la cual es otro de los teas plares de este trabao. Fundaentalente, se pretende brndar el conocento básco necesaro para el entendento de la odelzacón realzada en la resolucón del problea de la búsqueda de patrones en textos. En la prera seccón se defne el concepto general de agente, se lo dferenca con un prograa convenconal, se defne el entorno de un agente y se ntroducen algunas clasfcacones del so. En la segunda seccón se aborda el tea de la clasfcacón de un agente en funcón del conocento que posea y su fora de operar. En la tercera seccón se defne la estructura nterna de un agente y la fora de coparacón de la sa con la de otros agentes, entras que en la cuarta seccón se ntroducen los conceptos sobre los ssteas ultagente y los dos enfoques exstentes para construrlos. En la qunta seccón se defnen las etodología basada en POO y la etodología basada en ICO para el desarrollo de ssteas agentes. En la sexta seccón se defne uno de los teas plares para esta tess que es el concepto de dub agent. Fnalente se defnen las característcas del odelo BDI para la odelzacón del estado del agente coo así tabén su coportaento. 8

3. Defncón de agente Son uchas las acepcones que tene el térno agente, y dependen del autor que las pronunce. Sn ebargo, todas las defncones tenen en cuenta dos deas fundaentales [4]:. Es algo que actúa, o puede actuar. 2. Alguen que actúa en lugar de otro, con perso, nforacón y un propósto. S ben estos dos conceptos pueden servr coo pautas para deternar una enuncacón ás foral sobre el térno agente, tal vez unos eeplos puedan servr para aclarar el panoraa y poder conclur en una frase sgnfcatva. Coo eeplos de agentes se puede consderar cualquer huano o anal, coo tabén los robots autónoos o agentes de software que vven en ssteas operatvos, bases de datos, redes, etc. Entonces, qué coparten todos estos agentes que consttuye la esenca de ser un agente? En prncpo, todos foran parte de un abente del cual obtenen la nforacón, que les perte actuar de fora autónoa. Por otro lado, todos, en ayor o enor edda, tenen una eta que alcanzar y sus accones repercuten en el edo. Por lo tanto, es concebble foralzar lo sguente [4]: Los agentes son ssteas autónoos que ntercaban nforacón con el abente en el que están subscrptos para alcanzar un obetvo. Coo se puede observar la defncón de un agente es bastante apla y, fáclente, se la puede coparar y confundr con la defncón de un prograa. Sn ebargo exsten dversas dferencas entre un prograa y un agente. Coo por eeplo [4]:. Los agentes son autónoos. Esta dferenca se basa fundaentalente en que un agente no necesta del acconar del usuaro u otro sstea. Es decr, opera ndependente de los usuaros. 2. Contenen certo grado de ntelgenca. El concepto de autonoía explcado anterorente plca que el agente posea ntelgenca para la toa de decsones. Esta capacdad se puede llevar a cabo edante los llaados otores de nferenca que poseen reglas para deducr certos acconares consderando la nforacón dsponble. 3. No actúan de fora reactva, pero s, a veces, proactva. 4. Tenen la habldad de trabaar socalente con otros agentes para alcanzar un obetvo en coún ucho ás copleo. Se anean dversos protocolos de councacón para que un agente entenda a otro y pueda copartr los datos que posee. Ahora ben, ya que deternaos las dferencas de un agente con un prograa ordnaro, s nos referos a los agentes artfcales (software, robots, etc.), cuáles son los benefcos que éstos otorgan?, 9

es decr, Cuál sería un buen otvo para pleentar un agente? La respuesta a estas preguntas se puede contestar edante dos sples obetvos: Splfcar el aneo de nforacón y procesaento dstrbudo (Agente coo adnstrador de recurso). Sobrellevar el problea de las nterfaces de usuaro (Agentes coo asstentes personales que se adaptan al usuaro). Fnalente, para poder ternar de entender la defncón de un agente y su fora de operar es necesaro desarrollar un poco ás el concepto de abente. Éste puede ser consderado coo el edo donde esta suergdo el sstea, coo, por eeplo, la seccón de produccón de una fábrca, una controladora de una línea de produccón, otro sstea, etc. El abente estula al agente y le provee nforacón para poder operar y toar decsones. Coo el funconar de un agente depende del abente es prescndble establecer una clasfcacón [32]: Accesbles Vs. Inaccesbles: Un sstea accesble es aquel en el cual se puede obtener nforacón copleta, certera y actualzada sobre el estado del abente Deternístcos Vs. No-deternístcos: Un sstea es deternístco cuando ante la realzacón de una accón deternada la respuesta a la sa es sepre la sa. Epsódcos Vs. No-epsódcos: Un abente epsódco es aquel en el cual la perforance de un agente es dependente de un dscreto núero de epsodos sn enlace con el acconar del agente en dferentes escenaros. Estátcos Vs. Dnácos: Un abente estátco es aquel que peranece en el so estado a no ser que sea odfcado por el acconar del agente. Dscreto Vs. Contnuos: Un abente es dscreto s exsten un núero fnto y cerrado de estados y accones posbles sobre el so. 3.2. Clasfcacón de Agentes Los agentes poseen dversas propedades según el propósto que deban alcanzar. Lo cual derva en la sguente clasfcacón [4] Propedad Reactvo Autónoo Orentado a etas Teporalente contnuo Sgnfcado Responde nedataente al cabos en el abente Tene control sobre sus accones. No actúa en respuesta al abente, sno que sgue un plan para alcanzar su propósto. Es un proceso que esta contnuaente correndo 20

Councatvo, socable Adaptatvo Móvl Flexble Personae Tene la capacdad de councarse con otros agentes, tal vez tabén con personas. Caba su coportaento de acuerdo a sus experencas. Se puede transportar autónoaente haca otro lado Sus accones no están deternadas de ante ano Con personaldad y estado eoconal. De acuerdo a nuestra defncón un agente satsface las cuatro preras característcas. Cualquer agregado de propedades derva en una subclase de agente. Cabe enconar que la categorzacón brndada anterorente no es únca, se puede clasfcar a un agente de acuerdo a las etas que posea, a su arqutectura de control o al rango y sensbldad de su percepcón del edo. 3.3 Estructura nterna de un agente S ben los agentes tenen característcas slares, éstos pueden dferr en su copledad y los algortos que pleenten nternaente. Las dferencas se pueden observar en los sguentes donos [30]: Parecdo (slarty): Los agentes que no se councan drectaente entre sí, es decr lo que spleente nteractúan con el edo, pueden dferr copletaente en su estructura nterna. Sn ebargo, s se councan drectaente uno con otro, deben hablar el so lenguae. A veces los agentes coparten el so códgo y solo dferen en los paráetros de estado. Sn ebargo, lo ás usual es que coparten los encabezados pero el códgo nterno es dstnto. Se puede dentfcar tres tpos: dferentes, déntcos y los body-head agents. Éste últo representa el caso en que los encabezados de los agentes son guales pero su cuerpo no. Modulardad (odularty): El odelo que dstngue los encabezados de los cuerpos de los agentes (body-head) perte la reutlzacón de los códgos de councacón entre los agentes que son dsíles. Meora (eory): Los agentes pueden o no recordar los cabos que sufreron en su estado basándose en su experenca. Mutabldad (utablty): En algunos ssteas, el códgo del agente puede cabar a lo largo de su vda. Nos referos fundaentalente a la estructura de datos que esta anpulando en un oento deternado. Esta odfcacón puede ser pulsada desde fuera del agente o nternaente. 2

3.4 Ssteas Multagentes Un agente raconal es una entdad que hace lo correcto para cuplr con sus etas. Los Ssteas Multagentes (SMA) buscan lograr la cooperacón de un conunto de agentes autónoos para la realzacón de una tarea. La cooperacón depende de las nteraccones entre los agentes e ncorpora tres eleentos: la colaboracón, la coordnacón y la resolucón de conflctos. Los SMA tenen un aplo rango de aplcacones, uno de los capos prncpales la consttuyen los agentes software los cuales se focalzan prncpalente en la explotacón cooperatva de recursos accesbles por Internet. El otro capo de aplcacones ncluye la utlzacón de agentes físcos y ha dado lugar a la robótca cooperatva; capo en el cual los conceptos y las teorías de SMA encuentran un ayor reto de aplcacón. Algunos de los capos de aplcacón de los SMA ncluyen: asstentes personales, supervsón hosptalara, asstentes fnanceros, anpulacón y fltrado de nforacón aplcados a dferentes donos, agentes bancaros, ventas y coerco electrónco, dfusón de notcas y publcdad, realdad vrtual y avatares, control de procesos y anufactura, telecouncacones, entre otros. Exsten dos enfoques para construr ssteas ultagentes: El enfoque foral o clásco, que consste en dotar de los agentes de la ayor ntelgenca posble utlzando descrpcones forales del problea a resolver y de hacer reposar el funconaento del sstea en tales capacdades cogntvas. Usualente la ntelgenca es defnda utlzando un sstea foral (por eeplo, ssteas de nferenca lógca) para la descrpcón, racocno, nferenca de nuevo conocento y planfcacón de accones a realzar en el edo abente. El enfoque constructvsta, que persgue la dea de brndarle ntelgenca al conunto de todos los agentes, para que a través de ecansos ngenosaente elaborados de nteraccón, el sstea so genere coportaento ntelgente que no necesaraente estaba planeado desde un prncpo o defndo dentro de los agentes sos (que pueden ser realente sples). Este tpo de conducta es habtualente llaado coportaento eergente. 3.5 Metodologías de odelado de agentes En los últos tepos, el crecento en nvestgacón sobre ssteas Multagentes se hace notoro, sn ebargo, esta nueva tecnología es relatvaente nueva, por lo tanto, las etodologías utlzadas se basan en etodologías exstentes a las cuales se han odfcado para adaptarlas al problea de los agentes. 3.5. Metodología OO Exsten varos benefcos que ustfcan las extensones de la etodología orentada a obetos para la aplcacón en ssteas Multagentes. 22

En prncpo, exsten notables sltudes entre el paradga orentado a obetos y el paradga de agentes: [3]. Paso de ensaes para councarse. 2. El epleo de herenca y agregacón para defnr su arqutectura. 3. La utlzacón de una vsta estátca para defnr la estructura de los obetos y sus relacones puede ser utlzada tabén con agentes. 4. Una vsta dnáca para descrbr nteraccones. 5. Una vsta funconal para descrbr el fluo de datos entre los obetos, puede ser utlzado, para el caso de los agentes para hacer referenca a la councacón de los so. Por otro lado, exsten dferencas sgnfcatvas tabén puntualzadas por [3]:. Los agentes se councan de una fora predeternada 2. El estado ental de los agentes se deterna (para una etodología BDI, ver seccón 3.7) edante creencas, ntencones, deseo y acuerdos. 3. Los agentes no son obetos por lo que las herraentas de odelado del paradga orentado a obetos no explcan todo lo relaconado con los agentes. 4. Los obetos no actúan de fora autónoa y no tenen la capacdad de nferr coportaento coo los agentes, en consecuenca, el odelado de agentes edante técncas de la orentacón a obetos no esqueatzan estas característcas. 5. La councacón entre agentes deterna un proceso ás copleo, defndo por un protocolo y por un pasae de paráetros que se conocen de anteano. En el caso de los obetos, por otro lado, su councacón se basa prncpalente en la nvocacón de étodos por lo que lo hace ucho ás sencllo en coparacón con la de los agentes. 3.5.2 Metodología ICO La dea fundaentalente es que se utlcen todos los avances realzados en la ngenería en el conocento en los Multagentes para darle la característca de un obeto actuante y autónoo. Dado que los agentes tenen característcas cogntvas, estas etodologías pueden proporconar las técncas de odelado de la base de conocento de los agentes. La defncón del conocento de un agente puede consderarse un proceso de adquscón de conocento, y dcho proceso sólo es abordado por éstas etodologías. La extensón de etodologías de conocento puede aprovechar la experenca adqurda en dchas etodologías. Adeás se pueden reutlzar las bblotecas de étodos de resolucón de probleas y ontologías así coo las herraentas desarrolladas en estas etodologías. Aunque estas etodologías han sdo epleadas en ábtos ás restrngdos que las orentadas a obetos, tabén han sdo aplcadas con éxto en la ndustra. 23

La ayor parte de los probleas planteados en las etodologías de ngenería del conocento tabén se dan, obvaente, en el dseño de ssteas ultagente: adquscón del conocento, odelado del conocento, representacón y reutlzacón. Sn ebargo, estas etodologías concben un sstea basado en conocento coo un sstea centralzado. Por tanto, no abordan los aspectos dstrbudos o socales de los agentes, n en general su conducta proactva, drgda por obetvos. 3.6 Dub Agent Para la construccón de ssteas de agentes exste un enfoque basado en lo que denonaos un dub agent (agente tonto). Fundaentalente, esta dea propone la forulacón de ssteas basados en agentes que realcen tareas sples y que no recurran a étodos de ntelgenca artfcal, sno que dcha ntelgenca se genere a partr del acconar del conunto de dub agents. La aplcacón de dchos agentes puede presentarse tanto coo agentes aslados ntentando optzar su rendento, coo, en otros donos, agentes que puedan nteractuar, ncluyendo a las actvdades del so, la coordnacón con el resto. Asso, el coportaento de cada agente en el sstea puede ser el so o dstnto, el sstea se evalúa de acuerdo al cuplento del obetvo coún. En [2] se presentan algunos ssteas desarrollados edante esta etodología en la unversdad de Indana, coo ser el ovento de un robot o la aplcacón a ssteas de councacones. En todos ellos, se utlza la dea de realzar actvdades copleas a partr de un conunto de procedentos sples que son eecutados por agentes que carecen de ntelgenca o eora. Por lo general, los dub agentes no tenen eora, n son capaces de aprender, sn ebargo, son útles al oento de desarrollar ssteas que plquen un gran núero de agentes y donde la toa de decsones no es el prncpal obetvo. En estos casos, los dub agents resultan benefcosos en tepo y uso de eora. Estos agentes sples, pueden ser clasfcados de dversas aneras, s nos retos a la seccón 3.2, un dub agent puede ser reactvo y councatvo, coo así tabén orentado a etas o councatvo. Es decr, los agentes tontos no deben ser vstos coo un sple procedento que eecute tareas sno que puede ser pleentado de dversas aneras dependendo del obetvo que se desee alcanzar. En resuen, el enfoque de desarrollo de ssteas Multagentes basado en Dub Agents se fundaenta prncpalente en el uso de agentes sples que recurran a un escaso uso de los recursos de eora para generar un sstea que realce una actvdad coplea. Es decr, para certos probleas, coo los presentados en [6], resulta ás útl la pleentacón de ssteas con ódulos operatvos sples que la utlzacón de un conunto de agentes copleos basados en las dversas técncas de la ntelgenca artfcal. 3.7 Creencas, Deseos e Intencones (BDI) S ben se presentó en las seccones anterores algunas de las etodologías utlzadas para la odelzacón de los agentes, exsten odelos que pretenden sentar los prncpos báscos para esqueatzar los estados nternos de un agente. 24

El odelo de Creencas, Deseos e Intencones se ha convertdo, posbleente, en uno de los étodos ás estudados en lo que concerne a la teoría de agentes [6]. Estos tres conceptos fueron ntroducdos por [6] para explcar el funconaento del razonaento huano. Estas deas se foralzaron luego coo Creencas, Metas y Planes, que plcan una foralzacón ás fácl de pleentar. Sn ebargo, la etodología se conoce aún coo BDI (Belef, desres and ntentons). En prncpo, las Creencas de un Agente se encuentran relaconadas al entendento que tene el so sobre el abente en el que esta nerso. Es decr, representa de qué fora el Agente observa el edo y coo lo entende, cuál es la nforacón que percbe y coo la odelza [37]. El odelo de creencas especfca la nforacón que posee el agente y las accones que puede realzar. Ese conunto se denona conunto de creencas y puede varar o no según el estado del abente. Foralente, el conunto de creencas se defne coo un set de predcados cuyos arguentos son defndos por el usuaro [2]. S seguos una etodología de odelado de agentes edante obetos, este conunto de predcados depende exclusvaente de la clase de agente que se esté pleentando. Por otro lado, las Metas representan el deseo y el obetvo del agente, es decr, lo que quere cuplr. Fnalente, los Planes plcan las accones que realzará el agente en funcón de la Meta que quere lograr y en cuanto a los conocentos o Creencas que percbe del edo [37]. A gual que para el caso de las creencas, los agentes poseen un conunto de planes que descrbe las propedades y las estructuras de control de los dversos planes [2]. La fora de esqueatzar los planes ndvduales de cada uno de los agentes se puede plasar coo un pseudo códgo [33] o edante un dagraa de estados [2]. El nvel de copledad que tenga el agente para deternar cada uno de los Planes coo así tabén su fora de entender y abente deternan las característcas y, en consecuenca, la clasfcacón del so. Exsten dos nveles de abstraccón para los ssteas conforados por agentes [33]. En prer lugar, un punto de vsta externo, que pretende esqueatzar al sstea coo una erarquía de herenca de clases de agentes. Dchas clases se encuentran dentfcadas con las etas y planes del agente, coo así tabén por la nforacón que necesta del abente. Por otro lado, el punto de vsta nterno pone una estructura sobre la nforacón que anea el agente y la fora en que desarrolla sus planes. 25

Text Mnng CAPITULO 4 En este captulo se aborda el últo de los teas plares de esta tess. Prncpalente se ntroduce el concepto de Text Mnng y las operacones posbles con palabras de un texto. En la prera seccón se defne el concepto de Text Mnng eeplfcando los usos de las dstntas herraentas para el procesaento de textos. En la segunda seccón se hace referenca a las defncones báscas que serán utlzadas a lo largo del docuento asocadas al procesaento de textos y las palabras. Este conunto de térnos es de sua portanca para el entendento de las defncones que se explcten en los capítulos sguentes. En la tercera seccón se defnen las operacones con palabras que representan ayor relevanca para este trabao coo, por eeplo, la concatenacón y potenca. En la cuarta seccón se ntroduce el concepto de Asocacón de palabras para luego, en las seccones cnco y ses, explctar el soporte y confanza de una regla de asocacón y su representacón gráfca, respectvaente. 26

4.. Introduccón La nforacón exstente en, por eeplo, una epresa, puede encontrarse de fora estructurada, coo en el caso de las base de datos, o destructurada coo grandes coleccones de textos. Con respecto a la prera fora, el estudo de las bases de datos es desarrollado edante técncas de Data Mnng (DM), entras que la exploracón de textos para la búsqueda de nforacón concerne al área del Text Mnng (TM). La portanca de la exploracón de nforacón radca en el soporte para la toa de decsones, la autoatzacón de actvdades, entendento de desarrollos de procesos. En la actualdad una gran porcón de la nforacón se encuentra en fora textual, y por lo tanto destructurada [3]. El hecho de no presentar una estructura defnda hace que los textos propongan un desafío ás copleo a la hora de su procesaento. Es por ello que es necesaro el desarrollo de técncas especalzadas que pertan extraer nforacón relevante de grandes coleccones de docuentos. Muchas de las aplcacones de Text Mnng pueden plcar el uso de herraentas basadas en ssteas de Procesaento del Lenguae Natural (NLP), utlzadas, por eeplo, para el prepocesaento de un texto o análss seántcos [3]. Por otro lado, el análss y la organzacón de grandes repostoros de textos son tabén de suo nterés en los ábtos relaconados con la Intelgenca Artfcal y el aprendzae autoátco [23]. Fundaentalente, el obetvo es nclur algortos ntelgentes en los procesos de exploracón de textos para autoatzar la extraccón de nforacón relevante de los sos. Eeplos de la nterconexón de dchos algortos puede observarse en trabaos coo [], [35] y [4]. Los desarrollos nforátcos que plquen la utlzacón de técncas de Text Mnng pueden ser uy varados, por eeplo: Fltrado de Mals [23]: El usuaro desea defnr, a partr del contendo de sus als, un fltro autoátco. El sstea posee dos fases, en la de entrenaento, el algorto aprende a partr de los textos y las decsones de fltrado por parte del usuaro (aprendzae supervsado). Luego, el sstea clasfca los als según lo deternado en la prera etapa y corrge sus acertos o errores a partr de la supervsón del usuaro. Clasfcacón de textos [23], [5], [35]: A partr de patrones o estructuras counes en textos categorzar los sos de fora autoátca. Esta aplcacón del Text Mnng se encuentra fuerteente lgada a la categorzacón de págnas Web edante la cual se pueden realzar búsquedas en Internet a partr de conceptos y no palabras o, por otro lado, defnr perfles de usuaros. Lngüístca coputaconal y procesaento de textos [36]: Estudo del lenguae a partr de étodos coputaconales con un obetvo prncpal, la coprensón del lenguae. Según lo explctado anterorente se puede conclur la sguente defncón para el concepto de Text Mnng: Text Mnng es un área de nvestgacón eergente que puede ser caracterzada coo el descubrento de conocento en grandes coleccones de docuentos, cobnando 27

étodos de aprendzae con étodos de procesaento de textos. Está asocado prncpalente al descubrento de patrones nteresantes coo clusters, asocacones, desvacones, sltudes, y dferencas. Fnalente, en el aspecto práctco, cuando se habla de nforacón contenda en docuentos de textos, esta suele ser defnda coo relacones o patrones que están nersos en los docuentos y que, sn las herraentas vnculadas al Text Mnng, serían posbles de dentfcar. 4.2. Defncones báscas Antes de ntroducrnos en los conceptos ás sgnfcatvos asocados al procesaento de textos y Text Mnng, defnaos algunos de los ítes ás sples pero relevantes para la odelzacón de un docuento al oento de su estudo. Para referrnos a los teas enuncados en esta seccón se utlzará la ternología y noenclatura defnda en [42]. 4.2. a. Alfabeto Un alfabeto ( ) puede defnrse spleente coo un conunto no vacío fnto de síbolos [42]. Los síbolos pueden ser de cualquer tpo, coo por eeplo, letras, núeros, cobnacones de letras y núeros, etc. Es decr, un alfabeto debe ser defndo a pror en cualquer análss de textos y se puede especfcar a partr de un conunto de síbolos cualesquera, según el tpo de procesaento que se desea llevar a cabo. Eeplos de alfabetos pueden ser: el alfabeto español, el de los núeros o el alfabeto forado por los síbolos = { a, s, solo, Ω, } a. 4.2. b. Palabra o Cadena Una palabra o Cadena se defne coo una secuenca fnta de síbolos de un alfabeto. [42] S toaos por eeplo, los alfabetos antes enconados, en el caso del alfabeto español todos los térnos expresados en este docuento serían Palabras o Cadenas de ese alfabeto, por otro lado, el núero 25 representaría una Cadena del alfabeto de los núeros, y Ωs una palabra del alfabeto a. Cabe destacar que se pueden defnr palabras vacías ( λ ) coo aquellas que no poseen nngún síbolo. Las palabras o cadenas recben tabén una denonacón dstnta de acuerdo al núero de síbolos que posean (seccón 4.2 c.). Una palabra de k síbolos se denona k-graa [9], por eeplo, 23 es una tr-graa y ab un d-graa. Asso en [9] se acuña el térno de ultgraas coo un conunto de graas de longtud arbtrara. 28