Modelos de recomendación con falta de información

Transcripción

1

2

3 Modelos de reomendaión on falta de informaión Apliaiones al setor turístio Autor Luis Gonzaga Pérez Cordón Diretor Dr. Luis Martínez López

4 Modelos de reomendaión on falta de informaión : apliaiones al setor turístio [Reurso eletrónio] / Luis Gonzaga Pérez Cordón ; diretor, Luis Martínez López. -- 1ª ed. -- Sevilla : Consejería de Turismo, Comerio y Deporte, p. -- (Tesis dotorales ; 12) Doumento en pdf Tesis leída el 26 de septiembre de 2008 en la Universidad de Jaén, Esuela Politénia Superior de Jaén, Departamento de Informátia. ISBN Universidad de Jaén 2. Tesis 3. Turismo 4. Informaión I. Martínez López, Luis II. Andaluía. Consejería de Turismo, Comerio y Deporte III. Título IV. Serie Texto ompleto: 1ª Ediión 2009 AUTOR Luis Gonzaga Pérez Cordón DIRECTOR Dr. D. Luis Martínez López EDITA Consejería de Turismo, Comerio y Deporte Junta de Andaluía COORDINACIÓN DE LA EDICIÓN Direión General de Calidad, Innovaión y Prospetiva Turístia DISEÑO Y MAQUETACIÓN Serviio de Informaión y Doumentaión, Estudios y Publiaiones. ISBN: Núm. de Registro: JATUCODE 2009/012 Tesis dotoral leída el 26 de septiembre de 2008 en la Universidad de Jaén, Esuela Politénia Superior, Departamento de Informátia. Subvenionada por la Consejería de Turismo, Comerio y Deporte. Publiaión en línea disponible a través del Catálogo del Centro de Doumentaión y Publiaiones del Serviio de Informaión y Doumentaión, Estudios y Publiaiones de la Seretaría General Ténia de la Consejería de Turismo, Comerio y Deporte de la Junta de Andaluía, en la siguiente direión:

5 Agradeimientos Con mi agradeimiento y apreio a la gente sin la ual la realizaión de esta tesis no habría sido posible: En primer lugar y omo no podía ser de otra forma, a mi diretor de tesis Dr. Luis Martínez López, por su dediaión, esfuerzo y onfianza depositada en mí a lo largo de todo este tiempo. A mis ompañeros del Departamento de Informátia de la Universidad de Jaén y en espeial al grupo on el que omparto temas de trabajo e investigaión, Pao, Pedro, Manolo y Maarena, por su ánimo y su amistad. A mis ompañeros y ompañeras de la universidad de Jaén y muy enareidamente a Beatriz Montes. A Pao Herrera, por la oportunidad que me ofreió de inorporarme a esta apasionante profesión que es la doenia universitaria. Y ya por último a mi familia y amigos, por el apoyo reibido, y en partiular a Ruffy y a mi hermano José María, por haber diseñado la portada y ontraportada de esta tesis dotoral. Graias a todos...

6

7 Índie general 1. Introduión Motivaión Objetivos Estrutura de la memoria Sistemas de reomendaión Modelos de sistemas de reomendaión Sistemas de reomendaión olaborativos Sistemas de reomendaión basados en ontenido Sistemas de reomendaión basados en onoimiento Ténias de reomendaión: ventajas y desventajas Ténias de hibridaión Sistemas de reomendaión omeriales Filmaffinity Otros Modelado de la informaión en proesos de reomendaión Modelado de Preferenias Estruturas para la representaión de preferenias Dominios de expresión de preferenias Enfoque lingüístio difuso Eleión del onjunto de términos lingüístios Semántia del onjunto de términos lingüístios Modelos de omputaión on palabras Modelo omputaional lingüístio basado en el prinipio de extensión Modelo simbólio Modelo omputaional de las 2-tuplas Informaión lingüístia multigranular...89

8 Luis Gonzaga Pérez Cordón Seleión del CBTL Transformaión de la informaión lingüístia multigranular en onjuntos difusos Conversión de Conjuntos Difusos en 2-tuplas Lingüístias Modelo de reomendaión basado en ontenido on múltiples esala lingüístias sin informaión história Modelo de reomendaión basado en ontenido on múltiples esalas lingüístias Maro de reomendaión Creaión de la base de datos de produtos Adquisiión del perfil del usuario Filtrado de produtos Reomendaión Ejemplo de apliaión del modelo propuesto Conlusiones Modelos de Reomendaión Basados en Conoimiento RLM: Un modelo de reomendaión basado en onoimiento on informaión lingüístia multigranular Maro de reomendaión Creaión de la base de datos de produtos Obtenión del perfil de usuario Filtrado de produtos Reomendaión Ejemplo de apliaión del modelo RLM RRPI: Sistema de reomendaión basado en onoimiento on relaiones de preferenia inompletas Maro de reomendaión Creaión de la base de datos de produtos Obtenión del perfil de usuario

9 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Filtrado de produtos Reomendaión Ejemplo de apliaión del modelo RRPI Conlusiones REJA. Sistema de Reomendaión de Restaurantes de Jaén Esquema de hibridaión Módulo olaborativo Módulo basado en onoimiento RRPI Apliaión Conlusiones Conlusiones y Trabajos Futuros A. Noiones y Coneptos Básios de la Teoría de Conjuntos Difusos A.1. Conjuntos difusos y funión de pertenenia A.2. Tipos de funiones de pertenenia A.3. Número difuso B. Medidas de omparaión entre onjuntos difusos C. Rellenado relaiones de preferenia C.1. Algoritmo de rellenado de relaiones de preferenia numérias en el intervalo [0, 1] C.2. Algoritmo de rellenado de preferenias lingüístias C.3. Algoritmo de rellenado de relaiones de preferenias numérias, intervalares o lingüístias C.4. Propuesta de algoritmo de rellenado de relaiones de preferenia inompletas on tendenia al valor de indiferenia D. English summary D.1. Motivations D.2. Aims D.3. Struture of this report

10 Luis Gonzaga Pérez Cordón D.4. Reommender Systems D.5. Information modeling in reommender system D.6. A Multi-granular Linguisti Content Based Reommender Model D.7. Knowledge Based Reommender Systems Models D.8. REJA. REommender System of Restaurants in Jaén D.8.1. Hybridation outline D.8.2. User interfae D.8.3. Conlusions D.9. Conlusions and future works D.9.1. Proposal and obtained results D.9.2. Future works and researh Bibliografía Índie de figuras 2.1. Esquema de funionamiento de un sistema de reomendaión olaborativo Esquema de funionamiento de un sistema de reomendaión basado en ontenido Funionamiento sistema de reomendaión basado en ontenido Sistema de reomendaión basado en onoimiento Filmaffinity. Página prinipal Filmaffinity. Tour de pelíulas Filmaffinity. Almas gemelas Filmaffinity. Reomendaiones Filmaffinity. Puntuaiones Página de valoraiones donde el liente puntúa los produtos más reientemente omprados Página de CDNOW...60

11 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Página de Drugstore Página de ebay donde se puede ver un perfil de observaiones Página de MovieFinder Página de Reel.om Página de Zagat Funión trapezoidal Funión altura Funión altura on funión de pertenenia triangular Agregaión basado en el prinipio de extensión Aproximaión lingüístia basada en el prinipio de extensión Agregaión on el modelo simbólio Etiqueta lingüístia 2-tupla Contexto multigranular Esquema de proeso de agregaión de informaión lingüístia multigranular Funionamiento sistema de reomendaión basado en ontenido Funionamiento sistema de reomendaión basado en ontenido Sistema basado en ontenido sin informaión história Maro de trabajo del sistema basado en ontenido sin informaión história Proeso de omparaión mediante medidas de semejanza Esquema sistema de reomendaión Términos lingüístios A, B y C Ordenaión de juguetes Modelo basado en onoimiento on informaión lingüístia multigranular Maro de reomendaión del sistema basado en onoimiento

12 Luis Gonzaga Pérez Cordón 5.3. Conjunto de etiquetas S1,2 empleada en la base de datos de produtos Conjunto de etiquetas S3,4 empleada en la base de datos de produtos Conjunto de etiquetas utilizado por el usuario Modelo de sistema de reomendaión basado en onoimiento Cuantifiador proporional no dereiente Construión del perfil de usuario Similitud entre el perfil de usuario y un produto Esquema de funionamiento de un sistema de reomendaión olaborativo Modelo RRPI en REJA REJA. Pantalla de presentaión REJA. Restaurantes REJA. Informaión sobre un restaurante REJA. Georefereniaión REJA. Pantalla prinipal una vez identifiado REJA. Añadir puntuaiones REJA. Reomendaiones módulo olaborativo REJA. Reomendaión heha on el módulo olaborativo REJA. Perfil de usuario del módulo olaborativo REJA. Reomendaiones identifiado Modelo RRPI en REJA. El usuario da un ejemplo y una relaión de preferenia sobre diho ejemplo y otros tres restaurantes REJA. Aportando informaión de preferenia módulo RRPI Modelo RRPI en REJA. Se obtiene el perfil de usuario Modelo RRPI en REJA. Reomendaión REJA. Reomendaiones obtenidas REJA. Informaión sobre un restaurante A.1. Funión Edad A.2. Funión triangular

13 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio A.3. Funión trapezoidal A.4. Funión gaussiana A.5. Número real A.6. Intervalo de números reales A.7. Valores aproximados A.8. Intervalo aproximado B.1. Medidas de omparaión D.1. Content based reommender system D.2. Content based reommender system without using historial information D.3. Knowledge based reommender model with multigranular information D.4. Knowledge based reommender system model with preferene relations D.5. How ollaborative filtering algorithm works D.6. REJA. Phases D.7. REJA. Initial sreen D.8. REJA. Restaurants D.9. REJA. Information about a restaurant D.10. REJA. Geographi Information Systems D.11. REJA. Main sreen one users have been identified D.12. REJA. Add ratings to the restaurants D.13. REJA. Reommendations from the ollaborative filtering module D.14. REJA. Reommendations made by the ollaborative module D.15. REJA. User profile used by the ollaborative filtering module D.16. REJA. Reommendations to registered users D.17. Model RRPI in REJA. The user provides an example and a preferene relation over the examples

14 Luis Gonzaga Pérez Cordón D.18. REJA. Providing preferene information to the knowledge based reommendation system D.19. Model RRPI in REJA. Obtaining the user profile D.20. Model RRPI in REJA. Making the reommendations D.21. REJA. Obtained reommendations D.22. REJA. Information about a restaurant

15 CAPÍTULO 1. Introduión 1.1 Motivaión En un prinipio mis primeras investigaiones se entraron en el modelado de preferenias y en la toma de deisiones. En onreto, estudiamos las relaiones de preferenias inompletas, métodos para ompletarlas, propiedades que debían umplir, et. Al mismo tiempo, busamos ampos de utilidad para estos estudios y nos fijamos en Internet. Internet ha produido un ambio drástio en la soiedad de hoy en día. Graias a Internet tenemos aeso on-line y de forma gratuita a enilopedias, diionarios de todo tipo, podemos onsultar las notiias de todo el mundo, omprar ientos de produtos o pagar por una serie de serviios. Las posibilidades que nos ofree Internet son prátiamente infinitas y la mayor limitaión que tenemos es el tiempo que podemos dediar en hallar lo que neesitamos o simplemente en busar algo que nos guste. Esta limitaión en iertos entornos supone un grave problema. En Internet podemos enontrar muhos serviios o modelos de negoio que, en prinipio, se pensaron que tendrían un éxito arrollador, pero que a la hora de la verdad, han supuesto en muhas oasiones pérdidas importantes de dinero, ierres de ompañías, despidos... Una de las áreas que más se ha visto afetada por esta perspetiva utópia de éxito ha sido la del omerio eletrónio, la ual se desarrolló rápidamente umpliendo mínimamente sus expetativas de éxito. Las ompañías involuradas en el omerio eletrónio ofreían una gran variedad de produtos, on el objetivo de satisfaer a miles o millones de poteniales lientes. En un prinipio, para el usuario esto suponía una importante ventaja que no tenía en la tienda tradiional, ya que, podía enontrar una gran variedad de produtos e informaión relaionados on sus neesidades sin salir de asa. Sin embargo, esta variedad de produtos a vees supone más que una ventaja, un inonveniente, pues ante una simple onsulta de un usuario, era muy probable que esa tienda eletrónia devolviera ientos o miles de produtos relaionados on diha onsulta. No todos ellos satisfaían las neesidades del usuario, y de entre aquellos produtos que podían satisfaer estas neesidades sólo unos poos eran del gusto del usuario. Enontrar estos produtos solía ser una tarea ardua, larga y muhos usuarios desistían de sus búsquedas, y preferían audir a las tiendas tradiionales donde podían ser atendidos por dependientes, que fáilmente les ofreían algún produto adeuado a sus neesidades aunque el espaio de búsqueda y la informaión reibida fuese de inferior alidad, dejando de esta forma de lado la ompra de produtos mediante tiendas eletrónias. 13

16 Luis Gonzaga Pérez Cordón Para soluionar el problema anterior se desarrollaron varias herramientas en el ámbito del omerio eletrónio. La que más éxito ha tenido han sido los sistemas de reomendaión [30, 31, 41, 113, 166, 179, 192]. Estos sistemas ayudan a los usuarios en sus proesos de búsqueda en las tiendas eletrónias. No existe un únio modelo de sistema de reomendaión, sino más bien una familia de modelos de sistemas de reomendaión que omparten el mismo objetivo, guiar al usuario haia aquellos produtos que son de su interés, y la misma estrutura de funionamiento: (i) parten de unos datos que ya están en el sistema antes de que el proeso de reomendaión empiee, (ii) el usuario proporiona sus neesidades o intereses para que el sistema pueda generar las reomendaiones, (iii) se aplia un algoritmo que ombina los datos de entrada del usuario, on los datos que ya tenía el sistema on el objetivo de generar las reomendaiones. Sin embargo, estos sistemas de reomendaión presentan una serie de inonvenientes en su utilizaión: 1. El uso de esalas preisas: muhos de los sistemas de reomendaión atuales fuerzan a los usuarios a expresar sus preferenias mediante esalas preisas, normalmente numérias. Aunque esto failita el manejo de los datos, ya que, los usuarios trabajan en el mismo dominio que trabaja el sistema de reomendaión, difiulta su uso. Prinipalmente porque los datos que estamos requiriendo están relaionados on los gustos, preferenias, perepiones u opiniones de los usuarios que son difíiles de valorar de forma preisa. 2. Uniidad en la esala de evaluaión de preferenias: trabajan on una únia esala independientemente de lo que se esté evaluando en ese momento, o el grado de onoimiento del usuario sobre esa materia o de la naturaleza de lo que estamos evaluando. Muhas de las operaiones internas de los sistemas de reomendaión están diseñadas para trabajar on una únia esala finita de valores. Es muy habitual que diha esala sea también utilizada por los usuarios y/o expertos aún uando grado de onoimiento no sea el mismo. 3. Informaión história: para generar las reomendaiones estos sistemas utilizan las valoraiones que han ido aportando los usuarios sobre los produtos que han visto, probado o omprado. Si diha base de datos história es lo sufiientemente buena, estos sistemas produen reomendaiones muy eranas a lo que neesita el usuario, sin embargo, esta situaión ideal no siempre se produe, y en iertos entornos, es habitual que no tengamos informaión história sobre los usuarios, no pudiéndose utilizar ténias lásias para generar las reomendaiones. 14

17 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 4. Dependenia de la densidad de la base de datos: la densidad de la base datos en muhas oasiones ha demostrado ser uno de los fatores más importante en la alidad de las reomendaiones. Aunque en muhas situaiones, se puede obligar o motivar al usuario a que proporione valoraiones para aumentar la densidad de la base de datos, en otros asos, esto es imposible o desaonsejable, ya sea por la naturaleza del problema o porque no se espera que el usuario interaione on el sistema de una forma habitual y duradera. Dado estos problemas enfoamos nuestra investigaión al desarrollo de modelos de reomendaión que soluionen o mitiguen los problemas anteriores y sean de apliaión a gran variedad de situaiones Objetivos Dada la motivaión de nuestra investigaión, los objetivos de esta memoria son los siguientes: n Estudiar las alternativas posibles que hay para modelar la informaión en este tipo de problemas, es deir, qué estrutura se pueden utilizar, tipo de informaión, operaiones... Debemos tener en uenta que la informaión que vamos a manejar es subjetiva, pues está relaionada on las opiniones, perepiones y gustos de los usuarios. n Mejorar los proesos de adquisiión de informaión para la onstruión de perfiles de usuario. Busamos requerir el mínimo de informaión a los usuarios y enontrar meanismos para inferir a partir de esta informaión un perfil de usuario. Para ello utilizaremos relaiones de preferenia inompletas y algoritmos de reonstruión. n Diseñar modelos de sistema de reomendaión apaes de realizar reomendaiones en situaiones donde la informaión história disponible sobre las valoraiones, opiniones o aiones pasadas del liente no esté disponible o sea esasa. n Implementar un prototipo de sistema de reomendaión apliado al setor turístio. Queremos implementar un prototipo funional que implemente varios modelos, tanto lásios omo algunos de los modelos teórios expuestos en esta memoria Estrutura de la memoria Esta memoria está estruturada en los siguientes apítulos: n En el apítulo 2, haremos una revisión en profundidad de los sistemas de reomendaión existentes en la atualidad, veremos su funiona- 15

18 Luis Gonzaga Pérez Cordón miento, sus ventajas y sus inonvenientes. Además veremos algunas de las ténias de hibridaión existentes entre sistemas de reomendaión. En este apítulo haremos espeial hinapié en los sistemas de reomendaión basados en onoimiento, en ontenido y olaborativos, pues, éstos serán los modelos que hemos desarrollado en esta memoria para alanzar nuestros objetivos. n En el apítulo 3, realizaremos una revisión del Enfoque Lingüístio Difuso [218] y de los modelos lingüístios de representaión de preferenias [76, 81]. Dado que un objetivo de la memoria es mejorar el modelado de las preferenias en los sistemas de reomendaión, y dado que la informaión presente en los sistemas de reomendaión es, en su mayoría, vaga e impreisa, hemos onsiderado adeuado el uso del enfoque lingüístio difuso ya que, ha demostrado ser útil modelando este tipo de informaión. En primer lugar revisaremos el enfoque lingüístio difuso y finalmente el modelo lingüístio omputaional basado en 2-tuplas [81]. n En el apítulo 4, presentaremos un modelo de sistema de reomendaión basado en ontenido adaptado a entornos donde no hay informaión história sobre los usuarios. Este modelo trabajará en un ontexto lingüístio multigranular. n En el apítulo 5, presentaremos dos modelos de sistema de reomendaión basados en onoimiento. El primero es un modelo que ofree un ontexto lingüístio multigranular a los usuarios para expresar sus opiniones y mejora el modelo presentado en el apítulo anterior, desde el punto de vista de que se puede apliar a un mayor número de produtos. El segundo modelo pretende optimizar la reogida de informaión de las neesidades del usuario y la generaión de perfiles de usuario. Para ello, proponemos el uso de relaiones de preferenia inompletas para la onstruión de perfiles de usuario. n En el apítulo 6, se presentará una implementaión de un sistema de reomendaión apliada al setor turístio, en onreto a la reomendaión de restaurantes de la provinia de Jaén, que utiliza la propuesta presentada en esta memoria y que fue desarrollado para los proyetos de la Consejería de Turismo, Comerio y Deporte de la Junta de Andaluía obtenidos por el grupo de investigaión del que soy miembro. n Finalmente, se presentan las onlusiones más relevantes obtenidas a lo largo de la memoria. Además, haremos una breve desripión de las lineas futuras de investigaión. Y se onluye on una reopilaión bibliográfia que reoge las ontribuiones más destaadas en la materia estudiada. 16

19 CAPÍTULO 2. Sistemas de reomendaión En el mundo real, nos podemos enontrar tiendas adaptadas a las neesidades o araterístias de un barrio o zona onreta. Sin embargo, es imposible que nos enontremos una tienda real que se pueda adaptar a las neesidades, gustos y araterístias de ada uno de los lientes que la visitan. En Internet esto si es posible y ha supuesto un gran ambio tanto en el omerio en sí, omo en las ténias de marketing. Hemos pasado del omerio y de las ténias de marketing lásias que busaban rear produtos estándares, on un gran ilo de vida y que pudieran ontentar a grandes merados homogéneos, a un omerio y a unas ténias que busan personalizar los serviios y los produtos de forma que puedan ontentar expresamente a ada usuario en onreto [98]. Aunque en un prinipio se pensó que la irrupión del omerio eletrónio llevaría a las ompañías a diseñar una gran variedad de produtos que se pudieran adaptar a los gustos partiulares de los usuarios o grupos de usuarios, el ambio más importante no lo han sufrido las empresas sino los usuarios, pues éstos, uando visitan una tienda eletrónia, tienen disponible una mayor gama de produtos que si visitaran una tienda tradiional. Así por ejemplo, aunque una librería tradiional puede ofreer ientos de libros distintos, una librería on-line aumenta esta oferta a miles o millones de libros distintos. Este aumento en las posibles eleiones, también suponen un aumento de la informaión que el usuario debe proesar antes de esoger el produto que mejor satisfae sus neesidades. Muhas vees esto produe una sobrearga de informaión para el usuario, que puede sentirse saturado, ya que debe de explorar una extensa gama de produtos y no tiene el tiempo sufiiente para haerlo o no quiere dediarle tanto tiempo en enontrar el produto deseado. Esto supuso un gran inonveniente y fue uno de los prinipales obstáulos que frenaron el desarrollo del omerio eletrónio, ya que lo usuarios muhas vees desistían de las búsquedas y terminaban audiendo a las tiendas tradiionales. Para solventar este problema de sobrearga de informaión, se rearon varias herramientas de personalizaión que se utilizan no sobre los produtos en sí, sino sobre la forma en que son presentados en la tienda on-line [99]. La personalizaión es un meanismo muy utilizado en otras áreas uyo objetivo es adaptar o personalizar un serviio a los gustos o neesidades partiulares de un usuario. Cuando hablamos de personalizaión web normalmente nos referimos a la personalizaión de las páginas web [117]. Esta personalizaión, ofree ontenidos adaptados y una presentaión de 17

20 Luis Gonzaga Pérez Cordón las páginas adaptadas basándose en las preferenias partiulares de ada usuario, en las visitas pasadas o en los intereses futuros. La idea de la personalizaión es ofreer la informaión o los produtos adeuados, de manera preisa, a la gente que los neesita. Una de las herramientas más utilizadas y que mejores resultados ha proporionado en este ampo han sido los sistemas de reomendaión [30, 31, 128, 146, 126, 183]. Los sistemas de reomendaión fueron definidos en un prinipio omo aquellos sistemas que tenían omo entrada de datos reomendaiones proporionadas por sus usuarios, agregaba estas reomendaiones y las mostraba a los sujetos apropiados [166]. Atualmente, el signifiado del término sistema de reomendaión es más amplio, refiriéndose a ualquier sistema que produe reomendaiones individuales omo salida, o que tiene el efeto de guiar al usuario de un modo personalizado a objetos útiles y/o interesantes dentro de un gran espaio de posibles opiones. Estos sistemas son muy atrativos en situaiones donde la antidad de informaión que se ofree al usuario supera ampliamente ualquier apaidad individual de exploraión. Los sistemas de reomendaión en la atualidad están integrados en muhas páginas web de omerio eletrónio tales omo Amazom.om o CDNow [179]. Los adjetivos individualizado e interesante y útiles que hemos usado en la definiión de sistemas de reomendaión son las araterístias que los separan de los sistemas de reuperaión de informaión o de los sistemas de soporte a la deisión. En este apítulo, en la seión 2.1, revisaremos los modelos de sistema de reomendaión más omunes y nos detendremos on mayor detalle en los utilizados en esta memoria. A ontinuaión, en la seión 2.2, revisaremos varios sistemas de reomendaión utilizados en la atualidad: Amazon.om, CDNOW, Drugstore.om, ebay, MovieFinder.om Reel.om o Filmaffinity Modelos de sistemas de reomendaión Los sistemas de reomendaión son usados en el área del omerio eletrónio para sugerir produtos a los lientes o para proporionarles informaión que les ayude a deidir qué produtos puede omprar. Estos produtos pueden ser reomendados basándose en las ventas más importantes, en informaión demográfia del liente y/o en el análisis histório de las ompras pasadas del liente para predeir futuras ompras. Existen varias formas de reomendaión, en éstas podemos inluir sugerenias de produtos a los lientes, proporionar informaión personalizada sobre el produto, resumir las opiniones de una omunidad de usuarios o proporionar las rítias de diha omunidad [180]. Estas ténias de reomenda- 18

21 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio ión son una parte fundamental en la personalizaión de una tienda eletrónia porque ayuda al sitio a adaptarse por si mismo a ada liente. Esta personalizaión puede verse omo una adaptaión de la tienda on-line a las neesidades partiulares de ada usuario [98]. Desde este punto de vista, uno podría definir los sistemas de reomendaión omo una herramienta que permite la reaión de una tienda virtual personalmente diseñada para ada liente [180]. Los sistemas de reomendaión mejoran las ventas de las tiendas eletrónias de tres formas distintas [180]: 1. Convierte a los visitantes en ompradores: muhos visitantes de tiendas eletrónias suelen visitar las páginas on el únio objetivo de ehar un vistazo a los produtos ofertados pero, sin ninguna intenión iniial de ompra. Los sistemas de reomendaión pueden ayudar a que estos usuarios enuentren los produtos que desearían omprar. 2. Inrementa las ventas ruzadas: los sistemas de reomendaión aumentan las ventas ruzadas al sugerir produtos adiionales a los lientes para que los ompre. Si las reomendaiones son buenas, la media de pedidos realizados en esa tienda debería inrementarse. Por ejemplo, una tienda eletrónia podría reomendar produtos adiionales en el proeso de finalizaión de la ompra (en la aja virtual), basándose en los produtos que ya tiene en el arrito de la ompra. 3. Mejora la fidelidad de los lientes: en un mundo virtual omo el de Internet donde, las tiendas eletrónias de la ompetenia están sólo a uno o dos liks de ratón, la fidelidad de los lientes se onvierte en una parte fundamental del éxito de ualquier tienda on-line [163, 164]. Los sistemas de reomendaión mejoran esta fidelidad al rear un valor añadido en la relaión de la tienda eletrónia on el liente. Las tiendas eletrónias utilizan los sistemas de reomendaión para aprender las ostumbres y gustos de sus lientes, y presentar reomendaiones personalizadas a las neesidades de ada uno de ellos. Si este proeso de personalizaión se ha realizado on éxito, existen muhas posibilidades de que estos lientes vuelvan a visitar el sitio web, y ésto hará a su vez, que se proporione más informaión sobre sus gustos, que mejoren las reomendaiones y que a la larga tengamos unos lientes fieles a diha tienda eletrónia. Inluso si un ompetidor desarrollara un software similar a esta tienda, los lientes tendrían que dediar el mismo tiempo que dediaron en el primer aso para que la ompetenia onoza on la misma preisión sus gustos y neesidades. Algo que normalmente no hará mientras la tienda atual sea apaz de ubrir sus neesidades [100]. 19

22 Luis Gonzaga Pérez Cordón En esta seión, presentaremos una lasifiaión de los sistemas de reomendaión [166, 179, 192] basada en las fuentes de informaión utilizadas para alular sus reomendaiones. Para entender diha lasifiaión, es importante señalar que los sistemas de reomendaión utilizan: 1. Datos de ontexto: la informaión que el sistema tiene antes de que el proeso de reomendaión empiee. 2. Datos de entrada: la informaión que el usuario omunia al sistema para generar una reomendaión. 3. Algoritmo de reomendaión: un algoritmo que ombine los datos de ontexto on los datos de entrada para generar las reomendaiones. Los datos de entrada están relaionados on los gustos, neesidades y preferenias de los usuarios. Dependiendo de omo se reoja esta informaión se puede lasifiar en: n Informaión explíita [2, 39, 53, 73, 75, 155, 162, 180]: informaión proporionada por el usuario, en la mayoría de los asos a petiión del sistema, aunque también puede ser introduida por tereras personas en base a uestionarios, datos aportados, informaión ya disponible, et., pero siempre ontemplando informaión diretamente proporionada por el usuario. De esta forma, es diho usuario el responsable de la veraidad de la informaión aportada. n Informaión implíita [2, 39, 53, 73, 75, 152, 155, 162, 180]: informaión reogida automátiamente por el propio sistema en funión del omportamiento del usuario. Pueden ser por ejemplo, datos referidos al historial de navegaión del usuario, produtos adquiridos en una página web, aeso a iertas páginas, et. Partiendo de esta informaión y de los algoritmos utilizados para generar las reomendaiones podemos distinguir ino ténias de reomendaión: 1. Sistemas de reomendaión olaborativos [19, 28, 41, 64, 67, 72, 159, 165, 176, 182]: son probablemente los más extendidos en el merado. Se han utilizado on éxito en múltiples oasiones y es el modelo más asentado en la atualidad. Los sistemas de reomendaión olaborativos agregan las valoraiones o reomendaiones de los objetos, identifian los gustos omunes de los usuarios basándose en sus valoraiones y generan una nueva reomendaión teniendo en uenta las omparaiones entre usuarios. Un perfil típio de usuario en un sistema olaborativo onsiste en un vetor de objetos y sus valoraiones. La mayor ventaja de las ténias olaborativas es que son ompleta- 20

23 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio mente independientes de la representaión interna de los produtos que se pueden reomendar. En la seión se expliarán on más detalle. 2. Sistemas de reomendaión basados en ontenido [7, 17, 128, 146, 126, 154, 183]: provienen de la investigaión del filtrado y reuperaión de informaión [16]. En un sistema basado en ontenido, los objetos de interés están definidos por sus araterístias asoiadas. Un sistema de reomendaión basado en ontenido aprende un perfil de intereses de los usuarios basándose en las araterístias presentes en los objetos que el usuario ha seleionado. En la seión los veremos más detalladamente. 3. Sistemas de reomendaión demográfios [148, 155] tienen omo objetivo lasifiar al usuario según sus atributos personales y haer las reomendaiones basándose en sus lases demográfias. Uno de los primeros ejemplos de este tipo de sistema fue Grundy [167] que reomendaba libros basándose en la informaión personal reogida mediante un dialogo interativo. Las respuestas del usuario eran omparadas on una librería onstruida manualmente de estereotipos de usuarios. Algunos sistemas de reomendaión más reientes también han utilizado este modo de trabajo. Por ejemplo en [114] se utilizan grupos demográfios de estudios de marketing para sugerir una gama de produtos y serviios. En otros sistemas, se utilizaron algoritmos de aprendizaje para onseguir un lasifiador basado en datos demográfios [155]. La representaión demográfia de la informaión en un modelo de usuario puede variar enormemente. El sistema de Rih [167] utilizaba atributos estableidos manualmente on valores de onfianza numérios. El modelo de Pazzani [155] usa Winnow para extraer las araterístias de las páginas de iniio de los usuarios que son las que predeían el gusto por iertos restaurantes. Uno de los prinipales benefiios del enfoque demográfio es que no requiere informaión história, omo ourre on las ténias olaborativas y basadas en ontenido, para realizar las reomendaiones. Sin embargo, tiene omo inonveniente que requiere informaión demográfia sobre el usuario, ésta muhas vees puede ser de aráter personal y muhos usuarios pueden sentir que se está violando su privaidad o que se le está requiriendo informaión de aráter privado. 4. Sistemas de reomendaión basados en onoimiento [30, 312, 32, 33, 201]: los sistemas de reomendaión basados en onoimiento intentan sugerir objetos haiendo inferenias sobre las neesidades de un usuario y sus preferenias. Se puede deir que todas las ténias 21

24 Luis Gonzaga Pérez Cordón de reomendaión haen algún tipo de inferenia. El enfoque basado en onoimiento se distingue en el sentido que usan onoimiento funional: tienen onoimiento sobre ómo un objeto en partiular puede satisfaer las neesidades del usuario, y por lo tanto pueden razonar sobre la relaión entre una neesidad y una posible reomendaión. El perfil del usuario es una estrutura de onoimiento que apoya esta inferenia. En la seión veremos detalladamente el funionamiento de este tipo de sistemas de reomendaión. 5. Sistemas de reomendaión basados en utilidad [68]: realizan sugerenias basándose en el álulo de una utilidad de ada objeto para el usuario. Por supuesto, el problema entral, es omo rear una funión de utilidad para ada usuario. Por ejemplo, TêTE-à-Tête y PersonalLogi tienen distintas ténias para onseguir una funión de utilidad espeífia para ada usuario y apliarla a los objetos en onsideraión [68]. El perfil de usuario por tanto, es una funión de utilidad que el sistema tiene que obtener del usuario y el sistema emplea ténias de satisfaión de restriiones para loalizar el produto que mejor onuerda on lo que quiere el usuario. Las ventajas de las reomendaiones basadas en utilidad es que puede trabajar on atributos no relaionados diretamente on los produtos, tales omo la fiabilidad del vendedor y la disponibilidad del produto. 6. Sistemas de reomendaión híbridos [13, 31, 40, 155]: individualmente todas las ténias presentan alguna limitaión o problema. Para soluionar éstas limitaiones se planteó la hibridaión de distintas ténias de reomendaión. Hablamos de hibridaión uando ombinamos dos o más ténias de reomendaión on el objetivo de obtener un mejor rendimiento que si hubieramos utilizado estas ténias de forma independiente. En la seión las veremos más detalladamente. En la tabla 2.1 podemos ver un resumen de las araterístias prinipales de los sistemas de reomendaión que hemos visto anteriormente. Suponemos que I es el onjunto de objetos sobre los uales podemos haer reomendaiones, U es el onjunto de usuarios uyas preferenias son onoidas, u es el usuario para el que queremos generar reomendaiones, e i es un objeto para el que nos gustaría predeir las preferenias de u, i I' on I' I. 22

25 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Colaborativo Basado en ontenido Demográfio Basado en utilidad Basado en onoimiento Tabla 2.1: Ténias de reomendaión Valoraión por parte de U de los objetos de I Caraterístias de los objeto de I Informaión demográfia sobre U y la valoraión de los objetos de I Caraterístias de los objetos de I Caraterístias de los objetos de I. Conoimiento de omo estos objetos satisfaen las neesidades del usuario. Valoraiones por parte de u de los objetos de I Valoraiones de de objetos de I Informaión demográfia sobre u Una funión de utilidad sobre los objetos en I que desriben las preferenias de u Una desripión de las neesidades o intereses de u Identifia usuarios en U similares a u y predie la valoraión de i a partir de las valoraiones de esos usuarios Genera un lasifiador que ajusta el omportamiento de las valoraiones de u y lo usa en i Identifia a los usuarios que son similares demográfiamente a u y a partir de las valoraiones de estos usuarios, predie la valoraión de i Aplia una funión a los objetos y determina la ordenaión de i Infiere una relaión entre i y las neesidades de u En las siguientes seiones revisaremos el funionamiento de los sistemas de reomendaión utilizados en el desarrollo de esta memoria ya sea para su implementaión o para el desarrollo de nuevos modelos de reomendaión a partir de ellos. En onreto estudiaremos por un lado los sistemas de reomendaión olaborativos (seión 2.1.1) y los basados en ontenido (seión 2.1.2). Por otro lado, también revisaremos los sistemas de reomendaión basados en onoimiento (ver seión 2.1.3), dado que en esta memoria presentamos nuevos modelos basados en esta ténia. En 23

26 Luis Gonzaga Pérez Cordón la seión haremos un resumen de las ventajas e inonvenientes que tienen ada una de las ténias de reomendaión vistas en este apítulo, y por último, en la seión veremos las ténias de hibridaión más onoidas, pues han sido utilizadas en el software presentado en el apítulo Sistemas de reomendaión olaborativos Para revisar estos sistemas, estudiaremos uáles fueron sus orígenes y en qué ténias se basa su funionamiento. Después, veremos una lasifiaión de los mismos y por último estudiaremos en profundidad el funionamiento de un modelo simple de sistema de reomendaión olaborativo. 24 Orígenes Cuando las empresas pudieron almaenar los datos de las transaiones omeriales, éstas empezaron a analizar diha informaión para omprender el omportamiento de sus lientes. El término minería se utiliza para desribir un onjunto de ténias de análisis utilizado para inferir reglas o onstruir modelos a partir de un gran onjunto de datos [39, 53]. Los primeros sistemas de reomendaión olaborativos basaban su esquema de funionamiento en las ideas provenientes de la minería de datos. Así por ejemplo, se diseñaron sistemas de reomendaión que tiene una fase off-line durante la ual aprenden el modelo, omo ourre en la minería de datos, y una fase on-line durante la ual aplian este modelo a situaiones reales generando reomendaión para los lientes del sistema. Sin embargo, lo más habitual es utilizar un modelo de aprendizaje relajado, en el ual se onstruye y se atualiza el modelo durante el funionamiento del sistema, ya que, las bases de datos sobre lientes evoluionan dinámiamente onforme los usuarios interaionan on el sistema. En las primeras tiendas de omerio eletrónio, las reomendaiones se generaban a partir de simples onsultas a una base de datos, muhas vees diseñadas por expertos y obtenidas mediante minería de datos. Clasifiaión Los sistemas de reomendaión olaborativos pueden ser agrupados en dos lases generales [2, 28, 48, 102, 177, 180, 204, 222]: n Sistemas de reomendaión que usan algoritmos basados en memoria [165, 185]: estos sistemas de reomendaión, esenialmente, realizan las reomendaiones basándose en la oleión ompleta de ítems valorados previamente por el usuario. Es deir, el valor de una puntuaión no onoida para un usuario en onreto sobre un produto en

27 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio partiular se alula omo un agregado de las valoraiones de otros usuarios (generalmente, los K más pareidos) sobre diho produto. Para estos álulos se utiliza el algoritmo de los veinos más eranos (K-NN) y omo agregaión se utiliza una media ponderada de los veinos más eranos que hayan valorado ese produto. Estas opiniones deberían ser esaladas para ajustar las diferenias en las tendenias de las valoraiones entre los usuarios [72]. Los algoritmos basados en el K-NN tienen la ventaja de ser apaes de utilizar rápidamente la informaión atual del sistema sobre las preferenias de los usuarios. En situaiones reales tienen un gran inonveniente: onforme la base de usuarios del sistema va reiendo, el tiempo y los reursos neesarios para generar las reomendaiones ree. Por lo que, puede llegar a ser exesivo y no generar reomendaiones en tiempos aeptables. Además la alidad de éstas dependen de la densidad de la base de datos, si hay muhos usuarios on poas reomendaiones es muy probable que no se generen reomendaiones adeuadas. Para soluionar este problema se suelen emplear heurístias para busar buenos veinos dentro de una gran poblaión de lientes. n Sistemas de reomendaión que usan algoritmos basados en modelo [28, 41, 66, 205]: las aproximaiones basadas en modelos utilizan una oleión de valoraiones para aprender un modelo, el ual será utilizado para generar las reomendaiones. Los ténias más utilizadas para la onstruión de estos modelos han sido: 1. Redes Bayesianas [28, 41]: las redes bayesianas rean un modelo a partir de un onjunto de entrenamiento on un árbol de deisión, en donde ada nodo y ada lado representa informaión de los lientes. El modelo puede ser onstruido off-line y puede tardar horas o días en onstruirse. El modelo resultante es muy pequeño, rápido y en algunos asos tan preiso omo los modelos basados en los veinos más eranos [28]. Las redes bayesianas pueden ser prátias en situaiones en donde el onoimiento sobre las preferenias del usuario, ambia muy lentamente on respeto al tiempo que se tarda en onstruir modelo. No es útil o no es adeuado en situaiones en donde los modelos de preferenias de los lientes deben ser atualizados rápida y freuentemente. 2. Sistemas de Reomendaión basados en ténias de lustering: las ténias de lustering identifian grupos de lientes que pareen tener preferenias similares. Una vez se han reado los luster, las prediiones para un individuo pueden haerse agregando las opiniones de otros lientes perteneientes a ese luster. Algunas 25

28 Luis Gonzaga Pérez Cordón ténias de lustering tienen en uenta que un liente o usuario puede perteneer parialmente a varios lusters. En estos asos la prediión se obtiene mediante una agregaión entre los luster partiipantes, y ponderada por el grado de pertenenia. Las ténias de lustering normalmente produen reomendaiones menos personales que otros métodos y en algunos asos, los lusters pueden tener peor preisión que los algoritmos del veino más erano [28]. Una vez hemos obtenido todos los lusters, el rendimiento del sistema es muy bueno, ya que, el tamaño del grupo que debe ser analizado es muho más pequeño. 3. Modelos basados en ítems [176]: otro modelo propuesto son los algoritmos basados en ítems los uales, para haer una prediión de qué valoraión le daría el usuario a un produto dado, llevan a abo los siguientes pasos: primero tienen que explorar el onjunto de ítems o produtos que el usuario ha valorado, alulan lo similar que son al produto del ual queremos predeir la puntuaión que le daría el usuario, seleionan los k produtos más eranos de un modelo ya alulado, y por último, predien la valoraión global omo una media ponderada de las valoraiones del usuario de los produtos similares. 4. Sistemas de Reomendaión basados en lasifiadores: los lasifiadores son modelos omputaionales para asignar una ategoría a una entrada. Las entradas pueden ser vetores de ategorías para los produtos que han sido lasifiados o datos sobre las relaiones entre los produtos. Una forma de onstruir un sistema de reomendaión utilizando un lasifiador es utilizar la informaión sobre un produto o un liente omo entrada, y obtener una ategoría de salida que represente la onfianza on que se reomienda un produto al liente. Los lasifiadores han tenido bastante éxito en una variedad de dominios, desde la identifiaión de riesgos de réditos y fraude en transaiones finanieras, hasta diagnóstio médio o deteión de intrusos. En [14] podemos enontrarnos on un sistema de reomendaión híbrido que mezla el filtrado olaborativo y el basado en ontenido usando un lasifiador de aprendizaje mediante induión. En [66] se implementó un lasifiador de pelíulas, basado en vetores de araterístias on aprendizaje por induión y ompara la lasifiaión on las reomendaiones basadas en el veino más erano. Este estudio demostró que el rendimiento de los lasifiadores es ligeramente peor que el de el veino más 26

29 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio erano, pero que ombinándolos, pueden obtener mejores resultados que el del veino más erano por si sólo. 5. Sistemas de Reomendaión basados en reglas de asoiaión: las reglas de asoiaión han sido utilizadas en proesos de negoio, para analizar tanto los patrones de preferenia entre los produtos, y para reomendar produtos a lientes basados en los otros produtos que han esogido. Una regla de asoiaión expresa la relaión de un produto que es habitualmente omprado junto on otros produtos. Las reglas de asoiaión pueden formar una representaión ompata de datos de preferenia que pueden mejorar la efiienia del almaenamiento tanto omo la del rendimiento. No aporta buenos resultados uando el onoimiento de las preferenias ambia rápidamente. Las reglas de asoiaión han tenido un gran éxito en otras apliaiones tales omo las que organizan las estanterías en las tiendas al detalle. Por el ontrario, los sistemas de reomendaión basados en ténias del veino más erano son más fáiles de implementar para reomendaiones personales en un dominio donde se aportan freuentemente opiniones, tales omo, la venta al detalle on-line. 6. Sistemas de Reomendaión basados en Horting: es una ténia basada en grafos en donde los nodos son lientes y los aros indian el grado de similitud entre dos lientes [205]. Las prediiones son produidas desplazándose entre los nodos eranos y ombinando las opiniones de los lientes eranos. Horting difiere del veino más erano en el sentido que se puede explorar en el grafo, a lientes que aún no han evaluado el produto en uestión y, de esta forma, explorar relaiones transitivas que el veino más erano nuna onsideraría. En [205] tenemos un estudio, utilizando datos sintétios, en donde Horting produe mejores reomendaiones que un algoritmo del veino más erano. Esquema de funionamiento En esta seión expliaremos brevemente el funionamiento básio de los sistemas de reomendaión olaborativos lásio (basado en memoria). Estos sistemas de reomendaión basan su funionamiento en la idea de que la gente que estaba de auerdo en las valoraiones pasadas, también estará de auerdo en las futuras. En el filtrado olaborativo [64, 72] las reomendaiones se realizan enontrando las orrelaiones entre los usuarios del sistema de reomendaión (ver figura 2.1). Con esta metodología podemos enontrar fáilmente produtos de interés (produtos que no onoe el usuario atual pero que han sido valorado por otros usuarios afines 27

30 Luis Gonzaga Pérez Cordón a él) y predeir la valoraión que el usuario atual le daría a los produtos. Para entender su funionamiento desarrollaremos el ejemplo que puede verse en la tabla 2.2. En esta tabla tenemos las valoraiones de 5 usuarios sobre 5 restaurantes. El símbolo + india que al usuario le ha gustado la desripión del restaurante y el símbolo - india que al usuario no le ha gustado el restaurante. Figura 2.1: Esquema de funionamiento de un sistema de reomendaión olaborativo 28 Tabla 2.2: Valoraión de 5 usuarios sobre 5 restaurantes Marta Luis Carmen Pedro Pao Kitima Maro Polo Spiga Thai Touh Dole ? Para predeir la valoraión que Pao le daría al restaurante Dole, busaremos usuarios que tenga un patrón de valoraiones similares a Pao. En este aso, Marta y Pao tienen idéntios gustos y uno podría suponer que a Pao le gustará Dole porque a Marta le gusta. Una soluión más general sería enontrar el grado de orrelaión entre Pao y los demás usuarios, en vez de usar solamente aquellos usuarios que tiene el gusto más pareido a los de Pao, y usar un media ponderada de sus valoraiones para generar las reomendaiones. El peso dado a ada usuario será el grado de orrelaión entre los dos usuarios. En el aso más general, la valoraión podría ser un número ontinuo en vez de solo +1 o -1. Se podría

31 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio utilizar por ejemplo el oefiiente de orrelaión de Pearson r. Sea R i,j la valoraión del usuario i sobre el produto j, entones la orrelaión entre el usuario x y el usuario y se puede obtener de la siguiente forma: r (x, y) = d P rodutos R x,d Rx R y,d Ry d P rodutos R x,d Rx 2 R y,d Ry 2 Donde Ṝ x es el valor medio de las valoraiones hehas por el usuario x. En el ejemplo que estamos omentando, la orrelaión entre Pao y Marta es 1.0, entre Pao y Luis es 0.577, entre Pao y Carmen es 0.577, y entre Pao y Pedro es Si alulamos la media ponderada de la valoraión de ada usuario sobre el restaurante Dole por su orrelaión on Pao obtendremos un valor de Un algoritmo olaborativo predeiría que a Pao le gustaría el restaurante Dole basándose en las reomendaiones de los otros usuarios. Podemos destaar que en esta reomendaión se ha tenido en uenta el heho de que Pao y Pedro tienen prátiamente gustos opuestos y que a Pedro no le gusta el restaurante Dole. Aunque el filtrado olaborativo es omúnmente utilizado para enontrar orrelaiones entre las valoraiones de los usuarios, también puede ser utilizado para enontrar olaboraiones entre los objetos valorados. Por ejemplo, hay una orrelaión perfeta entre las valoraiones de Dole y Spiga en la tabla 2.2. Basándose en este heho, podríamos predeir que a Pao le gustaría el restaurante Dole ya que a Pao le gusta el Restaurante Spiga. De forma análoga, se puede alular la orrelaión entre restaurantes, usando otra vez el oefiiente de Pearson r, y haer prediiones basadas en la media ponderada de las valoraiones de los otros restaurantes. De nuevo, haiendo la media ponderada de todos los restaurantes de la tabla 2.2 obtendríamos el resultado de que a Pao le gustaría el restaurante Dole Sistemas de reomendaión basados en ontenido En esta seión veremos uáles fueron sus orígenes y en qué ténias se basaron para la onstruión de estos modelos de sistemas de reomendaión. Por último, estudiaremos en detalle el funionamiento de un modelo simple de sistema de reomendaión basado en ontenido. 29

32 Luis Gonzaga Pérez Cordón Orígenes Muhos de los produtos que se pueden enontrar en Internet se desriben on gran detalle mediante textos, desripiones, resúmenes... Los sistemas de reomendaión basados en ontenido explotan esta informaión mediante el uso de ténias previamente utilizadas en la reuperaión y filtrado de informaión. Como sabemos, uno de los usos más habituales de Internet es omo fuente de informaión. La antidad de informaión que podemos enontrar sobre un tema o relaionado on una onsulta es enorme, sin embargo, no toda esta informaión es relevante o oinide on lo que realmente busamos. Aunque, la mayoría de vees los usuarios pueden obtener lo que quieren utilizando los motores de búsqueda tradiionales, en oasiones estos devuelven muhos resultados que no son de interés real para el usuario. El problema de enontrar la informaión relevante es onoido omo sobrearga de informaión. Los fatores que ausan este problema son los siguientes: n La gran antidad de informaión existente y reiente en Internet. n La informaión mostrada en Internet no suele estar estruturada y la informaión nueva se añade sin ningún orden ni estrutura. n La informaión existente en Internet tiene una naturaleza dinámia. Puede ser ambiada, modifiada o borrada aunque ya haya sido publiada. El heho de que se hayan onvertido en una de las fuentes de informaión más importantes y más utilizadas ha heho que en muhas páginas web aparezan herramientas para: n Reuperaión de informaión [10, 174]: el objetivo de la reuperaión de informaión es devolver un doumento, o varios, a un usuario final que ontenga la informaión deseada por este usuario. Esta área ha evoluionado desde el análisis de letras y palabras, par a obtener el tema entral del doumento, hasta la integraión de propiedades intrínseas del doumento tales omo itas, hiperenlaes o datos del uso del doumento. Los enfoques basados en ontenido, tales omo, los estadístios o ténias de lenguaje natural proporionan resultados que ontienen un onjunto espeífio de palabras o signifiados, pero no diferenian qué doumentos en una oleión son los que de verdad interesan leer. Salton [174], un pionero en reuperaión de informaión desde 1970, introdujo el modelo espaial vetorial que se ha onvertido en la atualidad en la base para la representaión de 30

33 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio doumentos en los sistemas de reuperaión de informaión atuales y los motores de búsqueda web. n Filtrado de informaión [16]: las ténias de filtrado de informaión son un omplemento de los motores de búsqueda más que un modelo alternativo. El onepto de filtrado tiene que ver on la deisión de onsiderar, a priori, si un doumento es relevante o no, eliminándolo del onjunto de elementos que se pueden reuperar en aso ontrario. Estas ténias ombinan, normalmente, sistemas de auto aprendizaje y sistemas de reuperaión de informaión y han sido utilizadas en la onstruión de motores de búsqueda espeializados [37]. Debido a los grandes avanes que se hiieron en estos ampos, muhos de los sistemas de reomendaión basados en ontenido atuales se entran en reomendar produtos o ítems que ontienen informaión textual tales omo doumentos, páginas web (URLs), o mensajes de notiias de Usenet. Las mejoras sobre los enfoques de reuperaión de informaión tradiionales provienen del uso de perfiles de usuario que ontienen informaión sobre los gustos, preferenias o neesidades de estos. La informaión almaenada en estos perfiles se puede obtener de muy diversas formas: de forma explíita, mediante, por ejemplo, uestionarios que el usuario debe rellenar, o de forma implíita, obteniendo informaión estudiando su omportamiento (que ítems o produtos lee, et.). Esquema de funionamiento En esta seión expliaremos brevemente el funionamiento básio de los sistemas de reomendaión basados en ontenido. Estos sistemas, analizan las desripiones de los produtos que han sido valorados por el usuario y predien qué produtos le pueden gustar (ver figura 2.2). El funionamiento de estos sistemas dependerá en gran medida del tipo de informaión de desripión que se utilie en la onstruión del perfil de usuario. Esta informaión se puede dividir en: n Conjunto de araterístias: asoiado a ada produto puede apareer un onjunto de araterístias que lo desribe, omo por ejemplo el autor de un libro, serie a la que pertenee, atores de una pelíula, onsumo medio si estamos hablando de vehíulos... n Informaión textual sobre el produto: es un doumento que desribe diho produto (un resumen de un libro, el argumento de una pelíula,...). La prinipal diferenia on respeto al onjunto de araterístias, es que está informaión no está estruturada. 31

34 Luis Gonzaga Pérez Cordón Figura 2.2: Esquema de funionamiento de un sistema de reomendaión basado en ontenido Existen sistemas basados en ontenido que solo trabajan on los onjuntos de araterístias asoiados a ada produto. Éstos tienen un esquema de funionamiento similar al que podemos ver en la figura 2.3. Analizan las araterístias de los produtos omprados o valorados positivamente por el usuario. Construyen un perfil de usuario y por último, usan este perfil de usuario para busar nuevos produtos que puedan satisfaer al usuario y los reomienda. Por ejemplo, en [17], se presenta un sistema de reomendaión basado en ontenido de pelíulas. En este sistema, el perfil de usuario está ompuesto, mayoritariamente, por el onjunto de araterístias deseables en una pelíula. Una de las araterístias utilizadas en este sistema son los atores preferidos por el usuario. Así por ejemplo, supongamos que tenemos un usuario que ha visto la pelíula ``La milla verde y ``Soñador, y que ha puntuado dihas pelíulas on un 4 (buena) la primera y on un 5 (muy buena) la segunda (ver tabla 2.3). 32

35 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 2.3: Funionamiento de un sistema de reomendaión basado en ontenido 33

36 Luis Gonzaga Pérez Cordón Tabla 2.3: Desripión de dos pelíulas Caraterístias La milla verde Soñador Reparto T. Hanks, D. Morse K. Russell, D. Morse Puntuaión 4 5 Para generar las reomendaiones para este usuario, el sistema onstruirá el perfil de usuario, partiendo de las araterístias de las pelíulas valoradas positivamente por él. Si nos entramos uniamente en la araterístia Reparto veremos que el perfil obtenido (ver tabla 2.4) ontiene los atores y atries de las pelíulas valoradas positivamente por él. Además, podemos ver que que ada uno de ellos tiene asoiado un peso que mide el grado de preferenia del usuario por diho ator o atriz. A partir de este perfil, el sistema busará aquellas pelíulas que umplan en mayor grado on las araterístias almaenadas en él y las reomendará. Caraterístias Reparto... Tabla 2.4: Perfil de usuario basado en ontenido Perfil de usuario ({T. Hanks, D. Morse, K. Russell}), (0.25, 0.50, 0.25}) Sin embargo, la mayoría de las ténias lásias de reomendaión basadas en ontenido analizan úniamente la informaión textual del produto. El objetivo de este análisis es enontrar patrones en el ontenido de dihos textos para realizar las reomendaiones. Muhos de estos sistemas de reomendaión son versiones espeializadas de lasifiadores entrenables donde su objetivo es aprender una funión que predie a qué lase pertenee un doumento (si el doumento le gusta o no le gusta). Otros algoritmos tratan este problema omo un problema de regresión en donde el objetivo es aprender una funión que predie un valor numério (la valoraión del produto). Existen dos problemas importantes en el diseño de un sistema de filtrado basado en ontenido. El primero es enontrar una representaión de doumentos. El segundo es rear un perfil de usuario que nos permita reomendar produtos al usuario que aún no haya visto. En este tipo de sistemas de reomendaión los produtos se representan mediante doumentos y éstos se modelan por medio de un vetor de palabras importantes. Por ejemplo, [13] representa los doumentos en términos de las 100 palabras on los pesos más altos en el TF-IDF [174], o 34

37 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio lo que es lo mismo, on las palabras que apareen más freuentemente en estos doumentos de lo que haen en media. En [154] se representa los doumentos on las 128 palabras más informativas, palabras que están más asoiadas on un doumento que on otro. En la tabla 2.5 podemos ver un ejemplo on 5 restaurantes y 5 palabras que apareen en las desripiones de los restaurantes. Las valoraiones de Pao sobre estos restaurantes también las podemos enontrar en la misma tabla. Tabla 2.5: Palabras ontenidas en la desripión de 5 restaurantes junto on las valoraiones de unos usuarios para estos restaurantes Kitima Y Y Y Y Y - Maro Polo Y Y + Spiga Y Y + Thai Touh Y Y Y - Dole Y Y Y? Una vez que hemos definido una representaión para los doumentos, podemos entrenar un algoritmo de lasifiaión para que distinga los doumentos que tendrían una valoraión alta de los otros. Fab [13] utiliza el algoritmo de Rohio [170] para aprender un vetor TF-IDF que es la media de los doumentos que tienen una valoraión alta. Syskill [154] utiliza un lasifiador Bayesiano para estimar la probabilidad de un doumento sea interesante para el usuario. Ambos sistemas de reomendaión tienen el inonveniente de que hay que definir a priori los términos que se van a utilizar en el perfil. En [155] utilizan el algoritmo Winnow [155] para identifiar las araterístias relevantes de entre todas las posibles. Para resolver este ejemplo on Winnow ada una de las palabras, x i, asoiadas a ada restaurante deberá ser tratada omo una variable booleana (valdrá 1 si esta palabra está en la desripión del restaurante y 0 si no está). Winnow aprende los pesos w i que están asoiados on ada palabra de auerdo on la ineuaión: / w i x i > x donde x un umbral. Al prinipio todos los pesos son iniializados a 1. A ontinuaión empieza una fase de aprendizaje uyo objetivo es aprender los pesos asoiados a ada palabra. Para ello, dividiremos el onjunto de restaurantes valorados por el usuario en un onjunto de entrenamiento y en un onjunto de prueba. A ontinuaión ajustaremos los pesos de forma que la suma de los pesos de las palabras ontenidas en la desripión de 35

38 Luis Gonzaga Pérez Cordón un restaurante supere el umbral, si ese restaurante le gusta al usuario, y se quede por debajo del umbral en aso ontrario. Para haer este ajuste, usaremos el onjunto de entrenamiento. Por ada ejemplo de este onjunto se obtiene la suma de los pesos de las palabras presentes en su desripión. Si la suma está por enima del umbral y al usuario no le gustó, el peso asoiado on ada palabra de este restaurante es dividido por 2. Si la suma está por debajo del umbral, y le gustaba el restaurante, el peso asoiado a ada palabra es multipliado por 2. En otro aso, el restaurante fue lasifiado orretamente y no se realiza ningún ambio en los pesos. Este proeso se repetirá ontinuamente ajustando los pesos hasta que todos los ejemplos del onjunto de prueba sean orretamente lasifiados (o hasta que se hayan pasado n iteraiones sin ningún ambio en la preisión de las reomendaiones del onjunto de prueba). Una vez heho este proeso de aprendizaje, podremos onoer si a Pao le gustará o no el restaurante Dole. Así por ejemplo, si después del entrenamiento obtenemos que los pesos asoiados a las palabras fideos, langostino, albahaa, exótio, salmón son {0.5, 0.9, 0.8, 0.2, 0.9} y el umbral seleionado es 1.5 el valor de la ineuaión será: = 2.6 > 1.5 Y por lo tanto el restaurante Dole será reomendado Sistemas de reomendaión basados en onoimiento Al igual que en los asos anteriores, en primer lugar estudiaremos uáles fueron sus orígenes y en qué ténias se basaron. Por último, estudiaremos el funionamiento de los sistemas de reomendaión basados en onoimiento. Orígenes La mayor parte de los sistemas de reomendaión basados en onoimiento emplean ténias de razonamiento basados en asos para inferir las reomendaiones. El razonamiento basado en asos fue formalizado en uatro pasos: 1. Reordar: dado un determinado problema, el sistema debe reuperar aquellos asos relevantes (similares) a este problema. Un aso onsiste en un problema, una soluión y anotaiones de ómo la soluión se llevo a abo. 2. Reutilizar: adaptar la soluión del problema anterior a este nuevo. 36

39 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 3. Revisar: probar que la soluión puede ser apliada al mundo real o al problema en onreto 4. Retener: si esta soluión ha sido satisfatoria almaenarla omo un nuevo aso para futuros problemas. El razonamiento basado en asos tiene sus orígenes en los trabajos de Roger Shank [181], Janet Kolobner [110] y Mihael Lebowitz \ ite{lebo83}. El primer sistema razonador basado en asos fue CLAVIER utilizado para diseñar las piezas ompuestas que se oerán en un horno industrial de onveión [93]. Esquema de funionamiento Este tipo de sistema de reomendaión utiliza el onoimiento que tiene sobre los usuarios y los produtos para, mediante un enfoque basado en diho onoimiento, generar una reomendaión razonando sobre qué produtos satisfaen las neesidades del usuario. Existen varias alternativas para implementar este tipo de sistemas, por ejemplo, el sistema de reomendaión PersonalLogi interaiona on el usuario mediante diálogos que le permiten explorar un árbol de disriminaión de las araterístias de los produtos. Otros han adaptado herramientas de soporte a la deisión on araterístias uantitativas para esta tarea [18]. En esta seión introduiremos los sistemas de reomendaión que se basan en el razonamiento basado en asos [69, 111, 168] para realizar las reomendaiones. El sistema de reomendaión de restaurantes Entree [30, 31, 32, 33] realiza las reomendaiones enontrando restaurantes en una nueva iudad similares a los que el usuario onoía o le gustaban. Los usuarios que interaionan on el sistema, delaran sus preferenias on respeto a un restaurante dando un ejemplo de sus neesidades. Posteriormente, si hae falta, éstos pueden refinar sus riterios de búsqueda. Estos sistemas de reomendaión presentan algunas ventajas sobre los sistemas de reomendaión lásios, los olaborativos y los basados en ontenido. Por ejemplo, los sistemas de reomendaión olaborativos neesitan una gran antidad de valoraiones de los usuarios sobre un onjunto de produtos para poder realizar reomendaiones preisas sobre dihos produtos. Este problema también se presenta en aquellas ténias de reomendaión que emplean algoritmos de aprendizaje, ya que, para que estos puedan aprender o generar un modelo que represente las preferenias del usuario, se neesita una ierta antidad de informaión sobre aiones pasadas o valoradas de los usuarios. Los sistemas de reomendaión basados en onoimiento no presentan estos inonvenientes ya que sus reomendaiones no están basadas en las valoraiones de un grupo de usuarios. Esto hae que los sistemas de reomendaión basados en onoimiento no 37

40 Luis Gonzaga Pérez Cordón sólo sean útiles por si mismos, sino también un importante omplemento para otros tipos de sistemas de reomendaión. En la siguiente figura (figura 2.4) podemos ver un ejemplo de ómo funiona este tipo de sistemas de reomendaión, uando utilizan el razonamiento basado en asos, para generar las reomendaiones. Los pasos que se siguen son los siguientes: 1. Obtiene un ejemplo de las neesidades del usuario: el usuario le proporiona al sistema un ejemplo que represente sus neesidades. 2. Búsqueda de produtos que umplen las neesidades del usuario: a partir de la desripión del ejemplo proporionado por el usuario, el sistema de reomendaión busará otros produtos similares a él y los devolverá omo reomendaiones (parte izquierda de la figura 2.4). 3. Fase de refinamiento: en algunas irunstanias puede ourrir que los produtos reomendados, a partir del ejemplo no oinidan exatamente on las neesidades del usuario. En estos asos el usuario debe refinar las araterístias del produto seleionado omo ejemplo, modifiando y/o añadiendo nuevas araterístias (parte dereha de la figura 2.4). Figura 2.4: Sistema de reomendaión basado en onoimiento 38

41 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Estos sistemas de reomendaión utilizan el onoimiento que tienen sobre el usuario y los produtos para inferir las reomendaiones. Este onoimiento puede lasifiarse de la siguiente forma: n Conoimiento de atálogo: onoimiento sobre los produtos que pueden ser reomendados y sus araterístias. Por ejemplo, un sistema de reomendaión de restaurantes podría saber que la oina Tailandesa es un tipo de oina asiátia. n Conoimiento funional: el sistema debe ser apaz de estableer relaiones entre las neesidades del usuario y los produtos que podrían satisfaer estas neesidades. Por ejemplo, si el usuario neesita un sitio romántio, un restaurante que podría satisfaer esta neesidad sería uno que es silenioso y on una vista marítima. n Conoimiento de usuario: para proporionar buenas reomendaiones, el sistema debe tener algún onoimiento sobre los usuarios. Éste podría venir de informaión demográfia o de informaión espeífia sobre las neesidades del usuario en ese momento. Uno de los prinipales inonvenientes de estos sistemas de reomendaión es que la mayoría del onoimiento que utilizan debe ser proporionado por un experto. La preisión de las reomendaiones dependerá en gran medida de la alidad y la antidad del onoimiento proporionado por diho experto. Además, es muy importante el tipo de herramientas que se le failiten al usuario para proporionar sus neesidades. Por un lado, el sistema debe proporionar al usuario una interfaz fáil y senilla para que este pueda proporionar sin ningún problema un ejemplo erano a sus neesidades. Debemos tener en uenta que este onjunto de ejemplos poteniales no debe de ser muy numeroso y sus elementos ser onoidos por el usuario, bien porque los onoza por su propia experienia, o bien porque sean bien onoidos por todo el mundo. Si el onjunto potenial de ejemplos ofreidos por el sistema fuera muy numeroso, o bien ontuviera muhos ejemplos no onoidos por el usuario, orreríamos el riesgo de que éste desistiera de reibir reomendaiones, ya que, éste tendría que emplear muho tiempo explorando todas las alternativas, hasta enontrar un ejemplo que represente adeuadamente sus neesidades. Otro de los grandes inonvenientes de este tipo de sistemas de reomendaión está relaionado on la fase de refinamiento. Es muy difíil que un usuario enuentre un ejemplo exato de lo que neesita, por lo que es bastante probable que éste deba refinar su perfil del usuario modifiando o añadiendo algunas de las araterístias del ejemplo dado. Las herramientas que se ofrezan al usuario para proporionar esta nueva informaión juegan un papel fundamental en este tipo de sistemas de reomendaión. 39

42 Luis Gonzaga Pérez Cordón Por un lado, si los produtos están desritos on un número exesivo de araterístias puede ourrir que el usuario se sienta abrumado al tener que revisar dihas araterístias. Si por el ontrario sólo se presenta un número reduido de ellas, por ejemplo, las más relevantes, puede ourrir que se limite en exeso la posibilidades de búsqueda del usuario. Por otro lado, estas araterístias han sido valoradas normalmente por expertos en el tema, y por lo tanto, es de esperar, que estén expresados en dominios preisos y rios en valoraiones, que un usuario normal puede enontrar difíil de entender y evaluar. Por lo tanto, también enontrará difíil su utilizaión para modifiar o expresar sus neesidades. A pesar de estas difiultades los sistemas de reomendaión basados en onoimiento, han sido utilizados on éxito, por ejemplo en la reomendaión de restaurantes [30], y presentan muhos benefiios uando son hibridados on otro tipo de sistemas de reomendaión [31], ya que, son apaes de generar reomendaión sin neesidad de usar informaión história sobre los usuarios. En esta memoria, en el apítulo 5, presentamos dos modelos de sistemas de reomendaión basados en onoimiento que resuelven los problemas anteriormente menionados. El primero es un modelo que ofree un ontexto lingüístio a los usuarios para expresar sus opiniones y de esta forma failitar el proeso de refinamiento del perfil de usuario. El segundo modelo tiene omo objetivo optimizar la reogida de informaión de las neesidades del usuario y la generaión de perfiles de usuario Ténias de reomendaión: ventajas y desventajas Todas las ténias de reomendaión tienen sus puntos fuertes y sus debilidades que disutiremos a ontinuaión y que podemos ver de forma resumida en la tabla 2.6. Quizás el problema más onoido es el problema del inremento (ramp-up problem) [113]. Este término de heho se refiere a dos problemas distintos pero que están relaionados: 40 n Problema del nuevo usuario: uando las reomendaiones se basan solamente en omparaiones entre las valoraiones aumuladas de un usuario objetivo y otros usuarios, si este usuario objetivo tiene poas valoraiones es bastante difíil lasifiarlo de forma orreta. n Problema del nuevo produto: de forma análoga, un nuevo produto que no tiene muhas valoraiones tampoo puede ser fáilmente reomendado. Este problema aparee en dominios de reomendaión de nuevos artíulos, donde existe un flujo ontinuo de nuevos produtos y ada usuario sólo valora unos poos. Este problema también es

43 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio onoido omo el problema del valorador prematuro, porque la primera persona que valora un produto apenas obtiene benefiio por haerlo (esas valoraiones prematuras no mejoran la habilidad on que se ompara un usuario on otro [9]). Una de las soluiones que se ha propuesto para resolver este problema es inentivar a los usuarios de alguna forma para que proporionen más valoraiones. Tabla 2.6: Ventajas y desventajas de las ténias de reomendaión Ténia Positivo Negativo Colaborativa (CF) Basados en ontenido Demográfios Basados en utilidad A. Puede identifiar nihos entre géneros B. No neesita dominio de onoimiento C. Adaptativo: la alidad mejora a lo largo del tiempo D. Feedbak implíitos son sufiientes (haber omprado un produto,...) I. Problema del nuevo usuario J. Problema del nuevo produto K. El problema de la oveja gris L. Calidad dependiente del tamaño del onjunto de datos histórios M. Problema de la estabilidad vs maleabilidad B, C, D I, L, M A, B, C E. No sufre problema del inremento F. Sensible a los ambios de preferenias G. Puede inluir araterístias no relaionadas on los produtos I, K, L, M N. Debe usar informaión demográfia O. El usuario debe introduir una funión de utilidad P. Habilidad estátia de sugerenia (no aprende) Basados en onoimiento E, F, G H. Puede estableer relaiones de las neesidades de los usuarios on los produtos P Q. Requiere adquisiión del onoimiento Los sistemas de reomendaión olaborativos dependen de las oinidenias entre las valoraiones de los distintos usuarios y tienen difiultades en enontrar estas oinidenias si el espaio de valoraiones es poo denso (sólo unos poos usuarios han valorado los mismos produtos). El problema de la densidad se redue de alguna forma uando empleamos 41

44 Luis Gonzaga Pérez Cordón enfoques basados en modelos. La densidad sigue siendo un problema importante en dominios tales omo el filtrado de notiias, ya que existen muhos produtos disponibles, y a no ser que, la base de datos sea muy grande, es bastante difíil obtener otro usuario que omparta un gran número de produtos valorado. Estos problemas sugieren que las ténias puramente olaborativas, funionan mejor en problemas donde la densidad de usuarios es relativamente alta en omparaión on el universo de produtos, el ual debería ser pequeño y estátio. Si el onjunto de produtos ambia rápidamente, las valoraiones antiguas apenas sirven para los nuevos usuarios, que no han sido apaes de tener valoraiones en omparaión on aquellos usuarios existentes. Si el onjunto de produtos es muy grande y los usuarios apenas valoran produtos, entones las probabilidades de tener valoraiones omunes on otros usuarios es muy pequeña. Los sistemas de reomendaión olaborativos trabajan mejor para un usuario que enaja en un grupo de usuarios numeroso de gustos similares. La ténia no trabaja bien uando existen usuarios ovejas grises [40], que están entre las fronteras de dos grupos de usuarios. Este problema también se presenta en los sistemas de reomendaión demográfios que intentan lasifiar a los usuarios basándose en sus araterístias personales. Por otro lado, los sistemas de reomendaión demográfios no sufren del problema del nuevo usuario, porque no requieren una lista de valoraiones de un usuario. En vez de esto, tienen el problema de que deben reoger informaión demográfia. Con el inremento de la sensibilidad de los datos on-line, espeialmente en los ontextos de omerio eletrónio [43], es bastante difíil que los sistemas de reomendaión demográfios tengan éxito, ya que, la mayoría de la informaión neesaria para realizar las reomendaiones es informaión que el usuario no suele estar dispuesto a revelar. Los sistemas de reomendaión basados en ontenido tienen el problema de que deben aumular sufiiente informaión sobre los gustos y neesidades de los usuarios para realizar reomendaiones fiables. Además, están limitados a las araterístias que explíitamente están asoiadas on los produtos que pueden reomendar. Por ejemplo, un sistema de reomendaión basado en ontenido de pelíulas, sólo puede basar sus reomendaiones en la desripión esrita de las pelíulas: nombres de los atores, argumento... Debido a que no puede obtener ninguna informaión de la pelíula en si, esto hae que estás ténias basen sus reomendaiones úniamente en los datos desriptivos disponibles. Los sistemas de reomendaión olaborativos sólo onfían en las valoraiones que pueden ser utilizadas para reomendar produtos sin tener en uenta los datos des- 42

45 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio riptivos. Inluso en la presenia de datos desriptivos, se ha demostrado que los sistemas de reomendaión olaborativos pueden ser más preisos que los basados en ontenido [5]. La gran ventaja de los sistemas de reomendaión olaborativos sobre los basados en ontenido está relaionado on la habilidad de ruzar géneros (ross-genre reommendations) o salir de la aja (outside the box). Por ejemplo, puede ourrir que un afiionado a la músia que le guste el Jazz, también le guste la músia lásia, pero un sistema de reomendaión basado en ontenido, entrenado en su afiión en jazz, sería inapaz de sugerir produtos de músia lásia si ninguna de las araterístias (interpretes, instrumentos o repertorio) oinide on los produtos de las otra ategoría, osa bastante habitual. Sólo si se mira fuera de las preferenias del individuo se podrían realizar tales reomendaiones. Ambas ténias de reomendaión sufren del efeto artera (portfolio). Un sistema de reomendaión ideal no sugeriría algo que el usuario ya onoe o una pelíula que ya ha visto. El problema se omplia en dominios tales omo el filtrado de notiias, donde es muy fáil enontrarse la misma notiia repetida varias vees, pero de fuentes distintas, pero donde también es muy fáil enontrarse la misma notiia presentando nuevos hehos o perspetivas que, podrían ser de interés para el usuario y éstas no serían reomendadas por el sistema. Por ejemplo, el sistema DailyLearner [19] utiliza un umbral superior de similitud en su reomendador basado en ontenido para dejar fuera aquellas notiias demasiado similares a aquellas que el usuario ya ha leído. Los sistemas de reomendaión basados en onoimiento no tienen problemas de inremento o densidad, pues no basan sus reomendaiones en datos aumulados. Sin embargo, presenta un inonveniente omo todos los sistemas basados en onoimiento: neesitan adquirir el onoimiento. A pesar de este inonveniente, los sistemas de reomendaión basados en onoimiento tienen algunas araterístias benefiiosas. Son adeuados para demandas puntuales, pues requiere menos informaión del usuario que otros sistemas de reomendaión. No tienen ningún problema al omienzo del funionamiento del sistema, en donde las sugerenias son de baja de alidad porque el sistema aaba de arranar y no tienen ninguna informaión de preferenia de ningún usuario. Como inonveniente, podría itarse que no es apaz de desubrir grupos de usuarios tal y omo haen los sistemas de reomendaión olaborativos. Por otro lado, puede haer reomendaiones tan variadas omo su base de onoimiento lo permita. Los sistemas de reomendaión olaborativos y demográfios tienen la apaidad únia de poder estableer relaiones entre géneros y poder 43

46 Luis Gonzaga Pérez Cordón reomendar produtos no eranos a las preferenias habituales de los usuarios. Los sistemas de reomendaión basados en onoimiento podrían haer lo mismo, sólo si tales asoiaiones han sido identifiadas a priori por un experto. Todas estas ténias basadas en el aprendizaje (olaborativas, basadas en ontenido y demográfias) sufren del problema del omienzo de una forma u otra. Una vez que el perfil de usuario se ha estableido en el sistema, es difíil que se ambien estas preferenias. Por ejemplo, si a alguien le gustaba omer arne y se hae vegetariano, ontinuará reibiendo reomendaiones de omida no vegetariana por algún tiempo, hasta que las nuevas valoraiones hayan ambiado las preferenias almaenadas. Muhos sistemas de reomendaión solventan estos problemas inluyendo algún sistema de envejeimiento de valoraiones, para que las más antiguas tengan menos influenias, pero se orre el riesgo de perder informaión de preferenia antigua pero valiosa, que represente de forma preisa las preferenias del usuario Ténias de hibridaión Dado que las ténias de reomendaión anteriormente presentadas tienen algunas limitaiones, se planteó omo soluión a dihos problemas: la hibridaión de ténias. En ella, ombinamos dos o más ténias de reomendaión para obtener un mejor rendimiento que utilizando ada una de ellas de forma independiente. Lo más omún, es ombinar las ténias de filtrado olaborativo on alguna otra ténia on el objetivo de evitar el problema del inremento. En la tabla 2.7 podemos ver algunas de las ombinaiones más freuentemente utilizadas [31]. En esta seión estudiaremos estas ténias y terminaremos señalando qué onlusiones se pueden obtener sobre la hibridaión. Modelos de hibridaión A ontinuaión expliaremos ada una de estas ténias más detalladamente: 1. Mediante pesos: los sistemas de reomendaión híbridos ombinan las reomendaiones de ada sistema, dándole un peso a ada una de las reomendaiones dependiendo de que sistema las ha generado. La importania o puntuaión de ada produto se alula a partir de los resultados obtenidos por todas las ténias de reomendaión presentes en el sistema. 44

47 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Por ejemplo, el sistema de reomendaión híbrido mediante pesos más simple sería aquel que alula la puntuaión final mediante una ombinaión lineal. El sistema P-Tango [40] es un ejemplo de este tipo de hibridaión. Iniialmente tanto la ténia olaborativa omo la basada en ontenido tienen el mismo peso (la misma importania), pero gradualmente va ajustando los pesos de auerdo on las opiniones de los usuarios sobre si están onformes o no on los resultados mostrados. Este modelo de ombinaión no utiliza valoraiones numérias, sino que trata las salidas de ada ténia de reomendaión (olaborativa, basada en ontenido o demográfia) omo un onjunto de votos, los uales son ombinados mediante un esquema de onsenso [155]. Método de hibridaión Mediante pesos Conmutaión Mezla Combinaión de araterístias Casada Aumento de araterístias Meta-nivel Tabla 2.7: Métodos de hibridaión Desripión Los valoraiones (o votos) de varias ténias de reomendaión son ombinadas para produir una únia reomendaión El sistema utiliza una u otra ténia dependiendo de la situaión atual Las reomendaiones provenientes de varias ténias de reomendaión son mostradas al mismo tiempo Las araterístias de las fuentes de datos de varias ténias de reomendaión son ombinadas en un algoritmo de reomendaión únio Uno de los sistemas de reomendaión refina los resultados dado por otro La salida de una ténia es utilizada omo una entrada de araterístia de otro El modelo aprendido por un sistema de reomendaión es utilizado omo entrada de otro 45

48 Luis Gonzaga Pérez Cordón Las ventajas de este tipo de sistema de reomendaión, es que todas las apaidades del sistema son utilizadas en el proeso de reomendaión de una forma senilla y direta, por lo que es muy fáil ajustar los pesos manualmente o mediante algoritmos simples. Sin embargo, esta ténia parte de la hipótesis de que ese valor de importania relativa entre las distintas ténias es más o menos uniforme en todo el espaio de produtos. Como hemos visto anteriormente, ésto no siempre es verdad pues, por ejemplo, los sistemas de reomendaión olaborativos tienen un peor omportamiento en aquellos produtos que tienen poas valoraiones. 2. Conmutaión: estos sistemas híbridos utilizan distintos riterios para alternar la ténia de reomendaión que deben emplear en ada momento. Por ejemplo, el Daily Leaner [19], es un sistema de reomendaión híbrido basado en ontenido y olaborativo. Este sistema emplea primero métodos de reomendaión basados en ontenido y si no puede obtener ninguna reomendaión on sufiiente onfianza, hae uso del método olaborativo. Este modelo no evita el problema del inremento ya que ambos métodos, el olaborativo y el basado en ontenido, presentan el problema del nuevo usuario, y son utilizados de forma independiente. En estos sistemas, la ténia olaborativa proporiona la posibilidad de realizar búsquedas a través de géneros, por lo que podemos obtener reomendaiones de produtos, relevantes, pero que no son eranos en semántia on aquellos produtos que han sido evaluados por el usuario. Este método de hibridaión onlleva una omplejidad adiional en el proeso de reomendaión pues tenemos que determinar el riterio por el ual ambiaremos de una a otra alternativa, lo ual introdue otro nivel de parametrizaión. Por otro lado, si este riterio es seleionado de forma adeuada puede aprovehar de mejor forma las ualidades de los sistemas de reomendaión que lo omponen y evita las debilidades de otros sistemas en esas situaiones. 3. Mezla: este tipo de hibridaión mezla los resultados provenientes de varias ténias de reomendaión mostrándolas al mismo tiempo. Puede ser utilizado en situaiones donde se requieran un gran número de reomendaiones y de esta forma, presentar al mismo tiempo las reomendaiones de todas las ténias impliadas. 46

49 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio El sistema PTV [186] usa este enfoque para reomendar un programa de televisión. Utiliza ténias basadas en ontenido para tratar la informaión textual de los programas de televisión e informaión olaborativa para aprovehar la informaión de preferenia de otros usuarios. Las reomendaiones de ambas ténias se ombinan en una sugerenia final. Estas hibridaiones evitan el problema del nuevo produto debido prinipalmente a que, el omponente basado en ontenido basa sus reomendaiones en nuevos programas utilizando la desripión de éstos, inluso si no han sido evaluados por nadie todavía. Sin embargo, si presenta el problema del nuevo usuario, ya que, ambos sistemas de reomendaión neesitan algunos datos sobre las preferenias del usuario. 4. Combinaión de araterístias: otra forma de hibridar los sistemas de reomendaión basado en ontenido y olaborativos, es manejar la informaión olaborativa omo una araterístia de datos asoiada on ada ejemplo, y utilizar ténias basadas en ontenido sobre este onjunto de datos ampliado. Por ejemplo, en [14] emplean un algoritmo de aprendizaje de reglas para reomendar pelíulas, no sólo utilizando las araterístias ontextuales, sino también las valoraiones de los usuarios. Aunque este modelo presenta mejoras sustaniales on respeto al enfoque puramente olaborativo, esto sólo ourre uando se tratan manualmente las araterístias ontextuales. Los autores de este modelo se dieron uenta que empleando todas las araterístias ontextuales aumentaban el número de produtos que se reomendaban, pero no la preisión de las reomendaiones. Este tipo de hibridaión permite a los sistemas usar datos olaborativos sin depender exlusivamente de ellos, reduiendo de esta forma, la sensibilidad del sistema al número de usuarios que han valorado un produto. En ambio, permite al sistema obtener informaión sobre la similitud inherente que no es posible enontrar en sistemas de reomendaión basados en ontenido. 5. Casada: este método ombina las ténias mediante proesos ompuestos de varias fases, en donde, en la primera fase, hae una primera seleión de produtos que deben ser reomendados mediante una de las ténias, y en las fases siguientes, se utilizan las otras ténias para filtrar este onjunto de andidatos. 47

50 Luis Gonzaga Pérez Cordón 48 En [31] se presenta un modelo de reomendaión de restaurantes, EntreeC, que ombina ténias olaborativas y basadas en onoimiento. EntreeC usa el onoimiento que tiene sobre los restaurantes para haer reomendaiones según los intereses delarados por el usuario. Las reomendaiones son oloadas en onjuntos de igual preferenia y se utiliza la ténia olaborativa para seleionar uno de los onjuntos, y adiionalmente, para ordenar las reomendaiones de diho onjunto. La ténia en asada evita que la segunda ténia tenga que tratar on produtos que ya han sido desehados por la primera o que tienen sufiientes valoraiones negativas omo para que nuna sean reomendados. Graias a esto, las fases posteriores a la iniial son más efiientes, ya que, sólo tienen que tratar on un onjunto reduido de andidatos y no on todo el onjunto de produtos. Además, está ténia es tolerante al ruido en las reomendaiones, en el sentido, de que los produtos reomendados por las fases superiores sólo pueden ser refinados y no puede ourrir, por ejemplo, que un produto no valorado positivamente en una fase anterior sea introduido en una fase posterior. 6. Aumento de araterístias: esta ténia es empleada para produir una valoraión o una lasifiaión de un produto, y esa informaión, es inorporada en el proeso utilizado en la siguiente ténia de reomendaión. Por ejemplo, el sistema Libra [145] hae reomendaiones basadas en ontenido de libros utilizando los datos enontrados en Amazon. om. Usa una red bayesiana para lasifiar los distintos ampos de texto presentes en la desripión. En los datos textuales se inluyen los autores relaionados y los títulos relaionados que Amazon genera usando su sistema de reomendaión olaborativo. Estas araterístias se han demostrado que mejoran los resultados de las reomendaiones. Esta ténia es interesante debido prinipalmente a que permite mejorar el rendimiento de la ténia prinipal empleada en la reomendaión, sin neesidad de que diha ténia se vea alterada en su funionamiento ni onepión. Hay que observar que esta ténia es diferente de la ombinaión de araterístias donde los datos eran ombinados de forma direta. También esta ténia es distinta de la ombinaión en asada. Aunque ambas ténias usan los algoritmos de reomendaión uno detrás de otro.

51 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 7. Meta-nivel: otra forma de ombinar varias ténias de reomendaión es utilizando el modelo generado por uno omo entrada para otro. Esto difiere del aumento de araterístias en el sentido que, en el aumento de araterístias, utiliza el modelo aprendido para generar araterístias omo entradas para el segundo algoritmo. Aquí, la entrada es el propio modelo. El primer híbrido meta-nivel fue el sistema de filtrado de páginas web Fab [11, 12]. En Fab, un agente de seleión espeífio para el usuario realiza un filtrado basado en ontenido utilizando el método de Rohio [170] para mantener un modelo de vetor de términos que desriba las áreas de interés del usuario. Una oleión de agentes, que reogen nuevas páginas de la web, usa los modelos de todos los usuarios en sus operaiones de reogida. De esta forma, los doumentos que son primeramente reogidos son aquellos interesantes para la omunidad al ompleto y entones es distribuido a los usuarios partiulares. Además de la forma de ompartir los modelos de usuario, Fab también realiza una oleión de reomendaión en asada olaborativas y basadas en ontenido, aunque el modelo olaborativo sólo genera un onjunto de elementos y la informaión sobre su ranking no es utilizada en la seleión de omponentes. El benefiio de este tipo de hibridaión, espeialmente uando estamos hibridando basados en ontenido y olaborativos, es que el modelo aprendido es una representaión omprimida de los intereses del usuario y el meanismo olaborativo opera sobre esta representaión ondensada de informaión más fáilmente que sobre datos sin tratar. En el apítulo 6 presentamos el software REJA, el ual tiene una hibridaión de varios sistemas de reomendaión. En este aso la hibridaión implementada es la de onmutaión, ya que el sistema alternará entre los distintos sistemas de reomendaión dependiendo de que informaión se tenga sobre el usuario y sus neesidades. Conlusiones sobre la hibridaión La hibridaión puede aliviar algunos de los problemas asoiados on el filtrado olaborativo y otras ténias de reomendaión. Los sistemas de reomendaión híbridos que utilizan algoritmos de reomendaión basados en ontenido y olaborativos, independientemente de la ténia de hibridaión que empleen, siempre presentarán el problema del inremento pues ambas ténias neesitan un base de datos de valoraiones. 49

52 Luis Gonzaga Pérez Cordón De todas maneras, esta hibridaión es bastante utilizada, porque en muhas situaiones tales valoraiones ya existen, o porque presentan más flexibilidad y mejores resultados que si emplearan estas ténias de forma independiente. Las meta ténias evitan el problema de la densidad de datos omprimiendo las valoraiones sobre muhos ejemplos en un modelo, el ual, puede ser fáilmente utilizado para ompararlo entre los usuarios. Las ténias basadas en onoimiento y utilidad pareen ser buenas andidatas para la hibridaión, ya que no presentan ninguno de los problemas relaionados on el inremento de nuevos usuarios o de produtos. La tabla 2.8 resume algunas de las aportaiones más importantes en sistemas de reomendaión híbridos. Para simplifiar la tabla, se mostrarán juntos los basados en onoimiento y en utilidad ya que los basados en utilidad son un aso espeial de los basados en onoimiento. Debemos destaar que uatro de las ténias presentadas obtienen los mismos resultados independientemente del orden en el que se utilien los algoritmos de reomendaión: pesos, mezla, onmutaión y ombinaión de araterístias. Sin embargo la hibridaión mediante asada, aumento y meta-nivel son dependientes del orden. Tabla 2.8: Sistemas de reomendaión híbridos posibles y atuales (CF=Colaborativo, CN= Basado en ontenido, DM= Demográfio, KB= Basado en onoimiento) CF/CN Mediante pesos P-Tango CF/DM [155] Mezla PTV, ProfBuilder Conmut. Daily- Leaner CF/KB [198] [199] CN/CF Comb. de araterístias CN/DM [155] [41] CN/KB DM/CF DM/CN DM/KB Casada Aumento de araterístias [14] Fab Libra KB/CF EntreeC GroupLens KB/CN KB/DM Meta-nivel Fab,[41], LaboUr 50

53 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 2.2 Sistemas de reomendaión omeriales Aquí vamos a revisar el funionamiento de varios sistemas de reomendaión que podemos enontrarnos en Internet. En primer lugar, revisaremos en profundidad Filmaffinity debido a que es uno de los sistemas de reomendaión más onoidos y que más éxito ha tenido. Y posteriormente, veremos más brevemente otros sistemas de reomendaión omeriales que podemos enontrarnos en Internet (Amazon.om, Drugstore.om,...). El objetivo de esta revisión es alarar o failitar el entendimiento de las ténias presentadas en este apítulo. Además, estos sistemas de reomendaión han aportado algunas ideas para nuestras propuestas y la implementaión que hemos realizado en el apítulo Filmaffinity Filmaffinity ( es una página web dediada al ine (ver figura 2.5) reada en 2002 por el rítio Pablo Kurt y el programador Daniel Niolás. Atualmente es una de las bases de datos más importantes en español y es uno de los sistemas de reomendaión olaborativos más importantes y utilizados en la atualidad. Permite obtener informaión sobre las pelíulas omo: su nombre, el diretor, atores, naionalidad, argumento... Pero quizás la ualidad más importante, y que ha supuesto su éxito en Internet, es que proporiona informaión sobre que puntuaiones han obtenido de los usuarios, sus rítias, y sobre todo, que es apaz de generar reomendaiones de otras pelíulas que le podrían gustar a un usuario en onreto. Filmaffinity implementa un sistema de reomendaión olaborativo. Este sistema de reomendaión busará usuarios on gustos similares a un usuario dado, lo que Filmaffinity denomina almas gemelas, y agregará las puntuaiones de estas almas gemelas para generar las reomendaiones para diho usuario. Filmaffinity utiliza esalas numérias para que los usuarios proporionen una evaluaión sobre las pelíulas. Los usuarios evaluarán las pelíulas, independientemente de su grado de onoimiento, de si son inéfilos o usuarios asuales, mediante una esala numérias del 1 al 10 donde 1 signifia Muy mala y 10 Exelente. Este sistema de reomendaión presenta los mismos inonvenientes de los sistemas de reomendaión olaborativos y que vimos en la seión Es muy difíil que reomiende un produto nuevo que tenga poas 51

54 Luis Gonzaga Pérez Cordón valoraiones, y los nuevos usuarios no reibirán buenas reomendaiones hasta que no hayan valorado un onjunto sufiiente de pelíulas. Figura 2.5: Filmaffinity. Página prinipal Para failitar esto último, Filmaffinity ofree a los usuarios Tours de votaiones de pelíulas (ver figura 2.6) donde podrán valorar un onjunto de pelíulas lasifiadas por años, géneros... De esta forma los nuevos usuarios fáilmente pueden proporionas las valoraiones neesarias para que Filmaffinity pueda empezar a generar reomendaiones. Otra de las opiones que ofree Filmaffinity es la búsqueda de Almas gemelas (ver figura 2.7), personas que oiniden en gran medida on nuestros gustos y opiniones en las pelíulas omunes. Con esta opión el usuario puede busar pelíulas que él no ha visto, pero que si han visto otras personas que tienen gustos similares a él. 52

55 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 2.6: Filmaffinity. Tour de pelíulas Figura 2.7: Filmaffinity. Almas gemelas 53

56 Luis Gonzaga Pérez Cordón Quizás, la opión más interesante y potente de Filmaffinity sea la generaión de reomendaiones para un usuario en partiular. A partir de las puntuaiones dadas por los otros usuarios, teniendo en uenta la afinidad de estos en las valoraiones de las pelíulas on el usuario dado, el sistema es apaz de generar un onjunto de reomendaiones (ver figura 2.8). Esta opión permite seleionar uantas reomendaiones quiero reibir, por defeto 20, el rango de años de las pelíulas reomendadas y el género de éstas. Figura 2.8: Filmaffinity. Reomendaiones La última opión que ofree Filmaffinity relaionada on el sistema de reomendaión es la posibilidad de alterar las puntuaiones proporionadas por el usuario (ver figura 2.9), bien porque éste se equivoara al introduirla o porque haya ambiado de opinión. Esta opión, de heho, lo que muestra es el perfil de usuario atual y que utiliza para enontrar otros usuarios similares a él. 54

57 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 2.9: Filmaffinity. Puntuaiones Otros A ontinuaión veremos brevemente otras páginas web omeriales que emplean sistemas de reomendaión para ofreer serviios personalizados a sus lientes. Amazon.om Amazon.om In., es una ompañia de omerio eletrónio on sede en Seattle, estado de Washington, y fue una de las primeras grandes ompañías en vender bienes a través de Internet. En la atualidad vende una gran variedad de produtos, desde libros hasta ropa, pasando por artíulos eletrónios, ds de músia, software, muebles, omida, et. Amazon se ha estableido en varios países omo Canadá, Reino Unido, Alemania, Austria, Frania, China y Japón para poder ofreer los produtos en estos países. Amazon fue fundada omo Cadabra.om por Jeff Bezos en 1994 y lanzada en Cadabra.om omenzó omo una librería online que tenía más de títulos que se podían omprar por orreo eletrónio. 55

58 Luis Gonzaga Pérez Cordón Tiempo después, su nombre fue ambiado a Amazon, por el río sudameriano del mismo nombre. Amazon implementa una gran variedad de sistemas de reomendaión, tanto lásios, omo híbridos. Por ejemplo, parte de las reomendaiones que generan pareen estar hehas por un sistema de reomendaión basado en ontenido, que utiliza las desripiones de los produtos valorados positivamente por el usuario para enontrar otros nuevos. Para valorar estos produtos usa una esala de 1 al 5 de estrellas donde el uno es la valoraión mas baja y signifia que no le ha gustado y el 5 la más alta. En esta seión nos entraremos úniamente en los serviios personalizados que ofree Amazon en la seión de Libros (ver figura 2.10), los uales están basados en sistemas de reomendaión: Figura 2.10: Página de valoraiones donde el liente puntúa los produtos más reientemente omprados. Clientes que ompraron (Customers Who Bought): omo otros muhos sistemas de reomendaión omeriales, Amazon.om ( estrutura la informaión en una página donde podemos enontrar informaión sobre un libro en onreto, dando detalles del texto o informaión de ompra. La araterístia Clientes que ompraron se en- 56

59 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio uentra en la página de informaión de ada libro del atálogo. De heho, muestra dos listas de reomendaión diferentes. Tus reomendaiones: Amazon también anima a que los lientes aporten sus opiniones sobre los libros que han leído. Los lientes valoran dihos libros usando una esala de 5 puntos que representa valoraiones desde lo odio hasta la valoraión máxima me enanta. Después de valorar una muestra de libros, los lientes pueden pedir reomendaiones de libros que le podrían gustar. Observador (eyes): esta araterístia permite que los lientes reiban notifiaiones por orreo eletrónio de nuevos produtos que han apareido en el atálogo de Amazon. Entregas de Amazon.om: es una variaión de la araterístia anterior. Los lientes seleionan una serie de géneros o ategorías de una lista de ellas (libros de oina, biografías,...) y periódiamente los editores de Amazon.om les envían sus últimas reomendaiones vía para los subsriptores de diha ategoría. Ideas para regalos de la librería: la araterístia Ideas para regalos permite a los lientes reibir reomendaiones de los editores. Los lientes seleionan una ategoría de libros de la que le gustaría reibir sugerenias. Mientras navega por esta seión de regalos, se puede ver una lista general de reomendaiones reada por los editores de Amazon.om. Esta araterístia es, en muhos aspetos, una versión on-line de la araterístia Entregas de Amazon.om expliada anteriormente. La prinipal diferenia es que aquí, los lientes reiben las reomendaiones anónimamente ya que, no tienen ninguna neesidad de registrase en Amazon omo si ourre en Entregas de Amazon.om. Comentarios de los lientes: esta araterístia permite a los lientes reibir reomendaiones basadas en las opiniones de otros lientes. Estos omentarios apareen en la página de informaión de los produtos on una valoraión de 1 a 5 estrellas y on omentarios esritos proporionados por otros lientes que han leído el libro en uestión y dado una rítia. Los lientes tienen la posibilidad de inorporar estas reomendaiones en sus deisiones de ompra. Además, los lientes pueden valorar estos omentarios. En ada omentario podemos enontrarnos la pregunta Te ha ayudado este omentario? en donde los lientes pueden deir si o no. Los resultados son tabulados y se informa de la utilidad de ese omentario diiendo 5 de ada 7 personas enontraron esta rítia útil. Círulos de ompras: el írulo de ompras permite a los lientes ver la lista de los 10 más destaados dada una región geográfia, ompa- 57

60 Luis Gonzaga Pérez Cordón ñía, instituión eduativa, gobierno u otra organizaión. Por ejemplo, un liente podría pedir ver que libros son los más vendidos para los lientes que trabajan en Orale, MIT, o los residentes de Nueva York. 58 CDNOW CDNOW es una de las primeras tiendas de omerio eletrónio en tener éxito. Fue fundada en febrero de 1994 por los hermanos gemelos Jason y Matthew Olim. Iniialmente fue lanzado omo un serviio Telnet en agosto de 1994, y en septiembre de 1994 se lanzó la página web de CDNOW. CDNOW fue una de las ompañías pioneras en el uso del marketing por Internet, ofreiendo a sus lientes entre otras osas reomendaiones, video on-line, marketing por orreo eletrónio... En la atualidad CDNOW es una tienda dediada a la venta de CDs por Internet y utiliza los sistemas de reomendaión para aumentar dihas ventas y lograr una mayor fidelidad de los lientes. Por ejemplo, al igual que ourría on Amazon, parte de las reomendaiones que generan pareen estar hehas por un sistema de reomendaión basado en ontenido, que utiliza las desripiones de los produtos valorados positivamente por el usuario para enontrar otros nuevos. Para valorar estos produtos usa una esala de 1 al 5 de estrellas donde el uno es la valoraión mas baja y signifia que no le ha gustado y el 5 la más alta. CDNOW ofree los siguientes serviios para proporionar reomendaiones a sus lientes: Consejero de álbumes: este onsejero de CDNOW trabaja de tres modos distintos. Los dos primeros son similares al Clientes que ompraron que vimos en Amazon.om. Los lientes van explorando y examinando distintos álbumes o artistas. El sistema al mismo tiempo, va reomendando diez álbumes distintos relaionados on el álbum o artista en uestión. Las reomendaiones se muestran on frases omo Los lientes que ompraron X también ompraron el onjunto S o Los lientes que ompran el produto reado por Y también ompraron el onjunto. El terer modo de trabajo es un onsejero de regalos. Los lientes esriben los nombres de hasta tres artistas y el sistema devuelve una lista de 10 álbumes que CDNOW onsidera similares a los artistas en uestión. Artistas relaionados: esta araterístia de CDNOW basa su funionamiento en la idea de que si a un liente le gusta un intérprete en onreto, existe un grupo de artistas on estilo similar que también le puede gustar. Los lientes loalizan a un artista y seleiona los enlaes de artistas relaionados. Al haerlo, se proporiona una lista de estos artistas que

61 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio son onsiderados artistas similares y una lista de artistas que perteneen a sus orígenes o influyen en el artista seleionado. Guías del omprador: la araterístia guía del omprador permite a los lientes reibir reomendaiones relaionadas on un tipo espeífio de músia. Los lientes navegan en una lista de géneros y seleionan uno de estos enlaes de esta lista llevando a los lientes a una nueva lista de álbumes que los editores onsideran una parte fundamental de este género El artista esoge: en esta opión se presentan reomendaiones proporionados por los artistas. Cada semana un artista diferente proporiona una lista de álbumes que representen sus gustos o que artistas está esuhando en la atualidad. Los 100 más importantes: tradiionalmente los produtos más vendidos o los más promoionados son los más utilizados para haer reomendaiones a sus lientes. Después de todo, si un álbum esta en los 10 más vendidos, entones debe de ser un álbum bueno. Esta araterístia permite a los lientes de CDNOW reibir este tipo de reomendaiones, estos 100 se obtienen de las ventas realizadas en el sitio web y teóriamente son atualizadas para reflejar las ventas atuales. Mi CDNOW: mi CDNOW permite a los lientes rear su propia tienda de músia, basándose en los álbumes y los artistas que le gustan. Los lientes indian qué álbumes poseen y qué artistas son sus favoritos. Las ompras desde CDNOW se añaden automátiamente en la lista álbumes que poseo y estas ompras, por defeto, se supone que le han gustado a los lientes. Posteriormente estos lientes pueden modifiar esa suposiión e indiar que produtos que posee le gustan y uales no. Cuando los lientes soliitan las reomendaiones, el sistema predie seis álbumes que al liente le podría gustar basándose en aquellos que ya posee. Se produe una retroalimentaión uando el liente proporiona informaión sobre si ya posee este produto, si quiere añadirlo a los produtos que desearía omprar o si por el ontrario ese produto no es de su agrado. En la figura 2.11 podemos ver un ejemplo de funionamiento de CDNOW. 59

62 Luis Gonzaga Pérez Cordón Figura 2.11: Página de CDNOW Drugstore.om Drugstore.om es una farmaia on-line uya sede entral está en Bellevue, Washington. Empezó a funionar el 24 de febrero de Está asoiada on otras ompañías omo la adena de tiendas Raid Store, y la General Nutrition Center (GNC). Para vender produtos de dihas adenas. Entre los produtos que podemos adquirir podemos enontrarnos desde remas de proteión solar, hasta remedios para la gripe o atarro pasando por produtos del uidado del abello, et. Dado el funionamiento del serviio Consejero que expliaremos a ontinuaión se intuye que trabaja on un sistema de reomendaión basado en utilidad. A ontinuaión presentaremos detalladamente este serviio y otros que ofree drugstore.om para ayudar a sus lientes mediante reomendaiones: Consejero: el onsejero en Drugstore.om permite a los lientes delarar sus referenias uando desean omprar un produto en algunas de las araterístias tales omo proteión solar o remedios ontra la gri- 60

63 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio pe y resfriados. Por ejemplo, en este último aso, los lientes indian los síntomas que desean aliviar (nariz que moquea o estornudos), la forma en que quieren que le proporionen dihos produtos y la edad del paiente al ual se le va a administrar el produto. Una vez se haya proporionado todos estos datos el onsejero devuelve una lista de produtos que umplen estas ondiiones. Test de pruebas: se le envía un produto a un grupo de voluntarios, obtenido de los lientes del sitio web, para que proporionen rítias del produto inluida una puntuaión basada en estrellas y omentarios (ver figura 2.12). Figura 2.12: Página de Drugstore ebay ebay In., es una ompañía de omerio eletrónio ameriana que gestiona el sitio web ebay.om, dediado a las subastas online y omerio, donde la gente y las ompañías ompran y venden bienes y serviios por todo el mundo mediante subastas o ompra direta. A parte del sitio web situado en Estados Unidos, ebay ha estableido otros sitios webs en otros treinta países. 61

64 Luis Gonzaga Pérez Cordón Figura 2.13: Página de ebay doonde se puede ver un perfil de observaiones El sitio web fue fundado en San José, California el 3 de septiembre de 1995 por Pierre Omidyar on el nombre de AutionWeb. La ompañía ambio ofiialmente de nombre en septiembre de 1997 pasando a onoerse omo ebay. En este aso, uno de los sistemas de reomendaión implementados en ebay, es uno basao en utilidad, omo puede omprobarse si se emplea la opión de Comprador personal que presentaremos posteriormente. A ontinuaión expliaremos, no sólo esta herramienta, sino otras que ofree esta empresa para ayudar a sus lientes: Perfil de observaiones: el perfil de observaiones es una de las araterístias de ebay.om que permite tanto a ompradores y a vendedores ontribuir en el perfil de observaiones de otros lientes on quien ha heho alguna transaión eonómia. Estas observaiones onsisten en una valoraión de satisfaión (satisfeho/neutral/desontento) y un omentario espeífio sobre este liente. Estas observaiones son utilizadas para proporionar un sistema de reomendaión a los ompradores, que serán apaes de ver los perfiles de los vendedores. Este perfil onsiste en 62

65 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio una tabla on el número de valoraiones en los últimos 7 días, mes pasado, seis meses además de un resumen global (ejemplo, 867 valoraiones positivas de 776 lientes distintos). Si el liente lo desea, puede navegar por las distintas valoraiones individualmente y onsultar los omentarios que se han puesto sobre el vendedor (ver figura 2.13). Comprador personal: el omprador personal permite a los lientes indiar en que produtos está interesado en su ompra. El liente introdue un plazo en el que se realizar diha búsqueda y se busa en base a un onjunto de términos, inluyendo informaión sobre los límites de preio que desea pagar. Cada ierto tiempo, on uno, dos o tres días de intervalo, el sitio web realiza las búsqueda del liente en todas las subastas y devuelve un orreo on los resultados de esta búsqueda. MovieFinder.om MovieFinder.om es un sitio web de pelíulas mantenido por E! Entertainment Television (ver figura 2.14) que permite obtener informaión sobre una pelíula, atores, atries, o por ejemplo, ver las últimas notiias relaionadas on el mundo del ine. Figura 2.14: Página de MovieFinder 63

66 Luis Gonzaga Pérez Cordón E! es una ompañía de televisión ameriana que opera tanto por able omo vía satélite. Esta ompañía fue reada por, entre otros, Larry Namer, Alan Mruvka, Brian Owens y Rik Portin el 31 de julio de 1987 y se denominó Movietime. En prinipio solo ofreía serviios de bajo oste omo la emisión de tráiler de pelíulas, notiias de atualidad, eventos y entrevistas. Tres años después, en junio de 1990, ambio su nombre a E! Entertainment Television. Aunque propiamente diho MovieFinder.om no tiene implementado ningún sistema de reomendaión, si tiene herramientas básias para produir reomendaiones o serviios personalizados a sus lientes. En este aso, la esala que utilizan los usuarios, los lientes y los editores, para valorar las pelíulas es una esala on letras (A-F). A partir de esta informaión MovieFinder.om ofree los siguientes serviios personalizados a sus lientes: Califiaión usuarios/nuestra alifiaión: tanto la alifiaión de los usuarios omo nuestra alifiaión se realizan utilizando una letra (A-F) que representa esta lasifiaión. Estas evaluaiones son agregadas y este valor agregado se muestra omo la alifiaión de los usuarios. Nuestra alifiaión es una alifiaión proporionada por los editores de E! Online. De esta forma, los lientes uando ven las araterístias de una pelíula, ven también la alifiaión que le han dado tanto los editores omo otros usuarios de ese sitio web. Los 10 mejor valorados: los 10 más importantes permiten a los lientes obtener reomendaiones de los editores en una ategoría seleionada por el usuario. Los lientes seleionan diha ategoría de una lista de ategorías previamente definidas y le devuelve las 10 pelíulas mejor valoradas por los editores de E! Online. Reel.om Reel.om (ver figura 2.15) es el sitio web de Reel Video, también onoido omo Reel the Store. Reel Video es una tienda de alquiler de pelíulas situado en Berkeley, California, desde Era la únia tienda físia real que estaba detrás del sitio web Reel.om, que fue fundada on la intenión de onvertir la tienda en una adena de tiendas naional. Reel.om fue adquirida por Hollywood Video en 1998 y la parte omerial de este sitio web fue lausurada en el Aunque la tienda real sigue alquilando pelíulas, atualmente Reel.om es otro sistema de reomendaión de pelíulas que me permite onsultar informaión relativa a pelíulas atuales, que están en artelera, lásias... 64

67 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 2.15: Página de Reel.om Reel.om también permite que sus usuarios reiban reomendaiones pero no ofree ninguna informaión sobre qué ténia de reomendaión está empleando. En prinipio puede ser una basada en onoimiento o una variante de uno basado en ontenido. Graias a este sistema de reomendaión Reel.om ofree el siguiente serviio a sus lientes: Combinaión de pelíulas: tiene un funionamiento muy similar al que vimos en Amazon.om en Clientes que ompraron y proporiona las reomendaiones en la misma página donde se muestra la informaión sobre ada pelíula. Estas reomendaiones onsisten en ombinaiones eranas o ombinaiones reativas. Cada onjunto ontiene una doena de enlaes a las páginas de informaión de ada una de estas pelíulas. Estos enlaes están desritos on una frase que india lo similar que esta pelíula a la pelíula original en uestión. Zagat.om Zagat Survey es una empresa ameriana fundada en 1979 por Tim y Nina Zagat que se dedia a la ediión de todo tipo de guías de restaurantes, hoteles, lubes o tiendas de distintas iudades de los Estados Unidos y Canadá. En zagat.om los usuarios registrados pueden votar distintos aspetos (hasta 30) del loal preferido y, además, introduir pequeños omentarios on su experienia. En base a estas votaiones los responsables de la empresa asignan su puntuaión en sus guías anuales y haen reomendaiones individuales a sus usuarios a través de su web. Estas reomendaiones son hehas por un sistema de reomendaión olaborativo. 65

68 Luis Gonzaga Pérez Cordón Zagat (ver figura 2.16) es la página web omerial que utiliza un sistema de reomendaión olaborativo, donde las valoraiones de los restaurantes son atualizadas onstantemente por los usuarios. Inluye muhas opiones de búsquedas avanzadas donde el usuario puede espeifiar sus riterios de búsqueda en ategorías tales omo omida, deoraión, oste, et., o restringir la búsqueda a ierta área o un tipo de oina onreta. Este sistema de reomendaión tiene el mismo objetivo que el desarrollado en esta memoria en la apítulo 6. Entre otras opiones inluye: Valoraiones y rítias de restaurantes: permite explorar los restaurantes de una iudad en onreto, de Estados Unidos o del mundo. Una vez seleionado la zona y el restaurante, podemos leer las rítias hehas por otros usuarios o ver qué valoraiones tienen en omida, deoraión, serviio y oste. Valoraiones y rítias de oio noturno: similar al anterior pero espeializado en sitios que se pueden visitar para el oio noturno. Valoraiones y rítias de hoteles: nos proporiona informaión detallada sobre un hotel determinado, junto on la puntuaión que ha reibido y rítias de otros usuarios. Valoraiones y rítias de atraiones: similar al anterior pero entrado en atraiones turístias. Figura 2.16: Página de Zagat 66

69 CAPÍTULO 3. Modelado de la informaión en proesos de reomendaión Como hemos visto en el apítulo anterior, los sistemas de reomendaión, utilizan informaión aera de sus usuarios para generar reomendaiones personalizadas. Diha informaión está relaionada on los gustos, neesidades y preferenias de los usuario. Esta informaión suele ser vaga o impreisa, ya que, la mayoría de las vees se están expresando, o bien aspetos ualitativos de los objetos que han omprado, utilizado o visto, o bien ualidades de los objetos que desean adquirir, ver o utilizar. Sin embargo, tal y omo hemos visto en el apítulo anterior, los sistemas de reomendaión obligan a los usuarios a expresar esta informaión mediante valoraiones numérias preisas. En la literatura se han afrontado situaiones similares a ésta y se han desarrollado ténias y modelos que permiten representar, o modelar, diha informaión desde otras perspetivas más adeuadas tales omo, el enfoque lingüístio difuso [218]. Este enfoque se ha utilizado on éxito sobre un gran número de problemas tales omo la toma de deisiones [23, 46, 60, 78, 125, 129, 158, 172, 193, 200, 212], seleión de materiales [38], administraión de personal [80], reuperaión de informaión [24], eonomía [8], diagnosis línia [44], gestión omerial [214], psiología [35, 42, 105], evaluaión 130, 131, 132, 138, 139], o planifiaión y seueniaión [1, 107]. A la hora de modelar las preferenias de los usuarios, además de elegir el dominio de la informaión, también hay que deidir la estrutura on la que se representará esa informaión. En el aso de los sistemas de reomendaión es habitual el uso de vetores de utilidad y de valoraiones numérias. El dominio numério fue el primer dominio utilizado por los sistemas de reomendaión, ya que es el dominio utilizado internamente por los sistemas de reomendaión lásios para generar las reomendaiones. Como hemos visto, este dominio no siempre es el más adeuado si tenemos en uenta que el usuario está expresando sus preferenias, valoraiones o perepiones subjetivas sobre produtos. Un usuario difíilmente puede expresar informaión preisa, pues lo habitual es que un usuario sólo tenga una idea más o menos lara sobre lo que quiere omprar. Por lo tanto, para estas situaiones, paree más aertado el uso de valoraiones lingüístias más eranas al modo en el que se expresan los 67

70 Luis Gonzaga Pérez Cordón usuarios y así modelar de forma más adeuada la inertidumbre y vaguedad de diha informaión. Dado que uno de nuestros objetivos es aumentar la alidad del modelado de la informaión reogida para aumentar la alidad de las reomendaiones, proponemos en esta memoria el uso de informaión lingüístia. En nuestras distintas propuestas propondremos el uso de distintas estruturas de representaión de informaión así omo, el uso de múltiples esalas lingüístias para ofreer una mayor flexibilidad de expresión a los usuarios y expertos involurados en el sistema de reomendaión. A ontinuaión, vamos a haer una revisión de los oneptos relaionados on el modelado de preferenias que vamos a usar en esta memoria. Primero veremos distintas estruturas de representaión de informaión que podemos utilizar en el sistema de reomendaión, para después revisar el onepto de dominios de expresión, entrándonos en el modelado lingüístio. En la literatura existen distintas propuestas para modelar la informaión lingüístia [118, 218]. En esta memoria, nosotros propondremos el uso del enfoque lingüístio difuso del que revisaremos los oneptos neesarios para entender nuestras propuestas, y terminaremos revisando un maro de trabajo para manejar múltiples esalas lingüístias que utilizaremos en algunas de nuestras propuestas Modelado de Preferenias El modelado de preferenias es una área de investigaión de gran importania en muhos ampos de apliaión y atividades tales omo, la toma de deisión [50, 172], onsenso [87] o los sistemas de reomendaión [134, 135]. Esta última área se ha entrado prinipalmente en mejorar y definir nuevos algoritmos de reomendaión y no en un estudio profundo del modelado adeuado de preferenias para estos asos. El modelado de preferenias es el enargado de estudiar la representaión más adeuada para representar las preferenias de los expertos en un problema dado. A la hora de deidir omo modelar la informaión debemos estudiar por un lado, la estrutura para representar la informaión, y por otro, el dominio en el que se expresarán las preferenias sobre los elementos del problema. En las siguientes seiones estudiaremos las alternativas más omúnmente utilizadas a la hora de modelar esta informaión entrando nuestro interés en las estruturas y dominios que utilizaremos en el resto de la memoria. 68

71 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Estruturas para la representaión de preferenias A la hora de modelar las preferenias, no sólo tenemos que tener en uenta qué dominio se va a utilizar para representar las valoraiones, sino también que estrutura esogeremos para representar esta informaión. La eleión de la estrutura juega un papel fundamental en los proesos de reomendaión. Hay estruturas de representaión de preferenias más fáiles o más ompletas de utilizar dependiendo del usuario, del problema a resolver y del tipo de informaión que deseamos representar [202]. En esta seión haemos un repaso de las estruturas de informaión más utilizadas en la literatura para representar las preferenias por parte de los expertos y/o usuarios involurados en un problema omo son [87, 94, 189]: n Vetores de Utilidad n Órdenes de Preferenia n Relaiones de Preferenia Vetores de Utilidad En esta estrutura almaenamos la utilidad, o la preferenia, de ada una de las alternativas del problema. Esta estrutura ha sido una de las más utilizadas en muhos problemas [49, 127, 189] al ser muy fáil de usar, entender y explotar, siendo la más omún en sistemas de reomendaión. Cada usuario tendrá asoiado un vetor de utilidad donde almaenará la valoraión de ada produto que onoza o haya omprado. En esta estrutura, aquellos elementos que tengan una valoraión mayor, serán los preferidos por el usuario. Ejemplo Sea E = {e 1,...,e m } (m m 2) un onjunto de usuarios y X = {x 1,x 2,...,x n } (n m 2) onjunto de produtos que se van a valorar. La preferenia dada por el usuario, e j, sobre el onjunto de elementos X se expresará de la siguiente forma utilizando vetores de utilidades: U j = {u j 1,..., u j n} donde u j i representa la utilidad o valoraión dada por el usuario j al produto i. Órdenes de preferenia En esta estrutura lo que representamos es el orden de preferenia de los elementos para un determinado problema [94, 184, 187]. Esta estrutu- 69

72 Luis Gonzaga Pérez Cordón ra, aunque es más fáil de utilizar que la anterior presenta el inonveniente que, no hay forma de onoer el grado on que un elemento es preferido sobre otro, sólo onoemos el orden de preferenia. Para un individuo, e j, un orden de preferenia se representará mediante un vetor ordenado dereiente del onjunto de elementos O j = {o j (1),...,o j (n)} de forma que uanto menor sea la posiión de una alternativa, más preferida es para diho individuo. En sistemas de reomendaión esta estrutura no es muy utilizada ya que, es bastante difíil de utilizar si el número de elementos es grande, lo que es muy habitual en sistemas de reomendaión. Además aporta menos informaión que los vetores de utilidad y que las relaiones de preferenia que veremos a ontinuaión. 70 Ejemplo Sea E = {e 1,...,e m } (m m 2) un onjunto de usuarios y X = {x 1, x 2,...,x n } (n = 4) onjunto de elementos o produtos que se van a valorar. Las preferenias dadas por los individuos 1 y 2 sobre el onjunto de elementos X utilizando órdenes de preferenia podrían ser las siguientes: O 1 = {x 3, x 2, x 1, x 4 } O 2 = {x 2, x 3, x 1, x 4 } En este ejemplo, el individuo 1 onsidera que el elemento que más prefiere es el elemento es x 3 y el menos preferido el x 4. Sin embargo, para el individuo 2 el más preferido es x 2 y el menos también es el x 4. Relaiones de Preferenia El terer tipo de estrutura que revisamos son las relaiones de preferenia. Este tipo de estruturas han sido muy utilizadas en problemas de toma de deisión [34, 56, 65, 79, 86, 103, 104, 144, 206] y se utilizan para representar relaiones binarias entre pares de elementos x l Rx k x l on x k X. Una relaión binaria mide la intensidad o el grado on que un elemento x l es preferido sobre otro elemento x k. La prinipal ventaja de este tipo de estrutura frente a las anteriores es que para las personas es más fáil expresar su preferenia sobre un par de elementos, que dar un vetor utilidad o un orden sobre todos los elementos en uestión. Además, la informaión aportada por una relaión de preferenia suele ser mayor y proporiona una mayor flexibilidad a la hora de expresar la informaión de preferenia [202], sin embargo, también pueden induir la apariión de inonsistenias. En ondiiones ideales, una persona no debería tener ningún problema en expresar sus preferenias sobre todos los pares de elementos de un onjunto de elementos. Además, estas preferenias deberían ser onsisten-

73 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio tes para que las soluiones obtenidas a partir de esta informaión fueran siempre satisfatorias. Bajo estas suposiiones se han hehos estudios para determinar que propiedades deben de umplir las relaiones de preferenias, de forma que se pueda garantizar que las soluiones obtenidas son satisfatorias. Independientemente del dominio en el que estén expresadas estas preferenias, se define la onsistenia en términos de transitividad. A ontinuaión vamos a estableer algunas propiedades de las relaiones de preferenia que nos ayudarán a estudiar su onsistenia. Enumeramos estas propiedades, tal y omo fueron definidas iniialmente, en dominios numérios definidos en el intervalo [0, 1] donde el valor 0.5 representa la indiferenia: 1. Condiión triangular [127]: p ij + p jk p ik Si interpretamos esta ondiión geométriamente debemos onsiderar las tres alternativas x i, x j, x k, omo los vérties de un triángulo on el tamaño de los lados p ij, p jk, p ik, y por lo tanto, la longitud orrespondiente a los vérties x i, x k no debería exeder la suma de las longitudes orrespondientes a los vérties x i, x j y x j, x k. 2. Transitividad débil [188]: p ij 0.5, p jk 0.5 p ik 0.5 La interpretaión de esta ondiión es la siguiente: si x i es preferido a x j y x j es preferido a x k, entones x i es preferida a x k. Este tipo de transitividad es la ondiión usual de transitividad que una persona lógia y onsistente debería utilizar si no quiere expresar opiniones inonsistentes, y por lo tanto es la ondiión requerida mínima que una relaión de preferenia debería umplir. 3. Transitividad max-min [51, 224]: p ik mín (p ij, p jk ) 6i, j, k En este aso, el valor de preferenia obtenido por la omparaión direta de dos alternativas debería ser igual o mayor que el mínimo de los valores obtenidos por la omparaión de esas dos alternativas on una intermedia. Este tipo de transtividad ha sido el requisito tradiional para araterizar la onsistenia en el aso de relaiones de preferenia numérias [0, 1] [224]. Sin embargo, a la hora de verdad, en situaiones prátias, nos podemos enontrar on relaiones de preferenia que podrían ser onsideradas omo perfetamente onsistentes y que no umplen esta transitividad. 4. Transitividad max-max [51, 224]: p ij máx (p ij, p jk ) 6i, j, k Este onepto representa la idea de que el valor de preferenia obtenido por una omparaión direta de dos alternativas debería ser 71

74 Luis Gonzaga Pérez Cordón igual o mayor que el máximo valor obtenido de omparar esas dos alternativas on una intermedia. Esta transitividad es más fuerte que la anterior, y por tanto las relaiones que no verifiaban la anterior tampoo verifian ésta. 5. Transitividad max-min restritiva [188]: p ij 0.5, p j k 0.5 p ik mín (p ij, p jk ) 6i, j, k Cuando una relaión de preferenia verifia esta ondiión entones una alternativa ualquiera x i es preferida a x j on un valor p ij y x j es preferido a x k on un valor p jk, entons x i debería ser preferido a x k on, al menos, una intensidad de preferenia p ik igual al mínimo de los valores anteriores. Esta transitividad es más fuerte que la transitividad débil pero es menos restritiva que la transtividad max-min. 6. Transitividad max-max restritiva [188]: p ij 0.5, p j k 0.5 p ik máx (p ij, p jk ) 6i, j, k Cuando una alternativa x i es preferida a x j on un valor p ij y x j es preferida a x k on un valor p jk, entones x i debería ser preferido a x k on al menos una intensidad de preferenia p ik igual al máximo de los valores anteriores. Este onepto es más restritivo que la transitividad max-min restritiva y más suave que la transitividad max-max. 7. Transitividad multipliativa [188]: ( p ji/p ij ) ( p kj/p jk ) = p ki/p ik 6i, j, k Tanino [188] introdujo este onepto de transitividad en el aso de que p ij > 0 6i,j e interpretando p ij/p ji omo un ratio de la intensidad de preferenia de x i a x j (x i es p ij/ p ji vees tan bueno omo x j ). La transitividad multipliativa inluye la transitividad max-max restritiva [187, 188] y puede ser reesrita omo p ij p jk p ki = p ik p kj p ji 6i,j,k para ser extendida a todo el onjunto de relaiones de preferenia numérias [0, 1]. 8. Transitividad aditiva [187, 188]: (p ij 0.5)+(p jk 0.5) = (p ik 0.5) 6i,j,k o equivalentemente p ij + p jk + p ki = 6i,j,k Este tipo de transitividad ha sido muy utilizada en los proeso de rellenado de relaiones de preferenia ya que proporiona un valor únio dada dos preferenias, y por lo tanto, su álulo y su utilizaión es senillo. Este tipo de transitividad es más fuerte que la definida on la transitividad max-max restritiva. Sin embargo, en muhas situaiones reales no podemos garantizar ni suponer que un usuario, e j, pueda o quiera proporionar todas las preferen- 72

75 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio ias sobre los pares de elementos, ni que no existan inonsistenias entre dihas preferenias. Además, esta representaión tiene otra desventaja debido a que la informaión que debe aportar el usuario, es mayor que on los vetores de utilidad o on los órdenes de preferenia. Con el primero, sólo tienen que aportar n valoraiones, en el segundo, ordenar n elementos, mientras que on esta representaión tiene que aportar n % n valoraiones. Este tipo de relaiones se representa mediante una matriz P ej X % X, donde el valor µ Pej (x l, x k ) = p l k j representa el grado de preferenia de la alternativa x l sobre la alternativa x k dada por e j [121, 189, 217], P ej = Q p 11 j p 1n j Æ Ø Æ p n1 j p nn j a Hay situaiones en los que no todos los valores de la matriz son onoidos. Puede ourrir que haya valores desonoidos por las siguientes razones [202]: n Desonoimiento: el usuario puede no onoer las preferenias entre alguno de los elementos. n Falta de tiempo: puede ser que al usuario no se le exija o no tenga el tiempo neesario para proporionar toda la informaión. n Inomparabilidad: esto ourre uando estamos omparando elementos totalmente distintos que no se pueden omparar (la preferenia de un ohe sobre un ratón, por ejemplo). En el apéndie C revisamos varios algoritmos que pueden reonstruir, en algunos asos, relaiones de preferenia inompletas y que serán útiles en el segundo modelo de reomendaión basado en onoimiento que presentamos en el apítulo 5. En sistemas de reomendaión esta representaión no ha sido utilizada debido a la difiultad de que un usuario proporione una relaión de preferenia ompleta sobre todos los produtos del sistema de reomendaión. Sin embargo, en el apítulo 5, proponemos la utilizaión de esta representaión apliada sobre un subonjunto reduido de elementos eranos a las neesidades del usuario para la generaión de un perfil de usuario que represente las neesidades de éste. 73

76 a Q Luis Gonzaga Pérez Cordón Ejemplo E = {e 1,..., e m } (m > 2) un onjunto de usuarios y X = {x 1, x 2,...,x n } (n = 4) onjunto de elementos que se van a valorar. Si el dominio en el que trabajamos es un dominio numério [0, 1] tal que:, signifia que hay indiferenia sobre la preferenia entre ambos elementos. n p l k i = 1 2 n p l k i m 1 2, signifia que el elemento x l es preferida sobre el x k. n p l k i = 1, signifia que el elemento x l es totalmente preferido sobre la x k. Las preferenias dadas por el individuo, e 1, sobre el onjunto de elementos X tendría el siguiente aspeto: P e1 = Q a Dominios de expresión de preferenias Una vez se haya estableido uál es la estrutura de representaión de preferenias más adeuada para el tipo de problema a resolver, se debe determinar qué dominio utilizarán los individuos para valorar los elementos. Si la eleión del dominio ha sido adeuada, los individuos se sentirán más seguros a la hora de expresar sus valoraiones y tendremos una mayor garantía de éxito [50]. Lo habitual es que todos los individuos expresen sus preferenias en un mismo domino de informaión, es deir en un ontexto homogéneo [3, 23, 36, 46, 55, 115, 123, 129, 161, 207]. Sin embargo, existen situaiones y problemas donde es onveniente que los individuos expresen sus preferenias utilizando distintos dominios de informaión o dominios on distintas esalas o granularidad, es deir, en un ontexto heterogéneo [45, 57, 83, 86, 196, 223]. En la literatura [45, 86, 223] enontramos que la informaión puede ser expresada en distintos dominios dependiendo de distintos fatores, siendo los siguientes dominios los más utilizados por los expertos y/o usuarios: 74 n Dominio Numério: es el dominio más utilizado en el modelado de preferenias debido prinipalmente a la failidad on la que se puede

77 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio manejar matemátiamente. En la literatura podemos enontrarnos on tres variantes a la hora de valorar informaión numériamente: l Numério Binario: en el ual los individuos sólo pueden utilizar dos valores para expresar sus alternativas, el 0 para representar una valoraión negativa de las alternativas y 1 para representar una valoraión positiva. l Numério normalizado en el intervalo [0, 1].: En este dominio se puede expresar una intensidad o grado de preferenia utilizando un valor numério perteneiente al intervalo [0, 1] [58, 86, 121]. La prinipal ventaja de esta representaión sobre la anterior es que ahora, al existir una mayor flexibilidad y una mayor expresividad, podemos obtener resultados más preisos. l Numério en un esala (a,, b): en sistemas de reomendaión, lo habitual es utilizar esalas numérias on un limite inferior y otro superior, y en donde solo se permiten utilizar valores enteros para expresar la preferenia. Por ejemplo, Filmaffinity almaena las preferenias de sus usuarios mediante un vetor de utilidad numério, donde ada elemento reibirá una valoraión entre entre 1 y 10; Amazon usa la misma representaión y dominio pero on una esala entre 1 y 5. En estas esalas el 1 representa la peor valoraión y el 5 o el 1 la mejor dependiendo de la esala. n Dominio Intervalar: este dominio se utiliza en situaiones donde no se puede dar un valor preiso, y se quiere de alguna forma, reoger la impreisión o vaguedad on la que una persona expresa sus valoraiones o preferenias [115, 191]. Este problema ha heho que se neesiten definir nuevos modelados de preferenia más flexibles y apaes de reoger esta inertidumbre, siendo el modelado intervalar uno de ellos. En este dominio, las preferenias se expresan por medio de intervalos [a, ā] (a [ ā). De esta forma las personas no se ven forzadas a dar una valoraión exata, sino el intervalo en donde se enuentra diha preferenia. En los sistemas de reomendaión este dominio no ha sido utilizado y además presenta un inonveniente adiional. Los usuarios deben aportar dos valores, el límite superior y el límite inferior de la relaión. Por lo tanto, deben esforzarse más y dediar más tiempo por ada valoraión. Esto no suele ser aonsejable en este tipo de problemas, ya que, puede haer que los usuarios desistan de sus búsquedas. 75

78 Luis Gonzaga Pérez Cordón n Dominio Lingüístio: aunque, el enfoque lingüístio es menos preiso que el numério, proporiona algunas ventajas tales omo que las valoraiones lingüístias, uando estamos valorando aspetos ualitativos, se entienden mejor que las numérias además de disminuir los efetos de ruido, debido a que, uanto más refinada es una valoraión, más sensible es al ruido y por lo tanto mayores errores onllevan. Además de ser el dominio utilizado habitualmente en el razonamiento humano. En esta memoria, prestaremos una mayor atenión al dominio lingüístio, ya que, es en el que se han entrado la mayor parte de nuestras propuestas de modelos de reomendaión a la hora de modelar la informaión proporionada por los usuarios de un sistema de reomendaión. Esta deisión se debe a que onsideramos que en este dominio, los usuarios (expertos o lientes), se sienten más ómodos utilizando términos lingüístios para valorar aspetos relaionados on las perepiones subjetivas de naturaleza ualitativa. Las uales, en el mundo real, se expresan de forma habitual utilizando palabras del lenguaje natural en lugar de números. En este apítulo revisaremos la aproximaión que utilizaremos en nuestra memoria para modelar este tipo de situaiones, el enfoque lingüístio difuso [218]. Este enfoque ha sido utilizado on éxito, por ejemplo, en problemas de seueniaión [1], toma de deisión en polítia [6], teoría de la deisión [21, 46, 61, 133, 206], onsenso [90, 91, 140], reuperaión de informaión [24, 89], diagnosis línia [44] o en la evaluaión de produtos o serviios [62, 77, 122, 132, 136, 138, 137]. El uso de informaión lingüístia implia proesos de omputaión on palabras, por lo que en primer lugar revisaremos los oneptos básios del enfoque lingüístio difuso y sus modelos lásios de omputaión on palabras. Posteriormente, revisaremos una extensión del enfoque lingüístio difuso basado en la 2-tupla lingüístia y su modelo omputaional, debido a las ventajas que presentan frente a modelos omputaionales lásios [82]. Por lo que será el modelo omputaional que utilizaremos en nuestras propuestas de esta memoria. Finalmente, también revisaremos un maro de representaión y un modelo omputaional para tratar on múltiples esalas lingüístias, ya que, algunas de nuestras propuestas están definidas en este tipo de ontextos Enfoque lingüístio difuso Los problemas que nos enontramos en el mundo real presentan aspetos que pueden ser de distinta naturaleza. Cuando dihos aspetos 76

79 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio o fenómenos son de naturaleza uantitativa, éstos se valoran fáilmente utilizando valores numérios. Sin embargo, uando se trabaja on informaión vaga e impreisa o uando la naturaleza de tales aspetos no es uantitativa sino ualitativa, no es senillo ni adeuado utilizar un modelado numério, aonsejándose el uso de un modelado lingüístio. Los aspetos ualitativos apareen freuentemente en problemas en los que se pretende evaluar fenómenos relaionados on perepiones y relaiones de los seres humanos (diseño, gustos,...). En estos asos se suelen utilizar palabras del lenguaje natural (bonito, feo, dule, salda, simpátio,...) en lugar de valores numérios para emitir tales valoraiones. Tal y omo se india en [221], el uso de un modelado lingüístio de preferenias puede deberse a varias razones: 1. La informaión disponible on la que trabajan los expertos es demasiado vaga o impreisa para ser valorada utilizando valores numérios preisos. 2. La informaión puede no ser uantifiable debido a su naturaleza y sólo puede ser desrita mediante términos lingüístios (ej., al evaluar el onfort o el diseño de un ohe [122]). 3. Puede ser que la naturaleza de lo que estemos midiendo permita la utilizaión de valores numérios, pero en la prátia esto no sea posible, bien porque no existan los instrumentos neesarios para llevar a abo estas mediiones, o bien porque el oste de estas mediión sea demasiado elevado. En este aso el uso de un valor aproximado, es deir, una etiqueta lingüístia, puede ser adeuado. El Enfoque Lingüístio Difuso ha demostrado ser una ténia adeuada para modelar este tipo de informaión [1, 6, 21, 24, 44, 46, 76, 197, 206, 212] debido a que proporiona un método direto para representar la informaión lingüístia mediante variables lingüístias, que se diferenian de las numérias en que sus valores son palabras o frases en un lenguaje natural en lugar de números [218]. Una variable lingüístia, en el enfoque lingüístio difuso, se arateriza por un valor sintátio o etiqueta y por un valor semántio o signifiado. La etiqueta es una palabra o frase perteneiente a un onjunto de términos lingüístios y el signifiado de diha etiqueta viene dado por un onjunto difuso en un universo del disurso. Esta forma de representar la informaión permite modelar la inertidumbre de la informaión. Formalmente una variable lingüístia se define omo \[218]: Definiión 3.1. Una variable lingüístia está araterizada por una quíntupla (H, T (H), U, G, M), en la que: 77

80 Luis Gonzaga Pérez Cordón n H es el nombre de la variable} n T (H) es el onjunto de valores lingüístios o etiquetas lingüístias. n U es el universo de disurso de la variable. n G es una regla sintátia (que normalmente toma forma de gramátia) para generar los valores de T (H). n M es una regla semántia que asoia a ada elemento de T (H) su signifiado. Para ada valor L T (H), M (L) será un subonjunto difuso de U. Para definir el onjunto de valores lingüístios que tomará una variable lingüístia desde punto del vista del Enfoque Lingüístio Difuso, es neesario llevar a abo dos operaiones fundamentales: 1. Eleión de un onjunto de términos lingüístios adeuado, T (H). 2. Definiión de la semántia asoiada a ada término lingüístio Eleión del onjunto de términos lingüístios Para que una fuente de informaión (un experto, un usuario, un onsultor,...) pueda expresar on failidad sus opiniones y/o sus onoimientos es neesario que disponga de un onjunto adeuado de desriptores lingüístios. Uno de los aspetos más relevantes a la hora de definir o seleionar un onjunto de desriptores lingüístios, es el número de etiquetas lingüístias disponible para expresar esta informaión, o lo que lo mismo, la granularidad de la inertidumbre de diho onjunto de etiquetas [22]. Se die que un onjunto de términos lingüístios tiene: n Una granularidad baja, o un tamaño de grano grueso, uando la ardinalidad del onjunto de etiquetas lingüístias es pequeña. Esto signifia que el dominio está poo partiionado y que existen poos niveles de distinión de la inertidumbre, pudiéndose produir una pérdida de expresividad, y por lo tanto de informaión, si no es posible enontrar ninguna etiqueta que represente on preisión la opinión o la valoraión de la fuente de informaión. n Una granularidad alta, o un tamaño de grano fino, se produe uando la ardinalidad del onjunto de etiquetas lingüístias es alta. Esta situaión puede provoar un exeso de omplejidad en la desripión del dominio, de forma, que las fuentes de informaión no sean apaes de disernir uál, de un onjunto posible de etiquetas, representa mejor su opinión o valoraión. 78

81 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Por lo tanto, podemos afirmar que la ardinalidad de un onjunto de términos lingüístios no debe de ser demasiado pequeña omo para imponer una restriión en la preisión de la informaión que se quiere expresar, pero debe ser lo sufiientemente grande, omo para permitir haer una disriminaión adeuada de las valoraiones en un número limitado de grados. Normalmente, se prefiere utilizar ardinalidad impar, 7 ó 9, donde el término medio representa una valoraión aproximada de 0.5 y el resto de términos se distribuyen alrededor de él [22]. Estos valores lásios de ardinalidad están diretamente relaionados on el estudio realizado por Miller [142] sobre la apaidad humana, en el que se india que se pueden manejar razonablemente y reordar alrededor de siete o nueve términos diferentes. Una vez estableida la ardinalidad, se neesita un meanismo para generar los términos lingüístios. Existen dos enfoques difereniados para esta tarea, uno los define a partir de una gramátia libre de ontexto, y el otro mediante un orden total definido sobre el onjunto de términos. A ontinuaión revisaremos brevemente ambos meanismos: 1. El enfoque basado en una gramátia libre de ontexto: una posibilidad para generar el onjunto de términos lingüístios onsiste en utilizar una gramátia libre de ontexto G, donde el onjunto de términos pertenee al lenguaje generado por G [21, 24, 220]. Una gramátia generadora, G, es una 4-tupla (V N, V T, I, P) donde V N es el onjunto de símbolos no terminales, V T el onjunto de símbolos terminales, I el símbolo iniial y P el onjunto de reglas de produión. La eleión de estos uatro elementos determinará la ardinalidad y forma del onjunto de términos lingüístios. El lenguaje generado por esta gramátia deberá ser lo sufiientemente grande omo para que pueda desribir ualquier posible situaión del problema, pero no infinito o muy grande pues difiultaría su omprensión y utilizaión. 2. El enfoque basado en términos primarios on una estrutura ordenada. Una alternativa para reduir la omplejidad de definir una gramátia onsiste en dar diretamente un onjunto de términos distribuidos sobre una esala on un orden total definido [23, 78, 211, 212]. Por ejemplo, onsideremos el siguiente onjunto de siete etiquetas: s 0 = N = Nada T (H) = {N, MB, B, M,A, MA, P} s 1 = MB = Muy bajo s 2 = B = Bajo s 3 = M = Medio s 4 = A = Alto s 5 = MA = Muy alto s 6 = P = Perfeto 79

82 Luis Gonzaga Pérez Cordón donde s i < s j si y sólo si i < j. Normalmente en estos asos es neesario que los términos lingüístios satisfagan las siguientes ondiiones adiionales: a) Que exista un operador de negaión. Por ejemplo, Neg (s i ) = s j, j = g i (g + 1 es la ardinalidad de T (H)) b) Tiene que haber un operador de maximizaión: máx (s i, s j ) = s i si s i m s j. ) Y un operador de minimizaión: mín (s i, s j ) = s i si s i [ s j Semántia del onjunto de términos lingüístios} En la literatura existen varias alternativas para definir la semántia del onjunto de etiquetas lingüístias [23, 195, 196, 218], siendo la alternativa más omún el uso de funiones de pertenenia [22, 24, 46, 120, 193]. De esta forma, para definir la semántia del onjunto de términos lingüístios, se utilizan números difusos en el intervalo [0, 1], donde ada número difuso está definido por una funión de pertenenia. En el apéndie A, haemos una pequeña revisión de los oneptos básios de la Teoría de Conjuntos Difusos que utilizaremos en esta seión. Para mayor detalle, véase [108]. Un método efiiente, desde un punto de vista omputaional, para araterizar un número difuso es el uso de una representaión basada en parámetros de la funión de pertenenia [21]. Algunos autores onsideran que las funiones de pertenenia trapezoidales son lo sufiientemente buenas omo para modelar la impreisión de la informaión que se desea representar [21, 22, 46, 193, 194]. Esta representaión paramétria se expresa usando una 4-tupla (a, b, d, ) que se muestra en la figura 3.1. Los parámetros b y d indian el intervalo en el que la funión de pertenenia vale 1; mientras que a y indian los extremos izquierdo y dereho de la funión de pertenenia [21]. Figura 3.1: Funión trapezoidal 80

83 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio En la figura 3.2 se muestra la semántia de una variable lingüístia que evalúa la altura de una persona utilizando números difusos definidos por funiones de pertenenia trapezoidales: Figura 3.2: Funión altura T (Altura) = {Muy bajo, Bajo, Mediano, Alto, Muy alto} Muy bajo = (0, 0, 0.6, 0.62) Bajo = (0.6, 0.62, 0.67, 0.7) Mediano = (0.67, 0.7, 0.8, 0.82) Alto = (0.8, 0.82, 0.92, 0.95) Muy Alto = (0.92, 0.95, 1,1) Un aso partiular de este tipo de representaión son las funiones de pertenenia triangulares, en las que b = d. Se representan mediante una 3-tupla (a, b, ), donde b es el valor donde la funión de pertenenia vale 1, mientras que a y indian los extremos izquierdo y dereho de la funión. La figura 3.3 muestra el mismo onjunto visto anteriormente, pero representado ahora on funiones de pertenenia triangulares. Figura 3.3: Funión altura on funión de pertenenia triangular 81

84 Luis Gonzaga Pérez Cordón Otros autores prefieren utilizar otro tipo de funiones omo por ejemplo las Gaussianas [24]. 3.3 Modelos de omputaión on palabras El uso de informaión lingüístia implia proesos de omputaión on palabras tales omo la fusión, agregaión y omparaión de valoraiones lingüístias. Para realizar estos álulos el enfoque lingüístio difuso ha utilizado difentes modelos de omputaión: n El modelo omputaional lingüístio basado en el prinipio de extensión: uando la semántia de las etiquetas está definida mediante onjuntos difusos se puede utilizar el prinipio de extensión [218] para operar sobre dihos onjuntos. Este prinipio nos permite operar on términos lingüístios a través de álulos sobre sus funiones de pertenenia asoiadas. El prinipal inonveniente de este modelo de omputaión es, que el uso de la aritmétia difusa desarrollada a partir del prinipio de extensión, puede inrementar la impreisión de los resultados ya que estos resultados vienen dados por números difusos que no tienen porque oinidir on ningún número difuso de los utilizados para definir la semántia de las etiquetas lingüístias iniiales. En estos asos, se lleva a abo un proeso de aproximaión lingüístia [22, 44] que identifia el número difuso obtenido en las operaiones on el número difuso más erando asoiado a una etiqueta iniial. n El modelo simbólio [46, 212]: este modelo realiza álulos diretamente en las etiquetas usando el orden de dihas etiquetas en el onjunto de términos lingüístios. El resultado de dihas operaiones estará en un dominio ontinuo (intervalo de valores de R), por lo que estos puede que no oinidan on ningún valor asoiado al orden que oupa una etiqueta. En tal aso, hay que haer una aproximaión del resultado al valor disreto más erano que represente una etiqueta. Los modelos omputaionales anteriores se explian on mayor detalle a ontinuaión y se verá omo presentan una serie de problemas a la hora de la preisión y la interpretabilidad. Para mejorar estos problemas se presentó un nuevo modelo de representaión de informaión basado en la 2-tupla lingüístia en [81] y posteriormente en [203]. Este modelo de reprentaión define un modelo omputaional que permite operar on estos valores obteniendo a su vez valores perteneientes al mismo dominio. Este modelo será el utilizado a lo largo de la memoria para operar on la 82

85 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio informaión lingüístia manejada por los modelos de reomendaión aquí presentados. A ontinuaión revisaremos los modelos omputaionales que aabamos de nombrar Modelo omputaional lingüístio basado en el prinipio de extensión El prinipio de extensión fue introduido para generalizar las operaiones matemátias definidas sobre datos preisos (risp) a los onjuntos difusos. El uso de la aritmétia basada en el prinipio de extensión [51] inrementa la inertidumbre o vaguedad de los resultados. Los resultados obtenidos mediante la aritmétia difusa son números difusos, que habitualmente no oiniden on ningún término lingüístio del onjunto de términos iniial. Esto hae que sea neesario un proeso de aproximaión para expresar los resultados en el dominio de expresión original. En la literatura podemos enontrar diferentes operadores de aproximaión lingüístia [22, 44]. Figura 3.4: Agregaión basado en el prinipio de extensión ENTRADA SALIDA Variables Ling. valoradas en S Agregaion basada en el Prinipio de Ext. Resultados Intermedios: Números difusos Aproximaión Linguístia Resultado Final: Valor Ling. valorado en S Un operador de agregaión lingüístio basado en el prinipio de Extensión atúa de auerdo a la siguiente expresión (ver figura 3.4): S n F F (R) app 1 ( ) S donde S n simboliza el produto artesiano n de S, F es un operador de agregaión basado en el Prinipio de Extensión, F (R) el onjunto de onjuntos difusos sobre el onjunto de números reales R, app1 : F (R) S es una funión de aproximaión lingüístia que devuelve una etiqueta del onjunto lingüístio S uyo semántia sea la más erana al número difuso obtenido de la agregaión, y S es el onjunto de términos iniial. 83

86 Luis Gonzaga Pérez Cordón Figura 3.5: Aproximaión lingüístia basada en el prinipio de extensión Termino mas erano segun app_1 N MB B y2 M A MA P N MB B y 2 M A MA P Por ejemplo, en la figura 3.5 a la izquierda, podemos ver que el resultado de una agregaión, y 2, usando el prinipio de extensión. Este resultado no oinide on ninguna de las etiquetas lingüístias del onjunto de etiquetas iniial. Por lo tanto, si queremos que el resultado perteneza a este onjunto de etiquetas, deberemos aproximarlo a la más erana. En este aso, si nos fijamos en la figura de la dereha veremos que la más erana es la etiqueta M. Como podemos ver e intuir, al haer esta aproximaión se pierde informaión Modelo simbólio Un segundo enfoque para operar on informaión lingüístia es el modelo omputaional simbólio [47] que realiza los álulos utilizando los índies de las etiquetas lingüístias. Para realizar estos álulos se asume que las etiquetas que forman el onjunto de términos lingüístios, S = {s 0,..., s g }, tienen una estrutura ordenada, s i < s j si y sólo si i < j. Los resultados intermedios son también numérios, α [0, g], el ual debe ser aproximado a una etiqueta lingüístia por medio de una funión de aproximaión app 2 : [0, g] {0,..., g}. Esta funión obtiene un valor numério, de tal forma que represente el índie asoiado on el termino lingüístio más erano, S app 2(α) S. Formalmente, se puede expresar de la siguiente forma (ver figura 3.6): S n C app 2 ( ) [0,g] {0,...,g} S donde C es un operador de agregaión lingüístio simbólio y app 2 (.) es una funión de aproximaión utilizada para obtener un índie {0,..., g} asoiado a un termino de S = {s 0,..., s g } a partir de un valor en [0, g]. El uso de esta funión de aproximaión onlleva pérdida de informaión en los resultados ya que, el valor obtenido es aproximado al índie más erano. 84

87 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 3.6: Agregaión on el modelo simbólio ENTRADA Variables Ling. valoradas en S Agregaión Simbólia Aproximaión Simbólia Resultados Intermedios β[0,g] Aproximaión al índie: app (β) {0,...,g} 2 SALIDA Resultado Final: S s app 2 ( β ) Modelo omputaional de las 2-tuplas El modelo de representaión lingüístio basado en 2-tuplas fue presentado en [81] para mejorar los problemas de pérdida de informaión en los proesos de omputaión on palabras que se presentaban en los modelos omputaionales basados en el prinipio de extensión [44] y el modelo simbólio [46] tal y omo hemos visto en las seiones anteriores. Además este modelo se ha demostrado útil uando trabaja en ontextos de informaión no homogéneos [83, 85, 86] omo algunos de los que abordaremos en esta memoria. Una Representaión Lingüístia on 2-tuplas Para entender el modelo omputaional basado en 2-tuplas primero revisaremos el modelo de representaión de informaión lingüístia basado en 2-tupla. Este modelo se basa en el onepto de translaión simbólia. 85

88 Luis Gonzaga Pérez Cordón Definiión 3.2. Sea S = {s 0,..., s g } un onjunto de términos lingüístios, y b [0, g] un valor en el intervalo de granularidad de S. La Translaión Simbólia (ver figura 3.7) de un término lingüístio s i es un número valorado en el intervalo [ 0.5, 0.5) que expresa la diferenia de informaión entre una antidad de informaión expresada por el valor b [0, g] obtenido en una operaión simbólia y el valor entero más próximo, i { 0,..., g }, que india el índie de la etiqueta lingüístia (s i ) más erana en S. Figura 3.7: Etiqueta lingüístia 2-tupla S 0 S 1 S S 3 S 4 S 5 S (S, - 0.2) 3 A partir de este onepto el modelo de representaión de la informaión lingüístia modela diha informaión mediante un par de valores o 2-tupla, (s i, a i ) donde: 1. s i S representa una etiqueta lingüístia 2. a i [ 0.5, 0.5) es un número que expresa el valor de distania desde el resultado original b al índie de etiqueta lingüístia más erana (s i ) en el onjunto de términos lingüístios S, es deir, su translaión simbólia. A ontinuaión se define un onjunto de funiones básias que permitiránonvertir un número definido en el intervalo [0, g] en su equivalente en 2-tuplas y vieversa. Definiión 3.3. Sea S = {s 0,..., s g } un onjunto de términos lingüístios y b [0, g] un valor que representa el resultado de una operaión simbólia, entones la 2-tupla lingüístia que expresa la informaión equivalente a b se obtiene usando la siguiente funión: D : [0,g] S % [-0.5, 0.5) D (b) = (s i,a), on * s i, i = round (b) a = b i a [ 0.5,0.5) 86

89 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio donde round es el operador usual de redondeo, s i es la etiqueta on índie más erano a b y a es el valor de la translaión simbólia. Proposiión 1. Sea S = {s 0,..., s g } un onjunto de términos lingüístios y (s i, a) una 2-tupla lingüístia. Existe la funión D -1, tal que, dada una 2-tupla (s i, a) esta funión devuelve su valor numério equivalente b [0, g]. Demostraión. Es trivial si onsideramos la siguiente funión. D 1 : S % [-0.5, 0.5) [0, g] D 1 ((s i, a)) = i + a = b Comentario 1: A partir de las definiiones 1 y 2 y de la proposiión 1, la onversión de un término lingüístio en una 2-tupla onsiste en añadir el valor ero omo translaión simbólia: s i S ( s i, 0 ) Modelo omputaional lingüístia para la representaión on 2-tuplas Este modelo de representaión tiene un modelo omputaional asoiado presentado en [81] que permite: 1. Comparaión de 2-tuplas 2. Agregaión de 2-tuplas 3. Operador de Negaión de una 2-tupla A ontinuaión estudiaremos ada una de estas operaiones Comparaión de 2-tuplas La omparaión de informaión representada on 2-tuplas se realiza de auerdo a un orden lexiográfio lásio. Sea (s k, a 1 ) y (s l, a 2 ) dos 2-tuplas que representan dos valoraiones: n Si k < l entones (s k, a 1 ) es más pequeño que (s l, a 2 ) n Si k = l entones: 1. Si a 1 = a 2 entones (s k, a 1 ) y (s l, a 2 ) representan el mismo valor 2. Si a 1 < a 2 entones (s k, a 1 ) es más pequeño que (s l, a 2 ) 3. Si a 1 > a 2 entones (s k, a 1 ) es mayor que (s l, a 2 ) 87

90 Luis Gonzaga Pérez Cordón Ejemplos: (s 4, 0.3) < (s 5, -0.3) (s 4, 0.3) > (s 4, -0.2) (s 1, 0.2) = (s 1, 0.2) Agregaión de 2-tuplas La agregaión de 2-tuplas lingüístias permite obtener un valor resumen de un onjunto de valores. El resultado de esta operaión será una 2-tupla lingüístia. En [81] podemos enontrar varios operadores de agregaión basados en los operadores de agregaión lásios, entre los uales podemos destaar: 1. Media aritmétia: este operador simboliza el onepto intuitivo de punto de equilibrio o entro del onjunto de valores. Definiión 3.4. [81] Sea x = {(s 1, a 1 ),..., (s m, a m )} un onjunto de 2-tuplas, su media aritmétia se alularía on el operador media aritmétia extendida, x e, que es definido omo, m m x e ((s 1, a 1,..., (s m, a m )) = D 1 m i=1 1 (s i, a i ) = D 1 m i=1 b i 2. Media ponderada: la media ponderada permite que diferentes valores x i tenga diferente importania en la agregaión. Esto se realiza asignando a ada valor x i un peso asoiado w i, que india uál es la importania de ese valor. Definiión 3.5. [81] Sea x = {(s 1, a 1 ),..., (s m, a m )} un onjunto de 2-tuplas y W = (w!,..., w m ) un vetor numério on los pesos asoiados a ada 2-tupla. La media ponderada extendida se define omo: x e = D m i=1 D 1 (s i, a i ) w i m i=1 w i = D m i=1 b iw i m i=1 w i 3. Operador OWA (Ordered Weighted Aggregation): este operador introduido por Yager en [210] es un operador de agregaión ponderado, en el uál, los pesos no están asoiados a un valor predeterminado sino que están asoiados a una posiión determinada. Definiión 3.6. [81] Sea un x = {(s 1, a 1 ),..., (s m, a m )} un onjunto de 2-tuplas y W = (w!,..., w m ) un vetor de pesos asoiados que sa- 88

91 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio tisfae que (i) w i [0, 1] y (ii) / w i = 1. El operador OWA extendido F e para ombinar 2-tuplas atúa omo: F e ((s 1, a 1 ),..., (s m, a m )) = D m j =1 w j b j siendo b j el j-ésimo mayor valor de los D -1 ((s i, a i )) 4. Operador IOWA (Indued OWA operator): este operador fue propuesto por Yager en [210] y es utilizado para agregar tuplas de la forma (v i, a i ). El valor v i es onoido omo valor de induión y a i es el valor pasado omo argumento. El objetivo del operador IOWA es realizar una agregaión similar al que se realiza mediante el operador OWA, pero ordenando los valores, no por su propio valor, sino por el valor de induión que tiene asoiado ada valor. Este operador extendido a las 2-tuplas se define de la siguiente forma: Definiión 3.7. Sea un x = {((s 1, a 1 ), a 1 ),..., ((s m, a m )), a m )} un onjunto de 2-tuplas on sus valores de induión, los uales pueden estar expresados en ualquier dominio en donde podamos estableer un orden, y W = (w!,..., w m ) un vetor de pesos asoiados que satisfae que (i) w i [0, 1] y (ii) /w i = 1. El operador IOWA extendido F e w para ombinar 2-tuplas atúa omo: F e w (((s 1, a 1 ), a 1 ),..., ((s m, a m ), a m )) = D m j =1 w j b j siendo b j la j-ésima 2-tupla obtenida de ordenar el vetor x en funión de las variables de induión. Operador de negaión de una 2-tupla: El operador de negaión de una 2-tupla se define omo: Neg (s i, a) = D (g - D -1 (s i, a)) donde g + 1 es la ardinalidad de S, si e S = {s 0,..., s g } 3.4. Informaión lingüístia multigranular Como vimos anteriormente, un aspeto fundamental del modelado lingüístio de la informaión es la granularidad de la inertidumbre, o lo que es lo mismo, el número de etiquetas que utilizamos en la definiión 89

92 Luis Gonzaga Pérez Cordón del onjunto de términos lingüístios. Cuando nos enontramos en un problema en donde una o varias variables lingüístias puede tomar valores de distintos onjuntos de etiquetas on distinta granularidad, deimos que estamos trabajando en un ontexto on informaión lingüístia multigranular [76, 97]. En esta memoria presentaremos dos modelos de sistemas de reomendaión, uno en el apítulo 4 y en el apítulo 5 que trabajan en ontextos multigranulares lingüístios. Por lo que en esta seión vamos a revisar los oneptos, operadores y herramientas neesarios para manejar este tipo de informaión en nuestras propuestas. En estos modelos, la multigranularidad puede deberse a dos ausas. Por un lado, al grado distinto de onoimiento que tienen los usuarios del sistema a la hora de evaluar los aspetos de los produtos: (i) tenemos los expertos, que desribirán los produtos on unas etiquetas on mayor granularidad ya que su grado de onoimiento es mayor, y (ii) tenemos usuarios, que se presupone que tendrán un grado de onoimiento menor y por lo tanto deberán utilizar onjuntos de etiquetas on menor granularidad. Por otro lado, también hay que tener en uenta que los aspetos evaluados pueden tener una naturaleza distinta o ser adquiridos de forma distinta (mediante la vista, el tato,...) y por lo tanto la granularidad entre distintos aspetos de un elemento también debería de ser la adeuada para ada situaión. En la figura 3.8 podemos ver varios ejemplos de un onjunto de etiquetas S A, S B y S C que definen un ontexto multigranular para evaluar un elemento dado. Figura 3.8: Contexto multigranular S A S B S C

93 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio No es posible operar diretamente sobre variables lingüístias valoradas en ontextos multigranulares. Además hay que añadir que en estas situaiones no existen definidos proesos de normalizaión estándar para operar on este tipo de informaión ni operadores de agregaión para la misma. Para soluionar estos problemas utilizaremos un proeso de unifiaión propuesto en [86], basado en el modelo de representaión lingüístio on 2-tuplas, que se desarrolla de auerdo al esquema que podemos ver en la figura 3.9. Figura 3.9: Esquema de proeso de agregaión de informaión lingüístia multigranular Informaión Lingüístia multigranular Seleión del CBTL (Conjunto Básio de Términos Lingüístios) Haer uniforme Conjuntos difusos en el CBTL Conversión a 2 tuplas 2-tuplas en CBTL Agregaión Resultado de la agregaión: 2-tuplas en ST 91

94 Luis Gonzaga Pérez Cordón Para llevar a abo el proeso de unifiaión de la informaión debemos seguir los siguientes pasos: Seleión del CBTL. Para onvertir la informaión multigranular primero debemos seleionar el dominio en donde unifiaremos diha informaión, A este dominio lo denominaremos CBTL (Conjunto Básio de Términos Lingüístios). 2. Transformaión de la informaión lingüístia multigranular en onjuntos difusos. Consiste en transformar ada etiqueta lingüístia de entrada a un onjunto difuso definido sobre un CBTL, que notaremos omo S T. 3. Conversión de los onjuntos difusos a 2-tuplas lingüístias. Cada onjunto difuso sobre el CBTL obtenido en la fase anterior es transformado en una 2-tupla lingüístia basada en la translaión simbólia y valorada sobre el CBTL. A ontinuaión veremos ada uno de estos pasos en detalle Seleión del CBTL Antes de poder realizar álulos sobre las variables lingüístias valoradas en un ontexto multigranular, tenemos que expresarlas en un únio dominio, al que denominamos omo CBTL [86] (Conjunto Básio de Términos Lingüístios) y se denota omo S T. El primer paso de este proeso es seleionar diho onjunto, S T. Este onjunto debe umplir que: 1. Permita mantener el grado de inertidumbre asoiado a ada experto. 2. Conserve la apaidad de disriminaión que expresan los valores de preferenia. Partiendo de estas premisas, busamos un CBTL on la máxima granularidad de los S i que partiipan en el problema. Nos podemos enontrar on las siguiente situaiones: n Que exista un únio onjunto de términos lingüístios on máxima granularidad, en este aso, lo seleionaremos omo S T. n Que existan dos o más onjuntos de etiquetas on máxima granularidad, entones, S T, será seleionado dependiendo de la semántia de estos onjuntos de etiquetas, pudiéndose dar los dos siguientes asos a la hora de estableer S T :

95 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 1. Todos los onjuntos de etiquetas on máxima granularidad tienen idéntia semántia, entones, S T puede ser ualquiera de ellos. 2, Existen varios onjuntos de etiquetas on diferente semántia. Entones, S T será un onjunto básio de términos lingüístios on una ardinalidad mayor a la que una persona es apaz de disriminar (normalmente 11 ó 13, ver [142]. Una vez seleionado el CBTL que vamos a utilizar para unifiar la informaión de entrada (expresar en un únio dominio de expresión), ya podemos realizar las distintas fases del proeso de normalizaión Transformaión de la informaión lingüístia multigranular en onjuntos difusos El primer paso para unifiar la informaión lingüístia multigranular sobre el dominio de expresión, S T, es onvertir ada etiqueta de entrada valorada en un onjunto de etiquetas, S i, en un onjunto difuso sobre S T. Para realizar esta onversión se definió la siguiente funión de transformaión [86]: Definiión 3.8. Sea A = {l 0,..., l p } y S T = { 0,..., g} dos onjunto de términos lingüístios g m p. Definimos una funión de transformaión multigranular, xas T, omo: xas T : A F (S T ) xas T (l i ) = #( k, a i k) /k {0,..., g}-,6l i A a i k = máx mín {n y l i (y), n k (y)}, donde F (S T ) es el onjunto de onjuntos difusos definidos sobre S T, siendo n l i (y) y n k (y) las funiones de pertenenia de los onjuntos difusos asoiados a los términos l i y k, respetivamente. El resultado de xas T para ualquier etiqueta lingüístia de A es un onjunto difuso definido sobre el CBTL, S T. 93

96 Luis Gonzaga Pérez Cordón Para simplifiar la notaión, notaremos xs i S T ( y ij ) omo r ij, que representa ada onjunto difuso de preferenia mediante sus grados de pertenenia. r ij = a ij o ij,..., a g Conversión de Conjuntos Difusos en 2-tuplas Lingüístias Hasta este momento, lo que hemos heho es unifiar la informaión lingüístia multigranular de entrada transformando ada valor lingüístio y ij en un onjunto difuso sobre S T utilizando xs i S T (y ij ), tal que, xs i S T (y ij ) = ( 0, ao ij ),..., g, ag ij. Ahora vamos a onvertir estos onjuntos difusos a 2-tuplas lingüístias valoradas sobre S T. Para ello, definimos una funión que alula una 2-tupla (s k, a) ij que soporta la informaión del onjunto difuso xs i S T (y ij ). Definiión 3.9. Sea xs i S T (y ij ) = ( 0, a ij o ),..., g, a ij g un onjunto difuso que representa un término lingüístio l i S i sobre el onjunto básio de términos lingüístios S T. Vamos a obtener una 2-tupla, (s k, a) ij, que soporta la informaión del onjunto difuso mediante la siguiente funión: : F (S T ) S T % [-0.5, 0.5) ({( k, a k ), k = 0,..., g, k S T, a k [ 0.5, 0.5]}) = D g j =0 jai j g j =0 ai j = (s k, a) ij donde s k S T y a [-0.5, 0.5) es el valor de la traslaión simbólia. En este momento toda la informaión de entrada está expresada de forma uniforme sobre un únio onjunto de términos lingüístios, S T, utilizando 2-tuplas. Sobre las que podremos operar sin limitaiones de granularidad. 94

97 CAPÍTULO 4. Modelo de reomendaión basado en ontenido on múltiples esalas lingüístias sin informaión história En el apítulo 2 vimos que uno de los prinipales inonvenientes que presentan los sistemas de reomendaión es que muhas vees fuerzan a los usuarios a expresarse usando un únio dominio similar al utilizado internamente por el sistema para operar on los datos, normalmente numério. Aunque, en un prinipio puede pareer que esto no supone un gran inonveniente, existen situaiones donde puede ser inadeuado. Por ejemplo, en los sistemas de reomendaión en los que los usuarios expresan perepiones de aráter ualitativo uyo modelado se adeúa mejor al lingüístio. Además, normalmente, la desripión de los produtos de la base de datos se realiza por expertos on un grado de onoimiento mayor que el de los usuarios. En el apítulo 3, vimos que en estas situaiones puede ser más adeuado el uso de múltiples esalas lingüístias para reflejar esa diferenia de onoimiento. En este apítulo, presentamos un modelo de reomendaión basado en ontenido, que trabaja sobre el onjunto de araterístias que desriben los produtos y no sobre la informaión ontextual que desribe a los mismos. Este modelo ofreerá un maro de trabajo lingüístio multrigranular que proporiona a los usuario una mayor flexibilidad a la hora de expresar sus preferenias y/o neesidades. Cada araterístia utilizada para desribir los produtos está evaluada mediante una esala lingüístia seleionada, según el grado onoimiento del usuario, y según la naturaleza de la misma. Si el usuario es un experto, entones se utilizarán esalas lingüístias on una granularidad mayor, es deir, la preisión es superior que el utilizado por los lientes finales para delarar sus preferenias. Al final de este apítulo, expondremos las onlusiones que se desprenden del funionamiento de este modelo Modelo de reomendaión basado en ontenido on múltiples esalas lingüístias En esta seión presentamos un modelo de sistema de reomendaión basado en ontenido uyas araterístias prinipales vimos en el apítulo 2. Si reordamos brevemente su funionamiento (ver figura 4.1), vemos que el perfil del usuario en estos sistemas reoge las araterístias más 95

98 Luis Gonzaga Pérez Cordón importantes de todos los produtos valorados positivamente por el usuario en el pasado. Sin embargo, nuestra propuesta de modelo está orientada a proesos de reomendaión en los que, por diversas razones, no existe informaión história. A pesar de esto, para generar las reomendaiones, utilizaremos los proesos y meanismos propios de un modelo de reomendaión basado en ontenido. El modelo propuesto será útil en situaiones donde: Figura 4.1: Funionamiento sistema de reomendaión basado en ontenido 96 n Lo realizado por el usuario en el pasado no está relaionado on lo que hae en el presente. Por ejemplo, en la venta de juguetes para niños, las neesidades de un niño a una determinada edad, no tiene porque tener relaión on las neesidades de ese niño dos años después, o por ejemplo, un usuario neesita una reomendaión sobre un

99 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio restaurante porque quiere elebrar un heho puntual (una boda, jubilaión), pero que no tiene nada que ver on las vees que ha estado anteriormente en otros restaurantes. n No existe informaión história sobre el usuario. Por ejemplo, supongamos un sistema de reomendaión de restaurantes. Un número importante de sus usuarios pueden no haber interaionado nuna on el sistema. Este problema se denomina el problema del nuevo usuario y ha sido estudiado on detenimiento en el apítulo 2. n La informaión história no es sufiiente omo para generar las reomendaiones. Las ténias ténias lásias basadas en ontenido o olaborativas, neesitan que los usuarios hayan interaionado un número de vees sufiiente omo para generar reomendaiones on garantías de éxito. Este problema también fue omentado en el apítulo 2 uando se habló de la densidad de las bases de datos. Además de generar las reomendaiones sin informaión história, este modelo está definido en un maro de trabajo lingüístio flexible. Para modelar adeuadamente las perepiones subjetivas de los usuarios y ofreer una mayor flexibilidad a los usuarios, tanto lientes omo expertos, a la hora de expresar sus neesidades o preferenias o desribir los produtos. El esquema de funionamiento de este modelo se muestra en la figura 4.3. Como se puede observar, la diferenia entre los modelos lásios (figura 4.2) y nuestra propuesta, viene definida por la sustituión de la informaión história del usuario, por informaión explíita expresada por el usuario en un ontexto multigranular. El resto de las fases serán iguales, aunque los proesos omputaionales tendrán que ser redefinidos y adaptados para manejar informaión lingüístia multigranular. Las fases de este modelo son las siguientes: 1. Creaión de la base de datos de produtos: el modelo de reomendaión neesita una base de datos de produtos en donde están almaenadas sus desripiones. Esta base de datos puede ser reada mediante: n Proesos automátios de reuperaión de informaión on o sin la supervisión de expertos. n Manualmente mediante un grupo de expertos. 2. Adquisiión del perfil de usuario: en está fase el usuario expresará sus neesidades y éstas se almaenarán en el perfil de usuario, P u, orrespondiente. Esta fase es diferente de los modelos lásios basados en 97

100 Luis Gonzaga Pérez Cordón ontenido, ya que, anteriormente este perfil se generaba de forma automátia analizando la informaión y araterístias de los produtos adquiridos por el usuario en el pasado. Debido a que esta informaión no existe, en situaiones ómo las anteriormente menionadas, proponemos esta fase de adquisiión explíita de la informaión. 3. Filtrado de produtos: el sistema alulará la similitud entre el perfil de usuario y las desripiones de los produtos almaenados en la base de datos de produtos. Es importante remarar que, el uso de múltiples esalas lingüístias supondrá la definiión de operaiones y modelos que sean apaes de manejar este tipo de informaión. Así por ejemplo, neesitaremos definir operaiones que permitan alular la similitud entre la semántia de dos etiquetas lingüístias. Figura 4.2: Funionamiento sistema de reomendaión basado en ontenido 98

101 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 4.3: Sistema basado en ontenido sin informaión história 4. Reomendaión: en esta última fase, el sistema deberá esoger los produtos más adeuados para las neesidades del usuario. Para ello, ordenará los produtos de auerdo a aquellos produtos que satisfagan mejor las neesidades del usuario. A ontinuaión, veremos el maro de reomendaión que se propone en este modelo y, las herramientas neesarias para que el modelo genere las reomendaiones. En las seiones posteriores se explian las fases del modelo detalladamente. 99

102 Luis Gonzaga Pérez Cordón Maro de reomendaión En esta seión, mostraremos el ontexto en el que se define el proeso de reomendaión del modelo que vamos a presentar. En él se fijará el modelado de preferenias que manejará el modelo y las herramientas neesarias para manejar dihas preferenias. Nuestra propuesta onsiste en un modelo que ofreerá un ontexto multigranular lingüístio (ver figura 4.4), debido fundamentalmente a las siguientes razones: n La inertidumbre intrínsea a las perepiones hae que el grado de onoimiento sobre distintos atributos pueda ser distinto por lo que, el uso de distintas esalas de evaluaión, puede ser adeuado para obtener mejores resultados. n El grado de onoimiento que se tiene sobre estos atributos es distinto si, el que los está evaluando es un experto o si es un usuario asual del sistema. Por lo que, sería onveniente ofreerles a ambos esalas lingüístias distintas que tengan en uenta su grado de onoimiento. Figura 4.4: Maro de trabajo del sistema basado en ontenido sin informaión história Atributo Esalas lingüístias ofreidas a los usuarios Esalas lingüístias usada por los expertos C 1 C 2... C l Menor granularidad Mayor granularidad A ontinuaión, veremos el ontexto de definiión del sistema de reomendaión. El objetivo de este modelo es reomendar uno o varios produtos de la base de produtos, A: 100 A = {a 1,..., a j,..., a n }

103 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio donde ada uno de estos produtos, a j, está desrito por un onjunto de araterístias C = { 1,..., k,..., l } Las neesidades o preferenias del usuario estarán almaenadas en el perfil P u = {p u 1,..., p u k,..., p u l }, donde, p u k, representa la valoraión, en la araterístia, k, del produto que deseada enontrar el usuario. Como podemos ver en la figura 4.4, y debido al uso de un ontexto lingüístio multigranular, las esalas lingüístias utilizadas para valorar la araterístia, k, en el perfil de usuario, P u, y en un produto, a j, no tienen porqué oinidir. Sin embargo, de alguna forma, tenemos que llevar a abo una omparaión entre etiquetas perteneientes a esalas lingüístias distintas. Para realizar los proesos omputaionales neesarios en este modelo, operaremos sobre la semántia de las etiquetas lingüístias representadas mediante números difusos, tal y omo, desribimos en el apítulo 3. Podemos llevar a abo diha omparaión de etiquetas, empleando alguna medida de omparaión que me permita onoer uánto se pareen dos números difusos. En el apéndie B hemos realizado una breve revisión sobre las distintas medidas que podríamos utilizar para realizar diha omparaión Creaión de la base de datos de produtos Un elemento fundamental, para un modelo de sistema de reomendaión, es la generaión de la base de datos de produtos que tendrá una estrutura similar a la mostrada en la tabla 4.1. Cada uno de los produtos, a j, de la base de datos estará desritos por un onjunto de araterístias C = { 1,..., k,..., l } La base de datos puede generarse on distintas metodologías omo por ejemplo: Tabla 4.1. Base de datos 1... l a 1 v v 1 l a n v n l... v n l 101

104 Luis Gonzaga Pérez Cordón 102 n Mediante ténias de reuperaión de informaión de forma automátia. n De forma semiautomátia o manual supervisada por un experto o un onjunto de expertos Dada nuestra propuesta, ada uno de los objetos, a j, (ver tabla 4.1) es desrito por medio de un vetor de araterístias, F aj = v j 1,..., v j k,..., v l l, j = 1,..., n Las valoraiones, v j k, de las araterístias del produto, a j, estarán expresadas usando la esala lingüístia S k, v j k d S k donde S k = {s k 1,, s k 2 } es el onjunto de términos lingüístios definido para evaluar la araterístia, k, de auerdo on el grado de onoimiento del experto o del grupo de expertos que está realizando diha evaluaión. Una vez desritos todos estos produtos, el sistema almaenará este onjunto de produtos: en una base de datos. A = {a 1,..., a j,..., a n } Adquisiión del perfil del usuario Dado que el modelo propuesto no utilizará informaión história, iniialmente, es neesario reoger las neesidades y preferenias del usuario y almaenarlas en un perfil de usuario: P u = {p u 1,..., p u k,..., p u l }, Este perfil estará ompuesto por un onjunto de atributos, C = { 1,..., k,..., l } que el usuario utilizará para desribir sus neesidades, preferenias o gustos del produto que desea enontrar. Este onjunto de atributos oinide on el utilizado en las desripiones de los produtos de la base de datos. Diferentes usuarios pueden tener diferentes perepiones sobre sus preferenias o gustos, y de la misma forma, un mismo usuario puede tener un grado de onoimiento más o menos detallado dependiendo de la araterístia que esté valorando. Por esta razón, este modelo ofree la posibilidad de que el usuario pueda seleionar para expresar sus preferenias diferentes esalas lingüístias de auerdo a su grado de onoimiento y a

105 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio la naturaleza del atributo que este valorando. De esta forma, el usuario trabajará en un ontexto multigranular flexible (ver figura 4.4), en vez de forzarlos a utilizar una únia esala, que podría reduir la alidad del onoimiento que tenemos sobre las neesidades del usuario. Para ello, el sistema ofreerá a sus usuarios una esala lingüístia para ada atributo. Así, la esala lingüístia, S ku, ha sido expresamente definida para valorar el atributo k del perfil de usuario P u. Vemos ómo este proeso se adapta al maro de reomendaión definido anteriormente Filtrado de produtos En este momento, nuestro modelo uenta on un perfil de usuario, P u = {p u 1,..., pu l }, y las desripiones de los objetos, F aj = {v j 1,..., v j l } de ada uno de los produtos, {a j, j = 1,..., n} de la base de datos. Para averiguar uáles son los produtos más adeuados de la base de datos, para el perfil de usuario, P u, el modelo llevará a abo un proeso de filtrado entre, P u, y ada objeto de la base de datos a j. Para realizar estos álulos, definiremos una medida de similitud (ver apéndie B), R u j, entre el perfil de usuario P u y las araterístias del produto F aj = {v j 1,..., v j l } que pertenee a la base de datos de produtos: R u j = Similarity (P u, F aj ), j = 1,..., n = (r j 1,..., r j l) Figura 4.5: Proeso de omparaión mediante medidas de semenjanza N VL L M H VH P N VL L M H VH P p k u Comparaión N VL L M H VH P v k i Debido a que, tanto el perfil del usuario, omo las desripiones de los produtos están valorados on etiquetas lingüístias y su semántia está representada mediante números difusos, la similitud podrá ser alulada utilizando una medida de semejanza simple de usar y que fue propuesta en [52] (ver figura 4.5): 103

106 Luis Gonzaga Pérez Cordón Definiión 4.1. Sea p u k el valor orrespondiente al riterio, k, del perfil de usuario, P u, y sea v j k el orrespondiente valor lingüístio del riterio k del produto a j (ver figura 4.5), la funión que mide la similitud entre ambos valores lingüístios se define de la siguiente forma: 104 r j k = D pu k, v j k = sup mín f p u k x (x), f v j (x), (4.1) k donde f p u k es la funión de pertenenia de los valores lingüístios orrespondiente al riterio, k en P u, y f p u k es la funión de pertenenia del valor lingüístio orrespondiente al riterio, k, en F aj. Para obtener la medida de similitud entre el perfil de usuario y el ada uno de los produtos usaremos la siguiente funión. Definiión 4.2. Sea P u el perfil de usuario y F aj la desripión del produto a j, la similitud entre ambos se alula mediante la siguiente funión: Similarity (P u, F j ) = R u j = r j 1,..., r j l donde ada omponente, r j k, es alulado por la euaión Reomendaión El objetivo del modelo reomendaión es reomendar los produtosmás adeuados para los lientes. Hasta ahora, el modelo ha aluladola similitud, R u j, entre todos los produtos, a j, y el perfil de usuario, P u. En esta fase del proeso de reomendaión, la similitud puede ser interpretada omo una preferenia, ya que, uanto mayor sea el valor de esta preferenia, mejor satisfae el produto las neesidades del usuario. Por lo tanto, para poder llevar a abo este objetivo, es neesario ordenar los produtos de auerdo a su similitud on los perfiles de usuario. Tenemos que tener en uenta que diha similitud está expresada por medio de onjuntos numérios. Para ordenarlos y reomendar los más adeuados, nuestro modelo de reomendaión usará un proeso de ordenaión on tres fases que fue presentado en [76]: 1. Construir una relaión de preferenia a partir de las medidas de similitud. 2. Calular el grado de no dominania (NDD) para ada produto. 3. Reomendar los mejores produtos. Estos produtos serán los primeros n on mayor grado de no dominania. A ontinuaión mostraremos en detalle estas fases.

107 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Construir una relaión de preferenia a partir de las medidas de similitud En este momento el sistema tiene una medida de similaridad, R u j, del perfil de usuario, P u, on todos los produtos, a j. Nosotros proponemos la onstruión de una relaión de preferenia Q u = [q ij ], a partir de los valores de similitud, R u j. De esta forma, a partir de esta relaión de preferenia, se podrá alular ual es el produto, a j, preferido por el usuario, o lo que es lo mismo, ual es el produto que mejor satisfae sus neesidades. Para ello, el modelo de reomendaión utilizará una medida de inlusión. Sea A y B dos onjuntos de números, una medida de inlusión, S (A, B), alulará el grado en el que A está inluido en B. En la literatura podemos enontrar diferentes tipos de medidas de inlusión [51, 175]; después de haber estudiado algunas de ellas, deidimos optar por la siguiente medida que es fáil de alular y que presenta buenos resultados: S (A, B) = ínf mín (1 f A (x) + f B (x), 1), (4.2) x donde f A (x) y f B (x) son las funiones de pertenenia de A y B respetivamente. La funión anterior alula el grado en el que A está inluido en B, pero el modelo de reomendaión neesita onoer uanto de A ubre B para interpretar este valor omo una preferenia. Para obtener el grado de preferenia de A sobre B, q AB, neesitamos alular su grado de inlusión de la siguiente forma: q AB = S (B, A) Para onstruir la relaión de preferenia, Q u, proponemos utilizar la medida de inlusión 4.2 que mide uanto ubre R u i a R u j,6i, j {1,..., n}. Por lo tanto, para alular el grado de preferenia utilizaremos la siguiente funión: Definiión 4.3. Sea R u i y R u j la similitud del produto a i y a j on respeto al perfil de usuario P u. El valor, q ij, que mide el grado de preferenia entre ambos produtos se alula de la siguiente forma: q ij = S R u j, R u i = ínf mín 1 f R u x j (x) + f R u i (x), 1 Realizando todos los álulos para todas las alternativas obtendremos la relaión de preferenia Q u : 105

108 a Q Luis Gonzaga Pérez Cordón q q 1j... q1n Q Q u = q j1... q jj... qjn qn1... q nj... qnn a Calular del grado de no dominania El objetivo de esta fase es alular un valor que ayude a elegir y ordenar todos los produtos de la base de datos, de forma que, fáilmente, pueda ordenar los produtos según el grado en el que satisfagan las neesidades del usuario. Se pueden emplear distintas medidas para realizar esta tarea [153]. Este modelo de reomendaión utilizará el grado de no dominania (NDD) que india que alternativas no están dominadas por las otras. Definiión 4.4. [153] Sea Q = [q ij ] una relaión de preferenia difusa definida sobre un onjunto de alternativas X. Para la alternativa x i su grado de no dominania, NDD i, se obtiene de la siguiente forma: NDD i = mín X j 1 q s ji, j = i, (4.3) donde q s ji = (q ji q ij, 0) representa el grado en el ual x i es estritamente dominado por x j. El grado de no dominania (NDD) de todos los produtos se obtiene de auerdo a la euaión 4.3. Por lo tanto, para alular el grado NDD de los distintos produtos se realizarán los pasos que se desriben a ontinuaión: 1. Calular el grado de preferenia estrito de la relaión, Q s u, a partir de Q u : Q s u = [ q s ij], donde q s ij = máx (q ij q ji, 0) 2. Calular NDD de ada produto a j omo: NDD j = mín j =i 1 q s ij 106

109 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Reomendar los mejores produtos En este paso, el sistema reomendará los $n$ mejores produtos, es deir, aquellos que mejor satisfaen las neesidades del usuario. De auerdo on nuestra interpretaión, estos produtos son aquellos que tiene un grado de NDD más alto, ya que, son los produtos menos dominados. Los produtos on el grado de NDD más alto oinidirán on aquellos produtos que han obtenido una similitud mayor on el perfil de usuario y por lo tanto, son los que mejor satisfaen sus neesidades. Debemos tener en uenta que puede haber varios produtos on el mismo NDD. Éstos ouparán la misma posiión en la ordenaión. Un esquema general del proeso de reomendaión que hemos seguido es el siguiente es el que se muestra en la figura 4.6. Figura 4.6: Esquema sistema de reomendaión Base de datos de produtos Cálulo de la relaión de preferenia Cálulo de los grados de no dominania para ada produto 107

110 Luis Gonzaga Pérez Cordón 4.2. Ejemplo de apliaión del modelo propuesto Supongamos un sistema de reomendaión para reomendar juguetes para niños. En estas situaiones puede ser difíil, e inluso desaonsejable, utilizar la informaión história que tengamos del usuario. La prinipal razón es, que las neesidades de los niños o las inteniones del regalo suelen variar de una forma apreiable a lo largo del tiempo, muhas vees no teniendo nada que ver las neesidades de un niño tiempo atrás on las neesidades atuales. Por tanto, vamos a ver omo funionaría el modelo propuesto en este apítulo para este tipo de problemas, viendo ada uno de los elementos y fases del modelo propuesto para este ejemplo. 1. Creaión de la base de datos de produtos En este ejemplo ada juguete vendrá desrito por un onjunto de araterístias C = {J I, H M, H M U, H L, H M T, H C, H V, F A} uyo signifiado es: n Juego independiente (JI): este parámetro de aprendizaje promueve la autoestima y la onfianza en los niños. n Habilidades matemátias (HM): mide si los niños están involurados en atividades de soluión de problemas, razonamiento... n Habilidades musiales (HMU): si el juguete atrae al niño en la realizaión de atividades musiales. Tabla 4.2: Esalas lingüístias A, B y C Esala lingüístia A Esala lingüístia B Esala lingüístia C Difíil (D) (0, 0, 0.5) Adeuado (A) (0, 0.5, 1) Fáil (F) (0.5, 1, 1) Muy básio (MB) (0, 0, 0.25) Básio (B) (0, 0.25, 0.5) Normal ( N) (0.25, 0.5, 0.75) Avanzado (AV) (0.5, 0.75, 1) Muy Avanzado (MAV) (0.75, 1, 1) Nada (NA) (0, 0, 0.16) Un poo (P) (0, 0.16, 0.33) Menos que la media (MM) (0.16, 0.33, 0.5) Mediano (M) (0.33, 0.5, 0.66) Más que la media (MQ) (0.5, 0.66, 0.83) Muho (MU) (0.66, 0.83, 1) Todo (T) ( 0.83, 1, 1) Figura 4.7: Términos lingüístios A, B y C D A F VB B N AV MAV NA P MM M MQ MU T 108

111 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio n Habilidades lingüístias (HL): fomenta las habilidades verbales del niño. n Habilidades motoras (HMT): promueve y desarrolla las habilidades atlétias de los niños y/o la oordinaión ojo/mano. n Habilidades de ooperaión (HC): mejora la ooperaión y la interaión on el objetivo on onseguir logros omunes. n Habilidades visuales(hv): estimula al niño en la evaluaión visual y en atividades que aumentas la reatividad. n Failidad de aprendizaje de omo se juega (FA): algunos juguetesrequieren menos tiempo que otros a la hora de aprender omo jugar on ellos. Cada una de estas araterístias estará valorada mediante una esala lingüístia que no tiene porque oinidir on las utilizadas en las otras araterístias. Utilizaremos las esalas lingüístias definidas en la tabla 4.2 y uya semántia se puede ver en la figura 4.7. Las araterístias que desriben los produtos han sido valorados usando las siguientes esalas lingüístias: Tabla 4.3: Desripiones de los produtos de la base de datos Juguete JI HM HMU HL HMT HC HV FA T 1 NA MV MB N M MB MQ D T 2 P B MAV MB M B MU D T 3 M B B A MM N T A T 4 MM N N N T AV M A T 5 M AV MAV AV MU MAV MM D T 6 M MB N N MQ N NA A T 7 MQ N N MAV M AV M A T 8 MU MAV N N NA N M A T 9 NA N B MAV NA MAV NA D T 10 P AV N N MQ N MU D n Juego independiente (JI): esala lingüístia C. n Habilidades matemátias (HM): esala lingüístia B. 109

112 Luis Gonzaga Pérez Cordón n Habilidades musiales (HMU): esala lingüístia B. n Habilidades lingüístias (HL): esala lingüístia B. n Habilidades motoras (HMT): esala lingüístia C. n Habilidades de ooperaión (HC): esala lingüístia B. n Habilidades visuales (HV): esala lingüístia C. n Failidad de aprendizaje de omo se juega (FA): esala lingüístia A. Para seguir este ejemplo, mostraremos una vista parial de la base datos (ver tabla 4.3) on 10 produtos. En problemas reales, se emplean más araterístias y esalas lingüístias para desribirlos. Cómo indiamos en la seión 4.1.2, esta base datos ha podido ser reada de forma automátia mediante ténias de reuperaión de informaión, de forma semiautomátia o de forma manual on la supervisión y ayuda de un experto o grupo de expertos. 2. Adquisiión del perfil del usuario El sistema requerirá al usuario o liente que exprese sus preferenias y/o neesidades on respeto al produto que desea. De esta forma, se obtendrá el perfil de usuario. Supongamos que el perfil proporionando es el que se muestra en la tabla 4.4 y que desribe las neesidades del usuario. Tabla 4.4: Perfil del usuario JI HM HMU HL HMT HC HV FA M B B AV M NA T A 3. Filtrado de produtos El modelo propuesto alula la similitud del perfil de usuario, P u, on los juguetes, T j, de la base de datos. Supongamos la desripión del juguete T 1 tal y omo se ve en la tabla 4.5. Se efetuarán los siguiente álulos: Tabla 4.5: Desripión del juguete T 1 JI HM HMU HL HMT HC HV FA N MB MB N M MB MQ D Similitud entre el perfil de usuario P u y el juguete T 1 : 110

113 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio R u 1 = Similarity (P u, T 1 ) = r 1 1, r1 2, r1 3, r1 4, r1 5, r1 6, r1 7, r1 8 = (0, 0.5, 0.5, 0.5, 1, 0, 0, 0.5) Los valores de similitud obtenidos se han alulado omo sigue: r1 1 = sup x mín (M, N) = 0 r2 1 = sup x mín (B, MB) = 0.5 r3 1 = sup x mín (B, MB) = 0.5 r4 1 = sup x mín (AV, N) = 0.5 r5 1 = sup x mín (M, M) = 1 r6 1 = sup x mín (NA, MB) = 0 r7 1 = sup x mín (T, MQ) = 0 r8 1 = sup x mín (A, D) = 0.5 Los grados de similitud obtenidos en el paso anterior para todos los produtos T j on j d {1,...,10} son los que se muestran en la tabla 4.6. Tabla 4.6: Grados de similitud entre el perfil del usuario y ada juguete T 1 T 2 T 3 R u T 1 = (0;0.5;0.5;0.5;1;0;0;0.5) R u T 2 = (0;1;0;0;1;0.5;0.5;0.5) R u T 3 = (1;1;1;1;0.5;1;1;1) T 4 T 5 T 6 R u T 4 = (0.5;0.5;0.5;0.5;0;0.5;0;1) R u T 5 = (1;0;0;1;0;0;0;0.5) R u T 6 = (1;0.5;0.5;0.5;0.5;1;0;1) T 7 T 8 T 9 R u T 7 = (0.5;0.5;0.5;0.5;1;0.5;0;1) R u T 8 = (0;0;0.5;0.5;0;1;0;1) R u T 9 = (0;0.5;1;0.5;0;0;0;0.5) T 10 R u T 10 = (0;0;0.5;0.5;0.5;1;0.5;0.5) 4. Reomendaión Para reomendar los produtos más adeuados, el sistema deberá realizar las siguientes fases: a) Construir una relaión de preferenia a partir de las medidas de similitud A partir de la tabla 4.6 se obtiene la siguiente relaión de preferenia, Q u : 111

114 a Q Luis Gonzaga Pérez Cordón Q Q u = a Algunos ejemplos de omo se obtienen los valores de esta matriz son: q 12 = ínf x mín (1 f T2 (x) + f T1 (x), 1) = ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1)) = 0.5 q 13 = ínf x mín (1 f T3 (x) + f T1 (x), 1) = ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1)) = 0 q 14 = ínf x mín (1 f T4 (x) + f T1 (x),1) = ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1) ^ ((( ) ^ 1)) = 0.5 donde el símbolo ^ representa el operador mínimo. b. Calular el grado de no dominania 112

115 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Para ello, en primer lugar, hay que obtener la relaión de preferenia estrita, Q u s, a partir de Q u : Q Q s u = a Donde los valores de la matriz se obtienen omo: q12 s = máx (q 12 q 21, 0) = máx ( , 0) = 0 q s 13 = máx (q 13 q 31, 0) = máx (0 0.5, 0) = 0 q s 14 = máx (q 14 q 41, 0) = máx (0.5 0, 0) = 0.5, Finalmente, el grado de no dominania alulado para todos los produtos, T j, tal y omo se muestra en la tabla 4.7. Dihos valores se obtienen omo: Tabla 4.7: Grado de no dominania (NDD) de los juguetes T 1 T 2 T 3 T 4 T T 6 T 7 T 8 T 9 T

116 Luis Gonzaga Pérez Cordón NDD 1 = mín { (1-0), (1-0.5), (1-0), (1-0), (1-0.5), (1-0), (1-0), (1-0), (1-0.5) } = 0.5 NDD 2 = mín { (1-0), (1-0.5), (1-0), (1-0), (1-0.5), (1-0), (1-0), (1-0), (1-0.5) } = 0.5 NDD 3 = mín { (1-0), (1-0), (1-0), (1-0), (1-0), (1-0), (1-0), (1-0), (1-0) } = 1 ) Reomendar los mejores produtos El objetivo final del sistema de reomendaión es reomendar aquellos produtos, T j, que mejor se adaptan al perfil de usuario. Para ello, el modelo ordenará los produtos T j según su grado de no dominania tal y omo puede verse en la figura 4.8. En está gráfia podemos ver que laramente el juguete T 3 es el que mayor grado tiene, y por lo tanto, es el que debería ser reomendado en primer lugar, seguido de los juguetes, T 1, T 2 y T 7. Figura 4.8: Ordenaión de juguetes T 3 T T T T T T T T T

117 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 4.3. Conlusiones Los sistemas de reomendaión lásios emplean informaión história del usuario para la generaión de reomendaión. Esta informaión está relaionada on las preferenias, neesidades, o gustos del usuario en el pasado y se utilizada para definir el perfil de usuario. Cuando un usuario expresa sus preferenias, se le suele requerir informaión en el dominio numério, ya que, es el utilizado internamente por el sistema de reomendaión para generar las reomendaiones. En este apítulo hemos presentado un modelo de reomendaión basado en ontenido uyas mejoras on respeto a los sistemas basados en ontenido lásios son las siguientes: 1. Se puede utilizar uando no se tenga informaión história del usuario para generar las reomendaiones. Para ello el usuario proporionará esta informaión en el momento en el que desee reibir las reomendaiones. Esta mejora permite utilizar este modelo en situaiones donde la informaión história, o bien no existe, es demasiado esasa, o bien no tienen sentido utilizarla ya que no está relaionada on las neesidades atuales. 2. Ofree un maro lingüístio flexible de expresión a los usuarios del sistema. El sistema ofreerá varias esalas lingüístias para que sus usuarios empleen esalas adeuadas tanto a la naturaleza de las araterístias evaluadas, omo al grado de onoimiento que tienen sobre ellas. Como resultado de estas mejoras, podremos utilizar este tipo de sistema de reomendaión en entornos donde antes no era posible, debido a la falta de informaión história. Además, hemos mejorado la alidad de la informaión reogida del usuario sobre sus neesidades haiendo que mejoren las reomendaiones generadas por el modelo. Por último, hemos visto la apliaión de este modelo a un problema real de reomendaión de juguetes. 115

118

119 CAPÍTULO 5. Modelos de reomendaión basados en onoimiento En nuestro proeso de investigaión sobre sistemas de reomendaión nos dimos uenta que, aunque el modelo anterior era orreto y útil para su ometido, dentro de esta área de investigaión se estaba avanzando on otros modelos de reomendaión: los basados en onoimiento. Éstos fueron ideados para resolver este mismo tipo de problemas, la generaión de reomendaiones uando no existe o no es relevante la informaión história. Por esta razón dirigimos nuestra atenión haia ellos, teniendo en uenta los resultados y propuestas del modelo anterior. En este apítulo, presentamos dos modelos de sistemas de reomendaión basados en onoimiento. El primero de ellos, es un modelo de sistema de reomendaión basado en onoimiento uyos perfiles de usuario y desripiones de los produtos a reomendar están definidos en un ontexto lingüístio multigranular. Tal y omo, ourría en el modelo presentado en el apítulo anterior, queremos ofreer al usuarios un ontexto flexible donde puedan utilizar esalas lingüístias más adeuadas para su grado de onoimiento. Los objetivos que nos planteamos on este primer modelo fueron: 1. Failitar el proeso de adquisiión de las preferenias del usuario. El usuario proporiona un ejemplo, y en base a este ejemplo, se onstruye un perfil de usuario. Si este perfil no representa adeuadamente sus neesidades, el usuario tiene la oportunidad de refinar el perfil. 2. Mejorar el álulo de similitud entre el perfil de usuario y los produtos de la base de datos. 3. Reduir la arga omputaional de la generaión de reomendaiones. Los álulos neesarios para esta generaión de las reomendaiones son más simples. El segundo modelo se presenta omo una mejora del anterior. El objetivo prinipal de este segundo modelo es mejorar los meanismos de onstruión de perfil de usuario, de forma que, éste sea más fiel y no requiera muha más informaión del usuario. El modelo soliitará un onjunto de ejemplos de las neesidades del usuario y una relaión de preferenia sobre ellos, y a partir de esta informaión se onstruirá un perfil de usuario. Las ventajas que aportará serán: 117

120 Luis Gonzaga Pérez Cordón 1. Se ha eliminado la fase de refinamiento. 2. Hemos reduido la dependenia existente entre la alidad de las reomendaiones y la buena eleión del ejemplo elegido para representar las neesidades del usuario. A ontinuaión presentaremos ambos modelos de reomendaión. El primero de ellos, denominado modelo de reomendaión basado en onoimiento on informaión lingüístia multigranular (o RML) será presentado en la seión 5.1. El segundo, un sistema de reomendaión basado en onoimiento basado en relaiones de preferenia inompletas (o RRPI), lo veremos en la seión 5.2. Por último, en la seión 5.3 señalaremos algunas onlusiones RLM: Un modelo de reomendaión basado en onoimiento on informaión lingüístia multigranular A ontinuaión, presentamos un modelo de sistema de reomendaión basado en onoimiento. Este tipo de sistemas de reomendaión fueron estudiados en profundidad en el apítulo 2, y omo hemos diho al prinipio de este apítulo, fueron diseñados expresamente para generar reomendaiones uando la informaión história sobre el usuario no existiera, no fuera sufiiente o no fuera relevante para la reomendaión. El heho de generar reomendaiones sin utilizar informaión história hae que este tipo de sistemas reomendaión no presenten el problema del nuevo usuario ni del nuevo produto, tal y omo, vimos en el apítulo 2. La mayor parte de los sistemas de reomendaión basados en onoimiento emplean el razonamiento basado en asos [93, 111] para generar las reomendaiones. En este modelo de reomendaión, los produtos de la base de datos están desritos por un vetor de araterístias donde ada elemento, normalmente, está relaionado on aspetos ualitativos del produto, on perepiones o on gustos. Por lo tanto, el dominio más adeuado para desribirlas será el lingüístio. Además, se debe de tener en uenta, que no sólo debemos usar una esala lingüístia distinta para ada araterístia que estemos evaluando, sino que debemos tener en uenta el grado de onoimiento de quien esté aportando esta informaión. Por lo que, sería bueno modelar esta informaión mediante un ontexto lingüístio multigranular. En esta propuesta, nos hemos entrado prinipalmente en los siguientes dos puntos: 118

121 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio n Crear un modelo de sistema de reomendaión basado en onoimiento, uyo funionamiento esta basado en el razonamiento basado en asos, que permita obtener reomendaiones para los usuarios uando la informaión história sobre ellos sea inexistente, esasa o no esté relaionada on la búsqueda atual. n Ofreer a los usuarios del modelo un maro de trabajo flexible, donde se pueden utilizar distintas esalas lingüístias dependiendo de la araterístia que se este evaluando, y del grado de onoimiento que tenga la persona que lo está evaluando. Este modelo desarrolla su atividad según el siguiente esquema (ver figura 5.1): 1. Creaión de la base de datos de datos de produtos. 2. Obtenión del perfil de usuario. Esta fase se ompone de dos pasos: a) Adquisiión del ejemplo preferido por el usuario. b) Refinamiento oasional de preferenias. 3. Filtrado de produtos. Está ompuesta de la siguientes fases: a) Unifia la informaión lingüístia. b) Cálulo de la similitud de los produtos y el perfil de usuario. 4. Fase de reomendaión. Figura 5.1: Modelo basado en onoimiento on informaión lingüístia multigranular 119

122 Luis Gonzaga Pérez Cordón A ontinuaión presentaremos de forma detallada el maro de reomendaión de este modelo, y seguidamente, presentaremos ada una de estas fases on más detalle Maro de reomendaión Al igual que en el apítulo 4, en esta seión, expliamos el ontexto en el que se generarán las reomendaiones y qué herramientas empleamos para generarlas. Como hemos introduido anteriormente, uno de los objetivos del modelo es ofreer un maro de trabajo flexible (ver figura 5.2) donde: 1. Cada araterístia pueda ser evaluada mediante la esala lingüístia más adeuada dependiendo de la naturaleza de ésta. 2. Se tenga en uenta quien está proporionando está informaión, si es un experto, la granularidad de la esala lingüístia será mayor pues tiene un grado de onoimiento mayor que si fuera un liente, el ual usará una esala lingüístia on menor granularidad. Figura 5.2: Maro de reomendaión del sistema basado en onoimiento Atributo Esalas lingüístias ofreidas a los usuarios Esalas lingüístias usada por los expertos C 1 C 2... C l Menor granularidad Mayor granularidad Para llevar a abo las reomendaiones, neesitaremos definir unas medidas de similitud que me permitan omparar la informaión almaenada en el perfil de usuario sobre las neesidades de éste, on la desripión de ada uno de los objetos que se puede reomendar. En este modelo, a 120

123 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio diferenia del anterior, vamos a trabajar on medidas de similitud que neesitan que toda la informaión esté expresada en el mismo dominio, para reduir la omplejidad omputaional y obtener mejores resultados. Por lo tanto, en primer lugar, las valoraiones del perfil de usuario y de las desripiones de los produtos se unifiarán en un mismo dominio de expresión. A ontinuaión, revisaremos brevemente el proeso de unifiaión de informaión presentado en 3.4, y posteriormente, presentamos las medidas que utilizamos para alular la similitud entre la informaión unifiada. Unifiaión informaión En el modelo basado en ontenido, el método de omparaión del perfil de usuario on los produtos era muy ostoso tanto omputaionalmente omo en tiempo, aunque produía buenos resultados. Uno de los objetivos de este modelo es mejorar el rendimiento en la generaión de las reomendaiones. Para ello, proponemos un nuevo método para alular la similitud entre el perfil de usuario y ada objeto de la base de datos. En este método, se unifia la informaión en un únio dominio de expresión, y el álulo de la similitud se realiza álulando la distania entre dos onjuntos difusos perteneientes al mismo dominio. Para realizar el proeso de únifiaión realizaremos el proeso presentado en 3.4: 1. Seleionar el CBTL o onjunto básio de términos lingüístios. 2. Apliar la funión x para unifiar toda la informaión el CBTL. En este paso unifiaremos el perfil de usuario, y las araterístias P e = {p e 1,..., pe l } C = { 1,..., k,..., l } que desriben ada uno de los produtos, a i de la base de produtos, A = {a 1,..., a n }, En este momento, las preferenias de los usuarios y las araterístias de los produtos están expresados mediante onjuntos difusos en el CBTL. 121

124 Luis Gonzaga Pérez Cordón Cálulo de la similitud Vimos que uno de los objetivos de este modelo es eliminar la omplejidad en la omparaión del perfil de usuario on las desripiones de los produtos del modelo anterior para, de esta forma, generar reomendaiones on menor oste omputaional y temporal. Para ello, proponemos utilizar una medida de similitud basada en la distania entre dos onjuntos difusos expresados en un mismo dominio lingüístio. En [90] se hizo un estudio sobre medidas de similitud sobre este tipo de informaión. De él se desprende que el uso de valores entrales de los onjuntos difusos: Definiión 5.1. Dado un onjunto difuso b* = {a 1,..., a g } definido sobre S = {s h } para h = 0,..., g obtenemos su valor entral v del siguiente modo: v = g h=0 index (s h) a h g h=0 a h, donde index (s h ) = h representará la posiión media o entro de la gravedad de la informaión ontenida en el onjunto difuso b*. El rango de este valor entral es el intervalo errado [0, g]. Ésto permite definir una medida de similitud para onoer el grado de similitud, simple y util, entre el perfil de usuario, P e, y un produto, a j, de la base de datos, tal y omo sigue: Definiión 5.2. Para obtener la similitud total, d j, entre P e y a j se utilizará la funión, d, que definiremos a ontinuaión: l 1 d j = d (P e, a j ) = sim pk e (P e, a j ) l, v j k, sim pk e, v j k V SIM k =1 Donde V SIM (P e, a j ) = {sim (p1 e, v1 j e ),..., sim (pk, v j k ),..., sim (pl e, v j l )} es un vetor que ontiene la similitud de todos los atributos del perfil de usuario on respeto a la desripión del produto a j. En este modelo, dihos valores se agregarán mediante una mediante un operador de agregaión que podrá ser distinto dependiendo del problema. La funión sim alula la similitud entre los valores de los atributos del perfil de usuario y el produto, a j, y es definida omo: 122

125 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Esta funión se define de la siguiente forma: Definiión 5.3. Sea v Pe k el valor entral del onjunto difuso pk e, orrespondiente al perfil de usuario, P e, y v a j k el valor entral del onjunto difuso para del produto a j, la funión que alula la similitud de ambos valores se define omo: sim p e k, v j k = 1 v Pe k Una vez definido el maro de reomendaión, presentaremos las distintas fases del modelo de reomendaión. g v a j k Creaión de la base de datos de produtos Como en todos los modelos vistos, éste también neesita una base de datos ompuesta de las desripiones de los produtos a reomendar. Diha base de datos tendrá una estrutura omo la mostrada en la tabla 5.1. La base de datos puede generarse on distintas metodologías omo por ejemplo: n Mediante ténias automátias. Tabla 5.1. Base de datos 1... l a 1 v v 1 l a n v n l... v n l n De forma semiautomátia o manual supervisada por un experto o un onjunto de expertos. Esta base de datos ontendrá n produtos, A = {a 1,..., a n }, donde ada produto, a e, está desrito por un vetor de valoraiones F e = {v e l,..., v e l }, en donde ada elemento v e k S k es una valoraión de la araterístia k del onjunto de araterístias, C = { 1,..., k,..., l } 123

126 Luis Gonzaga Pérez Cordón que desriben los produtos, siendo S k la esala lingüístia más adeuado para valorar la araterístia k Obtenión del perfil de usuario Una de las prinipales mejoras de este modelo, on respeto al anterior, está relaionada on la obtenión del perfil del usuario. En el modelo anterior, se mostraban al usuario todas las araterístias del perfil, y éste, valoraba ada una de las araterístias para desribir uales eran sus gustos o neesidades. Esto onlleva una serie de desventajas que en este modelo se han intentado soluionar: El número de atributos que el usuario tiene que revisar para ompletar su perfil puede requerir demasiado tiempo y ser una de las ausas por las que el usuario desista de su busqueda. El usuario no tiene porqué onoer todos los atributos que desriben este perfil. Si no es un experto en la materia puede haber atributos que no pueda valorar, porque desonoza diha araterístia. Por ejemplo, alguien no familiarizado on la automoión puede desonoer el signifiado del término EPS. Existen varias alternativas para minimizar estos inonvenientes. Una de ellas sería mostrar sólo un onjunto reduido de las araterístias más signifiativas. Sin embargo, esta soluión onllevaría una perdida de expresividad para los usuarios. Otra alternativa que se propone en los modelos de reomendaión basado en onoimiento es la de definir el perfil de usuario a partir de un ejemplo de las neesidades del usuario, y sólo modifiar aquellas araterístias que el usuario onsidere que no representan realmente sus neesidades. Esta soluión evita onoer o valorar todas las araterístias que definen el perfil de usario. A ontinuaión, expliaremos detenidamente los pasos que el modelo sigue para onstruir el perfil de usuario (ver figura 5.1). Adquisiión del ejemplo preferido por el usuario El objetivo de esta fase es reoger la informaión iniial sobre las neesidades del usuario y onstruir un perfil de usuario iniial P e0. El punto de partida para definir las neesidades del usuario se basa en la eleión de un ejemplo, es deir, de un produto que el usuario expone omo un aso de sus neesidades. Sea, a e, el produto seleionado omo ejemplo de las preferenias del usuario, u e. Este produto estará desrito en la base de datos mediante un vetor de utilidad 124

127 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio F e = {v e l,..., v e l }, donde, v e k S k, es el valor asignado a diho produto para la araterístia, k, expresado en S k. Este ejemplo, seleionado por el usuario, genera un perfil de usuario iniial que notamos omo P e0 = {p e 0 1,..., pe 0 l } donde, p e 0 k = v e k, ya que, se asigna diretamente los valores de la base de datos a los del perfil. En este perfil iniial, los onjuntos de términos lingüístios son los mismos que los utilizados en la base de datos. Refinamiento oasional de preferenias Esta fase tiene omo objetivo ofreer al usuario la posibilidad de refinar su perfil, debido a que éste ha podido elegir un ejemplo erano a sus neesidades, pero que no refleje exatamente lo que neesita. Para ello, el modelo ofree al usuario la posibilidad de alterar algún valor de su perfil dando una valoraión para una araterístia determinada expresada en una esala lingüístia a su eleión o la ya existente. En tal aso, para una araterístia, k, el usuario podrá asignarle una nueva valoraión, p e 1 k, expresada en otra esala lingüístia, S k, aorde on su grado de onoimiento y on la naturaleza de la araterístia que está evaluando. Después de esta modifiaión, que es opional, tenemos un perfil definitivo de usuario P e = {p e 1,..., pe l } donde p e k S e k obtenidos del siguiente modo: p e k = pe 0 k, p e k S e k = S e k si la araterístia no ha sido modifiada p e k = pe 1 k, p e k S e k = S k en aso ontrario. En esta fase de nuestro modelo, se ofree a los usuarios la posibilidad de desribir sus neesidades utilizando sus propios onjuntos de términos lingüístios, S k, aordes on su grado de onoimiento y on la naturaleza de la araterístia, sin neesidad de tener que adaptarse a una esala únia fijada a priori Filtrado de produtos Al igual que en otros modelos anteriores. Este modelo ha de filtrar los produtos de la base de datos on respeto al perfil del usuario, P e, para enontrar uáles son los produtos más adeuados para el usuario. 125

128 Luis Gonzaga Pérez Cordón En este modelo, para realizar este proeso se propone alular la similitud entre los produtos y el perfil de usuario, P e, siguiendo el siguiente proeso: 1. Unifiaión la informaión lingüístia: en primer lugar y debido a que el maro de definiión del perfil de usuario, P e y de los produtos, A = {a 1,..., a n }, es multigranular, no podemos operar diretamente sobre ella por lo que deberemos unifiarla en un únio dominio de expresión [76]. 2. Calulo de la similitud entre ada produto y el perfil de usuario: una vez unifiada la informaión alularemos la similitud entre el perfil de usuario, P e y ada uno de los produtos, a j de la base datos, A, mediante la medida de similitud que se presentó en la seión 5.1.1: l 1 d j = d (P e, a j ) = sim pk e (P e, a j ) l, v j k, sim pk e, v j k V SIM k = Reomendaión Una vez alulada la similitud entre el perfil de usuario y todos los produtos de la base de datos, nuestro objetivo es ordenar los produtos según la similitud obtenida y que están representadas en el siguiente vetor de similitud D = {d 1,..., d n } Los mejores serán aquellos que mejor satisfagan las neesidades del perfil del usuario (on la similitud mayor). Así pues, dado el onjunto de produtos A = {a 1,..., a n } el sistema reomendará al usuario un onjunto de k produtos, A B = {a 1,..., a k }, que verifia: 1. Si a i A B entones a i! a e. 2. a i A B son los k produtos on los mayores valores de similaridad, d i. Como puede omprobarse, la generaión de reomendaiones de este modelo requiere muha menos arga omputaional. Esto hae que, este modelo sea apaz de manejar bases de datos de produtos on un mayor número de produtos y de araterístias que el modelo presentado en apítulo

129 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Ejemplo de apliaión del modelo RLM Al igual que on el modelo propuesto en el apítulo 4, vamos a mostrar un ejemplo general simple del funionamiento del modelo presentado. 1. Creaión de la base de datos de produtos. s 1,2 0 s 1,2 2 s 1,2 4 s 1,2 6 s 1,2 8 Supongamos una base de datos de produtos A = {a 1, a 2, a 3, a 4, a 5, a 6 } desritos por un onjunto de atributos C = { 1, 2, 3, 4 } En sistemas reales estas bases de datos podrían tener almaenados miles de produtos y estarán desritos por más atributos. Dado que el modelo se define en un ontexto multigranular, los atributos 1 y 2 se valorarán usando las esala lingüístia S 1,2 (ver figura 5.3) y para los atributos 3 y 4 en la esala lingüístia S 3,4 (ver figura 5.4). Estas esalas lingüístias se definirán mediante las siguientes funiones de pertenenia: = Infimo = (0, 0, 0.125) s 1,2 1 = Bajo = (0.125, 0.25, 0.375) s 1,2 3 = Medio = (0.375, 0.5, 0.625) s 1,2 5 = Alto = (0.625, 0.75, 0.875) s 1,2 7 = Extremo = (0.875, 1, 1) = Muy bajo = (0, 0.125, 0.25) = Un poo bajo = (0.25, 0.375, 0.5) = Un poo alto = (0.5, 0.625, 0.75) = Muy alto = (0.75, 0.875, 1) Figura 5.3: Conjunto de etiquetas S 1,2 empleada en la base de datos de produtos s 1,2 0 s 1,2 1 s 1,2 2 s 1,2 3 s 1,2 4 s 1,2 5 s 1,2 6 s 1,2 7 s 1,

130 Luis Gonzaga Pérez Cordón s 3,4 0 s 3,4 2 s 3,4 4 s 3,4 6 = Despreiable = (0, 0, 0.16) s 3,4 1 = Inferior = (0.16, 0.33, 0.5) s 3,4 3 = Elevado = (0.5, 0.66, 0.83) s 3,4 5 = Considerable = (0.83, 1, 1) = Muy inferior = (0, 0.16, 0.33) = Normal = (0.33, 0.5, 0.66) = Muy elevado = (0.66, 0.83, 1) Figura 5.4: Conjunto de etiquetas S 3,4 empleada en la base de datos de produtos s 3,4 0 s 3,4 1 s 3,4 2 s 3,4 3 s 3,4 4 s 3,4 5 s 3, Las desripiones de los produtos, de la vista de la base de datos utilizado para mostrar el ejemplo, la podemos ver en la tabla 5.2 Tabla 5.2: Base de datos de produtos a 1 s 1,2 0 s 1,2 3 s 3,4 3 s 3,4 2 a 2 s 1,2 5 s 1,2 2 s 3,4 1 s 3,4 4 a 3 s 1,2 7 s 1,2 4 s 3,4 0 s 3,4 5 a 4 s 1,2 5 s 1,2 6 s 3,4 2 s 3,4 6 a 5 s 1,2 8 s 1,2 0 s 3,4 4 s 3,4 6 a 6 s 1,2 1 s 1,2 8 s 3,4 3 s 3, Obtenión del perfil de usuario Si un usuario, u e, desea reibir una reomendaión del sistema, deberá proveer informaión al sistema de sus neesidades para que éste ree su perfil de usuario. Para obtener diho perfil, se siguen los siguientes pasos:

131 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio a) Adquisiión del ejemplo preferido por el usuario El produto, a 1, es el ejemplo que el usuario dará para expresar sus neesidades atuales y a partir de éste se onstruye un perfil iniial del usuario: P e = #s 1,2 0, s 1,2 3, s 3,4 3, s 3,4 2 - b) Refinamiento oasional de preferenias Supongamos que el usuario quiere aumentar el valor de la araterístia, 1, pero la esala lingüístia utilizado por el sistema para desribir esta araterístia es demasiado preisa para el nivel de onoimiento que tiene. El usuario deide utilizar la esala lingüístia S * 1 que definimos a ontinuaión (ver figura 5.5): s *1 0 = Muy alto = (1, 1, 0.75) s *1 1 = Alto = (1, 0.75, 0.5) s *1 2 = Medio = (0.75, 0.5, 0.25) s *1 = Bajo = (0.5, 0.25, 0) 3 s *1 = Muy bajo = (0.25, 0, 0) 4 Figura 5.5: Conjunto de etiquetas utilizado por el usuario s *1 0 s *1 1 s *1 2 s *1 3 s* El usuario le asigna el valor s *1 2 a la araterístia 1. Por lo tanto, después de este paso su perfil de usuario será el siguiente: 3. Filtrado de produtos P e = #s *1 2, s 1,2 3, s 3,4 3, s 3,4 2 - El siguiente paso en nuestro ejemplo es el álulo de la distania entre el perfil de usuario y los produtos de la base de datos de produtos. Para ello debemos realizar los siguientes pasos: 129

132 Luis Gonzaga Pérez Cordón a) Unifiar la informaión lingüístia: según las ondiiones enumeradas en el apítulo 3, seión 3.4, el CBTL elegido para unifiar la informaión será S 1,2. El perfil, P e, unifiado en S 1,2 es: P e = {(0, 0, 0.33, 0.66, 1, 0.66, 0.33, 0, 0), (0, 0, 0, 1, 0, 0, 0, 0, 0) (0, 0, 0.14, 0.57, 1, 0.57, 0.14, 0, 0), (0, 0.28, 0.71, 0.85, 0.42, 0, 0), 0, 0) Y la base de datos de produtos unifiada en el CBTL está en la tabla 5.3. Tabla 5.3: Desripión de los produtos en el CBTL a 1 (1, 0, 0, 0, 0, 0, 0, 0, 0) (0, 0, 0, 1, 0, 0, 0, 0, 0) (0, 0,.14,.57, 1,.57,.14, 0, 0) (0,.28,.71,.85,.42, 0, 0, 0, 0) a 2 (0, 0, 0, 0, 0, 1, 0, 0, 0) (0, 0, 1, 0, 0, 0, 0, 0, 0) (.42,.85,.71,.28, 0, 0, 0, 0, 0) (0, 0, 0, 0,.42,.85,.71,.28, 0) a 3 (0, 0, 0, 0, 0, 0, 0, 1, 0) (0, 0, 0, 0, 1, 0, 0, 0, 0) (1,.57,.14, 0, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0,.28,.71,.85,.42) a 4 (0, 0, 0, 0, 0, 1, 0, 0, 0) (0, 0, 0, 0, 0, 0, 1, 0, 0) (.28,.71,.85,.42, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0, 0,.14,.57, 1) a 5 (0, 0, 0, 0, 0, 0, 0, 0, 1) (1, 0, 0, 0, 0, 0, 0, 0, 0) (0, 0, 0, 0,.42,.85,.71,.28, 0) (0, 0, 0, 0, 0, 0,.14,.57, 1) a 6 (0, 1, 0, 0, 0, 0, 0, 0, 0) (0, 0, 0, 0, 0, 0, 0, 0, 1) (0, 0,.14,.57, 1,.57,.14, 0, 0) (.42,.85,.71,.28, 0, 0, 0, 0, 0) b) Cálulo de la distania entre dos objetos: en esta fase el modelo alulará la distania entre el perfil de usuario y el resto de objetos 1) Cálulo de los valores entrales tanto de los produtos de la base de datos omo del perfil de usuario (ver tabla 5.4 y 5.5) Tabla 5.4: Valores entrales de los produtos a a a a a a

133 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Tabla 5.5: Valores entrales del perfil del usuario Un ejemplo de álulo de estos valores es: v Pe 1 (0, 0, 0.33, 0.66, 1, 0.66, 0.33, 0, 0) = = = ) Cálulo de la distania entre los atributos del perfil de usuario y la base de datos de produtos (ver tabla 5.6): Tabla 5.6: Distania entre los atributos de la base de datos de produtos y el perfil de usuario a a a a a a sim p e 1, v 1 1 = 1 v1 Pe v a = = 0.5 3) El último paso de esta fase es el álulo de la similitud entre los produtos de la base de datos y el perfil de usuario obteniendo los siguientes resultados (ver tabla 5.7). Tabla 5.7: Distania entre los produtos y el perfil de usuario a 1 a 2 a 3 a 4 a 5 a d 1 = d (P e, a 1 ) = =

134 Luis Gonzaga Pérez Cordón 4. Reomendaión En la última fase del modelo, se reomendará aquellos produtos que más se aerquen a las neesidades del usuario. Si nos damos uenta el produto que más se aera al perfil de usuario es, a 1, lo ual es bastante lógio teniendo en uenta que este fue el ejemplo que dio el usuario. Por esta razón, a 1, no es reomendado, ya que, el usuario está busando produtos similares a a 1, pero que no sean a 1. Por lo tanto, el vetor ordenado que obtenemos es {a 2, a 6, a 4, a 3, a 5 } Si suponemos que nuestro sistema de reomendaión sólo reomienda los dos produtos más eranos. Las reomendaiones reibidas por el usuario serían: a 2, a RRPI: Sistema de reomendaión basado en onoimiento on relaiones de preferenia inompletas En nuestra búsqueda de mejorar los proesos de reomendaión, en aquellas situaiones donde hay falta de informaión. Vamos a presentar un nuevo modelo, basado en onoimiento, que mejora el proeso de adquisiión de informaión del usuario on respeto a los modelos anteriores. Para ello, este modelo denominado RRPI, partirá de un onjunto reduido de ejemplos que expresan las neesidades del usuario y de una relaión de preferenia inompleta sobre dihos ejemplos. A partir de esta informaión, onstruirá el perfil de usuario evitando, de esta forma, la fase de refinamiento del modelo RML. El modelo RRPI se entrará en umplir los siguientes objetivos: 1. Ofreer al usuario una herramienta que permita generar su perfil de forma fiel a sus neesidades sin aportar muha informaión, y que además lo guíe mejor haia aquellos produtos que le pueden interesar más. Como omentamos en la introduión, este modelo define el perfil de usuario a partir de varios ejemplos, y no de uno, y por lo tanto, es menos suseptible a lo bien han sido esogidos éstos para representar las neesidades del usuario. 2. Conseguir que el usuario no tenga que delarar de forma explíita ada uno de las araterístias de su perfil, tal y omo, ourría on 132

135 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio el modelo presentado en el apítulo 4, ni que este neesite refinar las araterístias del perfil omo ourre en el modelo RML. El modelo seguirá el siguiente esquema de funionamiento para generar las reomendaiones (ver figura 5.6): 1. Creaión de la base de datos de produtos. 2. Obtenión del perfil de usuario. a) Adquisiión de la informaión de preferenia del usuario: Esta fase es un proeso de dos pasos: 1) Estableer los ejemplos favoritos y una relaión de preferenia inompleta sobre ellos. 2) Rellenado automátio de la relaión de preferenia inompleta. b) Construión de un perfil de usuario: 1) Construión de perfiles de usuario pariales. 2) Obtenión del perfil de usuario. 3. Filtrado de produtos. 4. Reomendaión. A ontinuaión, vereremos el maro de reomendaion de este modelo y expliaremos ada una de las fases que lo omponen. Por último, veremos un ejemplo de ómo funiona en la seión Maro de reomendaión. El maro de reomendaión que proponemos para el modelo RRPI, modelará la informaión de los usuarios mediante relaiones de preferenia. Nuestra propuesta de reduir el tiempo de obtenión de diha informaión nos lleva a requerir del usuario úniamente una relaión de preferenia inompleta. Sin embargo, para poder sugerir reomendaiones adeuadas, neesitamos la máxima informaión posible sobre los gustos y preferenias del usuario. Para ello, proponemos ompletar la relaión de preferenia inompleta dada por el usuario, basándonos en la propiedad de transitividad aditiva. De esta forma, podemos obtener la máxima informaión posible, evitando inonsistenias, ya que, si éstas no se evitaran, las soluiones (reomendaiones) obtenidas por el modelo podrían no ser satisfatorias. Existen varios algoritmos para llevar a abo esta tarea. En el apéndie C hemos revisado los algoritmos más utilizados en la literatura para rellenar 133

136 Luis Gonzaga Pérez Cordón relaiones de preferenia inompletas, y presentamos nuestra propuesta de algoritmo de rellenado de relaiones de preferenia lingüístias, utilizado en este modelo. Figura 5.6: Modelo de sistema de reomendaión basado en onoimiento 134

137 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Este maro de evaluaión no se entra en los dominios de expresión que pueden utilizarse en el modelo, ya que, existen en la literatura herramientas para extender su uso en diferentes ontextos de definiión. En prinipio, proponemos que la informaión dada por el usuario, se exprese en un dominio lingüístio, y la informaión de los produtos en un dominio numério. Aunque en un futuro, puedan ser extendidos a otros dominios Creaión de la base de datos de produtos Cada uno de los produtos de la base de datos (ver tabla 5.8), A = {a 1, a 2,, a m } a reomendar se desriben por un onjunto de araterístias C = { 1,..., t } Tabla 5.8. Base de datos 1... l x 1 v v 1 l x m v n l... v n l y ada produto, a i, está desrito on una valoraión en ada una de estas araterístias, a i = { 1 i,... t i}. En este aso, ada uno de estos valores podrá ser un número en el intervalo o una etiqueta lingüístia. En el ejemplo que mostraremos al final del apítulo, sólo hemos empleado valoraiones numérias, pues nuestro objetivo prinipal en este modelo es mostrar ómo se onstruiría el perfil de usuario a partir de la informaión proporionada por el usuario. Como hemos indiado, su extensión a otros dominios de expresión es simple. Aunque la base de datos podría rearse mediante ténias reuperaión de informaión de forma automátia, normalmente la reaión de esta base de datos será semiautomátia o manual, ya que, es muy probable que se requiera la supervisión de un experto o un onjunto de expertos para definir: Qué araterístias son importantes? Qué valores utilizarán ada una de estas araterístias? 135

138 Luis Gonzaga Pérez Cordón Si existe algún tipo de relaión entre distintos valores Obtenión del perfil de usuario Es en esta fase, se desarrollan las prinipales mejoras de nuestra propuesta. En el modelo RML, para onstruir el perfil de usuario éste debía: 1. Dar un ejemplo de las neesidades del usuario. 2. Usar la fase de refinamiento si quería modifiar su perfil para adeuarlo lo mejor posible a sus neesidades. En el modelo RRPI, nuestro objetivo es evitar esta fase de refinamiento y onstruir un perfil fiel a sus neesidades. Para ello, el modelo realizará los siguientes pasos: 1. Adquisiión de la informaión de preferenia del usuario: a) Estableer los ejemplos favoritos y una relaión de preferenia inompleta sobre ellos. b) Rellenado automátio de la relaión de preferenia inompleta. 2. Construión de un perfil de usuario: a) Construión de perfiles de usuario pariales. b) Obtenión del perfil de usuario. Adquisiión de la informaión de preferenia del usuario El objetivo de esta fase es obtener informaión sobre las preferenias del usuario. Primero, el usuario debe esoger algunos produtos (uatro o ino) omo ejemplo de sus preferenias, gustos o neesidades. La prinipal difiultad para el usuario, sería ómo explorar la base de datos de produtos para enontrar estos uatro o ino produtos, ya que, puede ser inmensa. Para failitar la tarea de seleión, el sistema onstruye un onjunto de produtos representativo para este usuario. Sea A = {a 1, a 2,, a m } el onjunto de produtos que pueden ser reomendados y ada uno de ellos esta desrito por un vetor de araterístias a i = { 1 i,... t i}. Cuando un usuario visita el sistema se le ofreerá un subonjunto de produtos A r = {a r 1, a r 2,..., a r m} (m [ m). 136

139 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Este subonjunto debería de ser sufiientemente grande omo para ontener produtos que representen ualquier tipo de neesidad del usuario y además estos produtos tienen que ser onoidos por el usuario. Sin embargo, debemos tener uidado en no ofreer un onjunto de produtos demasiado grande ya que podría haer desistir al usuario del uso del sistema de reomendaión. Existen varias alternativas para obtener este subonjunto, la mas fáil es la utilizaión de listas de produtos readas por expertos, listas de produtos más vendidos,... Por ejemplo, CDNOW ( ofree a sus usuarios listas de CDs por género reados por expertos en músia o les permite onsultar los CDs más vendidos en ese momento. Sería fáil, a partir de estas listas onstruir el subonjunto A r. Además este subonjunto no tiene porque ser únio, se le puede ofreer al usuario un subonjunto distinto dependiendo de lo que esté busando (no es lo mismo busar músia rok, que lásia). Nota 5.1. No existe ninguna orrelaión entre onoidos y preferidos. En este subonjunto A r que se le ofree al usuario, éste podrá enontrar tanto produtos interesantes, omo produtos que al usuario no le interesen. Por ejemplo, si estuviéramos reomendando hoteles, los hoteles Hilton serían muy onoidos pero no tienen porque ser del agrado del usuario. i. Estableer los ejemplos favoritos y una relaión de preferenia inompleta sobre ellos. El onjunto, A r, es mostrado al usuario para que esoja el onjunto de ejemplos que representan sus neesidades, A u = {a u 1,..., a u n}. Después, el sistema le pedirá al usuario que exprese sus preferenias entre los elementos de A u por medio de una relaión de preferenia lingüístia, en la ual, se utilizará la esala lingüístia S = {s 0,, s g } El usuario solo tiene que rellenar una fila de la relaión de preferenia, ya que, el modelo de reomendaión obtendrá una relaión de preferenia ompleta a partir del algoritmo de rellenado de relaiones de preferenia inompletas on tendenia al valor de indiferenia que hemos presentado en el apéndie C. De esta forma, se obtienen tres ventajas: 1. El proeso de adquisiión de informaión de preferenia es rápido y fáil: el usuario proporiona la informaión mínima neesaria para 137

140 Luis Gonzaga Pérez Cordón que, el sistema pueda empezar a generar un perfil de usuario útil para el álulo de las reomendaiones. 2. El algoritmo de rellenado de preferenias nos permite trabajar on relaiones de preferenias lingüístias ompletas. 3. Debido a que el modelo parte de un onjunto de ejemplos pequeño y una relaión de preferenia, las reomendaiones son menos dependientes de lo bien seleionado que sean estos ejemplos, osa que no ourre en los sistemas de reomendaión basados en onoimiento lásios. Ya que en ellos, las reomendaiones son guiadas por un solo ejemplo esogido por el usuario, si no es el adeuado, las reomendaiones difíilmente serán aertadas. Cuando las reomendaión son guiadas por varios ejemplos, es más probable que se puedan obtener buenas reomendaiones siempre y uando tengamos algunos ejemplos que representen de forma adeuada las neesidades del usuario. Además, el uso de las relaiones de preferenia nos da la oportunidad de averiguar que ejemplos son más eranos o más lejanos de lo que quiere realmente el usuario. A partir de esta informaión, podemos obtener un perfil de usuario más refinado que el obtenido en sistemas de reomendaión lásios. ii. Rellenado automátio de la relaión de preferenia inompleta. Una vez el usuario nos ha proporionado el onjunto de ejemplos de sus neesidades y una relaión de preferenia lingüístia inompleta sobre ellos, para alular el perfil de usuario neesitamos rellenar esta relaión de preferenia, utilizando un algoritmo de rellenado de relaiones de prefenia inompletas. En esta fase partiremos de una relaión de preferenia similar a la siguiente: p 11 p 12 p 13 p 14 Q P =? p 22???? p 33? a??? p 44 Donde? representa valoraiones desonoidas, que algoritmo deberá estimar. Hay que señalar que, p ii, por definiión tomarán el valor de indiferenia, y p 12, p 13, p 14 son las valoraiones proporionadas por el usuario. Q a 138

141 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Tras apliar el algoritmo de rellenado de relaiones de preferenia, obtendremos la siguiente relaión: p 11 p 12 p 13 p 14 Q P = p 21 p 22 p 23 p 24 p 31 p 32 p 33 p 34 p a 41 p 42 p 43 p 44 donde ada elemento de la relaión estará expresado on términos lingüístios de S, representados mediante 2-tuplas, y en donde p ij es un elemento alulado mediante diho algoritmo. Construión de un perfil de usuario A partir de la relaión de preferenia ompleta, se onstruye un perfil de usuario que el sistema utilizará para omparar las neesidades del usuario on las araterístias de todos los produtos almaenados en la base de datos de produtos. El sistema alulará el perfil de usuario, partiendo de las desripiones de los produtos elegidos omo ejemplo de las neesidades del usuario y utilizando la relaión de preferenia ompletada obtenida. El perfil del usuario se onstruye omo sigue: i. Construión de los perfiles de usuario pariales Partiendo de ada olumna de la relaión de preferenia, (p 1j, p 2j,, p nj ), se obtiene un perfil de usuario parial que representa las preferenias del usuario on respeto al produto a u j. El proeso para obtener este perfil parial, onsiste en la agregaión de los vetores de araterístias de los otros produtos distintos de, a u j. Para onstruir el perfil parial utilizaremos el operador IOWA propuesto por Yager en [213]. Con él, agregaremos el vetor de araterístias de los otros produtos distintos de a u j, utilizando los elementos onoidos de la relaión de preferenia (p 1j, p 2j,, p nj ) que utilizaremos omo variables de induión de orden en la agregaión. El operador IOWA se utiliza para agregar tuplas de la forma (v i, a i ), donde, v i, es onoido omo la variable de induión de orden y a i es el valor a agregar F W ( o 1, a 1,..., o n, a n ) = W T B v, siendo B v = (b 1,..., b l ) el resultado de ordenar el vetor K = (a 1,..., a l ) de auerdo a los valores de las variables de induión de orden y W T es un vetor de pesos que umple las siguientes ondiiones: Q a 139

142 Luis Gonzaga Pérez Cordón W = (w 1,..., w l ) w i [0, 1]6i, l i=1 w i = 1 El objetivo de este paso es alular n perfiles pariales %pp j = ` 1 pp j,..., t pp j j/, uno por ada produto a u j. El perfil parial, pp j, para ada produto a u j es un vetor uyos valores indian las preferenias del usuario de auerdo a sus neesidades sobre el produto, a u j. El perfil parial, pp j, se obtiene agregando los vetores {( 1 i,... t i),6 i! j} que desriben al ítem a u j. Cada elemento, k pp j, se obtiene por la agregaión de los n 1 elementos { k i,6 i! j}. Para llevar a abo esta agregaión usaremos el operador IOWA. Así, para ada elemento, k pp j, las variables de induión de orden son obtenidas a partir de la olumna j de la relaión de preferenia {p ij,6 i! j}. Para ada araterístia apliaremos la siguiente funión: k pp j = F W p 1j, k 1,..., p nj, k n = W T B v, donde el vetor B v = (b 1, b n 1 ) es dado por un orden de mayor a menor de los elementos del onjunto { k i,6 i! j} de auerdo on el orden induido por las variables (p 1j,, p nj ) donde, p ij, representa las preferenias de el ejemplo, a u i, sobre el ejemplo a u j. Nota 5.2. Si estuviéramos operando on araterístias lingüístias, entones el operador de agregaión que se debe utilizar en este aso es el IOWA para modelos lingüístios [209]. Hay diferentes métodos para onstruir el vetor de pesos W = (w 1,...,w n 1 ). Podríamos asoiarlo on un uantifiador lingüístio [210] o resolver un problema matemátio tal y omo se explia en [150]. En nuestro modelo, hemos optado por el método sugerido por Yager para alular el peso de los operadores de agregaión OWA mediante uantifiadores lingüístios no dereientes. Un uantifiador lingüístio no dereiente debe satisfaer las siguientes tres propiedades: 1. Q (1) = 1 2. Q (0) = 0 3. Q (r 1 ) m Q (r 2 ) si r 1 m r 2 En el aso de un uantifiador no dereiente proporional Q (ver figura 5.7), los pesos para el elemento i on i = 1, n 1 se alula mediante la siguiente expresión: 140

143 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio w i = Q i n 1 Q i 1 n 1 Figura 5.7: Cuantifiador proporional no dereiente donde la funión de pertenenia de este uantifiador proporional no dereiente Q es la siguiente: 0 si x < a Q (x) = * x a si a [ x [ b b a 1 si x > b ii. Obtenión del perfil de usuario El sistema alulará el perfil final de usuario ombinando los perfiles pariales (ver figura 5.8), pp 1,, pp n obtenidos anteriormente. Para este proeso de agregaión, el sistema también utilizará el operador IOWA, ya que, se enuentra en una situaión similar. En este paso vamos a agregar todos los perfiles pariales, pp j = ` 1 pp j,..., t pp j j, obtenidos para ada produto a r j. Utilizaremos la siguiente funión para obtener ada uno de los valores del perfil de usuario: k fp = F W p 1, k pp 1,..., p n, k pp n = W T B v, donde el vetor, B v = (b 1,, b l ), se obtiene mediante una ordenaión reiente de los elementos del onjunto, { k pp 1, i = 1,, n}, tomando omo variables de ordenaión las variables (p 1,..., p n ). El vetor de pesos, W, se obtendrá siguiendo uno de los métodos expliados en el paso anterior. 141

144 Luis Gonzaga Pérez Cordón Figura 5.8: Construión del perfil de usuario FP u pp 4 pp 3 pp 2 pp 1 Si estuviéramos operando on araterístias lingüístias, entones el operador de agregaión será el mismo que indiamos en la nota 5.2. Para alular los valores de ordenaión p j, utilizaremos la siguiente funión que alula el grado de dominania de ada alternativa, p j, sobre el resto de alternativas p j = 1 n 1 j =0 j =i (b ji ), donde b ji = D 1 (p ji ) y p ji es una 2-tupla lingüístia que representa la preferenia de la alternativa sobre la alternativa i. La alternativa más erana a las preferenias del usuario (la preferida) tendrá el valor más alto, la segunda más erana el segundo más alto y así suesivamente. El perfil final de usuario tendrá la siguiente forma: F P u = 1 fp,..., t fp. 142

145 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Filtrado de produtos Una vez que tenemos el perfil de usuario, F P u = 1 fp,..., t fp, hay que filtrar los produtos de la base de datos, para busar los produtos más eranos a las neesidades del usuario. La base de datos de produtos A = {a 1, a 2,, a m } ontiene todos los produtos donde ada a i es desrito por un onjunto de araterístias a i = { 1 i,, t i}. El proeso para enontrar el produto más similar al perfil de usuario onsiste en la omparaión de las desripiones de estos produtos on el perfil de usuario final. Para haerlo, el sistema alulará una valoraión que medirá la similitud entre un produto a i y el perfil del usuario. Nosotros proponemos el uso de una medida basada en el oseno de vetores [106, 190, 215]. Para llevar a abo este álulo, trataremos el perfil de usuario y las desripiones de los produtos omo vetores ompuestos por t araterístias definidas en un espaio t-dimensional. La funión de similitud basada en el oseno de dos vetores se define de la siguiente forma (ver figura 5.9): Figura 5.9: Similitud entre el perfil de usuario y un produto FP u Similarity(FP u,x i ) x i pp 1 143

146 Luis Gonzaga Pérez Cordón Definiión 5.4. La similitud entre el perfil de usuario, FP u, y el produto a i se obtiene omo: Similitud (F P u, a i ) = os F P u, a i = F P u a i F P u a i Nota 5.3. Si alguna de las araterístias esta evaluada mediante una esala lingüístia se operaría on otras medidas de similitud omo las presentadas en los modelos anteriores Reomendaión Finalmente, el sistema reomendará al usuario un onjunto de k produtos, A B = {a 1,, a k }, que verifia: 1. Si a i A B entones a i v A u. 2. Similitud (F P u, a i r ), a i v A u son los k produtos on los mayores valores de similaridad Ejemplo de apliaión del modelo RRPI A ontinuaión, apliaremos nuestro modelo a un problema donde un usuario desea obtener alguna reomendaión. De auerdo al esquema de funionamiento: 1. Creaión de la base de datos de produtos Nuestro sistema ha almaenado una base de produtos, A = {a 1, a 2,, a m } donde ada produto es desrito por un onjunto de araterístias valoradas en [0, 1] (ver tabla 5.9). Estas araterístias no son usualmente visibles para el usuario ya que son difíiles de entender. Aunque internamente el sistema las usará para alular las reomendaiones, lo que verá el usuarios será una desripión preisa, breve y fáil de entender sobre ellos. Por ejemplo, en este ejemplo reomendaremos CDs de músia (aunque podría ser apliado a otros produtos omplejos omo hoteles, restaurantes, et.). 144

147 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio A ontinuaión mostraremos los pasos que se tienen que seguir para obtener las reomendaiones. Tabla 5.9: Base de datos de produtos Desripión Produto Produto a Produto a Produto a Produto a Produto a Produto a Produto a Produto a Produto a Produto a m Obtenión del perfil de usuario Para obtenerlo, se realizarán las siguientes fases: a) Adquisiión de la informaión de preferenia del usuario El sistema mostrará el onjunto de los produtos más representativos del sistema A r = {a r 1, a r 2,..., a r m} (m [ m) y el usuario seleionará los uatro produtos más eranos a lo que el neesita (ver tabla 5.10). 145

148 a Q Luis Gonzaga Pérez Cordón Tabla 5.10: Ejemplos dados Desripión (oulta) CD ID Spirit Cry No Angel Produto ) Estableer los ejemplos favoritos y una relaión de preferenia inompleta sobre ellos. En este ejemplo, el usuario ha esogido los CDs, Spirit, 0304, Cry y No Angel omo ejemplo de sus neesidades. El usuario da sus preferenias sobre el onjunto de ejemplos dados. Para expresar la preferenia de la alternativa sobre la alternativa utilizamos la siguiente esala lingüístia: S = {s 0 = VL, s 1 = L, s 2 = I, s 3 = H, s 4 = VH} donde VL, L, I, H, VH representan Muy bajo, Bajo, Indiferente y Alto y Muy alto respetivamente. En nuestro aso, el usuario proporiona las preferenias del primer produtos sobre todos los demás. Expresa su opinión por medio de términos lingüístios que se transformarán en 2- tuplas y se obtendrá la siguiente matriz de preferenia: P = (s 2, 0) (s 0, 0) (s 1, 0) (s 3, 0) Q (s 2, 0) (s 2, 0) (s 2, 0) a 146

149 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 2) Rellenado automátio de la relaión de preferenia inompleta. El sistema rellenará la relaión de preferenia utilizando el algoritmo de rellenado de relaiones de preferenia on tendenia al valor de indiferenia y obtendremos la siguiente relaión de preferenia ompleta: P = (s 2, 0) (s 0, 0) (s 1, 0) (s 3, 0) Q (s 3, 0) (s 2, 0) (s 3, 0) (s 4, 0) (s 3, 0) (s 1, 0) (s 2, 0) (s 4, 0) (s 2, 0) (s 0, 0) (s 0, 0) (s 2, 0) a b) Construión de un perfil de usuario El objetivo de esta fase es obtener el perfil de usuario final. Para ello: 1) Construión de los perfiles de usuario pariales Lo primero que hay que haer es alular los vetores de pesos, W y W. Para obtener estos pesos, utilizaremos la fórmula que aparee en la seión on y. Dependiendo de las araterístias de ada problema, se podrá utilizar un valor de y distinto. El primer vetor es W = (0.67, 0.33, 0) y el segundo W = (0.5, 0.5, 0, 0). Con esos pesos y utilizando la relaión de preferenia que nos ha dado el usuario, obtendremos los perfiles pariales del usuario. Por ejemplo, para obtener el primer valor del perfil parial relaionado on el primer ejemplo tenemos que haer el siguiente álulo: 1 pp 1 = F W ( (s 3, 0), 1, (s 3, 0), 0.5, (s 2, 0), 0.1 ) = Q a Q 1 = (0.67, 0.33, 0) a = = 0.83 Los perfiles pariales que obtenemos se pueden ver en la tabla

150 Luis Gonzaga Pérez Cordón 148 Tabla 5.11: Perfiles pariales Desripión Perfil parial pp pp pp pp ) Obtenión del perfil de usuario A ontinuaión, se agregan los perfiles pariales utilizando el vetor de pesos W. Las variables de induión, (p 1, p 2, p 3, p 4 ), se obtienen a partir de la relaión de preferenia tal y omo se indió en la seión de la siguiente manera: p 1 = p 2 = p 3 = p 4 = n j =0 j =1 n j =0 j =2 n j =0 j =3 n j =0 j =4 b j 1 = 1 ( ) = b j 2 = 1 ( ) = b j 3 = 1 ( ) = b j 4 = 1 ( ) = Para alular el primer valor del perfil de usuario realizaremos los siguientes álulos: 1 fp = F W ( 2.54, 0.83, 0.33, 0.67, 1.61, 1, 3.39, 0.83 ) = Q = (0.5, 0.5, 0, 0) = a = = 0.83 Q a

151 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Después de alular todos los valores, obtendremos el perfil de usuario que se puede ver en la tabla Tabla 5.12: Perfil de usuario FP u Filtrado de produtos En esta fase, el modelo ompara el perfil de usuario on ada produto y reomienda aquellos produtos de la base de datos. Los resultados obtenidos se pueden ver en la tabla Reomendaión Tabla 5.13: Reomendaiones Produto similitud Produto x Produto x Produto x El sistema reomendará los k produtos más eranos al perfil de usuario de auerdo on las reglas introduidas en la seión (ver tabla 5.13). Si que k = 3, entones los produtos que el sistema reomienda son X B = {x 2, x 1, x 21 } Conlusiones En esta apítulo, hemos presentado dos modelos de sistemas de reomendaión basados en onoimiento el RML y el RPPI, uyos objetivos son: 1. Failitar el proeso de adquisiión de las preferenias del usuario. 2. Reduir la arga omputaional de los modelos. El primero de ellos, el RML, es un sistema de reomendaión basado en onoimiento, en el ual, el perfil de usuario se onstruye a partir de un produto elegido por el usuario omo ejemplo de sus neesidades. Este mo- 149

152 Luis Gonzaga Pérez Cordón delo de reomendaión explota la informaión disponible sobre el usuario empleando ténias de razonamiento basado en asos. Además, este modelo de reomendaión ofree un ontexto de trabajo más adeuado que los lásios debido a que maneja informaión lingüístia para modelar la informaión sobre los gustos, neesidades u opiniones de los usuarios. También permite que éstos se expresen on esalas lingüístias más adeuadas al grado de onoimiento que tengan sobre la araterístia. Además, emplea una medida de distania que mejora la preisión de los resultados y redue de forma signifiativa la arga omputaional de la fase de reomendaión, permitiendo que se puedan utilizar on base de datos de produtos de mayor tamaño on respeto al modelo presentado en el apítulo 4. La segunda propuesta, RRPI, presenta una serie de mejoras sobre el modelo anterior y sobre otros sistemas de reomendaión basados en onoimiento lásios. Primero, evita la neesidad de una fase de refinamiento del perfil de usuario. Esta fase suele ser muy difíil de diseñar, implementar y adaptar a los usuarios, pudiendo presentar limitaiones que den lugar a reomendaiones no satisfatorias. Pero quizás, la ventaja más importante que presenta, RRPI, es la de onstruir un perfil más preiso que en los modelos anteriores, sin que el usuario tenga que aportar muha más informaión o tenga que tener un grado de onoimiento elevado de los produtos, ya que, el perfil de usuario es onstruido a partir de varios ejemplos y de una relaión de preferenia inompleta sobre dihos ejemplos. A partir de esta informaión se onstruirá un perfil de usuario, sin que esté tenga la neesidad de refinarlo, y se generarán las reomendaiones. 150

153 CAPÍTULO 6. REJA. Sistema de reomendaión de restaurantes de Jaén En este apítulo, presentamos la implementaión de un sistema de reomendaión para restaurantes de la provinia de Jaén. Este sistema de reomendaión se ha implementado dentro del proyeto sistema de reomendaión de restaurantes basado en lógia difusa REJA (REstaurantes de JAén) de la Junta de Andaluía (JA031/06) y graias a la bea de la Consejería de Comerio, Turismo y Deporte de la Junta de Andaluía, publiada en la Resoluión del 21 de Marzo de 2006 y onedida en la Resoluión 16 de agosto El sistema que presentamos, es un sistema de reomendaión híbrido ompuesto de dos sistemas de reomendaión, uno olaborativo, y uno basado en onoimiento. El basado en onoimiento es una implementaión del modelo RRPI que vimos en el apítulo 5. Nuestro objetivo fue rear un sistema de reomendaión que se pudiera apliar en situaiones en donde a los usuarios le gustaría reibir reomendaiones, pero en donde, debido a las araterístias del problema, no se pueden apliar ténias lásias de reomendaión. Por ejemplo, es muy difiil de implementar sistemas de reomendaión de restaurantes, lugares turístios o sitios de oio...ya que, presentan problemas omo los que enumeramos a ontinuaión: 1. Muhos de los usuarios que interaionán on el sistema, son usuarios asuales que nuna han usado el sistema de reomendaión o que lo han usado de forma esporádia y no piensan utilizarlo de forma habitual. En el apítulo vimos que las ténias lásias de reomendaión sufren del problema del nuevo usuario y por lo tanto no son apaes de generar reomendaiones uando se enontraban en estas situaiones. 2. Un número importante de usuarios tendrá un onoimiento basado en expetativas sobre el serviio o produto que quieren reibir y es muy probable que no sepan expresar de forma lara y preisa las araterístias del tipo de restaurante que desean visitar. 3. Es habitual que en este tipo de situaiones, existan usuarios que quieran reibir reomendaiones puntuales que no tengan nada que ver on lo que han heho en el pasado. Por lo tanto, en estos asos, la informaión história no será relevante y no debería ser utilizada 151

154 Luis Gonzaga Pérez Cordón 152 en la generaión de reomendaiones. Por ejemplo, si un liente desea elebrar un umpleaños en un restaurante, es muy probable que sea un heho puntual y que no quiera que se use la informaión de los restaurantes que le han gustado en el pasado para generar estas reomendaiones. En este apítulo, presentamos el funionamiento de este sistema. En la seión 6.1 daremos una breve desripión de los sistemas de reomendaion que forman parte de REJA, en la seión 6.2 veremos el funionamiento del interfaz utilizado en REJA y por último las onlusiones Esquema de hibridaión En este sistema de reomendaión, se ha empleado la onmutaión omo meanismo de hibridaión [31]. Este tipo de sistemas híbridos implementan varias ténias de reomendaión, y dependiendo de la situaión en la que se enuentren, emplean una u otra para la generaión de reomendaiones. Este tipo de hibridaión presenta las siguientes ventajas: Es bastante fáil de implementar, ya que su funionamiento es simple, ya que según la situaión emplea una ténia u otra. Como las ténias de reomendaión son independientes unas de otras, no hay que alterarlas. Su implementaión es la misma que si se quisiera utilizar de forma independiente. Deidimos emplear este tipo de hibridaión, ya que, después de estudiar las distintas alternativas, nos pareió una ténia adeuada a nuestras neesidades y que podía ofreer buenos resultados. Para que un usuario pueda reibir alguna reomendaión, éste debe estar registrado en el sistema y se tiene que idenfiar en el sistema. Dependiendo de ómo desee reibir las reomendaiones, y de la informaión que aporte y quiere que se utilie, se seleionará una u otra ténia de reomendaión: Así, se empleará la ténia olaborativa, si el usuario desea que se busquen restaurantes, basándose en la informaión história que el sistema tiene sobre aquellos que el usuario ha visitado. Se empleará una búsqueda basada en onoimiento, si éste quiere que las reomendaiones se basen en un ejemplo de un restaurante al que querría ir y no, en la informaión história de diho usuario. Este sistema de reomendaión está basado en el modelo RRPI presentado apítulo 5. A ontinuaión, expliaremos los módulos que de los que se omponen esta hibridaión.

155 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Módulo olaborativo Este es el primer módulo de reomendaión que vamos a revisar en REJA. El funionamiento de este módulo es el siguiente (ver figura 6.1): 1. El sistema guarda un perfil de ada usuario on sus evaluaiones sobre los restaurantes. 2. Se mide el grado de similitud entre los distintos usuarios del sistema en base a sus perfiles y se rean grupos de usuarios on araterístias afines. 3. El sistema usará toda la informaión obtenida en las fases anteriores para realizar las reomendaiones. A ada usuario, le reomendará restaurantes que no haya evaluado y que lo hayan sido de manera positiva por el resto de miembros de su grupo. Como indiamos en el apítulo 2, este tipo de sistemas de reomendaión no tienen en uenta el ontenido y las araterístias de los restaurantes que reomiendan, sino que busan usuarios on gustos similares al usuario atual. Este módulo generará las reomendaiones de restaurantes reomendando aquellos restaurantes que el usuario no haya visto, pero que, le hayan gustado al grupo de usuarios que son afines a él. Figura 6.1: Esquema de funionamiento de un sistema de reomendaión olaborativo En REJA no se ha llegado a implementar ningún algoritmo de filtrado olaborativo, sino que se ha utilizado un motor de búsqueda olaborativa llamada CoFE ( que trabaja sobre los datos que se le han proporionado. Debido a que hay aesibles gran antidad de sistemas de reomendaión olaborativos en la literatura, y a que la implementaión realizada es una implementaión estándar basada en CoFE. No vamos a haer una presentaión en detalle del funio- 153

156 Luis Gonzaga Pérez Cordón namiento ya que puede enontrarse en el apítulo 2, donde vimos este tipo de sistemas de reomendaión en profundidad Módulo basado en onoimiento RRPI Este módulo está basado en el modelo de reomendaión RRPI presentado en el apítulo. Las fases de este modelo las podemos ver en la figura figura 6.2. La únia diferenia signifiativa, on respeto al modelo presentado en el apítulo, es que mientras en el modelo teório era el usuario el que esogía los uatro produtos ejemplo, en REJA el usuario esoge un restaurante que represente sus neesidades, y el sistema, esoge los otros tres. Estos tres restaurantes serán los dos últimos valorados por el usuario y uno que no se pareza al esogido por el usuario, pero bien onoido. Figura 6.2: Modelo RRPI en REJA 154

157 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 6.2. Apliaión REJA es un sitio web on informaión sobre restaurantes que además implementa un sistema de reomendaión para restaurantes de la provinia de Jaén. A ontinuaión, expliaremos brevemente el funionamiento de REJA. La primera vez que onetemos on el sitio web que mantiene REJA veremos una pantalla omo la que se puede ver en la figura 6.3. Figura 6.3: REJA. Pantalla de presentaión Para obtener informaión sobre un restaurante lo únio que tenemos haer es pulsar sobre la opión Restaurantes que aparee a la izquierda de la pantalla prinipal. Una vez pulsada apareerá una pantalla (ver figura 6.4) que nos permitir elegir los restaurantes de forma alfabétia o por tipo de estableimiento. Una vez esogida ualquiera de las dos opiones, elegiremos un restaurante y apareerá una pantalla on la informaión disponible sobre él (ver figura 6.5) 155

158 Luis Gonzaga Pérez Cordón Figura 6.4: REJA. Restaurantes Figura 6.5: REJA. Informaión sobre un restaurante 156

159 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Además, REJA también permite georefereniar ualquier restaurante (ver figura 6.6). Con está araterístia REJA nos ofree entre otras osas, la posibilidad de mostrar en un mapa la loalizaión de un restaurante, onoer otros lugares de interés eranos a él, o el álulo de que ruta se debe de seguir para llegar a él. Figura 6.6: REJA. Georefereniaión Como hemos expliado en este apítulo, REJA está ompuesto por dos módulos, en donde, se implementa dos modelos de reomendaión distintos, que serán utilizados mediante un meanismo de hibridaión por onmutaión. En las siguientes subseiones expliamos qué pasos seguimos para utilizar ada uno de los módulos. Módulo Colaborativo Para utilizar este módulo es neesario que el usuario este registrado en el sistema, se identifique, y debe de haber proporionado sufiiente informaión sobre los restaurantes que onoe, para que el módulo olaborativo pueda generar reomendaiones preisas. Para identifiarse tiene que introduir un nombre de usuario y una ontraseña en las ajas de texto que apareen a la dereha de la pantalla 157

160 Luis Gonzaga Pérez Cordón prinipal (figura 6.3). Este nombre de usuario y esta ontraseña tienen que haber sido suministrados por los administradores del sistema. Figura 6.7: REJA. Pantalla prinipal una vez identifiado Una vez identifiados apareerá una pantalla de bienvenida similar a la que vemos en la figura 6.7, en la ual podemos ver, que se le ofreen dos opiones: 1. Realizar una nueva puntuaión: en donde podremos proporionar más informaión sobre los restaurantes que ha visitado y que opinión tiene sobre ellos. 2. Obtener reomendaiones: en la ual reibiremos reomendaiones basadas en estas opiniones. Si pulsa sobre la primera opión, Realizar una nueva puntuaión podremos añadir una puntuaión sobre un restaurante en el que hemos estado (ver figura 6.8). Para ello, se seleionara el restaurante que queremos puntuar y luego le daremos la puntuaión que deseemos: MM: Muy Mal, M: Mal, R: Regular, B: Bueno, MB: Muy Bueno. Esta informaión será utilizada para el módulo olaborativo para la generaión de reomendaiones 158

161 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 6.8: REJA. Añadir puntuaiones Una vez introduida toda la informaión neesaria, desde esta pantalla de bienvenida, es posible reibir reomendaiones olaborativas pulsando sobre la opión Obtener reomendaiones y apareerá una pantalla similar a la que vemos en la figura 6.9. Figura 6.9: REJA. Reomendaiones módulo olaborativo Si se pulsa sobre una de las reomendaiones apareerá otro pantalla (ver figura 6.10) en donde podremos ver informaión sobre este restaurante y en donde además podremos puntuarlo. 159

162 Luis Gonzaga Pérez Cordón Figura 6.10: REJA. Reomendaión heha on el módulo olaborativo Además REJA ofree otra opión relaionada on el módulo olaborativo. La opión Mis puntuaiones, que podemos enontrar a la izquierda de la pantalla de bienvenida. Si pulsamos sobre ella, veremos el perfil de usuario utilizado por el módulo olaborativo, es deir, todas las puntuaiones que ha aportado el usuario sobre los restaurantes que onoe o ha visitado (ver figura 6.11). Figura 6.11: REJA. Perfil de usuario del módulo olaborativo 160

163 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Módulo RRPI Para reibir las reomendaión desde el módulo RRPI, desde la pantalla de bienvenida que aparee una vez el usuario se ha idenfiado, se pulsará sobre la opión, Reomendaiones, que se enuentra a la izquierda de la pantalla prinipal. Una vez heho ésto, veremos la primera pantalla del módulo RRPI (ver figura 6.12), en donde el usuario deberá elegir un restaurante pareido al que busa. Figura 6.12: REJA. Reomendaiones identifiado Una vez el usuario ha elegido este restaurante ejemplo, el sistema le ofreerá otros tres restaurantes que deberá omparar on el elegido (ver figura 6.14). Para ello, nos dirá la preferenia de este restaurante on los mostrados por el sistema utilizando la esala lingüístia. En esta esala tenemos los siguientes valores lingüístios: muho mejor, mejor, igual, peor y muho peor. En la figura 6.13 podemos ver en que fases del modelo de reomendaión nos enontramos. 161

164 Luis Gonzaga Pérez Cordón Figura 6.13: Modelo RRPI en REJA. El usuario da un ejemplo y una relaión de preferenia sobre diho ejemplo y otros tres restaurantes Figura 6.14: REJA. Aportando informaión de preferenia módulo RRPI A partir de esta informaión obtendrá una relaión de preferenia ompleta y posteriormente, el perfil de usuario (ver figura 6.15). 162

165 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figura 6.15: Modelo RRPI en REJA. Se obtiene el perfil de usuario Con este perfil generará las reomendaiones (ver figura 6.16) y devolverá informaión similar a lo que vemos en la figura Figura 6.16: Modelo RRPI en REJA. Reomendaión 163

166 Luis Gonzaga Pérez Cordón Figura 6.17: REJA. Reomendaiones obtenidas Como ourría en los anteriores módulos, si pulsa sobre el nombre del restaurante reomendado, el sistema mostrará la informaión que tenga sobre éste (ver figura 6.18). Figura 6.18: REJA. Informaión sobre un restaurante 164

167 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 6.3. Conlusiones En este apítulo, se ha presentado la implementaión de un sistema de reomendaión híbrido para restaurantes de la provinia de Jaén. Se ha empleado la hibridaión por onmutaión y los modelos de reomendaión que omponen este sistema se han dividido en dos módulos: 1. Un módulo olaborativo 2. Un módulo basado en onoimiento, que se basa en el modelo RRPI presentado en el apítulo 5. Al prinipio de esta memoria estableimos omo objetivo final el desarrollo de un prototipo para un sistema de reomendaión. En este apítulo hemos presentado diho prototipo de un sistema de reomendaión híbrido de restaurantes de la provinia de Jaén. Las prinipales aportaiones y araterístias del prototipo presentado será: Ofree una mayor flexibilidad que los sistemas lásios, ya que, permite a los usuarios que expresan sus preferenias mediante valoraiones lingüístias. Mejora los proesos de adquisiión de informaión para la onstruión de perfiles de usuario. El módulo basado en onoimiento partirá de una relaión de preferenia inompleta sobre un onjunto de restaurantes para onstruir el perfil de usuario, ya que ésta puede ser reonstruida mediante proesos automátios. Es apaz de realizar reomendaiones aún uando no existe la informaión história o ésta no se tiene que utilizar. Aunque el sistema inluye un módulo olaborativo, su uso no es ni obligatorio ni neesario para reibir reomendaiones. En el sistema se ha inluido un módulo basado en ontenido para generar reomendaiones uando no se quiera o no se pueda utilizar esta informaión história. Es un prototipo que genera reomendaiones en el setor turístio, failitando así, la propagaión de este tipo de herramientas en el mismo. Éstas se habían visto limitadas por diversas difiultades propias de las araterístias de los produtos del setor. 165

168

169 Conlusiones y trabajos futuros A ontinuaión revisaremos uales han sido las prinipales propuestas y los resultados obtenidos a lo largo de esta memoria. Posteriormente presentamos las líneas de investigaión y trabajos futuros que nos planteamos a partir de estos resultados. Propuestas y resultados obtenidos Los sistemas de reomendaión ofreen reomendaiones personalizadas a sus usuarios, haiendo que el proeso de ompra en e-shops sea más ameno, rápido y personal. El objetivo de estos sistemas, es ofreer a los usuarios los produtos que más les interese o que más se adeuen a sus gustos o preferenias. Para aprender los gustos o preferenias de los usuarios muhos de estos sistemas utilizan la informaión história del usuario, que produtos ha omprado o ha evaluado. Aunque este tipo de sistemas ha sido empleado en muhas situaiones on éxito, ya que, esta informaión estaba disponible, existen otras situaiones donde la informaión no está disponible o no es útil y, sin embargo, es deseable que se generen reomendaiones para los usuarios. Los objetivos que estableimos al prinipio esta investigaión fueron: Estudiar omo modelar la informaión en este tipo de problemas. Mejorar los proesos de reogida de informaión del usuario en sistemas de reomendaión. Diseñar modelos de sistemas de reomendaión que generen reomendaiones en situaiones en donde la informaión história no esta disponible, bien porque no exista, sea esasa, o no sea relevante. Implementar un prototipo de sistema de reomendaión que pueda ser apliado al setor turístio. Teniendo en uenta estos objetivos, hemos presentado tres propuestas de modelos de Sistemas de Reomendaión para alanzarlos: 1. Modelo basado en ontenido on informaión lingüístia multigranular: las araterístias fundamentales de este modelo son las siguientes: Trabaja on informaión lingüístia. El dominio lingüístio es más adeuado, ya que, estamos modelando informaión subjetiva, gustos o preferenias adquirida mediante perepiones, y por lo tanto, tienen asoiado un alto grado de inertidumbre. 167

170 Luis Gonzaga Pérez Cordón 168 Genera reomendaiones sin neesidad de informaión história. Este modelo de reomendaión permite a los usuarios que espeifiquen su perfil, por lo que ya no es neesario el uso de la informaión história sobre éste. Trabajan on informaión multigranular. Definimos un ontexto multigranular que permitiera, tanto a los usuarios normales del sistema, omo a los expertos que desriben los produtos, utilizar las esalas lingüístias más adeuados on respeto a las araterístias que están evaluando o al grado de onoimiento que tengan. 2. Modelos basados en onoimiento: este tipo de modelos fueron reados para utilizarse para generar reomendaiones uando no existe informaión história. En nuestra memoria hemos presentado los siguientes modelos basados en onoimiento: a) Modelo de reomendaión basado en onoimiento on informaión lingüístia multigranular (o RML): en este modelo, el perfil de usuario se genera a partir de un produto ejemplo de las neesidades de este dado por el usuario. Freuentemente, este ejemplo no representará de forma exata las neesidades del usuario, y se requerirá una fase de refinamiento. Las prinipales mejoras on respeto a los modelos lásios basados en onoimiento son: Trabaja on informaión lingüístia. Trabaja on informaión multigranular. Además, ofree algunas ventajas sobre el modelo basado en onoimiento presentado en esta memoria: Es más fáil de onstruir el perfil de usuario, éste es más ompleto y por lo tanto es de esperar que se obtengan mejores reomendaiones Los álulos para generar las reomendaiones son más efiientes, y por lo tanto, podemos manejar bases de datos de mayor tamaño y generar reomendaiones en tiempos reduidos. b) Modelo de reomendaión basado en onoimiento basado en relaiones de preferenia lingüístias (o RRPI): uno de los inonvenientes de los sistemas de reomendaión basados en onoimiento, es que el proeso de refinamiento del perfil de usuario puede ser largo y omplejo. Debido a que nuestros primeros estudios se entraron en el modelado de relaiones de preferenia y su reonstruión, enontramos que éstas podían ser útiles para me-

171 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio jorar el proeso de adquisiión de informaión en los sistemas de reomendaión, y propusimos su uso en el modelo RRPI, uyas prinipales mejoras son: No existe fase de refinamiento. El perfil de usuario se genera a partir de uatro ejemplos de las neesidades del usuario y una relaión de preferenia inompleta. Minimizamos la informaión neesaria para generar las reomendaiones: en situaiones reales, no podemos exigirle al usuario que proporione una relaión de preferenia ompleta, ya que, le debería dediar muho, y en la mayoría de los asos, esta sería la ausa de que desistiera de sus búsquedas. En este modelo, hemos inluido las herramientas matemátias neesarias para que los modelos sean apaes de reonstruirla a partir de la relaión preferenia inompleta proporioana por el usuario. Trabaja on informaión lingüístia. El modelo RRPI, fue utilizado para implementar un sistema de reomendaión híbrido para restaurantes de la provinia de Jaén, REJA. Y así, lo dotamos de la apaidad de generar reomendaiones en situaiones en los que los sistemas de reomendaión lásios no podían. En relaión a la difusión y publiaiones de los resultados de nuestra investigaión en este ampo, destaaremos las siguientes publiaiones: Luis Martínez, Luis G. Pérez y Manuel Barrano, A Multi-granular Linguisti Content Based Reommendation Model. International Journal of Intelligent Systems. 22:5, 2007 pp Luis Martínez, Luis G. Pérez, Manuel Barrano y Maarena Espinilla. A Knowledge Based Reommender System with Multigranular Linguisti Information. International Journal of Computational Intelligene Systems,1 (2), 2008, pp Luis Martínez, Luis G. Pérez, Manuel Barrano y Maarena Espinilla. Improving the Effetiveness of Knowledge Based Reommender Systems Using Inomplete Linguisti Preferene Relations. International Journal of Unertainty, Fuzziness and Knowledge-Based Systems (aeptado, en espera de la publiaión). Luis Martínez, Luis G. Pérez y Manuel Barrano. A Knowledge Reommender System based on Fuzzy Consistent Preferene Relations. En el libro: Intelligent Deision and Poliy Making Support Systems. 169

172 Luis Gonzaga Pérez Cordón Serie: Studies in Computational Intelligene, Vol Editores: Da Ruan, Frank Hardeman y Klaas van der Meer (Springer, 2008) Luis G. Pérez, Manuel J. Barrano y Luis Martínez. Exploiting Linguisti Preferene Relations in Knowledge Based Reommendation Systems. Eurofuse Jaén. España Luis G. Pérez, Manuel Barrano y Luis Martínez. Building User Profiles for Reommender Systems from inomplete preferene relations. FUZZ-IEEE 2007, IEEE International Conferene on Fuzzy Systems. Londres L. Martínez, M. Barrano, L. Pérez, M. Espinilla y F. Siles. A Knowledge Based Reommendation System with Multigranular Linguisti Information. En el 2007 International Conferene on Intelligent Systems and Knowledge Engineering (ISKE2007), Ot 15-16, 2007, Chengdu, China. Trabajos futuros Una vez obtenidos los resultados previos, en el futuro nos planteamos mejorar los mismos en las siguientes líneas de atuaión: 1. Mayor flexibilidad en el modelado de preferenias. Para ello, estudiaremos omo adaptar los modelos presentados en esta memoria, para que trabajen en ontexto on informaión heterogénea: numéria, intervalar y lingüístia. 2. Estudiar modelos de hibridaión más avanzados que el propuesto, on el objetivo de failitar la obtenión de reomendaiones. 3. Estudiar en mayor profundidad, el tratamiento de la informaión inompleta, para mejorar los proesos de adquisiión de informaión en los sistemas de reomendaión. 4. Avanzar en la implementaión de REJA, para obtener a partir del prototipo atual, un sistema de reomendaión ompletamente funional y de uso omerial. 170

173 Apéndie A. Noiones y oneptos básios de la teoría de onjuntos difusos En 1960, L.Zadeh propuso la teoría de onjuntos difusos [219] on el objetivo de resolver problemas en donde los enfoques lásios no podían apliarse, o no produían soluiones satisfatorias. En esta teoría, Zadeh generaliza la noión lásia de onjunto definiendo un nuevo tipo de onjunto, llamado onjunto difuso, uya frontera no es preisa. Los onjuntos difusos se definieron omo una nueva forma de representaión de la impreisión y la inertidumbre [108, 224], distinta al tratamiento que se había llevado hasta ese momento mediante la Teoría Clásia de Conjuntos y la Teoría de la Probabilidad. Dentro de la Teoría de Conjuntos Difusos podemos disernir dos vertientes prinipales [157]: 1. Una teoría matemátia formal [95, 147], ampliando oneptos e ideas de otras áreas de la matemátia omo el álgebra, la Teoría de Grafos, la Topología, et. 2. Y una potente herramienta para tratar situaiones del mundo real en las que aparee inertidumbre (impreisión, vaguedad, inonsistenia, et.), esta se adapta on failidad a diferentes ontextos y problemas en donde la inertidumbre juega un papel fundamental: teoría de sistemas [29, 156], teoría de la deisión [63, 58], bases de datos [25, 216], et. A.1. Conjuntos difusos y funión de pertenenia Usando la noión de onjunto lásia, podemos representar una agrupaión en oleiones de objetos que umplen unas determinadas araterístias. De esta forma, en un universo de disurso X, ada uno de elementos perteneientes a este universo se le asignará un valor del onjunto {0, 1} para indiar si pertenee o no a diho onjunto. Si un elemento umple todas propiedades para perteneer a diho onjunto, se le asignará el valor 1, si por el ontrario, no umple todas las propiedades, se le asignará el valor 0 para indiar de esta forma que no pertenee a diho onjunto. Definiión A.1. Sea A un onjunto en el universo X, la funión araterístia asoiada a A, A (x) X, se define omo: 171

174 Luis Gonzaga Pérez Cordón A (x) = * 1 si x A 0 si x v A La funión A : X {0, 1} indue una restriión, on un límite bien definido, sobre los objetos del universo X que pueden ser asignados al onjunto A. Zadeh generalizó está definiión permitiendo valores intermedios en la funión araterístia asoiada, denominándola a partir de ese momento funión de pertenenia. Graias a los onjuntos difusos, podemos manejar adeuadamente iertas ategorías de objetos del mundo real, que antes difíilmente se podían representar, pues éstas no tenían unos límites laros o bien definidos. Por ejemplo, si hablamos del onjunto de ordenadores potentes, produtos on buen sabor, ohes rápidos,... podemos enontrarnos objetos que laramente perteneen a dihos onjuntos, que sin lugar a dudas no perteneen a dihos onjuntos, pero también podemos enontrarnos on objetos que perteneen en mayor o menor medida. El grado de pertenenia de dihos objetos se puede expresar mediante un número real en el intervalo {0, 1}, uanto más erano a 1 sea el grado, mayor será el grado de pertenenia a diha ategoría y uanto más erano a 0 menor será. Definiión básia de onjunto difuso A partir del punto anterior, intuitivamente se puede afirmar, que un onjunto difuso es una oleión de objetos on valores de pertenenia entre 0 y 1. Los valores de pertenenia expresan los grados de pertenenia a diho onjunto, o lo que es lo mismo, on qué grado umplen las propiedades neesarias para perteneer a diho onjunto. Si este grado es 0, el objeto no perteneerá el onjunto (exlusión ompleta), y si por el ontrario es 1, umple ompletamente todas las propiedades neesarias para perteneer a diho onjunto (pertenenia ompleta). Formalmente podemos definir los onjuntos difusos de la siguiente forma [219]: Definiión A.2. Un onjunto difuso Ã sobre X está araterizado por una funión de pertenenia que transforma los elementos de un dominio, espaio, o universo del disurso X en el intervalo [0, 1]. n Ã : X [0, 1] Así, un onjunto difuso Ã en X puede representarse omo un onjunto de pares ordenados de un elemento genério x, x X y su grado de pertenenia n Ã (x): 172

175 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Ã = {(x, n Ã (x))/x X, n Ã (x) [o, 1]} Como podemos observar, un onjunto difuso es una generalizaión del onepto de onjunto lásio uya funión de pertenenia sólo tomaba dos valores, 0 si no perteneía a diho onjunto, 1 si perteneía. Ejemplo Supongamos que queremos modelar el onepto de persona joven on el objetivo de lasifiar un onjunto de personas uya edad osila entre 0 y 100 años. Una persona menor o igual a 30 años se onsiderará joven y, por lo tanto, se le asignar un valor 1 a su grado de pertenenia al onjunto difuso de personas jóvenes. Una persona on una edad igual o superior a 65 años no puede onsiderarse omo una persona joven y de ahí que se le asigne el valor 0 al grado de pertenenia al onjunto difuso de personas jóvenes. La uantifiaión del resto de valores puede llevarse a abo mediante una funión de pertenenia n J : E [0, 1] que arateriza el onjunto difuso de personas jóvenes en el universo E = [1, 100]. n J (x) * 1 1 x x [1, 30] x [30, 65] x [65, 100] Figura A.1: Funión Edad Los onjuntos difusos pueden ser definidos sobre universos disretos o ontinuos usando distintas notaiones. Si un universo X es disreto y finito, on ardinalidad n, el onjunto difuso puede expresarse on un vetor n dimensional uyos valores son los grados de pertenenia de los orrespondientes elementos de X. Por ejemplo, si X = {x 1,..., x n }, entones 173

176 Luis Gonzaga Pérez Cordón un onjunto difuso Ã = puede notarse por [108]: a i x i x i X, donde a i = n Ã (x i ), i = 1,..., n, Ã = a 1 x 1 + a 2 x a n x n = Cuando el universo X es ontinuo, para representar un onjunto difuso usamos la siguiente expresión: a Ã = x donde a = n Ã (x) y la integral debería ser interpretada de la misma forma que el sumatorio en el universo finito. A ontinuaión, introduimos otros oneptos básios a la hora de trabajar on onjuntos difusos, omo son el soporte, el núleo y el a orte de un onjunto difuso: Definiión A.3. El soporte de un onjunto difuso Ã, Soporte bãl, es el onjunto de todos los elementos de x X, tales que, el grado de pertenenia sea mayor que ero. x n i=1 a i x i Soporte bãl = {x X n Ã (x) > 0} Si esta definiión la apliamos solo a aquellos elementos del universo X on grado de pertenenia igual a 1, tendríamos el núleo del onjunto difuso. Definiión A.4. El núleo de un onjunto difuso Ã, Núleo bãl, es el onjunto de todos los elementos de x X, tales que el grado de pertenenia es igual a 1. Núleo bãl = {x X n Ã (x) = 1} A vees puede ser más interesante onoer el onjunto de aquellos elementos que perteneen a un onjunto on un grado menor, igual o mejor que un umbral determinado a que el grado al que pertenee un elemento a diho onjunto. Estos onjuntos se denominan a orte. Definiión A.5. Sea a orte un onjunto difuso sobre el universo X, dado un número a [0, 1]. Se define el a orte sobre Ã, a A, omo un onjunto que ontiene todos los valores del universo X uya funión de pertenenia en Ã sea mayor o igual al valor a: a A = {x X n Ã (x) m a} 174

177 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio A.2. Tipos de funiones de pertenenia En prinipio ualquier funión n Ã : X [0, 1], desribe una funión de pertenenia asoiada a un onjunto difuso Ã que depende no sólo del onepto que representa, sino también del ontexto en el que se usa. Sin embargo, existen un onjunto de familias de funiones, que son las que más omúnmente utilizadas. Para obtener una funión de pertenenia onreta solo tenemos que fijar los parámetros que definen la familia de una funión. A ontinuaión nombraremos las familias más utilizadas: 1. Funiones triangulares (ver figura A.2): n Ã (x) = * 0 x b 0 a a x b si x [ a si x [a, b] si x [b, ] si x m Figura A.2: Funión triangular 1 0 a b donde b es el punto modal de la funión triangular y a y los límites inferior y superior, respetivamente, para los valores no nulos de n Ã (x). 175

178 Luis Gonzaga Pérez Cordón 2. Funiones trapezoidales (ver figura A.3): 0 si x [ a n Ã (x) = * x b 1 a a si x [a, b] si x [b, d] 0 x d si x [d, ] si x m Figura A.3: Funión trapezoidal donde b y d indian el intervalo donde la funión de pertenenia vale Funiones Gaussianas (ver figura A.4): A (x) = e k(x m)2 1 Figura A.4: Funión gaussiana 0 176

179 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio donde k > 0. Prinipio de extensión El prinipio de extensión es un onepto básio de la Teoría de Conjuntos Difusos. Se utiliza para generalizar oneptos matemátios no difusos, tales omo las operaiones aritmétias habituales sobre números reales, a onjuntos difusos y ha sido formulado de diferentes formas a lo largo del tiempo [101, 108, 218]. A ontinuaión presentaremos la definiión más habitual del prinipio de extensión: Definiión A.6. Sea X el produto artesiano de los universos X 1,..., X r y sean Ã 1,..., Ã r, r onjuntos difusos en X 1,..., X r respetivamente. Sea f una funión definida desde el universo X, (X = X 1 %...% X r ), al universo Y, y = f (x 1,..., x r ). El prinipio de extensión nos permite definir un onjunto difuso B en Y, a partir de los onjuntos difusos Ã 1,..., Ã r representando su imagen a partir de la funión f, de auerdo a la siguiente expresión, donde B = {(y, µ B (y)) /y = f (x 1,,x r ), (x 1,,x r ) X} µ B (y) = * sup (x 1,...,x r ) f 1 (y) mín µã1 (x 1 ),..., µãr (x r ) si f 1 (y) = 4 0, en otro aso Para r = 1, el prinipio de extensión se redue a: donde B = f (A) = & y, µ B(y) /y = f (x), x X 0 sup x f µ B (y) = * 1 (y)µã (x), si f 1 (y) = 4 0, en otro aso A.3. Número difuso Existe un subonjunto de los onjuntos difusos y que ha sido espeialmente utilizado debido a las propiedades que umple. Estos onjuntos difusos son onoidos omo números difusos o intervalos difusos y se definen de la siguiente forma [218]: Definiión A.7. Un número difuso Ã es un subonjunto de R que verifia las siguientes propiedades: 177

180 Luis Gonzaga Pérez Cordón 1. La funión de pertenenia es onvexa, 6x, y R, 6z [0, 1], n Ã (z) m mín {{n Ã (z)}, {n Ã (y)}} 2. Para ualquier a (0, 1], a A debe ser un intervalo errado 3. El soporte de Ã debe ser finito. 4. está normalizado, sup µã (x) = 1 x Casos partiulares de números difusos [108]: Los números reales (ver figura A.5) Figura A.5: Número real 1 0 Intervalos de números reales (ver figura A.6) Figura A.6: Intervalo de números reales

181 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Valores aproximados (ver figura A.7) Figura A.7: Valores aproximados 1 0 Intervalos aproximados o difusos (ver figura A.8) Figura A.8: Intervalo aproximado

182

183 Apéndie B. Medidas de omparaión entre onjuntos difusos La omparaión de objetos ha sido una tarea muy habitual en muhos ampos, tales omo, la psiología, ienias físias, proesado de imágenes, lustering, y razonamiento dedutivo. Generalmente, estas omparaiones están basadas en medidas de diferenia y de similitud entre dos objetos. Las medidas de omparaión pueden tener ser expresadas mediante distintas funiones [51, 52, 225], dependiendo para qué, lo vayamos a utilizar. En la literatura podemos enontrar distintos tipos de medidas de omparaión (ver figura B.1) [27, 169]: Figura B.1: Medidas de omparaión Medidas de omparaión Medidas de similitud Medidas de disimilaridad Medidas de satisfaión Medidas de inlusión Medidas de semejanza 1. Medidas de satisfaión: estas medidas se utilizan en situaiones donde se parte de un objeto referenia o lase y queremos saber si un nuevo objeto es ompatible on él o lo satisfae. Esta situaión es típia en razonamiento basado en prototipos, donde las referenias son prototipos y un nuevo objeto debe ser asoiado on una de ellas [26]. 2. Medidas de semejanza: las medidas de semejanza son utilizadas para haer omparaiones entre desripiones de objetos, al mismo nivel de generalidad, y para deidir si entre ellos hay sufiientes araterístias omunes. Esta situaión ourre habitualmente en sistemas de razonamiento basados en asos. También es la base de la lógia de la similitud [54, 173]. 3. Medidas de inlusión: en este tipo de medidas también se onsidera un objeto de referenia, tal y omo, ourre en las medidas de satisfaión. Si embargo, en este tipo de medida, se busa determinar la importania de las araterístias omunes en A y en B on respeto al objeto A. Estas medidas pueden ser usadas en sistemas de gestión de bases de datos para deidir si una lase está inluida en alguna otra [151, 171]. 181

184 Luis Gonzaga Pérez Cordón 4. Medidas de disimilaridad: este tipo de medida no mide la similitud entre los objetos, sino la diferenias entre ellos. Esta medida esta basada en el onepto de distania entre dos onjuntos difusos [109, 143, 160]. Las tres primeras medidas son onoidas también omo medidas de similitud [27] (ver figura B.1). Por ejemplo, podríamos usar las medidas de similitud en razonamiento dedutivo para evaluar si una observaión satisfae una regla dada o, en razonamiento basado en asos, para medir la semejanza entre las araterístias de un aso onoido y uno nuevo. En el modelo presentado en el apítulo se utiliza una medidas de semejanza para omparar el perfil de usuario on la desripión de los objetos ambos representables mediante onjuntos difusos. En [52] se propuso una medida de semejanza simple de utilizar y que es la que utilizaremos en el modelo propuesto en el apítulo 4 para el álulo de la similitud entre dos onjuntos difusos: D (A, B) = sup mín (f A (x), f B (x)) x (B.1) Esta medida apliada a dos onjuntos difusos, A y B, obtiene una medida de uanto se paree un onjunto a otro, uanto mayor sea diho valor, más pareidos serán. 182

185 a Q Apéndie C. Rellenado relaiones de preferenia En este apéndie, veremos las propuestas más signifiativas en la literatura para resolver el problema del rellenado relaiones de preferenia lingüístias inompletas. Comentaremos, brevemente, su funionamiento y las prinipales ventajas e inonvenientes. Finalmente, mostraremos la alternativa para rellenar relaiones de preferenias, que hemos enontrado más adeuada, para el tipo de problemas en el que desarrollamos nuestro trabajo. En donde debería tener más relevania la informaión proporionada por el usuario, que la estimada por el algoritmo. Todos los algoritmos que expliaremos posteriormente partirán de una relaión de preferenias P. P = p 11 p 1n Q Æ Ø Æ p n1 p nn a donde p ij podrá ser un valor onoido o desonoido, y en donde p ii tendrá el valor que representa la indiferenia. C.1. Algoritmo de rellenado de relaiones de preferenia numérias en el intervalo [0, 1] Este algoritmo fue presentado en [88], y usa la transitividad aditiva para rellenar la relaión de preferenia de preferenia. Trabaja on matries de preferenias numérias en [0, 1]. El método propone rellenar una relaión de preferenia reíproa numéria definida en [0, 1] a partir de los n 1 valores onoidos {p 12, p 23,, p n 1n } de la relaión de preferenia inompleta P siguiendo los siguientes pasos: 1. Calula el onjunto de valores de preferenias B omo B = {p ij, i < j. p ij v {p 12, p 23,, p n 1n }}, p ij = j i + 1 p ii+1 p i+1i+2... p j 1j 2 2. a = mín {B 4 {p 12, p 23,, p n 1n }} 3. P = {p 12, p 23,, p n 1n } 4 B 4 {1 p 12, 1 p 23,, 1 p n 1n } 4 B 183

186 Luis Gonzaga Pérez Cordón 4. La relaión de preferenia onsistente P se obtiene omo P = f (P) tal que f : [ a, 1 + a] [1, 0] f (x) = x + a 1 + 2a Este modelo fue extendido a modelos de deisión multipliativos en [88]. Ejemplo Si partimos de la siguiente relaión de preferenia inompleta: Q a 0.5 Se realizan los siguientes álulos p 31 = 1.5 p 12 p 23 = = 0.3 p 41 = 2 p 12 p 23 p 34 = = 0.05 p 42 = 1.5 p 23 p 34 = = 0.1 p 21 = 1 p 12 = 0.45 p 13 = 1 p 31 = 0.7 p 14 = 1 p 41 = 0.95 p 32 = 1 p 23 = 0.35 p 24 = 1 p 42 = 0.9 p 43 = 1 p 34 = 0.25 y se obtienen: Q a Q a Q a 184

187 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Ventajas: Las prinipales ventajas de este modelo es que obtenemos una relaión de preferenia ompleta y onsistente. Aunque en el modelo iniial, aquí revisado, se parte de n 1 valores {p 12, p 23,, p n 1n }, en otros estudios posteriores y que presentaremos en las siguientes seiones se supera esta limitaión y se permiten utilizar otros n 1 valores diferentes de la diagonal prinipal pero en el que al menos debe de ompararse una de las alternativas una vez. Inonvenientes: La prinipal desventaja de este modelo es que puede requerir un paso, el número 4, para transformar los valores obtenidos por el algoritmo al intervalo [0, 1], ya que, en iertas ondiiones, los valores alulados pueden superar diho rango. Esto puede onllevar que se alteren los valores proporionados por el usuario, {p 12, p 23,, p n 1n }, los uales suponemos omo más importantes que los alulados por el algoritmo a la hora de representar las informaión de preferenia del usuario. Ejemplo Si partimos de la siguiente relaión de preferenia inompleta: Q a Se realizan los siguientes álulos p 31 = 1.5 p 12 p 23 = = 0.3 p 41 = 2 p 12 p 23 p 34 = = 0.2 p 42 = 1.5 p 23 p 34 = = 0.15 p 21 = 1 p 12 = 0.45 p 13 = 1 p 31 = 0.7 p 14 = 1 p 41 = 1.2 p 32 = 1 p 23 = 0.35 p 24 = 1 p 42 = 1.15 p 43 = 1 p 34 = 0 Q a 185

188 a Q Luis Gonzaga Pérez Cordón y se obtienen: Q a Como puede verse se han obtenido valores fuera del rango [0, 1] y por lo tanto tenemos que haer el paso 4 obteniendo: Q a Q a Puede omprobarse omo no mantiene los valores originales dados por el usuario o experto. C.2. Algoritmo de rellenado de preferenias lingüístias Este algoritmo fue presentado en [208]. Este modelo trabaja on una esala lingüístia, S = {s t,, s 0,, s t }, on ardinalidad impar en donde el término medio,, representa la indiferenia. Este algoritmo de reonstruión neesita expandir el dominio disreto de etiquetas a uno ontinuo S = {s a a [ t, t]} y definir una operaión de agregaión, /: Definiión C.1. Sea s a, s b S, la operaión / se define omo: s a / s b = máx {s t, {s a+b, s t }} Zeshui Xu utiliza la transtividad aditiva para araterizar la onsistenia en una relaión de preferenia y la define de la siguiente forma: Definiión C.2. [208] Sea P = (p ij ) n%n una relaión de preferenia lingüístia y ompleta, P es una relaión ompleta onsistente si umple: a ij = a ik / a kj 6i, j, k El algoritmo que emplea para la rellenado es el siguiente: 186

189 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 1. Sea X = {x 1, x 2,, x n } un onjunto disreto de alternativas. El experto debe proporiona n 1 omparaiones que no oinidan on la diagonal de la relaión de preferenia (i = j). Además, deben de umplir que al menos se debe de omparar ada una de las alternativas una vez. 2. Utilizar la transitividad aditiva definida omo a ij = a ik a kj para, a partir de los elementos onoidos de la relaión de preferenia, obtener los desonoidos 3. Fin Ejemplo Sea S = {s 2, s 1, s 0, s 1, s 2 } y la relaión de preferenia inompleta la siguiente: Q s 0 s 1 s 2 s 2 s 0 s0 a s 0 Si empleamos el algoritmo anterior tendremos que realizar las siguientes operaiones: p 2,1 = p 1,2 p 3,1 = p 1,3 p 4,1 = p 1,4 p 23 = p 21 / p 13 = s 1 / s 2 = s 1 p 24 = p 21 / p 14 = s 1 / s 2 = s 1 p 32 = p 31 / p 12 = s 2 / s 1 = s 1 p 34 = p 31 / p 14 = s 2 / s 2 = s 0 p 42 = p 41 / p 12 = s 2 / s 1 = s 1 p 43 = p 41 / p 13 = s 2 / s 2 = s 0 y obtendremos la siguiente relaión de preferenia: 187

190 a Q Luis Gonzaga Pérez Cordón Q s 0 s 1 s 2 s 2 s 1 s 0 s 1 s 1 s 2 s 1 s 0 s 0 s 2 s 1 s 0 s 0 a Ventajas: Este algoritmo presenta las siguientes ventajas: Mantiene las valoraiones proporionadas por el usuario. Los álulos son bastante senillos de implementar y llevar a abo. Inonvenientes: Este algoritmo presenta una serie de inonvenientes, tales omo: La relaión de preferenia resultante, no tiene porqué umplir la transitividad aditiva, aunque en su reonstruión nos hemos basado en ella. No se puede garantizar que se vaya a obtener una únia relaión de preferenia ompleta, ya que los valores de ésta dependen del orden en que se hayan rellenado los valores desonoidos. Aunque el modelo lingüístio usado para la reonstruión tiene ierto pareido al modelo de 2-tupla [81], adolee en la interpretaión de los valores. Así, mientras que en las 2-tuplas, el valor (s 2, 0.3) tiene una interpretaión lingüístia asoiada, el valor en esta representaión, es onsiderada omo una etiqueta virtual sin ningún signifiado o interpretaión. Los motivos de estos inonvenientes las enumeramos a ontinuaión: Si uno de los valores desonoidos supera los rangos de definiión del problema, éste es trunado por el límite superior o por el inferior. Como se puede ver este valor ya no umplirá la transitividad aditiva. No se desribe el algoritmo on una formulaión formal, por lo que no refleja ni soluiona las situaiones en donde, debido a que no se umple la transitividad aditiva, se pueden obtener distintos valores para un mismo valor desonoido. 188

191 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Ejemplo Sea S = {s 2, s 1, s 0, s 1, s 2 } y la relaión de preferenia inompleta la siguiente: Q s 0 s 1 s 1 s 2 s 0 s 0 a Si empleamos el algoritmo anterior: p 2,1 = p 1,2 = s 1 p 23 = p 21 / p 13 = s 1 / s 1 = s 2 p 24 = p 21 / p 14 = s 1 / s 2 = s 3 p 31 = p 13 = s 1 s0 p 32 = p 31 / p 12 = s 1 / s 1 = s 2 Si alulamos el valor de p 34 nos enontramos on que tenemos dos posibles alternativas para haerlo, y que en ambas alternativas, se obtienen valores distintos: p 34 = p 31 + p 14 = s 1 / s 2 = s 1 p 34 = p 32 + p 24 = s 2 / s 2 = s 0 C.3. Algoritmo de rellenado de relaiones de preferenias numérias, intervalares o lingüístias Este algoritmo presentado en [4], permite rellenar relaiones de preferenia tanto numérias omo intervalares y/o lingüístias. También utiliza la transitividad aditiva para diho ometido. El objetivo de este algoritmo es proporionar una soluión únia, on un alto grado de onsistenia, y que no altere la informaión proporionada por el usuario. En el aso lingüístio, para representar la informaión se utiliza la 2-tupla lingüístia y el algoritmo se podría esribir de la siguiente forma: 189

192 Luis Gonzaga Pérez Cordón 1. Iniializaión: P = D 1 (P) EMV 0 = 4 h = 1 2. mientras EMV h! 4{ 3. para ada (i, k) EMV h { 4. K = 4 5. Hik 1 = {j! i, k (i, j),(j, k) KV h}; si (H ik 1!4)entones K = K 4 {1} 6. H 2 ik = {j! i, k (i, k),(j, i) KV h }; si (H 2 ik!4)entones K = K 4 {2} 7. H 3 ik = {j! i, k (i, j),(k, j) KV h }; si (H 3 ik!4)entones K = K 4 {3} n j H l p jl ik ik #Hik l 8. Calular p ' ik = 1 f p # l 9. si p ik < 0 entones p ik = si p ik > 1 entones p ik = g 11. sino p ik = p ik 12. h } 14. P = D (p ) 190 Donde: KV h son los valores onoidos en la iteraión h UV h son los valores desonoidos en la iteraión h EMV h es el subonjunto de valores perdidos que pueden ser alulados en la iteraión h EMV h = {(i, k) UV h j Hik 1 4 H ik 2 4 Hik} 3 p j 1 ik = p ij + p _ g jk p j 2 ik = p _ jk p ji + _ p kj + p j 3 ik = p ij 2 g 2 g 2

193 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Ejemplo Sea S = {s 0, s 1, s 2, s 3, s 4 } la esala lingüístia que el experto puede utilizar, donde representa el valor indiferenia. Si el experto nos proporiona la siguiente relaión de preferenia: Q (s 2, 0) (s 1, 0) (s 2, 0) (s 2, 0) (s 3, 0) (s 2, 0) (s 1, 0) (s 3, 0) (s 3, 0) (s 2, 0) a Después de apliar el algoritmo anteriormente desrito obtendremos la siguiente matriz de preferenia: Ventajas: Q (s 2, 0) (s 1, 0.39) (s 1, 0) (s 0, 0) (s 4, 0.39) (s 2, 0) (s 3, 0.33) (s 2, 0) (s 3, 0) (s 2, 0.33) (s 2, 0) (s 1, 0) (s 4, 0) (s 3, 0) (s 3, 0) (s 2, 0) a Las ventajas que proporiona son las siguientes: Mantienen las valoraiones proporionadas por el experto. Presentan una versión del algoritmo para distintos dominios: numério, lingüístio e intervalar. Proporiona una soluión únia. Los autores presentarón en [4] omo alular el grado de onsistenia de la relaión de preferenia rellenada. Inonvenientes: También presenta una serie de inonvenientes: Es más omplejo que los anteriores, más difíil de utilizar y de implementar. Ignora valores obtenidos en la misma iteraión para el álulo del resto de valores de esa iteraión. Este inonveniente no se puede evitar, ya que si se tuvieran en uenta, se podrían obtener distintas Q a Q a 191

194 Luis Gonzaga Pérez Cordón relaiones de preferenia dependiendo del orden en el alularamos los valores desonoidos, y por lo tanto, no podríamos garantizar que siempre obtuvieramos una relaión únia. Ejemplo Supongamos que partimos de la siguiente matriz de preferenia: p 11 p 12 p 13 p Q 14 p 22 p 33 a Siguiendo este algoritmo en el paso 1 será EMV 1 = {(2,3), (3,2), (2,4), (4,2),(3,4),(4,3)} y para alular estos valores se tendrá que haer: p 23 se alulará a partir de p 13 y p 12 p 32 se alulará a partir de p 12 y p 13 p 24 se alulará a partir de p 14 y p 12 p 42 se alulará a partir de p 12 y p 14 p 34 se alulará a partir de p 14 y p 13. Sin embargo, en este álulo se están omitiendo los valores ya alulados en esta misma iteraión. Si se tuvieran en uenta p 34 se podría alular también a partir de p 32 y p 24, y también desde p 24 y p 23. p 43 se alulará a partir de p 13 y p 14. Sin embargo, en este álulo se están omitiendo los valores ya alulados en esta misma iteraión. Si se tuvieran en uenta p 43 se podría alular también a partir de p 42 y p 23, y también desde p 23 y p 24. C.4. Propuesta de algoritmo de rellenado de relaiones de preferenia inompletas on tendenia al valor de indiferenia En esta seión presentamos nuestra propuesta para ompletar relaiones de preferenia inompletas que utilizaremos en nuestro modelo de reomendaión RRPI. Diha propuesta trata de mejorar las desventajas que tienen los algoritmos alteriores. Los algoritmos anteriores parten de la hipótesis de que los seres humanos son onsistentes on respeto a la transitividad aditiva. Sin embargo, p 44 Q a 192

195 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio hay estudios que demuestran que la toma de deisiones está más relaionada on la parte emoional y por lo tanto no es totalmente raional [15, 96]. De aquí, se puede deduir que, la relaión de preferenia alulada mediante estos algoritmos no tiene porque oinidir on la que el usuario daría si tuviera el tiempo neesario o el sufiiente grado de onoimiento, ya que, estas preferenias no son totalmente raionales aunque si mantienen las tendenias de las preferenias. Nuestra propuesta para ompletar una relaión de preferenia inompleta parte de que no se puede predeir de forma exata, uál sería la preferenia de un usuario dada un par de alternativas, si él mismo puede no saberlo. Nuestro objetivo es presentar un algoritmo que tenga en uenta que la informaión aportada por el usuario es más relevante que la inferida, es deir, el onoimiento dado por el usuario es más importante que la estimaión inferida. Para reflejar esto, presentamos un algoritmo basado en [4] que en lugar de obtener los distintos valores para una preferenia mediante una media, lo que haemos es seleionar aquel valor que sea el más erano a la indiferenia. De esta forma damos menos importania a los valores estimados que a los proporionados por el usuario. En sistemas de reomendaión esta alternativa podría proporionar mejores resultados, a la hora de alular el perfil de usuario. El algoritmo, para el aso lingüístio, aquí omentado sería el siguiente: Sea P la relaión de preferenias lingüístia inompleta que queremos rellenar, P = p 11 p 1n Q Æ Ø Æ p n1 p nn a donde p ij podrá ser un valor onoido o desonoido, y en donde p ii tendrá la valoraión lingüístia que representa la indiferenia. Los pasos a seguir para rellenar la relaión de preferenia son los siguientes: 193

196 Luis Gonzaga Pérez Cordón 1. Iniializaión: P = D 1 (P) EMV 0 = 4 h = 1 2. mientras EMV h! 4{ 3. para ada (i, k) EMV h { 4. K = 4 5. Hik 1 = {j! i, k (i, j),(j, k) KV h}; si (H ik 1!4)entones K = K 4 {1} 6. H 2 ik = {j! i, k (i, k),(j, i) KV h }; si (H 2 ik!4)entones K = K 4 {2} 7. H 3 ik = {j! i, k (i, j),(k, j) KV h }; si (H 3 ik!4)entones K = K 4 {3} 8. Calular p ik = masceranoindiferenia (p jl ik, 6l K, 6j H l ik ) 9. h } 11. P = D (p ) Donde: KV h son los valores onoidos en la iteraión h UV h son los valores desonoidos en la iteraión h EMV h es el subonjunto de valores perdidos que pueden ser alulados en la iteraión h EMV h = {(i, k) UV h j Hik 1 4 H ik 2 4 Hik} 3 p j 1 ik = p ij + p _ g jk p j 2 ik = p _ jk p ji + _ p kj + p j 3 ik = p ij 2 g 2 g 2 masceranoindiferenia (p jl ik, 6l K, 6j H ik l ): esta funión devolverá, de todos los valores posibles de p jl ik, el más erano al valor de indiferenia. Ejemplo Supongamos que partimos de la siguiente matriz de preferenia: 194

197 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio P = Q (s 2, 0) (s 0, 0) (s 1, 0) (s 3, 0) (s 2, 0) (s 2, 0) (s 2, 0) a Si empleamos nuestro algoritmo tendremos que realizar las siguientes operaiones: p 23 = p 13 p = = 3; p 23 = 3 p 32 = p 12 p = 1; p 32 = 1 p 24 = p 14 p = = 5; p 24 = 4 p 42 = p 12 p = = 1; p 42 = 0 p 34 = p 14 p = = 4; p 34 = 4 p 43 = p 13 p = = 0; p 43 = 0 p 21 = masceranoindiferenia (p 23 p , p 24 p ) = = masceranoindiferenia ( , ) = = masceranoindiferenia (4, 3) = 3; p 21 = 3 p 31 = masceranoindiferenia (p 32 p , p 34 p ) = = masceranoindiferenia ( , ) = = masceranoindiferenia (3, 3) = 3; p 31 = 3 p 41 = masceranoindiferenia (p 42 p , p 43 p ) = = masceranoindiferenia ( , ) = = masceranoindiferenia (2, 1) = 2; p 41 = 2 Y obtendremos la siguiente relaión de preferenia: Q a Q P = a (s 2, 0) (s 0, 0) (s 1, 0) (s 3, 0) (s 3, 0) (s 2, 0) (s 3, 0) (s 4, 0) (s 3, 0) (s 1, 0) (s 2, 0) (s 4, 0) (s 2, 0) (s 0, 0) (s 0, 0) (s 2, 0) 195

198 Luis Gonzaga Pérez Cordón A ontinuaión enumeraremos las ventajas del algoritmo que aabamos de proponer en esta seión: Mantiene las valoraiones proporionadas por el experto. Proporiona una soluión únia. Tiene en uenta que la informaión aportada por el usuario es más importante que la inferida. 196

199 Apéndie D. English summary Here, we inlude a summary of this thesis, entitled Reommender System Models with Lak of Information. Appliations to the Tourism Setor, as partial fulfilment for the European Ph. D. In this summary, we will present several reommender models whose aims are to make reommendations when the historial information is not available or useful. First of all, our motivations and aims of this report are exposed. Seondly, eah model is presented with a summary, in whih we will introdue its main aims, features, advantages and disadvantages, and afterwards, it is attahed the doument where the model was presented. Thirdly, REJA, a reommender system software program is presented in setion D.8. Finally, the onlusions, our future works and researh are pointed out and ommented. D.I. Motivations In the beginning, my researh was foused on the topi of preferene modelling and deision making. Speifially, I studied the use of inomplete preferene relations, filling methods to omplete them, properties of preferene relations, et. Meanwhile, I was also looking for what fields would be useful for these studies and we stared at Internet. Internet has aused important hanges in our soiety. It offers free on-line aess to enylopedia, any kind of ditionary, piees of news from anywhere in the world, thousands of produts or different servies. There are an endless number of possibilities we an do or buy by using Internet. The most important limitation users have, when they surf internet, is the time they an spend searhing for what they need or they like. This limitation has been an important drawbak in some environments. In Internet, we an find many servies or business models that, in the beginning, they have been expeted to be overwhelmingly suessful, but, atually, they suffered from important eonomi losses, some of them went bankrupt, or fired the staff. One of the most affeted fields was the e-ommere, whih was expeted to be very suessful but, however, it just met the lowest suess expetations. The e-ommere ompanies offered, in their e-shops, a wide range of produts with the aim of satisfying hundreds or even thousands of lients individually. At first, this was an important advantage for ustomers sine, they have a more variety of produts and more information without needing 197

200 Luis Gonzaga Pérez Cordón to go out and go to a retail shop. However, this wide range of produts, instead of being an advantage, it was a disadvantage. When users visited a e-shop and ommitted their neessities trough a query, these e-shops gave bak thousands of produts related to that query. Nevertheless, not all of them were useful for the ustomers, and among the produts that ould satisfy their neessities, only a few of them met ustomers needs. Finding these produts it was a time-onsuming and boring task. Then, many users gave their searhes up and preferred go shopping to retail shops where they were easy guided by shop assistants in order to find appropriate produts, even though, the quality of the produts ould be worse or had a lesser variety of produts. To address these problems, some tools were developed in the e- ommere field. The most suessful ones have been the reommender systems [30, 31, 41, 113, 166, 179, 192]. These systems assist ustomers in their searh proesses in the e-shops. There is not a unique reommender model, but a family of them that shares the same aim, to lead the users to interesting produts, and the same working struture: 1. Reommender systems use bakground data to make the reommendations. 2. Customers provide information about their neessities and/or tastes. 3. An algorithm ombines the bakground data and information provided by the users to order to generate reommendations. However, the use of reommender systems presents some drawbaks: 1. The use of preise sales: many reommender systems fore their ustomers to use preise sale, usually numbers. Although these sales make easier the management of the data, sine it is represented in the same domain as the domain used internally by the reommender system, this domain is more diffiult to be used by human beings, beause the information is usually related to pereptions, tastes or opinions. 2. An unique sale is used: these systems use a unique sale without taking into aount what they are evaluating, or the experts degree of knowledge. Most of reommender systems internal operations are designed to deal with data expressed in an unique domain. Even though, the data has been provided by ustomers or experts and they might have different degree of knowledge about them. 3. Historial information: the reommendations are usually based on historial information about the user past ations, opinions, or 198

201 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio purhases. If these systems deal with new users, they do not have any information about them, and they are then unable to generate any reommendation. 4. Dependent on the database density: the density of the database is hightly related to the quality of the reommendations. Many systems enourage their users to provide more information about their tastes, or neessities. However, in some ases, this is impossible or not advisable beause of the nature of the problem, or beause it is not expeted that user interats with the system again. Our aim in this researh report is to propose new reommendations models to address or smooth out the previous problems. We then expet these new models would be useful in a wide range of situations. For example, within tourist setor, reommending items suh as restaurants, hotels, monuments, and seni plaes an be a very diffiult task for lassi reommender models as: 1. There is no historial information. 2. Users annot spend enough time to provide the information needed to make the reommendations sine most of these models required muh information. Eventually, we will implement a hybrid reommender system, that inludes some of the models presented in this summary, to make reommendations about restaurants in the provine of Jaén. D.2. Aims The main aims of this report are the following ones: To study how to model the information in this kind of problems. We want to know whih strutures and domains an be used and whih ones are the most suitable. Due to the fat that the information we are going to deal with, is subjetive and unertain sine is related to users opinions, tastes and pereptions. To improve the users information gathering proess in reommender system in order to define the users profiles. We want users to be required the least quantity of information to let the system define their user profile. To do so, we will use inomplete preferene relations. To design reommender system models that are able to make reommendations in situations where there is no historial information 199

202 Luis Gonzaga Pérez Cordón about their past opinions, rates, or purhases, or the historial information is sare. To implement a prototype of a reommender system that an be used in the touristi setor. Our aim is to implement a software that uses both lassi reommender system models and the models proposed in this report. D.3. Struture of this report This report is struture in the following setions: In setion D.4, reommender systems are reviewed briefly, sine in the sientifi douments attahed in this summary explain them in detail. In setion D.5, the tools we have used to model and manage the information provided by the user are enumerated. These tools are explained in depth within the douments where the models were presented. In setion D.6, a ontent based reommendation model adapted to situations where there is no historial information is presented. This model is defined in a multigranular linguisti ontext in order to model the information, both the user preferenes and the desriptions of the items. In setion D.7, two knowledge based reommendation models are presented. The first one is also defined in a multigranular linguisti ontext to model the information and improve the previous model as it an be applied to a greater number of produts. The seond one, to improve the user preferene gathering proess with the aim of building better user profiles. To do so, we propose the use of linguisti preferene relations. In setion D.8, an implementation of a reommender system applied to the touristi setor is presented. Speifially, this reommender system is designed to make reommendations of restaurants in the provine of Jaén. Finally, we will point out the most important onlusions obtained in this report. Moreover, we will desribe our future works and researhs, and lastly, we have gathered the most outstanding bibliography related to the topi of this report. 200

203 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio D.4. Reommender Systems This setion is a brief summary of the full hapter presented in the hapter of the Spanish version of this report. Throughout the hapter, reommender systems are defined, a lassifiation is given and some ommerial examples are explained. Reommender systems are a kind of software whose aim is to assist ustomers with their shopping searhes by leading them to interesting items by means of reommendations. Before the development of reommender systems, users usually had to hoose from the first subset of items that ould partially fulfil their needs or give their searhers up, beause, unfortunately, they are unable to explore the entire range of items in the e-shop. This problem aused important looses in the e-ommere ompanies what lead them to develope tools to assist users in their purhase proesses. The most important key issues in the development and suess of e-ommere [180], were the reommender systems. Reommender system are lassified in six ategories: Demographi Reommender Systems [148, 155]: these systems ategorize their users into demographi groups, and make reommendations to a speifi user aording to the information about the people who belong to the same demographi group. Content-based Reommender Systems [7, 17, 116, 128, 146, 148, 126, 154, 183]: a ontent-based reommender system learns a user profile based on the features of the items that the user has liked and, it uses this profile to find out similar items that the user ould like. Collaborative Filtering Reommender Systems [19, 28, 41, 59, 64, 67, 72, 92, 159, 165, 176, 185, 182]: they use users ratings to filter and reommend items to a speifi user. In the simplest ase, these systems predit the users preferenes as a weighted aggregation of the other users preferenes. Knowledge Based Reommender Systems [30, 32, 201]: these systems use the knowledge about users neessities and how an item mathes these neessities to infer reommendations about whih items fulfil the user s expetations. Utility Based Reommender Systems [31]: they make reommendations by omputing a utility value for eah objet. 201

204 Luis Gonzaga Pérez Cordón Hybrid Reommender Systems [13, 30, 40, 155]: these systems arose with the aim of addressing several drawbaks presented in the previous ones. To aomplish this aim, they ombine different tehniques to improve the auray of the reommendations. Trought the hapter, the ontent-based, the knowledge based and the ollaborative filtering reommender systems are explained in depth, sine the models presented in the thesis used them. In this summary, the Content-based reommender system model is presented in setion D.6, two Knowledge based reommender system models in setion D.7, and, an implementation of an hybrid reommender system, omposed of a ollaborative filtering and knowledge based reommender system, is presented in setion D.8 and a further detail about them are presented in suh setions. D.5. Information modeling in reommender system Throughout the hapter of the Spanish version of this report, it was reviewed the linguisti bakground and preferene strutures used in the models presented in the report. As I have aforementioned, one of our aims is to improve the preferene modeling of the information involved in the reommender systems. To do so, the hapter reviewed the Fuzzy Linguisti Approah [218], sine it is used to model the information provided by the users. This information is usually vague and impreise as it is related to human pereptions, opinions, tastes, et. It was also reviewed the strutures used to model the users information. Although the most ommon struture to model the user information is a utility vetor[49, 127, 189], in the hapter, the preferene relations [56, 79, 84, 103, 104, 206] are explained in depth sine one of our models uses them to make the reommendations. We also foused on how to deal with multigranular linguisti ontexts [76, 97] beause, both the ontent based reommender model, presented in setion D.6, and the first knowledge based reommender model, presented in setion D.7, are defined in suh a type of ontext. Moreover, it is given a brief explanation of the 2-tuples linguisti representation model [81] sine it is used in the multigranular ontext and in the last of our model, in the knowledge based reommender Systems that uses Inomplete Linguisti Preferene Relations to make reommendations. 202

205 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio All these onepts, tools and models are explained within the attahed douments in setions D.6 and D.7. D.6. A Multi-granular Linguisti Content Based Reommender Model Content-based reommender model bases their reommendation on historial information about the user past purhase, their rates, tastes and/or opinions. They define the user profile gathering the main features or the items the user has bought or liked, and look for other items with similar features (see figure D.1). Although, these models has been used suessfully in a wide range of problems, they present some drawbaks that made them unsuitable in some situations: They are unable to provide reommendations if there is no historial information about the user. All the reommendations are related to the users past ations. This means that this kind of reommendation systems for examples does not adapt their reommendations if the users hange their tastes quikly either if they want to reeive reommendations for a partiular reason not related to their past. In order to smooth out these problems we developed a ontent-based reommendation model (see figure D.2) whose aims are the followings: To be able to make reommendation without needing historial information about the user. To offer the users a linguisti environment where they are able to express their neessities or taste easily but without lost of auray. Therefore, we deided let users define their own user profile. When a user expresses their neessities, they usually provide the features they would like to find in the items they would like to buy. These features are usually related to tastes, opinions and/or gathered through pereptions. However, lassial reommender systems fore their users to provide this information by using preise information, i.e., numbers as the domain used internally by the reommender system. We think that this domain is not the most suitable in the real world sine this information is usually expressed by words, and not with number. For this reason, we proposed that this model will deal with linguisti information instead of numerial one. However, the use of a multigranular ontext is even better beause of the following reasons: 203

206 Luis Gonzaga Pérez Cordón Figure D.1: Content based reommender system 204

207 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figure D.2: Content based reommender system without using historial information 205

208 Luis Gonzaga Pérez Cordón 206 The model is dealing with two kinds of users with different degree of knowledge: on the one hand, ustomers who wants to buy items, and on the other hands, experts who have desribed all the items. Eah feature ould have a different nature, for example, it ould be gathered by the different senses, and, eah sense has a different meaning. A detailed desription of this model is attahed following, by means of the paper published in the International Journal of Intelligent System (22:5) that introdues the ontext and bakground neessary to understand the proposed model and finally suh a model is desribed in detail. A Multi-granular Linguisti Content-Based Reommendation Model L. Martínez, L.G. Pérez, M. Barrano Dept. Of Computer Sienes, University of Jaén,23071, Jaén, Spain Abstrat The massive use of Internet has developed new types of servies in different areas as business, ommere, eduation, administration, et. A really important and promising or these topis is the eommere. In this paper, we fous on the area of the B2C in whih the development of intelligene e-servies plays a key role to be suessful in this new market. One of the most studied servies in this area are the Reommendation Systems, that try to help the users to find out the most suitable produts they are looking for among a vast quantity of information that there exist in Internet or in a website. There are different types of reommendation systems: (i) Based on ontent, (ii) Collaborative and (iii) Hybrid. These systems deal with information provided by the ustomers regarding the features they wish, in order to reah the most suitable produt for them. This information is related to the human pereption beause it expresses the neessities, preferenes, taste, et., of the ustomers, i.e., usually it is qualitative in nature, however urrent reommendation systems fore the ustomers to provide their preferenes using a predefined numerial sale, it seems not very suitable due to the unertainty that involves this type of information. We propose in this paper a based-ontent reommendation model to deal with qualitative information by means of the fuzzy linguisti approah beause it is more suitable to model qualitative aspets. This modelwill allow to the ustomers not only to provide their preferenes in a linguisti way but also theyould assess their preferenes in different

209 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio sales, i.e., different linguisti term sets. Beause different ustomers an have different pereptions about their own preferenes or taste. Hene, our proposal onsists of offering a multi-granular linguisti ontext to the ustomers instead of foring all of them to provide their preferenes in the same sale. One the ustomers have provided their profiles, these will be mathed with the produts features in whih the ustomers are interested and aording to the resemblane obtained, the reommendation model will hoose the most suitable produts for eah ustomer. Keywords: e-ommere, e-servies, reommendation systems, fuzzy linguisti approah, fuzzy rankings, deision-making 1. Introdution Almost all the areas related to the human beings has been interfered by Internet in the last years, this has implied the appearane of new market nihes, servies, and muh information available for the users. This explosive growth has produed that one of the main problems users fae navigating in Internet is the vast quantity of information they find, being most of it useless for their aims. Due to this fat, different e-servies have risen to help the internet users to reah easy and quikly their neessities, suh servies, an help them to obtain some information or to find out a produt they are searhing and so forth. In this paper, we fous on the reommendation systems that help the users to find out the most suitable produts aording to their preferenes, neessities or taste, hiding or removing the useless information there are in the websites. Companies suh as google, amazon or Los Angeles Times use reommendation systems to assist users in their searhes. The reommendation systems are a lass of software [Kau98, Res97] that has emerged in the last years as an e-servie within the domain of the E-Commere [Sh01]. The purpose of these systems is to reommend the most suitable items, from a set of them aording to the user s desires. Traditionally, these systems have fallen in three main ategories: (i) Collaborative filtering systems [Gol92, Kon97, Per99, Sha95]. (ii) Content-based filtering systems [Lie95, Paz96, Jen92] and Hybrid ontent-based and ollaborative reommendation systems [Bas98, Pop01, Vie04]. These systems gather preferene information from the ustomers, experts, et., rank the items, and make a deision about what items are the most attrative to the users. From this viewpoint, the final reommendation ould be seen as a deision making proess, suh that, it makes a reommendation about whih item(s) are the most preferred for the user. This deision 207

210 Luis Gonzaga Pérez Cordón is made taking into aount the preferenes and opinions gathered by the Reommendation Systems from different types of information soures [Ans00,Bre98]. These information soures provide their preferenes, soure profile, to the Reommendation System as opinions about their neessities regarding the items they are searhing, aording to their own pereptions. This type of information is subjetive beause it is related to the soures own pereptions and usually involves unertainty. So, the information provided by these soures is usually vague, inomplete and not preise. However, most of reommendation systems fore the soures to express their preferenes using just one numerial sale [Hay01]. This fat implies a lak of expressiveness for the soures and bounds to a lak of preision in the reommendations made by the systems. Despite there are different types of reommendation systems as we have aforementioned, we fous on ontent-based reommendation models that filter and reommend items aording to a mathing proess between the ustomers profiles and the desription of the items in its database in order to hoose those one(s) pretty similar to the ustomer s preferenes. In this paper, we propose a new model to improve the effetiveness of the reommendations given by the ontent based Reommendation Models. It onsists of offering a multi-granular linguisti ontext [Her00] to model the user preferenes as the item features. Therefore, the users ould express their preferene information using linguisti assessments instead of numerial ones, due to the fat that linguisti information is more suitable than numerial to assess qualitative information [Zad75] (human pereptions, taste, neessities). In addition, eah user an hoose their own linguisti term set to provide their preferene information aording to their knowledge about the produts. Also in the item database the item features provided by experts will be assessed by means of linguisti labels that ould be assessed in different linguisti term sets. To deal with the multi-granular linguisti information in our reommendation model we shall use the fuzzy linguisti approah [Zad75] to model the input information and fuzzy tools, suh as, fuzzy measures of omparison [Bou95, Bou96] to evaluate the resemblane of the produts with the ustomers profiles and rank them. Our proposal for a multi-granular linguisti ontent-based reommendation model will at aording to the followings steps (graphially, see Fig.1): Aquisition of the user profile and the item features: the user profile is an information struture to gather the information provided by the user about his/her neessities, tastes, interesting areas, et. and the

211 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio item features are the harateristis of the items to be reommended stored in a database that are provided by experts. In this model so the ustomers as the experts will provide their information by means of linguisti information and depending on the aspet they are assessing they an use linguisti assessments belonging to different linguisti term sets. 2. Mathing items for the user: to find out the most interesting items for the ustomers, the model ompares eah item in its item database with the ustomer neessities (profiles) by means of fuzzy measurements of omparison. 3. Making a Reommendation: the model will rank the items aording to its similarity with the ustomer profile, suh that, those items top ranked will be reommended to the ustomer. Fig. 1: A Multi-Granular Linguisti Content-Based Reommendation Model This paper is strutured as follows. In the Setion 2 we shall make brief review of the fuzzy linguisti approah and different reommendation models. In the Setion 3 we present our multigranular based ontent reommendation model, and in the Setion 4, we shall show the working of this model with a simple example. The paper is onluded in the Setion Preliminaries In this setion we shall review some ore onepts about the fuzzy linguisti approah and also review the different types of reommendation models we an find in the literature. 209

212 Luis Gonzaga Pérez Cordón Fuzzy Linguisti Approah Usually, we work in a quantitative setting, where the information is expressed by means of numerial values. However, many aspets of different ativities in the real world annot be assessed in a quantitative form, but rather in a qualitative one, i.e., with vague or impreise knowledge. In suh a ase, a better approah may be to use linguisti assessments instead of numerial values. The fuzzy linguisti approah represents qualitative aspets as linguisti values by means of linguisti variables [Zad75]. This approah is adequate in some situations, suh as, when attempting to qualify phenomena related to human pereption, we are often led to use words in natural language. The fuzzy linguisti approah has been suessfully applied to different problems [Bor93,Del92,Her95,Ya95]. We have to hoose the appropriate linguisti desriptors for the term set and their semantis. In order to aomplish this objetive, an important aspet to analyse is the granularity of unertainty, i.e., the level of disrimination among different ounts of unertainty. Therefore, aording to the soure of information knowledge it an hoose different ounts of unertainty. The universe of the disourse over whih the term set is defined an be arbitrary, linguisti term sets are usually defined in the interval [0,1]. In [Bon86] the use of term sets with an odd ardinal was studied, representing the mid term by an assessment of approximately 0.5, with the rest of the terms being plaed symmetrially around it and with typial values of ardinality, suh as 7 or 9. In this paper, we shall deal with soures of information with different degrees of knowledge, so eah one ould use different linguisti term sets with different granularity. We all this type of ontext multi-granular linguisti ontexts [Her00]. One possibility of generating the linguisti term set onsists of diretly supplying the term set by onsidering all terms distributed on a sale on whih a total order is defined [Her95,Yag95]. For example, a set of seven terms S, ould be given as follows: S ={s 0 = None; s 1 = Very Low; s 2 = Low; s 3 = Medium; s 4 = High; s 5 = Very High; s 6 = Perfet} In these ases, it is usually required that there exist: A negation operator Neg(s i ) = s j suh that j = g-i (g+1 is the ardinality). A minimization and a maximization operator in the linguisti term set: s i <= s j i<= j. The semantis of the terms are given by fuzzy numbers defined in the [0,1] interval, whih are desribed by membership funtions. A way to

213 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio haraterize a fuzzy number is to use a representation based on parameters of its membership funtion [Bon86]. Sine the linguisti assessments given by the users are just approximate ones, some authors onsider that linear trapezoidal membership funtions are good enough to apture the vagueness of those linguisti assessments, sine it may be impossible and unneessary to obtain more aurate values [Del92]. This parametri representation is ahieved by the 4-tuple (a, b, d, ), where b and d indiate the interval in whih the membership value is 1, with a and indiating the left and right limits of the definition domain of the trapezoidal membership funtion [Bon86]. A partiular ase of this type of representation are the linguisti assessments whose membership funtions are triangular, i.e., b = d, so we represent this type of membership funtion by a 3-tuple (a; b; ). For example, we may assign the following semantis to the set of seven terms (see Fig. 2). Fig. 2: A linguisti term set of seven terms and its semantis Other authors use a non-trapezoidal representation, e.g., Gaussian funtions [Bor93]. 2.2 Reommendation Systems The urrent reommendation systems an be lassified attending to the proess and the soure of information that are used to ahieve the reommendations. In [Ans00] we an see that the information used by the reommendation systems may be provided from different soures and there exist, at least, these five types of information soures: a) A person s expressed preferenes or hoies among alternative produts. b) Preferenes for produt attributes. ) Other people s preferenes or hoies. d) Expert judgments. e) Individual harateristis that may predit preferenes. 211

214 Luis Gonzaga Pérez Cordón So depending on whih soures and how the reommendation system deals with the information gathered in order to produe a reommendation ould be distinguished three main lasses of reommendation systems: Collaborative filtering systems: [Gol92,Kon97,Per99,Sha95] use expliit and impliit preferenes from many users to filter and reommend objets to a given user, ignoring the representation of the objets. In the simplest ase, these systems predit a person s preferene as a weighted sum of other people s preferenes, in whih the weights are proportional to orrelations over a ommon set of items evaluated by two people. Collaborative filtering algorithms were first introdued by Golberg and olleagues (Goldberg et al. 1992). They are used by Los Angeles Times, London Times, CRAYON, and Tango to ustomize online newspaper; by Bostondine to reommend restaurant in and around Boston; by Sepia Video Guide to make ustomized video reommendations; by Movie Criti, Moviefinder and Morse to reommend movies; and by barnesandnoble.om to reommend books. 2. Content-based filtering systems: [Lie95,Paz96,Jen92] filter and reommend the items by mathing user query terms with the index term used in the representation of the items, ignoring data from other users. There are some ommerial systems has been offered by PersonalLogi, Fritionless Commere, and Ative Researh that use self-expliated importane ratings and/or attribute trade-offs to make their reommendations. 3. Hybrid ontent-based and ollaborative reommendation systems: [Bas98,Pop01,Vie04] this new lass has emerged between the ontent-based and ollaborative reommendation systems and its aim is to smooth out the disadvantages of eah one of them. A usual way to hybrid both lasses is to make a two level filter algorithm, where we use first one of the algorithm (the ontent-based filtering algorithm) to obtain the first set of items and afterwards, we use the seond algorithm (the ollaborative filtering algorithm) to filter and reommend items from this set. Appliations of hybridbased reommendation systems on the Web inlude searh tools suh as Google ( and Inquirus 2 (inquirus.nj.ne. om/i2/inq2.pl) that ombines results of both ontent searhes and ollaborative reommendations. However, these systems are more omplex and have got new design problems to resolve in order to handle effiiently all the information available. In this paper we fous on ontent based reommendation models.

215 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 3. A Multi-granular linguisti Content Based Reommendation model Here, we present our proposal for a multi-granular linguisti ontent based reommendation model. Therefore, in order to make a reommendation for a user, it will just onsider information from the ustomer and the objets in its item database, ignoring information from other users: A person s expressed preferenes or hoies among alternative produts: Customer profile. Preferenes for produt attributes: Item features. In our proposal, both the user profiles and the item features an be assessed by means of multigranular linguisti information, it means, different ustomers or experts an use different linguisti term sets to provide their assessments. The reommendation proess will onsist of a mathing proess between the ustomers profiles and the items features of eah item in the database to obtain a measure of similarity, and afterwards the produts will be ranked aording to this measure in order to be reommended (graphially, see Fig. 3): 1. Aquisition of the user profiles and item features: in this stage the item features are added to the item database if it is neessary and the user preferenes are gathered into a profile. 2. Mathing items for the user: it omputes a measure of similarity between the user profile and eah item stored in the item database. 3. Making a reommendation: it hooses the most suitable item/s for a ustomer aording to their similarity with his profile. Fig. 3: Content-Based Reommendation model 213

216 Luis Gonzaga Pérez Cordón In the following subsetions we shall present in detail these stages and how this model works in order to reommend the most suitable produts to the ustomers Aquisition of the user profiles and the item features The aim of this stage is to gather the information with regards to produts in whih the ustomer u is interested. To do so, let C={ 1,, k,, l } be a set of riteria or attributes that the ustomer uses to desribe his neessities, preferenes and taste about the items he is interested. The reommendation model will have a set of items or produts (item database) that an be reommended, where eah item is desribed by a set of values, item features, for eah riterion, k, provided by some experts where these values will be linguisti labels that ould assessed in different linguisti term sets. To obtain an user profiel, eah user u, that wants to obtain a reommendation about the items or produts of the item database, must provide his/her profile aording to his/her preferenes. Mathematially we an desribe this stage in our reommendation model as a phase in whih a ustomer u who wants to find out whih is the most suitable produt/s among a set of them: A={a 1,,a j,,a n }, so the user will use a reommendation model whih desribes eah objet, aj, by means of a set of riteria: C={ 1,, k,, n }, suh that, the reommendation model has a database in whih eah item is desribed by means of a vetor of item features (Table 1): F j = {v 1 j,,v k j,,v l j }, j = 1,,n being v k j a linguisti value provided by the user for the objet, a j, of the riterion, k. Our model will reommend those produts a j more similar or suitable to the user preferene. Therefore the user, u, will provide his preferene profile: P u = {p 1 u,,p k u,,p l u }, by means of a utility vetor that express his preferenes, neessities and taste with regards to the produts he is looking for. Where, p k u Suk, is the linguisti value that the user u assign to the riterion k, aording to their knowledge, taste, preferene and neessities and S uk is the linguisti

217 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio term set hose by the ustomer u to provide his preferene about the riterion k. Different ustomers an have different pereptions about their own preferenes or taste or eve the same ustomer an have different knowledge about his preferene in different riteria. Hene, we offer the possibility that ustomers an assess their preferenes in different linguisti term sets aording to their knowledge. So, in our proposal we offer the ustomers a flexible multi-granular linguisti ontext instead of foring all of them to provide their preferenes in the same sale. Therefore, eah user an hoose his own linguisti terms set to provide his profile. 3.2 Mathing Items for eah user One we have got the user profiles the reommendation model will have: a) A user profile P u ={p 1u,,p lu } with the user preferenes provided by the user u, whih are desribed by means of linguisti labels assessed in S uk. b) A set of produts A={a 1,,a n } desribed by means of their item features F j ={v 1j,,v lj } for eah riterion/attribute C={ 1,, l } assessed linguistially. The item features will be in the item database as an be seen in the Table 1. a... a a 1 j... n 1,..., k,..., l v v v j 1... n 1,...,,...,,..., v v v 1 k... j k... n k,...,,...,,..., v v v 1 l... j l... n l Table 1: Item features in the database of items In order to find out whih are the most suitable produt/s for a ustomer u, the reommendation model will ompare the user profile P u with the item features of all the items in the database by means of a mathing proess in order to obtain the losest produts in the database aording to user preferenes or neessities. In our ase, the information that represents so the user profiles as the item features are linguisti labels whose semantis are given by fuzzy numbers, so to arry out this mathing proess we need measures 215

218 Luis Gonzaga Pérez Cordón of omparison between fuzzy numbers. In the following subsetions we shall review in short this type of measures and afterwards we present the mathing proess used by our model to obtain the similarity between the items and the user profile Measures of Comparison The omparison of objets is a usual task in many fields as psyhology, analogy, physial sienes, image proessing, lustering, dedutive reasoning, et. Generally, these omparisons are based on measures of the differenes and similitudes between two objets. In the literature we an find different types of omparison measures [Bou96, Rif00]: 1. Measures of satisfiability: These measures orrespond to a situation in whih we onsider a referene objet or a lass and we need to deide if a new objet is ompatible with it or satisfies it. 2. Measures of resemblane: A measure of resemblane is used for a omparison between the desriptions of two objets, of the same level of generality, to deide if they have enough ommon harateristis. 3. Measures of inlusion: Considering a referene objet like in the measures of satisfiability. We obtain how important are the ommon harateristis of A and B, with regards to A. 4. Measures of dissimilarity: This is other kind of measure that not assesses the similitude but the differenes. This measure is based on the onept of distane between two fuzzy sets. In our proposal to ompare the user profiles and the item features, we shall use measures of resemblane. Before showing the measures of resemblane we are going to use, it is neessary to revise some basi onepts. For any set Ω of elements, let F(Ω) denote the set of fuzzy subsets of Ω, f A the membership funtion of any set A in F(Ω) and supp(a) = {x Ω / f A (x)! 0} To ompare two fuzzy sets, it is important to onsider the intersetion of them. The membership funtion of the intersetion set is given as: f A B (x) = min(f A (x),f B (x)) Definition 1. [Bou96]: A fuzzy set measure M is a mapping: F(Ω) [0,1] suh that, for every A and B in F(Ω): P1: M(0)=0 216

219 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio P2: if B ` A, then M(B) [ M(A) In [Dub83] was proposed a measure of resemblane whih is easy to manage and ompute. This one has been widely used in the literature to arry out this kind of proesses. M1: D(A, B) sup min af A (x), f B (x)k After applying this measure to two fuzzy sets, we obtain some knowledge about their similarity: the greater value the more similarity Mathing Proess In the seond stage, the reommendation model will ompute the resemblane between the user profile P u and the item features F j of eah produt in the item database, a j, j=1,,n. Therefore, let P u ={p 1u,,p lu } be an user profile and {F j, j=1..n} a set of produts features where F j ={v 1j,,v lj }. Our proposal to obtain a similarity measure, r kj, between eah orrespondent ustomer preferene and item feature assessment, (p ku,v kj ), for all the produts j, and for all attributes, k. It is to apply a mathing proess by means of the similarity measure M1: ( ) u j ( p, v ) = supmin f u ( x) f j ( x) j rk = D k k, x p k v Hene, we shall obtain as similarity measure, between a user profile and eah item, a fuzzy set, R ju ={r 1j,,p lj }, where eah omponent, r kj, is omputed by the above measure of resemblane between eah user profile riterion k, i.e. p ku, and its orrespondent item feature that desribes thevalue of the riterion k for the produt a j, i.e. v kj. u j j ( P F ) = ( r r j ) R = Similarity,..., u, j 1 For instane, let s onsider the produt riterion, k, and we want to math it with the user preferene p k u. Both of them are assessed by means of linguisti terms in the linguisti term set of the Fig.2. In this ase we have for a produt aj the values p ku =L and v kj =M, then, the mathing proess will be (graphially, see Fig. 5): r j ( L, ) 0. 5 k = sup min M = x k l 217

220 Luis Gonzaga Pérez Cordón N VL L M H VH P N VL L M H VH P p k u MATCHING v k i N VL L M H VH P Fig.5: Mathing Proess 3.3 Making a Reommendation The objetive of a reommendation model is to find out whih are the most suitable produt/s for the ustomer. So far, we have omputed the similarity, R ju, between eah item, F j, and the ustomer profile, P u. We shall onsider in this stage of the reommendation proess that the similarity an be interpreted as a preferene, due to the fat that the greater value the more suitable. Therefore to ahieve the objetive, we have to rank the items aording to their similarity with the user profile, but the similarity values omputed are expressed by means of fuzzy sets. Therefore to rank them and reommend the most suitable produt/s, we shall use the three-step ranking proess presented in [Her00]: 1. To build a preferene relation from the measures of similitude 2. To ompute a Non Dominane Degree (NDD) for eah item 3. To rank the items aording to the NDD, and reommend the n top ranked. Following we show in further detail eah step of the reommendation stage. 218

221 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Building a preferene relation Here we shall build a preferene relation, Q=[qij], from the similarity values, R ju, in order to rank the items aording to their similarity with the user preferenes. To do so, we shall use an inlusion measure. In the literature we an find different types of inlusion measures [San79, Dub80]. But after a study about them and onsidering the faility of omputing and its good performane in our model, we have hosen the next one: M2: S(A,B) = inf min(1 f A (x) + f B (x),1) Let A and B be two fuzzy sets, an inlusion measure, S(A,B), omputes how muh A is inluded in B, however, we want to know how muh A overs B to interpret this value as a preferene one. Therefore, to obtain the preferene degree of A over B, q AB, we shall ompute the inlusion of B in A: q AB =S(B,A) Consequently to build the preferene relation, Q, from the similarity measures: R u j ={r 1 j,...,r j k,,r j j l }, where r supmin( f u ( x), f j ( x) ) k =, x p k vk we shall use the inlusion measure M2 in order to measure how muh overs R i u to R ju, for all i and j. This value will express the preferene degree, q ij, of R i u u over R ju, and it is omputed as: q ( f ( x) f ( ), 1) u u = S( R, R ) = inf min 1 x ij j i + u x R u j R i Applying this proess for all the possible pairs, we obtain the fuzzy preferene relation Q=[q ij ]. Q = q q q 11 Æ i1 Æ n1 q q 1 j Æ q ij Æ nj q q q 1n Æ in Æ nn Example: given two fuzzy sets R iu ={0, 0.5, 1, 0.5, 0} and R ju ={0, 0.5, 0.5, 0.5, 0} orresponding to the resemblane measures between the user 219

222 Luis Gonzaga Pérez Cordón profile P u and the produts features F i and F j respetively, we an obtain the next preferenes degrees (the symbol. stands for the operator min): q ( f ( x) f ( ), 1) u u = S( R, R ) = inf min 1 x = ij j i + u x R u j R i ((1-0+0). 1). (( ). 1). (( ). 1). (( ). 1). ((1-0+0). 1)=1 q ( f u ( x) f ( ), 1) u u = S( R, R ) = inf min 1 x = ji i j + u x R i R j ((1-0+0). 1). (( ). 1). (( ). 1). (( ). 1). ((1-0+0). 1)=0.5 So, the preferene degree of R i u over R j u, q ij = 1, whereas the degree of R j u over R iu, q ji = Computing the Non Dominane Degree To rank the items in order to be reommended we have built a preferene relation, so we shall apply a hoie degree to order the items aording to its similarity with the ustomer profile. In [Orl78] we an find different hoie degrees, in our model we have hosen the Non Dominane Degree, that indiates whih item is non dominated by the other ones. Definition 2 [Orl78]. Let Q=[q ij ] be a fuzzy preferene relation defined over a set of alternatives X. For the alternative x i its non-dominane degree, NDD i, is obtained as NDD i X j s { 1 q j! i} = min, where q s ji = max(q ji q ij,0) represents the degree to whih x i is stritly dominated by x j. Now, our aim is to obtain the non-dominane degree (NDD) of every alternative produt, aording to the Definition 2. For this purpose, it is neessary to build the strit preferene relation: Q s = [q s ij] where q s ij= max(q ij -q ji,0) Going on the previous example, the strit preferene relation between the two fuzzy sets are: q s ij=max(q ij -q ji,0)=max(1-0.5,0)=0.5 q s ji=max(q ji -q ij,0)=max(0.5-1,0)=0 Finally, we have to ompute the NDD for eah produt a i as: NDD = min 1! i i j ji s { q } ji 220

223 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Ranking the items in order to their reommendation Eventually the best produts or alternatives are those with a greater NDD, i.e., the alternatives less dominated by the other ones. We must take into aount that there an be several alternatives with the same NDD. These ones will oupy the same order in the ranking. Example: Let s suppose we have omputed the non-dominane hoie degree of eah alternative: {NDD 1 = 0.49, NDD 2 = 1, NDD 3 = 0.48, NDD 4 = 1} So, the solution is a ranking where NDD 2 and NDD 4 are the best alternatives. After them we find NDD 1 and finally, the worst is NDD 3. A general sheme of the reommendation proess arried out by this reommendation model an be seen in the Fig. 4. Fig. 4: Content-Based Reommendation model in great detail 221

224 Luis Gonzaga Pérez Cordón 4 Example of a reommendation proess To hose the finest toy/s for a hild is a really hard task, beause eah hild is different and needs different aspets to improve his verbal skills, reasoning, athleti ability, In this setion we are going to apply our based ontent representation model to the proess of hosing a suitable toy for a hild in a toy shop. The reommendation model is guided by several riteria that desribe the features of the toys, in this example eah riterion will be assessed in a linguisti term set (see Table 2) aording to the knowledge that the experts have about them: Independent play: this learning parameter promotes self-esteem and onfidene in hildren by empowering them with hoies and by organizing stimulating play ativities. It will be assessed in the linguisti term set C. Mathematial play: it measures if the hildren is involves in problem solving ativities, reasoning, and sequening. This helps the hild to aquire an understanding of basi math skills and develop fine motor skills. It will be assessed in the linguisti term set B. Musial play: the toy engages hildren in rhythmi musial ativity. There are studies that prove that musi enhanes reading, math, and reative skills. It will be assessed in the linguisti term set B. Linguisti play: it enourages a hild s verbal skill. It will be assessed in the linguisti term set B. Motor skill: it helps to promote and develop hildren s physial athleti ability, manual dexterity, and/or eye-hand oordination. It will be assessed in the linguisti term set C. Cooperative play: it improves ooperation and interation with the objetive of ahieving ommon goals. It will be assessed in the linguisti term set B Visual play: it stimulates the hild in visual evaluation and ativities that enhane reativity. It will be assessed in the linguisti term set C. Easy to learn how to play: Some games need more time than others to learn how to play it or need the help of an adult to be played. It will be assessed in the linguisti term set A. 222

225 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio These parameters are also used to desribe the user profile to simplify the example we use the same linguisti term sets for eah one, but an be different ones. The semantis of the linguisti term sets are showed in the Table 2 and in the Fig. 5: Linguisti term set A Linguisti term set B Linguisti term set C Diffiult (D) (0,0,0.5) Very basi (VB) (0,0,0.25) Nothing (N) (0,0,0.16) Suitable (S) (0,0.5,1) Basi (B) (0,0.25,0.5) A little (LT) (0,0.16,0.33) Easy (E) (0.5,1,1) Normal (N) (0.25,0.5,0.75) Less than average (LA) (0.16,0.33,0.5) Advaned (A) (0.5,0.75,1) Average (AV) (0.33,0.5,0.66) Very Advaned (VA) (0.75,1,1) More than Average (MA) (0.5,0.66,0.83) A lot (AL) (0.66,0.83,1) All (A) (0.83,1,1) Table 2: Semanti of the linguisti term sets A, B and C Figure 5: The linguisti term sets A,B,C In the Table 3, we an see the item database that we use in this example: Toy Independent Mathematial play play Musial play Linguisti play Motor skill Coopeerat. Play Visual Play Learning T 1 N VB VB N AV VB MA D T 2 LT B VA VB AV B AL D T 3 AV B B A LA N A S T 4 LA N N N A A AV S T 5 AV A VA A AL VA LA D T 6 AV VB N N MA N N S T 7 MA N N VA AV A AV S T 8 AL VA N N N N AV S T 9 N N B VA N VA N D T 10 LT A N N MA N AL D Table 3: Desriptions of toys of our Reommendation System The proess to reommend a toy for a ustomer follows the proess presented in the before setion. 223

226 Luis Gonzaga Pérez Cordón 1. Aquisition of the user profiles. A user provides his profile in order to obtain a reommendation aording to his neessities: Independent play Mathematial play Musial play Linguisti play Motor skill Coopeerat. Play Visual Play Learning AV B B A AV N A S Table 4: user profile With this information our reommendation model will find those toys that are loser to the user neessities. 2. Mathing Items for eah user The first step in our proess is to find the similarity between the user profile and every toy, by means of mathing proess presented in (see Table 5): u T1 T 1 T 2 T 3 R = (0,0.5,0.5,0.5,1,0,0,0.5) R = (0,1,0,0,1,0.5,0.5,0.5) u T2 R = (1,1,1,1,0.5,1,1,1) u T3 u T4 T 4 T 5 T 6 R = (0.5,0.5,0.5,0.5,0,0.5,0,1) R = (1,0,0,1,0,0,0,0.5) u T5 R = (1,0.5,0.5,0.5,0.5,1,0,1) u T6 u T7 T 7 T 8 T 9 R = (0.5,0.5,0.5,0.5,1,0.5,0,1) R = (0,0,0.5,0.5,0,1,0,1) u T8 R = (0,0.5,1,0.5,0,0,0,0.5) u T9 224 u T10 T 10 R = (0,0,0.5,0.5,0.5,1,0.5,0.5) Table 5: Similarity degree between user profile and every toy Where, for example, T 1, is alulated using the similarity funtion, D( A, B) = sup min( f ( x), f ( x ) between T 0 and the user profile U: x A B ( T U) { D ( N, AV),, D ( D, S) } Similarity... 1, = Independent Play learning = = S = T 1 ( 0,0.5,0.5,0.5,1,0,0,0.5) 3. Making a reommendation The last stage is to make a reommendation. To do so, first the model omputes a fuzzy preferene relation, Q, suh as it was shown in the setion (see Fig. 6).

227 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio S 0 Q = Q = Figure 6: Fuzzy preferene relation Q and the strit preferene relation Q s. Where q 12 represents the preferene degree of the toy T 1 over T 2 (or how muh similarity degree of T 1 overs T 2 ). For example, we show how the preferene degrees q 12 and q 13 are omputed: q 12 = inf x min (1 f T2 (x)+ f T1 (x),1)=((1 0+0).1).(( ).1).(( ).1)..(( ).1).((1 1+1).1).(( ).1).(( ).1).(( ).1)= 0.5 q 13 = inf x min (1 f T3 (x)+ f T1 (x),1)=((1 0+0).1).(( ).1).(( ).1)..(( ).1).(( ).1).((1 1+0).1).((1 1+0).1).(( ).1)= 0 Where. stands for min. Now, for eah toy T i, the model alulates its non-dominane degree NDD i. First, the strit preferene relation Q s is omputed (Fig. 6). Then, we ompute the non-dominane hoie degree of eah toy: {NDD 1 = 0.5, NDD 2 = 0.5, NDD 3 = 1, NDD 4 = 0, NDD 5 = 0, NDD 6 = 0, NDD 7 = 0.5, NDD 8 = 0, NDD 9 = 0, NDD 10 = 0}, where, NDD 1 = min{(1 0), (1 0.5), (1 0), (1 0), (1 0.5), (1 0), (1 0), (1 0), (1 0.5)} = 0.5 Finally, the model ranks the toys using the non-dominane hoie degree (Table 6): 225

228 Luis Gonzaga Pérez Cordón First Level Seond Level Third Level T 3 T 1 T 4 T 2 T 5 T 7 T 6 T 8 T 9 Table 6: Ranking of the toys. The most suitable toy to reommend aording to the user profile is T 3, after T 3 we ould reommend T 1, T 2 and T 7, and the least suitable toys to reommend are T 4, T 5, T 6, T 8, T 9, T Conluding Remarks In this paper, we have presented a reommendation model that an be applied in deision making problem when we have at one s disposal some linguisti information desriptive of every alternative. In addition, the user supplies his preferenes over eah attribute that desribe the alternatives given a user profile. The model mathes the user preferenes with the desription ofevery produt obtaining a resemblane index. In further works we are going to onsider not only the mathing between user profile and produt features but the distane between these sets. Moreover, we will researh the performane of other indies to evaluate the preferene between two fuzzy sets, and other indies for establishing hoie degrees in a fuzzy preferene relation. Aknowledgments This work has been partially supported by the Researh Projet TIC Referenes [Ans00] A. Ansari, S. Essegaier, and R. Kohli. Internet Reommendation Systems. Journal of Marketing Researh XXXVII (2000) [Bas98] C. Basu, H. Hirsh, and W. Cohen. Reommendation as CIassifiation: Using Soial and Content-Based Information in Reommendation. Proeedings of the Fifteenth National Conferene on Artifiial Intelligene, (1998) [Bon86] P.P. Bonissone and K.S. Deker. Seleting unertainty aluli and granularity: an experiment in trading-off preision and T

229 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio omplexity. In: L.H. Kanal, J.F. Lemmer, (Eds.), Unertainty in Artifiial Intelligene, North-Holland, Amsterdam, (1986) [Bor93] G. Bordogna and G. Passi. A fuzzy linguisti approah generalizing boolean information retrieval: a model and its evaluation. J. Amer. So. Inform. Si. 44 (1993) [Bre98] J. Breese, D. Hekerman, and C. Kadie. Empirial Analysis of Preditive Algorithms for Collaborative Filtering. Tehnial report MSR-TR-98-12, Mirosoft Researh. (1998). [Bou95] B. Bouhon-Meunier and M. Rifqi. Resemblane in database utilization. 6th IFSA World Congress, [Bou96] B. Bouhon-Meunier and M. Rifqi, and S. Bothorel. Towards general measures of omparison of objets. Fuzzy Sets and Systems, (84): , [Del92] M. Delgado, J.L. Verdegay and M.A. Vila. Linguisti Deision Making Models. Int. J. of Intelligent Systems 7 (1992) [Dub80] D. Dubois and H. Prade. Fuzzy Sets and Systems: Theory and Appliations. (Aademi Press, New York, 1980) [Dub83] D.Dubois and H.Prade. Ranking fuzzy numbers in the setting of possibility theory. Information Sienes 30 (1983) [Gol92] D. Goldberg, D. Nihols, B.M. Oki, and D. Terry Using Collaborative Filtering to Weave. Communiations of the ACM, 35(12) (1992) [Hay01] C. Hayes and P. Cunningham Smart Radio - Community Based Musi Radio. Knowledge-Based Systems 14 (3-4): [Her95] F. Herrera, E. Herrera-Viedma and J.L. Verdegay. A sequential seletion proess in group deision making with linguisti assessment. Inform. Si., 85 (1995) [Her00] F. Herrera, E. Herrera-Viedma, L. Martínez. A fusion approah for managing multigranularity linguisti term sets in deision making. Fuzzy Sets and Systems (2000). [Vie04] Herrera-Viedma, E., F. Herrera, L. Martinez, J.C. Herrera, and A.G. Lopez Inorporating Filtering Tehniques in a Fuzzy Linguisti Multi-Agent Model for Gathering of Information on the Web. Fuzzy Sets and Systems 148 (1) (2004)

230 Luis Gonzaga Pérez Cordón [Jen92] A. Jennings, and H. Higuhi. A Personal News Servie Based on a User Model Neural Network. IEICE Transations on Information and Systems E75-D (2) (1992) [Kau98] H. Kautz. Reommender Systems. AAAI Press, Menlo Park, CA [Kon97] J. Konstan, B. Miller, D. Maltz, J. Herloker, L. Gordon, and J. Riedl. Grouplens: Applying Collaborative Filtering to Usenet News. Communiations of the ACM 40 (3) (1997) [Lie95] H. Lieberman. Letizia: An Agent That Assists Web Browsing. In Proeedings of the 1995 International Joint Conferene on Artifiial Intelligene. Montreal, Canada (1995). [Orl78] S.A. Orlovski, Deision Making with a Fuzzy Preferene Relation, Fuzzy Sets and Systems 1 (1978) [Paz96] M. Pazzani, J. Muramatsu, and D. Billsus. Syskill & Webert: Identifying Interesting Web Sites. In Proeedings of the Thirteenth National Conferene on Artifiial Intelligene AA.AI, no. 96 (1996) [Per99] P. Perny, and J. D. Zuker. Collaborative Filtering Methods Based on Fuzzy Preferene Relations. EUROFUSE-SIC 99 (1999). Budapest. [Pop01] A. Popesul, L. II. Ungar, D. M. Pennok, and S. Lawrene. Probabilisti Models for Unified Collaborative and Content-Based Reommendation in Sparse-Data Environments. In Proeedings of the Seventeenth Conferene on Unertainty in Artifiial Intelligene (UAI) (2001), San Franiso, [Res97] P. Resnik and H.R. Varian. Reommender Systems. Communiations of the ACM 40 (1997) [Rif00] M.Rifqi, V.Berger and B.Bouhon-Meunier. Disrimination power of measures of omparison. Fuzzy Sets and Systems 110 (2000) [San79] E. Sanhez. Inverses of fuzzy relations, appliations to possibility distributions and medial diagnosis. Fuzzy Sets and Systems 2 (1979) [Sh01] J.B. Shafer, J.A. Konstan and J. Riedl. E-Commere Reommendation Appliations. Data Mining and Knowledge Disovery, no. 5 (2001)

231 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio [Sha95] U. Shardanand. Soial Information Filtering: Algorithms for Automating Word of Mouth. Proeedings of ACM CHI 95 Conferene on Human Fators in Computing Systems (1995), Denver, [Yag95] R. R. Yager, An approah to ordinal deision making, Int. J. Approximate Reasoning, no. 12, (1995) [Zad75] L.A. Zadeh. The onept of a linguisti variable and its appliation to approximate reasoning. Information Siene (8 and 9) (1975): (Part I and II) 8, pp and pp , (Part III) 9, pp,

232

233 D.7. Knowledge based reommender systems models In our researh, we realized that although the previous model was orret and useful for its aim, other models were developed in the e-ommere field to make reommendations when there is no historial information or it is irrelevant, the knowledge based reommender systems. In this setion, we will present two knowledge based reommender systems models. The first one, alled RML, is a lassi knowledge based reommender system model (see figure D.3). The aims of this model are: To make easier the user preferene gathering proess. This user profile is obtained through an example that the user provides. If the user profile does not represent faithfully the user s neessities, it an be hanged throughout a refinement phase. This user profile is more omplete and it is obtained faster than in the previous model. To ompute in a more aurate way how lose are two linguisti assessments. To find suitable items for user, it is needed to ompare the user profile with the desription of the items. Therefore, the more aurate omparison omputations are made, the better results the system will obtain. To derease the omputation load. The omputations of this model to make reommendations are simpler. Figure D.3: Knowledge based reommender model with multigranular information 231

234 Luis Gonzaga Pérez Cordón A further desription of this model is attahed following in the paper A Knowledge Based Reommender System with Multigranular Linguisti Information published in the International Journal of Computational Intelligene Systems. In this doument, it is introdued the ontext and bakground neessary to understand the proposed model and finally suh a model is desribed in depth. The seond model (see figure D.4), known as RRPI, is an improvement of the previous one, whose aim is to enhane the mehanisms used to build the user profile in order to obtain a loser profile to the user neessities without requiring the user to provide muh information. This model expets users to provide examples of their neessities and a preferene relation over them. The main advantages of this model are: The refinement phase is avoided. We have redued the dependene between the quality of the reommendations, and the seletion of the example. In the previous knowledge based reommender system model if the example was not well-hosen and the user did not use orretly the refinement phase, it would not make aurate reommendations. In this model, this dependene is lower, and therefore, it is likely that it will make better reommendations. A desription in depth of this model is attahed following in the paper Improving the Effetiveness of Knowledge Based Reommender Systems Using Inomplete Linguisti Preferene Relations aepted in the International Journal of Unertainity, Fuzziness and Knowledge-based Systems, that explains it in detail, the neessary bakground and how this model makes the reommendations. 232

235 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figure D.4: Knowledge based reommender system model with preferene relations 233

236 Luis Gonzaga Pérez Cordón International Journal of Computational Intelligene Systems, Vol. 0, No. 0 (April, 2000) Atlantis Press A Knowledge Based Reommender System with Multigranular Linguisti Information 234 Luis Martínez, Manuel J. Barrano, Luis G. Pérez, Maarena Espinilla Dpt. of Computer Siene, University of Jaen Jaen, Spain martin,barranolgonzaga,mestevez@ujaen.es Reeived (to be inserted Revised by Publisher) Reommender systems are appliations that have emerged in the e-ommere area in order to assist users in their searhes in eletroni shops. These shops usually offer a wide range of items that over the neessities of a great variety of users. Nevertheless, searhing in suh a wide range of items ould be a very diffiult and time-onsuming task. Reommender systems assist users to find out suitable items by means of reommendations based on information provided by different soures suh as: other users, experts, item features, et. Most of the reommender systems fore users to provide their preferenes or neessities using an unique numerial sale of information fixed in advane. In spite of this information is usually related to opinions, tastes and pereptions, therefore, it seems that is usually better expressed in a qualitative way, with linguisti terms, than in a quantitative way, with preise numbers. We propose a Knowledge Based Reommender System that uses the fuzzy linguisti approah to define a flexible framework to apture the unertainty of the user s preferenes. Thus, this framework will allow users to express their neessities in sales loser to their own knowledge, and different from the sale utilized to desribe the items. 1. Introdution One of the main problems users fae when they are surfing in Internet is the vast quantity of information, being most of it useless. For instane, most of the e-shops offer thousand of produts that onform a searh spae that the user an not evaluate arefully in order to find out the most suitable produts aording to his/her neessities. In suh ases, users an feel disappointed beause they do not find what they really want among so huge amount of alternatives despite wasting muh time. Different e-servies have risen to help them to reah easy by quikly the produts that meet their neessities. In this paper, we fous in reommender systems, a lass of software 5,21,22 that has emerged in the last years within E-Commere area 23. Its aim is to assist users in their searhs in order to find out the most suitable item/s aording to their preferenes, neessities or tastes. To do so, the systems provide reommendations and/or hide or remove the useless information. Essentially, all the reommender systems follow the same steps to make reommendations: first the systems gather preferene information from users, experts, et., related to their preferenes, tastes, and opinions suh

237 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio that using this information they rank the items and make reommendations about whih items are more attrative for them. Depending on the information gathered by the system, and the tehnique that ranks the items to suggest reommendations, the reommender systems an be lassified in different types: Demographi reommender systems 16 : They lassify users into demographi groups, using personal attributes. A user will reeive reommendations aording to the group in whih was lassified. Content-based reommender systems 20 : This type of reommender systems ompute reommendations aording to the past user behaviour as well as to the features of items that the user liked before. Collaborative filtering reommender systems 8 : They gather ratings about produts instead of item features and group the users aording to their similarity. The reommendations are omputed by means of a predition about how muh does a user like an item taking into aount the other group members ratings. Knowledge based reommender systems 4 : These systems ompute their reommendations using ase based reasoning proesses, i.e., the users provide an example similar to his/her aims and the systems infers a profile in order to find the better math produt in the searh spae. Utility based reommender systems 9 : They ompute reommendations based on the alulation of the utility of eah item aording with the user interests. Hybrid reommender systems 1,5 : This kind of reommender systems arise with the aim of solving drawbaks that the other systems present in some situations. In order to do that, these systems ombine different tehniques of the before reommender systems. All these types of reommender systems have been developed and applied to different situations, being the most used the ontent-based and ollaborative ones. However these systems are not always suessful beause they need big amount of users and items information to obtain good results and it is not always available. Therefore, different solutions have been proposed to avoid unsuessful reommendations when there is not information available suh as hybridization that an be useful in several ases but not always, or the use of knowledge based reommender systems, when there is not user information available. In this paper we fous in the last type of reommender systems. 235

238 Luis Gonzaga Pérez Cordón The information gathered by reommender systems is usually vague and inomplete beause it is related to users own pereptions. In spite of this fat, most of Reommender systems fore their users to provide the information in a numerial sale fixed a priori 10. This obligation implies a lak of expressiveness and hene a lak of preision in the suggested reommendations. To overome this drawbak, our proposal for a Knowledge Based Reommender System will offer the users the possibility of expressing their preferene information using linguisti assessments instead of numerial ones, sine the linguisti information is usually more suitable to assess qualitative information (human pereptions, taste, neessities) 17,25. In addition, our system allows the users to use their own linguisti term set to express their preferenes aording to their knowledge about the items. Thus, the ontext on whih the reommendations are omputed is a multi-granular linguisti ontext 11,13,14 In this paper we present a Knowledge based reommender system that will filter and reommend the losest items to the user s neessities omputing the similarity among the desriptions of the items and the user profile inferred from the examples provided by the user aording to their neessities. The system aomplishes the following steps to make the reommendations: 1 Profiling proess: the user profile is an information struture that express the user preferenes (neessities, tastes, et). In this phase, the system infers the user profile from an example provided by the user. 2 Reommendation proess: To find out the most suitable items for the users, the system will measure the similarity between the user profile and the items of the item database. The system ranks these items aording to the similarity measure and reommends the most similar ones. This paper is strutured as follow. In setion 2 we review some preliminaries about reommender systems and linguisti information that are useful to understand our proposal. In setion 3 we present our linguisti multigranular knowledge based reommender system. In setion 4 we show, by means of an example, how this system works. Finally, in setion 5 some onlusions are pointed out. 2. Preliminaries Before introduing our proposal, we shall review, firstly, the drawbaks that lassial reommender systems present. Seondly we shall make a brief review of knowledge base reommender systems. And finally we review the 236

239 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Fuzzy Linguisti Approah, whih is needed in our proposal in order to model the vague and impreise information provided by humans Drawbaks of Classial Reommender Systems Reommender systems use 5 : (i) Bakground data: the information that the system has before the reommendation proess begins, (ii) Input data: the information that user must ommuniate to the system in order to generate a reommendation, and (iii) An algorithm that ombines bakground and input data to ahieve the suggestions. Classial reommender systems, both the Collaborative and Contentbased ones, need a great amount of information about the users to exploit the bakground and the input data. Sometimes, this is an important drawbak, mainly when a new user aesses to the system ( ramp-up problem). When ollaborative filtering reommender systems have not bakground data about the target user, it is not possible to ompare him/her with other users in order to make reommendations. In a similar manner, ontent-based ones do not work properly in this situation beause they are not able to build the user profile when bakground information about the user does not exist. Also, we an see the ramp-up problem when a new item is added in ollaborative filtering system. In this ase, the new item ould be interesting to be reommended to some user, but the system does not use it beause it has not any rating about the item yet. Therefore, this item will not be taken into aount in the reommendation proess until it has reeived enough votes. Due to the fat that it is not being reommended, it is not likely that the item reeives enough rating to be reommended. Other problem we observed in ollaborative reommenders is the gray sheep problem. It ours when a user falls on a border between existing groups of users. The target user is equally similar to two or more groups of users and, hene, the reommendation he/she will reeive may be inaurate. The need of a large historial data set to ensure suessful results is also an important requirement for both ollaborative filtering and ontentbased reommender systems. These systems do not work properly when the historial data set is too small or sparse beause, in this ase, the probability of mathing between the target user and other users will be low. 237

240 Luis Gonzaga Pérez Cordón In order to overome these drawbaks, some proposals have been given, suh as hybrid reommender systems and Knowledge Based Reommender Systems. In this paper we present a Knowledge Based Reommender Systems that deals with linguisti information. In the next subsetion we shall explain the lassia 1 l knowledge based reommender system in further details Knowledge Based Reommender Systems Our interest in this paper is the Knowledge Based Reommender Systems 4. These systems use ase based reasoning 15 to make reommendations, i.e., they work starting with an example that the user points out, aording with his/her tastes or neessities, from whih the system infers a user profile utilized to find the best math produts in the searh spae. For reahing its purpose, this system mathes the user profile and the possible reommendations. So, when the user provides some knowledge about his/her needs or preferenes, the reommender system is able to make reommendations using suh mathing proess. This user knowledge an be any knowledge struture that allows to build a user profile. The simplest ase ould be that the user hooses, among all the available produts, one of them that ats as an example of his/her neessities or tastes. These systems manage three types of knowledge: Catalog knowledge: It is the knowledge that the Reommender System has about the produts and their features. For example, a reommender system for new ars needs to know the harateristis of a ar X: safety, omfort, prie, veloity, fuel-onsumption, et. Funtional knowledge: The system needs some knowledge to relate produts to the the user s neessities. For example, it is important to know that a need for a travelling salesman may be a ar with low fuel-onsumption and very high safety. User s knowledge: To provide good reommendations, the system needs to gather information about the user profile. For example, the user hooses a ar whih satisfies, more or less, his/her expetations. Then, the system will use this information to build an initial user profile onsisted of the features of the hosen ar. A good example of this kind or reommender systems may be The restaurant reommender Entree *6. This reommender system makes its reommendations by finding restaurants in a new ity similar to restaurants the user knows and likes. The system allows users to navigate by stating *

241 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio their preferenes with respet to a given restaurant, thereby refining their searh riteria. Knowledge based reommender systems are speially suitable for asual searhing, when the information about the user does not exist or is sare. Other systems have a period of start-up until the system gathers historial information about the user. The quality of the reommendations during this period is low. Knowledge based ones do not suffer this drawbak beause they do not need suh kind of historial information. They work very well with only a small amount of knowledge about the user. In a typial situation, the user knowledge is stated by the user by means of an example of his/her neessities that he/she must point out. Starting with this example, the system builds a user profile and searhes the produts that best fit with this profile. So, we an enumerate the following advantages of this kind of systems: (i) They do not suffer ramp-up problems (both new user and new item problems). (ii) The gray sheep problem does not appear in these systems. (iii) They do not depend on large historial data set On the other hand, these systems present two disadvantages related to the gathering of user knowledge: (i) When the amount of produts is very large, the proess of providing an example to express the user neessities may be a hard task. It may be a reason for the user to give up his/her searh beause he/ she an not easily find a suitable example. (ii) It is possible that the user does not find an example that fits exatly his/her neessities. So, the system reommends him/her produts that perhaps do not satisfy the user. So, it may be another reason for leaving the searh too. In setion 3, we present a proposal of a Knowledge Based Reommender System to overome these drawbaks Fuzzy Linguisti Approah Usually, we work in a quantitative setting, in whih the information is expressed by means of numerial values. However, many aspets of different ativities in the real world annot be assessed in a quantitative form, but rather in a qualitative one, i.e., with vague or impreise knowledge. In that ase, a better approah may be to use linguisti assessments instead of numerial values. The fuzzy linguisti approah represents qualitative aspets as linguisti values by means of linguisti variables 24. This approah is adequate in some situations in whih the information may 239

242 Luis Gonzaga Pérez Cordón be unquantifiable due to its nature, and thus, it may be stated only in linguisti terms. In our proposal, the system deals with information that is related to user s tastes, preferenes or qualitative features of the items suh as Safety or Comfort. Although, this information ould have been modelled by means of numerial values, we have onsidered using linguisti assessment sine this information is vague, impreise and will be better expressed with the Fuzzy Linguisti Approah. One possibility of generating the linguisti term set onsists of diretly supplying the term set by onsidering all terms distributed on a sale on whih a total order is defined. For example, a set of seven terms S, ould be given as follows: {s 0 : N, s 1 : VL,S 2 : L,S 3 : M,S 4 : H,S 5 : VH,S 6 : P} In these ases, it is required that there exists: A negation operator Neg(s i ) = s j suh that j = g i (g+1 is the ardinality). A min and a max operator in the linguisti term set: s i [ s j i [ j. The semantis of the terms are given by fuzzy numbers defined in the [0, 1] interval. A way to haraterize a fuzzy number is to use a representation based on parameters of its membership funtion 2. The linguisti assessments given by the users are just approximate ones, some authors onsider that the linear trapezoidal membership funtions are good enough to apture the vagueness of those linguisti assessments. This parametri representation is ahieved by the 4-tuple (a, b, d, ), in whih b and d indiate the interval in whih the membership value is 1, with a and indiating the left and right limits of the definition domain of the trapezoidal membership funtion 2. A partiular ase of this type of representation are the linguisti assessments whose membership funtions are triangular, i.e., b = d, so we represent this type of membership funtion by a 3-tuple (a, b, ). An example may be the figure 1: 240 Fig. 1. A linguisti term set and its semanti

243 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Other authors use a non-trapezoidal representation, e.g., Gaussian funtions Multigranular Linguisti Information An important aspet of fuzzy linguisti approah is the granularity of the unertainty, i.e., the level of disrimination among different ounts of unertainty. Therefore, aording to the soure of information knowledge it an be hosen different ounts of unertainty. The granularity should be small enough so as not to impose useless preision levels on the users but big enough to allow a disrimination of the assessments in a limited number of degrees 13. There are two reasons to utilize multigranularity in our proposal: 1 Users with different degrees of knowledge about the produts. User with more knowledge an disriminate among more ounts of unertainty than other ones with less knowledge. 2 Different attributes an need different auray degrees. When the produts are desribed in order to fit the produt database, eah feature an be valuated using a different linguisti term set with different granularity. Typial values of ardinality used in the linguisti models are the odd ones, suh as 7 or 9 19, where the mid term represents an assessment of approximately 0.5, and with the rest of the terms being plaed symmetrially around it. In this paper, we shall deal with soures of information with different degrees of knowledge, so eah one ould use different linguisti term sets with different granularity. We all this ontext as multi-granular linguisti ontext 11. Figures 2 and 3 show two examples of linguisti term sets with different granularity. s 1 0 s 1 1 s 1 2 s 1 3 s 1 4 s 1 5 s 1 6 s 1 7 s 1 8 = Extremely low = (0,0,.125) =Very low = (0,.125,.25) = Low = (.125,.25,.375) = Abit low = (.25,.375,.5) = Average = (.375,.5,.625) = Abit high = (.5,.625,.75) = High = (.625,.75,.875) =Very high = (.75,.875, 1) = Extremely high = (0.875, 1, 1) 241

244 Luis Gonzaga Pérez Cordón Fig. 2. The linguisti term set S 1 s 2 0 s 2 1 s 2 2 s 2 3 s 2 4 s 2 5 s 2 6 = Extremely low = (0, 0,.16) = Very low = (0,.16,.33) = Low = (.16,.33,.5) = Average = (.33,.5,.66) = High = (.5,.66,.83) =Very high = (.66,.83, 1) = Extremely high = (.83, 1, 1) Fig. 3. The linguisti term set S 2 3. A Knowledge Based Reommender System Model with multigranular linguisti information In this setion, we present our proposal for a Knowledge Based Reommender System. This model expets users to provide an example of their preferenes (for example, Bella Italia restaurant) in order to generate an initial user profile. So, the initial profile math exatly with the desription of the seleted item. This profile onsists of a vetor of features in whih eah feature is desribed by a linguisti label. Eah feature desribes a different aspet of the user profile, and therefore, it ould be assessed with a different linguisti term set aording to the available knowledge about this feature. 242

245 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Sometimes, the given example does not fix exatly what the user wants sine one or several featuresthat have been assessed with linguisti terms that do not fulfil user s expetations or needs. So, the user needs to refine his/her profile by hanging some of its linguisti assessments. Suppose he/she agrees with all the features of the given example exept one. For example, onsidering the prie as the feature in disagree, next, the user an hange the value low with the value very low. In suh ases, sometimes it ould be suitable to offer the user another linguisti term set loser to him/her knowledge than the one used in the desriptions of the items. With the hanges provided by the user, the system will generate the final profile that will be used in the reommendation proess. Therefore, our proposal develops its ativity aording to the shema (see figure 4). 1 Profiling proess: The system builds the user profile whih ontains information onerning the neessities of the user. This phase has two steps: (a) Gathering the preferred example from the user: The user hooses an item as an example of his/her neessities. The desription of this item will define the initial user profile. (b) Casual modifiation of preferenes: Usually the user does not searh an item exatly equal to the given example, but a similar one, with some differenes in its attributes. So, in suh ases, the user must refine his/her profile by using a set of linguisti terms adequate to his/her knowledge level. 2 Reommendation proess: The system alulates the similarity between the user profile and the items, and reommends the most suitable ones. This proess is omposed of the following steps: (a) Unifiation of the linguisti information: Due to the fat we are dealing with multigranular linguisti information, it is neessary to unify it in an unique domain alled Basi Linguisti Term Set (BLTS). (b) Calulation of the similarity between the user profile and the items: In order to reommend an item to the user, we need to know how lose the items are to the user profile. () Providing the reommendation: This is the final step in whih the losest items to the user neessities will be reommended. 243

246 Luis Gonzaga Pérez Cordón Fig. 4. Reommender System Model 244

247 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio In the following setions we will explain these steps in further detail Profiling proess In this phase, the system gathers the user s neessities or preferenes in order to know what kind of item is required by the user u e. The Reommender System has a database A = {a 1,, a n }, with n items, all of them desribed by means of a set of attributes { 1,, l }. Therefore, every item a j is desribed by an utility vetor F aj = {v j 1,..., v j l }, in whih v j k is the value of the attribute k for the item a j assessed in the linguisti term set S k. These desriptions are obtained either diretly from experts or from surveys realized about the items. In any ase, the information about the attributes an be assessed in a multigranular ontext that allows to use different linguisti term sets. So, every attribute an be assessed in a different label set aording to the existing degree of the knowledge about them. Therefore, the desription of the items stored in the database onforms a multigranular linguisti spae. One we know how the items are desribed in the Reommender System, we an study how to build the user profile Gathering the preferred example from the user In our Reommender System, the starting point to define the user neessities is the seletion of an example. Let a e be the item given as an example by the user u e. This item is desribed in the database by means of an utility vetor F e = {v e 1,..., v e l }, in whih v e k S k is an assessment for attribute k expressed in terms of S k. This seleted example defines a initial user profile that we denote as P e0 = {p e0 1,..., pe0 l }, where p e0 k = v e k. In this initial user profile, the linguisti terms sets are the same than the ones used in the system database Casual modifiation of preferenes One the initial user profile is defined, the system offers the user the possibility of hanging one or more values of his/her profile in order to refine the reommendation proess. Probably, the knowledge the user has about a given attribute k is different to the knowledge that the experts (database s builders) has about the same attribute. So, the linguisti term set used by the experts may not be appropriate for the user. Therefore, the system allows the user to utilize other linguisti term set more suitable to his/her attribute k, the user an assign a new value, p e1 k, expressed in other linguisti term set, S k aording to his/her knowledge. Then, we have a final user profile P e = {p e 1,..., pe l } where pe k Se k are obtained in the following way: 245

248 Luis Gonzaga Pérez Cordón (a) p e k = pe0 k,pe0 k Se k = S k if the attribute k has not been modified (b) p e k = pe1 k,pe1 k Se k = S k otherwise. In order to make easy this task, the system will provide an easy-use interfae that allows to selet a suitable the linguisti term set for the attribute to hange Reommendation proess In this phase, the system omputes how lose the items are to the user profile by means of measure of resemblane or similarity. To aomplish this phase the system will evaluate the similarity between all the items of the database A = {a 1,,a n } and the user profile following these steps: 1 Unify the linguisti information: beause there is no way to deal diretly with information that has been assessed in different linguisti term sets, we need to unify the information in a unique domain. 2 Calulate the similarity between every item and the user profile: they system omputes the similarity degree between the user profile and database items. 3 Providing the reommendations: finally, the system suggests to the user the most suitable items, i.e., the losest ones to the user profile Unifiation of the linguisti information In order to manage multigranular information, we must unify it using a unique expression domain 12,13,18. In this ase, we hoose as unifiation domain a Basi Linguisti Term Set (BLTS) that we note as S T. The information will be unified by means of fuzzy sets defined in the BLTS, F (ST ). The seletion of the BLTS is explained in 12. Following, the system unifies the multi-granular linguisti terms by means of fuzzy sets defined in the BLTS, F (S T ), using the following transformation funtion: Definition 1 12 Let A = {l 0,,l p } and S T = {s 0,, s g } be two sets of linguisti terms suh that g m p. Then, a funtion of multigranular transformation x AST, is defined as: x AST : A F (S T ) x AST (l i ) = $(s k, a i k ) k {0,, g}.,6l i A a i k = max y min {n li (y), n sk (y)} 246

249 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio where F (S T ) is the set of all the fuzzy sets defined on S T, and μ li (y) and μ sk (y) are membership funtions of the fuzzy sets assoiated to the terms l i and s k respetively. To unify the multigranular linguisti information the system will use the transformation funtions x Sk S T in order to express the user profile and the desriptions of the items by means of fuzzy sets defined into fuzzy sets in the BLTS. For instane, an assessment of the user profile, p e k Se k, is transformed into a fuzzy set, p e k, in whih this fuzzy set is desribed by a tuple of membership degrees `a e k,, 0 ae k j. g In the same manner, the desriptions of the items are also transformed into the BLTS. An assessment, v j k S k, of the item, a j, is transformed into a fuzzy set, v j k, and it is also represented in the same way `aj k0,, aj kg j. One all the information is expressed in the same expression domain, we an proeed to alulate the similarity between the user profile and item database Calulation of the similarity between the user profile and the items One the information has been unified, the system will look for whih items are loser to the user s neessities. To aomplish this step, we need to alulate the similarity between the user profile, P e, and the item, a j, of the database using the following funtion: 1 l d j = d (P e,a j ) = l k=1 w i sim `p 'e k,v' j kj where w i represents the importane of eah attribute and /w i =1, being sim a funtion that omputes the similarity between the values P e and a j Although initially, we have onsidered this funtion, sim, to be aomplished by using the Eulidean distane. However, it was disarded beause its results are not good (see 14 ). Then, we propose to ompute the similarity using a measure based on the use of entral values 14 that obtain suitable results aording to our aim in this phase of the reommendation proess. Definition 2 14 Giving a fuzzy set b = (a 1,,a g ) defined on S = {s h } for h = 0,,g, we obtain its entral value v in the following way: 247

250 Luis Gonzaga Pérez Cordón 248 v = g idx(s h )a h, where idx(s h ) = h h=0 g a h h=0 This value represents the entral position or entre of gravity of the information ontained in the fuzzy set b. The range of this entral value is the losed interval [0, g] Therefore, from this definition, it is defined the following similarity funtion sim: Definition 3 14 Let b 1 and b 2 be two fuzzy sets defined on the BLTS, S T = {s 0,,s g }, and let v 1 and v 2 be the entral values of b 1 and b 2 respetively, then the similarity between them is alulated as: sim `b ' 1,b ' 2 j = 1 v 1 v 2 g The final result of this step is a similarity vetor D = (d 1,,d n ) in whih the system will keep the similarity between the user profile P e and all the items in the database Reommendation Here, the system will rank the items aording to the similarity values of the vetor D = (d 1,,d n ). The best ones will be those that are loser the user profile, i.e., those with the greatest sore in the similarity. The system will reommend the top-n items that reah a given threshold 7, i.e., if one of the top-n items is too far from the user profile (its similarity degree is less than the threshold) then this item will not be inluded in the reommendation. Let the item set A = {a 1,,a n }, r the maximum number of items to be reommended and h the threshold to be reahed. Then, the reommendation to the user is given by the reommendation vetor, R A, where the first element is the top one reommended item, the seond is the seond losest to the user profile and so on: R A = {a q(1),,a q(r1 )} where r 1 [ r where the funtion q is defined in the following way: q : {1, 2,, r 1 } {1, 2,, n} q(i)! q(j)6i! j q(i)! e6i = 1,, r 1

251 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio being a e the example given by the user d q(i) m d q(i) 6i < j d q(i) m h6i = 1,, r 1 4. Example We shall show an easy example in order to larify our proposal. Let us suppose we are looking for a new ar. The system has a database with the ars that ould be reommended. They are desribed using a set of features. To simplify, in this example we have six items, A = {a 1,a 2,a 3,a 4,a 5,a 6 } where eah item orresponds to a ar whih is desribed by a set of four features C = { 1, 2, 3, 4 }, where 1 = Prie, 2 = Veloity, 3 = Safety and 4 = Comfort. In real systems we ould find thousand or millions items stored in the database and dozens of attributes are used to desribe them. To desribe the attributes we ould use different domains, i.e. different linguisti term sets. Here we have used the linguisti term set S 1,2 (see figure 5) for the attributes 1 and 2, and the linguisti term set S 3,4 (see figure 6) for 3 and 4. These sets are defined by the following membership funtions: s 1,2 0 s 1,2 1 s 1,2 2 s 1,2 3 = Extremely low = (0,0,.125) = Very low = (0,.125,.25) = Low = (.125,.25,.375) = Abit low = (.25,.375,.5) s 1,2 4 = Average = (.375,.5,.625) s 1,2 5 s 1,2 6 s 1,2 7 s 1,2 8 = Abit high = (.5,.625,.75) = High = (.625,.75,.875) = Very high = (.75,.875,1) = Extremely high = (0.875,1,1) s 0 1,2 s 1 1,2 s 2 1,2 s 3 1,2 s 4 1,2 s 5 1,2 s 6 1,2 s 7 1,2 s 8 1,2 0 1 Fig. 5. The linguisti term sets 1,2 249

252 Luis Gonzaga Pérez Cordón s 3,4 0 s 3,4 1 s 3,4 2 s 3,4 3 s 3,4 4 s 3,4 5 s 3,4 6 = Negligible = (0,0,.16) = Very inferior = (0,.16,.33) = Inferior = (.16,.33,.5) = Average = (.33,.5,.66) = Superior = (.5,.66,.83) = Very superior = (.66,.83,1) = Outstanding = (.83,1,1) s 0 3,4 s 1 3,4 s 2 3,4 s 3 3,4 s 4 3,4 s 5 3,4 s 6 3,4 0 1 Fig. 6. The linguisti term set S 3,4 The desriptions of the items, using these linguisti term sets, an be seen in the table 1. Table 1. Item database a 1 s 1,2 0 s 1,2 3 s 3,4 3 s 3,4 2 a 2 s 1,2 5 s 1,2 2 s 3,4 1 s 3,4 4 a 3 s 1,2 7 s 1,2 4 s 3,4 0 s 3,4 5 a 4 s 1,2 5 s 1,2 6 s 3,4 2 s 3,4 6 a 5 s 1,2 8 s 1,2 0 s 3,4 4 s 3,4 6 a 6 s 1,2 1 s 1,2 8 s 3,4 3 s 3,4 1 A user, u e, wants to reeive a reommendation from our system. Firstly, the system must build the user profile: 1 Gathering the preferred example from the user: the user states an item a 1, lose to what he/she needs. So, this item is the example seleted by the user and the initial user profile will be: P e = %s 1,2 0,s 1,2 3,s3,4 3,s3,4 2 / 250

253 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 2 Casual modifiation of preferenes: Nevertheless, the user realizes that the attribute 1 (ars prie) of the seleted item does not represent what he/she wants. Due to this fat, he/she wants to provide a new value, however, the linguisti term set used to desribe 1 is not suitable for him/her knowledge. He/she doesn t need to disriminate between nine linguisti terms to express his/her neessity about this feature. So he/she would rather use a smaller set. He/she deides to use a linguisti term set with only five elements, that is defined below (see figure 7:) s 1e 0 s 1e 1 s 1e 2 s 1e 3 s 1e 4 s 0 1e =Very low = (0,0,.25,) = Low = (0,.25,.5) = Average = (.25,.5,.75) = High = (0.5,0.75,1) =Very high = (.75,1,1) s 1 1e s 2 1e s 3 1e s 4 1e 0 1 Fig. 7. The linguisti term set S 1e The user assesses this attribute with the value s 1e 1 user profile is: P e = %s 1e 1,s 1,2 3,s3,4 3,s3,4 2 / and so, now, the One the the user profile is available, the system aomplishes the reommendation proess: 1 Unifiation of the linguisti information: Aording to 11 the system hooses S 1,2 as BLTS (S T ), being its higher granularity the main riterion to make suh deision, and transforms the user profile and item database into S T. So, the item database (see Table 2) and the user profile will be expressed in terms that an be ompared one eah other. P e = {(0,0,.33,.66,1,.66,.33,0,0), (0,0,0,1,0,0,0,0,0) (0,0,.14,.57,1,.57,.14,0,0) (0,.28,.71,.85,.42,0,0,0,0)} 251

254 Luis Gonzaga Pérez Cordón Table 2: Item database expressed into the BLTS a 1 (1,0,0,0,0,0,0,0,0) (0,0,0,1,0,0,0,0,0) (0,0,.14,.57,1,.57,.14,0,0) (.28,.71,.85,.42,0,0,0,0) a 2 (0,0,0,0,0,1,0,0,0) (0,0,1,0,0,0,0,0,0) (.42,.85,.71,.28,0,0,0,0,0) (0,0,0,0,.42,.85,.71,.28,0) a 3 (0,0,0,0,0,0,0,1,0) (0,0,0,0,1,0,0,0,0) (1,.57,.14,0,0,0,0,0,0) (0,0,0,0,0,.28,.71,.85,.42) a 4 (0,0,0,0,0,1,0,0,0) (0,0,0,0,0,0,1,0,0) (0,.28,.71,.85,.42,0,0,0,0) (0,0,0,0,0,0,.14,.57,1) a 5 (0,0,0,0,0,0,0,0,1) (1,0,0,0,0,0,0,0,0) (0,0,0,0,.42,.85,.71,.28,0) (0,0,0,0,0,0,.14,.57,1) a 6 (0,1,0,0,0,0,0,0,0) (0,0,0,0,0,0,0,0,1) (0,0,.14,.57,.1,.57,.14,0,0) (.42,.85,.71,.28,0,0,0,0,0) 2 Calulation of the similarity between the user profile and the items: In order to obtain this measurement the system alulates the entral values of the fuzzy sets of every item in the database (see table 3) and the fuzzy sets of the user profile: P CV e = {4, 3, 4, 2.62} Table 3. Central values of the item database a a a a a a Finally, the system omputes the similarity between the user profile and eah item of the the database using the similarity funtion presented in 3 (see table 4) onsidering that all the features have the same importane. Table 4. Similarity between the user profile and the items a 1 a 2 a 3 a 4 a 5 a Providing the reommendations: This is the final step of the reommendation proess. The system will sort out the items aording to the similarity to the user profile and obtains R A = (a 1, a 2, a 6, a 4, a 3, a 5 ) The first item, a1, annot be reommended sine it was hosen as an example of the user s neessities. Let s suppose that the system reommends the two items losest to the user profile, therefore the final reommendations will be: {a 2, a 6 } 252

255 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 5. Conlusions Reommender Systems support users to find the most suitable produts in e-shops within a huge amount of produts aording to their neessities and preferenes. There exists different types of Reommendations Systems, as the Content-based or the the Collaborative Reommendation Systems, that provide good reommendations but they present some problems, overall, related to the amount of information neessary to make reommendations. Hybrid and Knowledge-based reommender systems fae these problems from different points of view. In this ontribution we have presented a Knowledge Based Reommender System that deals with multigranular linguisti information instead of numerial values. The advantage of this representation is that we are able to gather the user s information, that is usually related to pereptions or tastes, without loosing expressiveness or auray. Moreover, we have defined a flexible model to deal with the information in whih eah attribute an be assessed with the most suitable linguisti term set and the users an use linguisti term sets aording to their knowledge or preferenes. Besides, we have proposed the use of a similarity measure based on entral values of fuzzy sets whih is able to ompute the similarity between items. In this manner, we haven t just taken into aount if the assessments are the same, but also we have omputed how different are they from eah other. 6. Aknowledgements This work is partially supported by the Researh Projets TIN , 2007/BA020 and FEDER funds Referenes 1. C. Basu, H. Hirsh, and W. Cohen. Reommendation as lassifiation: Using soial and ontentbased information in reommendation. In Proeedings of the Fifteenth National Conferene on Artifiial Intelligene, pages , P.P. Bonissone and K.S. Deker. Seleting Unertainty Caluli and Granularity: An Experiment in Trading- Off Preision and Complexity, hapter Unertainty in Artifiial Intelligene, pages North- Holland, G. Bordogna and G. Passi. A fuzzy linguisti approah generalizing boolean information retrieval: A model and its evaluation. Journal of the Amerian Soiety for Information Siene, (44):70 82,

256 Luis Gonzaga Pérez Cordón 4. R. Burke. Knowledge-based reommender systems. Enylopedia of Library and Information Systems, 69(32), R. Burke. Hybrid reommender systems: Survey and experiments. User Modeling and User-Adapted Interation, 12(4): , R. D. Burke, K. J. Hammond, and B. C. Young. The findme approah to assisted browsing. IEEE Expert, 12(4):32 40, Mukund Deshpande and George Karypis. Item-based top-n reommendation algorithms. ACM Transations on Information Systems, 22(1): , D. Goldberg, D. Nihols, B. M. Oki, and D. Terry. Using ollaborative filtering to weave an information tapestry. Communiations of the ACM, 35(12):61 70, Robert H. Guttman. Merhant differentation through integrative negotiation in agent-mediated eletroni omere. Master s Thesis, Shool of Arhiteture and Planning, Program in Media Arts and Sienes, Massahusetts Institute of Tehnology, C. Hayes and P. Cunningham. Smart radio - ommunity based musi radio. Knowledge-Based Systems, 14(3-4): , F. Herrera and E. Herrera-Viedma. Linguisti deision analisys: Steps for solving deision problems under linguisti information. Fuzzy Sets and Systems, (115): 67 82, F. Herrera, E. Herrera-Viedma, and L. Martínez. A fusion approah for managing multi-granularity linguisti term sets in deision making. Fuzzy Sets and Systems, (114):43 58, E. Herrera-Viedma, L. Martínez, F. Mata, and F Chilana. A onsensus support system model for group deision-making problems with multigranular linguisti preferene relations. IEEE Transations on Fuzzy Systems, 13(5): , E. Herrera-Viedma, F. Mata, L. Martínez, F Chilana, and L.G. Pérez. Measurements of onsensus in multigranular linguisti group deision making. Modeling Deisions for Artifiial Intelliegene, Proeedings Leture Notes in Computer Siene, (3131): , J. Kolodner. Case-Based Reasoning. Morgan Kaufmann, B. Krulwih. Lifestyle finder: intelligent user profiling using large-sale demographi data. AI Magazine, 18(2):37 45,

257 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 17. E. Levrat, A. Voisin, S. Bombardier, and J. Bremont. Subjetive evaluation of ar seat omfort with fuzzy set tehniques. International Journal of Intelligent Systems, (12): , L. Martínez, J. Liu, J.B. Yang, and F. Herrera. A multigranular hierarhial linguisti model for design evaluation based on safety and ost analysis. International Journal of Intelligent Systems, 20(12): , G. Miller. The magial number sever or minus two: Some limits on our apaity of proessing information. Psyhologial Review, (63):81 97, M. J. Pazzani, J. Muramatsu, and D. Billsus. Syskill webert: Identifying interesting web sites. In AAAI/IAAI, Vol. 1, pages 54 61, Saverio Perugini, Maros Andre Gonalves, and Edward A. Fox. Reommender system researh: A onnetion-entri survey. Journal of Intelligent Information Systems, 23(2): , P. Resnik and H.R. Varian. Reommender systems. Assoiation for Computing Mahinery. Communiations of the ACM., 40(3):56, Mar J.B. Shafer, J.A. Konstan, and J. Riedl. E-ommere reommendation appliations. Data Mining and Knowledge Disovery, (5): , L. A. Zadeh. The onept of a linguisti variable and its appliation to approximate reasoning-i, ii, iii. Information Sienes, 8-9: , , 43 80, L.A. Zadeh. Fuzzy logi = omputing with words. IEEE Transations on Fuzzy Systems, 4(2): ,

258 Luis Gonzaga Pérez Cordón International Journal of Unertainty, Fuzziness and Knowledge-Based Systems World Sientifi Publishing Company IMPROVING THE EFFECTIVENESS OF KNOWLEDGE BASED RECOMMENDER SYSTEMS USING INCOMPLETE LINGUISTIC PREFERENCE RELATIONS* 2 Luis Martínez, Luis G. Pérez, Manuel Barrano, Maarena Espinilla Department of Computer Sienes, University of Jaén, Campus Las Lagunillas s/n Jaén, 23071, Spain martin,lgonzaga,barrano,mestevez@ujaen.es Reeived (reeived date) Revised (revised date) In the e-ommere arena new methods and tools have been reently developed to improve and ustomize the e-ommere web sites, aording to users neessities and preferenes, that are usually vague and unertain. The most suessful tool in this eld has been the Reommender Systems. Their aim is to assist e-shops ustomers to nd out the most suitable produts by using reommendations. Sometimes, these systems fae situations where there is a lak of information or the information is vague or impreise that yield unsuessful results. Although several solutions have been proposed, they still present some limitations. In this paper, we present a Knowledge-Based Reommender System that manages and models the unertainty related to users preferenes by using linguisti information. This system will overome the problem of lak of information by omputing reommendations through ompleting inomplete linguisti preferene relations provided by the users. Keywords: Reommender Systems, Fuzzy Linguisti Approah, inomplete preferene relations, linguisti 2-tuples, e-ommere, e-servies 1. Introdution Reommender Systems 2,5,6,17,26,31,32,33 have been one of the key issues in the development and suess of e-ommere 34. Customers usually fae websites with a huge range of items that an potentially satisfy their requirements. However, only a small set of these will fulfil their preferenes and/or neessities. Unfortunately, these are often diffiult to establish. It may seem a typial deision making problem, where the users must hoose the best alternative(s) amongst the offered ones, but it is not. This is due to the fat that users are unable to explore the entire range of alternatives in the e-shop. For this reason, they usually hoose from the first subset of items that ould partially fulfil their needs. Notwithstanding the fat that they are aware these items are probably not the optimal ones. Reommender Systems an assist ustomers with their shopping searhes by leading them to interesting items by means of reommendations. *This work is partially supported by the Researh Projets TIN , JA031/06 and FEDER funds 256

259 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio All the Reommender Systems have essentially the same aim, to lead users through reommendations to those items that are the most suitable for them. However, the tehniques used to ahieve this aim are different from eah other, both in the proess of gathering information and in the proess of omputing the reommendations. Aording to these tehniques, Reommender Systems are lassified as: Demographi Reommender Systems 26 : these systems ategorize their users into demographi groups, and make reommendations to a speifi user aording to, the information about the people that belong to the same demographi group. Content-based Reommender Systems 30,31,33 : A Content-Based Reommender System learns a user profile based on the features of the items that the user has liked and, it uses this profile to find out similar items that the user ould like. Collaborative Filtering Reommender Systems 17 : they use users ratings to filter and reommend items to a speifi user. In the simplest ase, these systems predit the users preferenes as a weighted aggregation of the other users preferenes. Knowledge Based Reommender Systems 5,32 : these systems use the knowledge about users neessities and how an item mathes these neessities to infer reommendations about whih items fulfil the user s expetations. Utility Based Reommender Systems 18 : they make reommendations by omputing a utility value for eah objet. Hybrid Reommender Systems 2,6 : these systems arose with the aim of addressing several drawbaks presented in the previous ones. To aomplish this aim, they ombine different tehniques to improve the auray of the reommendations. To hoose the most suitable items for a user, all Reommender Systems gather information about the items, the users and their neessities. The information related to users neessities is usually vague and unertain. However, most of Reommender Systems use numerial and preise assessments in the gathering proess. The use of Linguisti Information 46 has provided suessful results modelling unertain information in di erent areas suh as Information Retrieval 4, Clinial Diagnosis 12, Marketing 41, Risk in Software Development 29, Tehnology Transfer Strategy Seletion 9, Eduation 27,28, Deision Making 10,13,21,23,38,40, Consensus 3,25, Reommender Sytems 30,44, et. For this reason, the use of the Fuzzy Linguisti Approah 257

260 Luis Gonzaga Pérez Cordón to model unertainty in Reommender Systems should be further onsidered. On the other hand, another important problem of the Reommender Systems is that information related to the users and items might be sare and insuffiient. In suh ases, lassial Reommender Systems (the ollaborative and ontent-based ones) are unable to make good reommendations. To overome this drawbak, hybrid and knowledge based systems have been used. In this paper we will fous our interest in Knowledge Based Reommender Systems 5, that usually require the users to provide one example of their preferenes. A user profile is then inferred from that example and utilized to find out the most similar items that are returned as reommendations. Sometimes, the information of the user profile inferred from the example might not math the user s preferenes. Therefore, the users ould hange some features of the given example. This task may be tedious and time-onsuming, and not all the users might be willing or trained to aomplish this refinement. The aim of this paper is to provide a linguisti Knowledge Based Reommender System that improves the managing of the two problems previously mentioned: (i) the modelling of vague information and (ii) the lak of information. In order to do this, we propose a Reommender System that deals with a linguisti framework to model the user s preferenes. Regarding the latter problem, our main onern would be to inrease the knowledge about the user by obtaining an aurate and useful user profile, whilst dereasing the time he/she spends to provide it. Hene, to aomplish this seond goal, the system will require the user a preferene relation in order to gather more information. Initially the use of a preferene relation ould result in more time being spent and further inonsistenies. To avoid suh problems and ahieve our goal we propose that the system, will require the user to provide an inomplete linguisti preferene relation that will be ompleted by using an algorithm based on the onsisteny property. In suh a way, the information gathering proess will inrease the knowledge about the users and also derease its time ost. This ontribution is strutured as follows, in setion 2 we shall review some neessary preliminaries to understand our proposal. In setion 3 we shall present our Linguisti Knowledge Based Reommender System while in setion 4 we shall demonstrate the appliation of our model. Finally in setion 5 some onlusions are pointed out Preliminaries This setion analyzes the problems that motivates our proposal, namely the lak of information and the modelling of unertainty in

261 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Reommender Systems. First, we review how does lak of information affet Reommender Systems? Afterwards some onepts about linguisti preferene modelling, suh as, the Fuzzy Linguisti Approah, the 2- tuple Linguisti Representation and linguisti preferene relations are also reviewed. Finally, it is revised the use of the onsisteny property to omplete an inomplete preferene relation Lak of Information in Reommender Systems The Collaborative Filtering 17 and the Content-based Reommender Systems 33 are the most used and well-known types of Reommender Systems, but they are not always suitable. Sometimes, they present important drawbaks. For example, the Collaborative Filtering Reommender Systems need a huge database of users ratings to filter and reommend items to a speifi one. In the simplest ase, these systems predit the users preferenes as a weighted aggregation of the other users preferenes, in whih the weights are proportional to the similarity among users based on their ratings. On the other hand, Content-based Reommender Systems look for new items that are similar to those ones that the user has bought in the past. Therefore, both systems require that the user has assessed a minimum number of items to suggest good reommendations. However, in the real world there are situations where the previous models are not suitable beause of lak of information. Several ommon problems in these models, related to the lak of information were presented in Ref. 6: The new user ramp-up problem: it means inaurate reommendations for users with few ratings. This problem is ommon in both Contentbased Reommender Systems and Collaborative Filtering. New item ramp-up problem: in Collaborative Filtering Reommender Systems an item with few ratings, it is not easy to be reommended. Grey sheep problem: in Collaborative Filtering Reommender Systems ould exist users whose ratings are not onsistently similar with any group of users. Then they will not reeive good reommendations. Quality dependent on large historial data set. To address these problems some alternatives have been presented, suh as the Hybrid Reommender Systems 2,6 and the Knowledge Based Reommender Systems 5. The former ombines different tehniques, usually the ollaborative and ontent-based algorithms to smooth out the disadvantages of both types of Reommender Systems. For instane, they 259

262 Luis Gonzaga Pérez Cordón do not suffer from new item ramp-up problem but they still suffer the new user ramp-up problem. The latter does not suffer from the previous problems but they need a knowledge aquisition proess 6, in whih the users provide one example that reflets their preferenes. The users do not want an item exatly equal to the example. The user then should modify several features of an initial profile inferred diretly from the example. Finally, a user profile is obtained and utilized to find out the user s preferred items from a database. There are several methods to exploit this knowledge 7,8, for example Entree uses ase based reasoning 19 to make reommendations. It s easy to observe that new users an obtain reommendations with these systems. But if the information gathering proess is time-onsuming, the users ould not be willing to provide their preferenes Fuzzy Linguisti Approah It is remarkable that most of the Reommender Systems manage the subjetive information related to the users preferenes or neessities by using risp values 2,5,17,26. In this paper, we shall propose to model this subjetive information by means of linguisti information in order to offer a more flexible and suitable reommendation framework to the users. Usually, we work in a quantitative setting, where the information is expressed by means of numerial values. However, many aspets of different ativities in the real world involve vague or impreise knowledge and annot be easily assessed in a quantitative form, but rather in a qualitative one. In suh a ase a better approah may be to use linguisti assessments instead of numerial values. The fuzzy linguisti approah represents qualitative aspets as linguisti values by means of linguisti variables 46. To deal with the linguisti information we have to hoose the appropriate linguisti desriptors for the term set and their semantis. In the literature, several possibilities an be found (see Ref. 20 for a wide desription). One possibility of generating the linguisti term set onsists of diretly supplying the term set by onsidering all terms distributed on a sale on whih a total order is defined 42. For example, a set of seven terms S, ould be given as follows: S = {s 0 : N, s 1 : V L, s 2 : L, s 3 : M; s 4 : H; s 5 : V H, s 6 : P} Usually, in these ases, it is required that in the linguisti term set there exist: 260

263 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 1) A negation operator: Neg(s i ) = s j suh that j = g-i (g+1 is the ardinality). 2) An order: s i [ s j i [ j. Therefore, there exists a min and a max operator. The semantis of the terms are given by fuzzy numbers defined in the [0,1] interval, whih are usually desribed by membership funtions 14,46. The use of linguisti information implies proesses of omputing with words (CW), in the literature an be found different omputational models: The approximate omputational model based on the Extension Priniple 12. This model uses fuzzy arithmeti based on the Extension Priniple 15 to make omputations over the linguisti variables. The symboli linguisti omputational model 14. This symboli model makes diret omputations on labels, using the ordinal struture of the linguisti term sets. The 2-tuple linguisti omputation model 22. It uses the 2-tuple fuzzy linguisti representation model The 2-Tuple Linguisti Representation Model Here we review the linguisti 2-tuple representation model 22 that we shall use in our proposal to arry out proesses of CW in a preise way. This model is based on the onept of symboli translation. The 2-tuple fuzzy linguisti representation model represents the linguisti information by means of a 2-tuple, (s, a), where s is a linguisti label and a is a numerial value that represents the value of the symboli translation. Definition 1. The Symboli Translation of a linguisti term s i S = {s 0,,s g } is a numerial value assessed in [ 5,.5) that supports the differene of information between an amount of information b [0, g] and the losest value in {0,,g} that indiates the index of the losest linguisti term s i S. Being [0, g] the interval of granularity of S. This linguisti representation model defines a set of funtions to make transformations between linguisti 2-tuples and numerial values: Definition 2. Let S = {s 0,,s g } be a linguisti term set and b [0, g] a value that represents the result of a symboli aggregation operation. The 2-tuple that expresses the equivalent information to b is obtained as: 261

264 Luis Gonzaga Pérez Cordón 262 D: [0, g] S % [ 0.5, 0.5) s D(b) = (s i, a), with [0, g] i i = round(b) ) a = b i a [.5,.5) where round(.) is the usual round operation, s i has the losest index label to b and a is the value of the symboli translation. Proposition 1. Let S = {s 0,,s g } be a linguisti term set and (s i, a) be a linguisti 2-tuple. There is always a D 1 funtion, suh that, from a 2-tuple it returns its equivalent numerial value b [0, g] in the interval of granularity of S. Proof. It is trivial, we onsider the funtion: D 1 : S % [.5,.5) [0, g] D 1 (s i, a) = i + a = b Remark 1. From definitions 1, 2 and proposition 1, it is obvious that the onversion of a linguisti term into a linguisti 2-tuple is: s i, S ( (s i, 0) This linguisti representation model has assoiated a omputational model defined in Ref. 22 that defines the following basi operations: (1) Comparison of 2-tuples: it is aomplished aording to an ordinary lexiographi order. Let (s i, a i ) and (s j, a j ) be two 2-tuples: (a) if i < j then (s i, a i ) is smaller than (s j, a j ) (b) if i = j then i. if a i = a j then (s i, a i ) and (s j, a j ) represents the same information ii. if a i < a j then (s i, a i ) is smaller than (s j, a j ) iii. if a i > a j then (s i, a i ) is bigger than (s j, a j ) (2) Aggregation of 2-tuples: the aggregation of linguisti 2-tuples onsists of obtaining a value that summarizes a set of values. In Ref. 22 we an find several 2-tuples aggregation operators. (3) Negation operator of a 2-tuple: this operator is defined as: Neg (s i, a) = D `g D 1 (s i, a)j where g + 1 is the ardinality of S Preferene relations One we had deided the modelling of the subjetive information in our model, we had to deide whih struture of representation would

265 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio be the more adequate to our aims. There exist different strutures to represent preferenes about a set of items X = {x 1,, x n } The most ommon ones are: (1) A preferene ordering of items 11 : in whih a user provides his/her preferenes about X as an individual preferene ordering O k = {o k (1),,o k (n)}, where o k (.) is a permutation funtion over the index set {1,, n} in whih the items are ordered from best to worst. (2) A utility vetor 37 : the preferenes are provided by using a set of n utility values U k = {u k i,i = 1,,n}, in whih, u k i, represents the utility assessment for the item x i. The bigger the evaluation the more the preferene. (3) A preferene relation 35 : in this representation the information is desribed bya preferene matrix P ` X % X, P = (p ij ), where p ij indiates the preferene intensity for the item x i regarding the item x j. p 11 Q P = Æ Ø Æ p n1 p nn a In our proposal we shall deal with preferene relations beause the user an provide more detailed information about the his/her preferenes. Initially this representation ould be time-onsuming and lead to inonsistenes. But to overome these drawbaks we will take advantage that in the literature has been studied the use of preferene relations where the users are under time pressure, either there is a lak of information or some alternatives ould be unknown 1,24,39. In these ases some preferenes, p ij, ould be missed. Suh relations are alled inomplete preferene relations, that we shall use in our proposal in order to improve the time ost and onsisteny of the information gathering proess. Here, we review some definitions about preferene relations that are used in our proposal of Knowledge Based Reommender System dealing with inomplete preferene relations. Definition 3. A reiproal numerial relation11;16;36 about a set of alternatives X = {x 1,, x n } is a funtion regarding the alternatives set X % X: p 1n n p : X % X [0, 1], where every value meets the onditions that p ij = 1 p ji 6i, j {1,, n} and represents the preferene degree or intensity of alternative, x i regarding, x j : Q a 263

266 Luis Gonzaga Pérez Cordón 264 p ij = 1/2 indiates indifferene between x i and x j. (x i i x j ) p ij = 1 indiates that x i is absolutely preferred to x j p ij > 1/2 indiates that x i is preferred to x j (x i n x j ) Definition 4. A reiproal numerial relation 11,16,36 about a set of alternatives X = {x 1,, x n } is additive onsistent if and only if: p ij + p jk + p ki = 3 2 6i [ j [ k Definition 5. 1 A funtion f : X Y is partial if every element in the set X not neessarily maps onto an element in the set Y. However, if every element from the set X maps onto one element of the set Y then f is a total funtion. Definition 6. 1 A preferene relation P about a set of alternatives X with a partial funtion is an inomplete preferene relation. We have pointed out that our proposal will model the information provided by the users by means of linguisti information by using the linguisti 2-tuple representation model. We shall then deal with linguisti preferene relations as: Definition 7. Let X = {x 1, x 2,, x n } be a set of alternatives and S a linguisti term set, the preferene attitude about X an be defined as a linguisti preferene relation, P = (p ij ), i, j = 1,, n, based on the 2-tuple linguisti model as: n p : X % X S % [ 0.5, 0.5], where np (x i, x j ) = p ij S % [ 0.5, 0.5) is a 2-tuple whih denotes the preferene degree of alternative x i regarding x j. If there is not a 2-tuple for every pair of alternatives, we have an inomplete linguisti preferene relation Dealing with inomplete linguisti preferene relations We mentioned that the use of preferene relations an be time onsuming and ontain inonsistenies from the user. We then propose the use of inomplete preferene relations to improve the effiieny of the information gathering proess as well as failitates the avoidane of inonsistenes. To do so, we shall omplete suh inomplete preferene relations by means of a ompletion algorithm based on the onsisteny property. There exist different algorithms 1,24,39 to omplete an inomplete preferene relation. The method suggested by Alonso et al. in Ref. 1 provides several interesting mathematial and onsisteny properties in order to omplete an inomplete linguisti preferene relation. Due to this fat, it will be used in our proposal and reviewed in further detail.

267 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Let P an inomplete linguisti preferene relation, P = (p ij ), whose assessments belong to a linguisti term set S = {s 1,, s g }. The preferene relation must fulfil the ondition 6i j i! j p ij is known or p ji is known. P, an be then ompleted with the algorithm proposed in Ref. 1 as follows: 1. Initializations P = D 1 (P) EMV 0 = 4 h = while EMV h! 4{ 2.2. for every (i, k) EMV h { 2.3. K = Hik 1 = {j! i, k (i, j),(j, k) KV h}; if (H ik 1!4)then K = K 4 {1} 2.5. Hik 2 = {j! i, k (i, k),(j, i) KV h }; if (H ik!4)then 2 K = K 4 {2} 2.6. Hik 3 = {j! i, k (i, j),(k, j) KV h }; if (H ik!4)then 3 K = K 4 {3} p jl ik 2.7. p ' ik = 1 j H ik # f l p l #Hik l 2.8. if p ik < 0 then p ik = 0 else if p ik > g then p ik = g 2.9. p ik = p ik } h + + } 3. P = D (P ) where: KV h means known values in iteration h UV h means known values in iteration h EMV h is the subset of the missing values whih an be alulated in step h EMV h = {(i, k) UV h j Hik 1 4 H ik 2 4 Hik} 3 p j1 ik = p' ij + p' jk _ g 2 ; pj2 _ p'ji g ; 2 pj3 _ p'kj ik = p' ij + ik = p' jk + An example about how this algorithm an omplete an inomplete preferene relation is showed. Example. Let S = {s 0 = VL, s 1 = L, s 2 = I, s 3 = H, s 4 = VH} and X = {x 1, x 2, x 3, x 4 } be a linguisti term set and a set of alternatives respetively. Step 1 Let s suppose a user provides the following inomplete linguisti preferene relation, P: g 2 265

268 Luis Gonzaga Pérez Cordón 266 P = Q (V L,0) (L, 0) (H, 0) x x x x x x x x x a The preferene relation P is transformed into, P, by means of the funtion D 1 : Step 2 P ' = Q a x x x x x x x x x Then the algorithm desribed by the steps 2.1 to 2.11 is applied to omplete the preferene relation P : P ' = Q a These values have been omputed with the following alulations: p 23 = p 13 p = = 3.00; p 23 = 3.00 p 32 = p 12 p = = 1.00; p 32 = 1.00 p 24 = p 14 p = = 5.00; p 24 = 4.00 p 42 = p 12 p = = 1.00; p 42 = 0.00 p 34 = 1 3 (]p 32 + p 24 2g (]p 14 p g + ]p 24 p g) + + ]p 32 p g) = 1 3 (] g + 1 (]3 1 +2g + ] g) ] gg = 3.17; p 34 = 3.17 p 43 = 1 3 (]p 42 + p 23 2g (]p 13 p g + ]p 23 p g) + + ]p 42 p g) = 1 3 (] g + 1 (]1 3 +2g + ] g) ] g = 0.83; p 43 = 0.83 p 21 = 1 2 (]p 23 p g + ]p 24 p gg = = 1 2 (]3 1 +2g + ] g) = 3.5; p 21 = 3.5 p 31 = 1 3 (]p 32 + p 21 2g + ]p 21 p g ]]p 32 p g) + + ]p 34 p gg) = 1 3 (] g + ] g (] g + ] gg) = 2.53; p 31 = 2.53 p 41 = 1 3 (1 2 ]]p 42 + p 21 2g + ]p 43 + p 31 2gg ]]p 21 p g + + ]p 31 p g) (]p 42 p g + ]p 43 p gg) = 1 3 (1 2 ]] g + ] g) + 1 (] g ] g (] g + ] gg) = 1.59; p 41 = 1.59 Step 3 Finally, we transform the preferene relation, P, into a 2-tuple linguisti preferene relation, P, by means of the funtion D: Q a Q a Q a

269 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio P '' = Q (V L,0) (L, 0) (H, 0) (H, 0.5) (H, 0) (V H,0) (H, 0.47) (L, 0) (H, 0.17) (I, 0.41) (V L,0) (L, 0.17) a 3. A Knowledge Based Reommender System Based on Inomplete Preferene Relations In this setion, we present our model for a Knowledge-Based Reommender System that deals with inomplete linguisti preferene relations. The information required by this system to aomplish its proesses is: Users neessities. An inomplete linguisti preferene relation is required on-line when the user demands a reommendation. Information about all the items that an be reommended. Eah item is desribed by a vetor of features where eah feature will be assessed with a number that belongs to the interval [0, 1]. These desriptions are stored in a database. This model will have a key advantage regarding the ontent-based 30,33 and the ollaborative ones 17. Due to the fat that these systems require historial information about the preferenes of the user in the past and omplex proesses for aquiring user s preferenes. However, our Knowledge Based Reommender System only needs a seletion of four or five preferred items that the user must hoose, and then provide an inomplete preferene relation about them. With this information the system builds a omplete user profile that will use to find out the most promising items for the user from a database that ontains all the items that an be purhased. Therefore in our proposal the system will deal with a database noted as, X. Let X = {x 1,, x m } be the set of items to be reommended and eah one is desribed by a vetor of features x i = { 1 i,..., t i }. Although the proess of building this type of database ould be automati, it is usually required the assistane of an expert 6 to define, (i) whih features are important, (ii) whih values ould be used, (iii) if there is any kind of relationship between different values, et. One we have got the database, the proposed system will deal with the following three phases (see figure 1): (i) Aquiring the user preferene information: The aim of this phase is to gather the user s preferene information. This phase is a two-step proess: (a) Setting the favourite examples: The user will hoose his/her favourite examples. He/she will then provide an inomplete Q a 267

270 Luis Gonzaga Pérez Cordón linguisti preferene relation providing just one row of the relation. (b) Completing the preferene relation: By using the algorithm proposed in setion 2.5 the inomplete linguisti preferene relation is ompleted. (ii) Building the user profile: The system infers a user profile by using the omplete preferene relation and, the desriptions of the items ontained in the database. This phase has two steps: (a) Building partial user profiles: The system exploits the preferene relation to obtain partial user profiles. (b) Obtaining the user profile: from the previous profiles is omputed the final one. (iii) Reommendation: The system makes use of the user s profile to find out the items that best satisfy his/her neessities or preferenes. 268 Fig. 1. Reommendation Model

271 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio We present in further detail these phases in the following subsetions Aquiring the user preferene information The goal of this phase is to obtain information about the user s preferenes. First, the user must hoose some items (four or five) as examples of his/her preferenes, tastes or neessities. Due to the fat that the database, X, an be huge to make easier this hoie task, the system offers a subset X r = {x r 1, x r 2,, x r m'} (m [ m). This subset should be big enough to have items that represent any kind of user s neessities, but not too big sine users ould find the task of hoosing the example of his/her neessities too tedious and time-onsuming. Moreover, these items ought to be well-known for almost everyone. There are several ways to obtain this subset, the easiest way is to use lists of items reated by experts or the bestsellers, for instane, CDNOW ( offers their users lists of CDs by genre reated by musi experts or let them onsult the bestsellers at the moment. It would be easy to define, X r, from these lists. Remark 2. There is not any orrelation between well-known and preferred, i.e., in this set, users ould find interesting items as well as items that the user dislikes. For instane, in reommendation of hotels the Hilton Hotels are well known but it might be that the user does not like Setting the favourite examples The set, X r, is shown to the user, so he/she an hoose a subset X u = {x u 1,, x u n}, with four or five elements, aording to his/her needs. Afterwards, the system inquires the users to express their preferenes amongst the elements of X u, by means of an inomplete linguisti preferene relation where their preferenes are assessed in a linguisti term set S = {s 0,, s g }. Due to the fat that one main goal of our proposal is derease the time of the information gathering proess. The system will require the user only one a row of the preferene relation. It will be then ompleted by using the algorithm presented in setion 2.5. So, the system provides three main benefits in order to gather the user s information: (i) The task is easier and quiker for the user: he/she provides the minimum information neessary. (ii) The proposed algorithm ompletes an inomplete preferene relation with an only row of known values and avoids inonsistenies. 269

272 Luis Gonzaga Pérez Cordón (iii) Sine the system uses several examples, the reommendations are less dependent on the adequay of the examples than in lassial Knowledge Based Reommender System. On the one hand, in lassial Knowledge Based Reommender Systems the reommendations are led by one example. If suh an example is not adequate, the reommendations will be likely inaurate. When reommendations are led by several examples, it will be more likely to obtain better reommendations whenever some of the examples are adequate Completing the preferene relation One the user has provided only one row of the preferene relation. The system then ompletes this preferene relation by applying the algorithm showed in 2.5. The result is the following preferene relation: p 11 p p 1n Q P '' p = 21 p p 2n p n 1 p n 2... p nn a where p 1j is a known value provided by the user about the preferene of x u 1 regarding x u j, expressed in the linguisti term set S, and p* ij is a value estimated about the preferene of x u i regarding x u j. By definition, p ii is the indifferene term of the term set S 3.2. Building the user profile Now the system has a omplete linguisti preferene relation, the following phase will be to ompute a user profile in order to ompare the user s neessities with the items stored in the database. The system omputes the user s profile by using the omplete preferene relation, P, and the desriptions of the items in X u, onsidered in suh a preferene relation. The user profile is omputed in two steps: Building partial user profiles For eah olumn of the preferene relation, (p 1j, p 2j,, p nj ), the system obtains a partial user profile that represents the user s preferenes related to the item x u j X u by aggregating the vetors of harateristis of the items, x u i = { u i 1,, ut i }, i {1,, n} and i! j. The aggregation operator used in our proposal is the IOWA (Indued OWA) operator proposed in Ref. 43. The IOWA operator aggregates pairs of values, (v i, a i ). Within these pairs, v i is alled the order induing value and, a i the argument value. The IOWA aggregation operator ats as: F W ( v 1, a 1,, v l, a l ) = W T B v Q a

273 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio where B v = (b 1,, b l ) is the result of ordering the vetor A v = (a 1,, a l ) aording to the value of the order induing variables, v i, and W T is the olumn vetor of weights whih satisfies the following onditions: W = (w 1,..., w l ) w i [0, 1]6i, l i=1 w i = 1 Here is omputed a partial profiles, %pp j = ` 1 pp j,..., t pp j j, j = {1,, n}/ for eah item, x u j. The partial profile, pp j, is a vetor whose values indiate the user s preferenes aording to his/her neessities with regards to the item x u j. The partial profile, pp j is obtained by aggregating the vetors {( 1 i,, t i),6 i! j} that desribes the items {x u i,6 i! j}. Eah element, k pp j, is obtained by aggregating the n 1 elements { k i,6 i! j} by means of the IOWA operator. Therefore, for the element k pp j, the order induing variables are the values of the preferene relation, p ij, suh that, {p ij,6 i! j}. Then: k pp j = F W p 1j, k 1,..., p nj, k n = W T B v, where the vetor B v = (b 1,, b n 1 ) is given by a dereasing order of the elements of the set {x u i,6 i! j} aording to the order indued by the values, (p 1j,, p nj ). There are different methods to ompute the weighting vetors W = (w 1,, w n 1 ). Yager suggested an interesting way to ompute the weighting vetor for OWA operators using non-dereasing linguisti quantifiers 43. A non-dereasing linguisti quantifier must satisfy three properties: (i) Q(1) = 1 (ii) Q(0) = 0 (iii) Q(r 1 ) m Q(r 2 ) if r1 m r2 Fig. 2. Non-dereasing proportional quantifier 271

274 Luis Gonzaga Pérez Cordón In the ase of a non-dereasing proportional quantifier Q (see fig. 2), the weights for the element i, for i = 1,, n 1, are omputed by the following expression: i w i = Q Q i 1 n 1 n 1 where the membership funtion of a non-dereasing proportional quantifier Q is as follows: Q(x) = * Obtaining the final user profile 0 x b 1 a a if x < a if a [ x [ b if x > b The system needs a user profile, FP u = ( i fp), i = 1, t, in order to ompute the reommendations. To obtain suh a profile, it ombines the partial ones (see figure 3), pp 1,, pp n, by using again the IOWA operator. The aggregation of the partial profiles, pp j = ` 1 pp j,..., t pp j j, obtained for every item x r j is omputed as: k fp = F W p 1, k pp 1,..., p n, k pp n = W T B v, Fig. 3. Building the user profile where the vetor B v = (b 1,, b l ) is given by a dereasing order of the values { k pp 1, i = 1,, n} aording to the order indued by the variables, (p 1,, p n ). The weighting vetor W = (w 1,, w l ) is obtained by using a linguisti quantifier. The order induing variables (p 1,, p n ) represent the importane of eah partial profile. The more important the partial profile the better the user s neessities are represented. To ompute these values the system uses the following funtion: 272

275 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio p i = 1 n 1 j =0 j =i (b ji ) n Where b ji = D(p ji ) and p i represents a mean of the preferenes provided by the user about the item x i. These preferenes are obtained from the preferene relation, P. Finally, the system obtains the user profile, FP u, that will be used in the reommendation phase Reommendation FP u = ( 1 fp,..., t fp) This is the most important phase of the Reommender System. One the user profile FP u = ( 1 fp,..., t fp), has been omputed the system should reommend the losest items to the user s neessities. The item database X = {x 1, x 2,, x m }, ontains all the items that ould be reommended. Where eah item x i, is desribed by a set of features x i = { 1 i,, t i}. The proess of omputing the most similar items to the user profile onsists of omparing eah item desription, x i, with the user profile, FP u. To do so, the system will ompute the similarity between the item, x i, and the user profile. We propose a measurement of similarity based on the osine of two vetors 45 defines as (see figure 4): Definition 8. The similarity between the user profile, FP u and the item x i is obtained as Similarity(F P u, x i ) = os F P u, x i = F P u x i F P u x i Fig. 4. Similarity between the final user profile and an item 273

276 Luis Gonzaga Pérez Cordón Finally, the system will reommend to the user a set of k items, X = {x 1, x 2,, x m }, that verifies: (1) If x i X B then x i v X u. (2) Similarity (FP u, x i ), x i X B are the top-k greatest values of similarity of the x i X X u 4. Appliation of the Knowledge Based Reommender System based on Inomplete Linguisti Preferene Relations Here we present an appliation of the proposed model. Let X = {x 1, x 2,, x m } be a database of musi CDs, in whih every item is desribed by a set of eatures assessed in [0, 1] (see Table 1). The system will use these features to ompute the reommendations, but the user will reeive a brief desription easy to understand about the items (Singer, duration, musi style,...). Following, it is showed in detail the reommendation proess of our system. Table 1. Produts database Desription Item item x item x item x item x item x item x item x item x item x item x m (i) Aquiring the user preferene information. The system will show the set X r = { x r 1, x r 2,, x r m'} (m [ m) of the most illustrative examples of the system, and the user will selet the four losest examples of his/her neessities (see Table 2). Let s suppose the user 274

277 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio has hosen as examples of his/her neessities the CDs Spirit, 0304, Cry, No Angel, being Xu = {x 11, x 12, x 32, x 41 }. Table 2. Given examples Hidden desription CD Item Spirit x x Cry x No Angel x Item (a) Setting the favourite examples. The user assesses his/her preferenes in the linguisti term set, S: S = {s 0 = VL, s 1 = L, s 2 = I, s 3 = H, s 4 = VH}, where VL, L, I, H, VH stand for Very Low, Low, Indifferene, High and Very High respetively. The user provides an inomplete preferene relation: P = Q a (s 2, 0) (s 0, 0) (s 1, 0) (s 3, 0) (s 2, 0) (b) Completing the preferene relation. (s 2, 0) (s 2, 0) The system ompletes the user s preferene relation by using the algorithm presented in setion 2.5 obtaining a omplete preferene relation, P : Q a P '' = Q a (s 0, 0) (s 1, 0) (s 3, 0) (s 3, 0.5) (s 3, 0) (s 4, 0) (s 3, 0.47) (s 1, 0) (s 3, 0.17) (s 2, 0.41) (s 0, 0) (s 1, 0.17) Q a 275

278 a Q Luis Gonzaga Pérez Cordón (ii) Building the user profile. First the system builds the partial profiles, and then, obtains the user profile from the partial profiles. To do so, it uses the IOWA operator. The weighting vetors used by this operator in both proesses are, W and W, respetively. In this example, the weights are omputed by using a linguisti quantifier represented by the values a = 0 and b = 0.5 in the equation (1). The vetors obtained are W = (0.67, 0.33, 0) and W = (0.5, 0.5, 0, 0). (a) Building the partial user profiles. Following the proess presented in the partial profiles obtained an be seen in the Table 3 and its omputation is as follows: 1 pp 1 = F W ( (s 3, 0.5), 1, (s 3, 0.47), 0.5, (s 2, 0.41), 0.1 ) = 1 = (0.67, 0.33, 0) Q a = = 0.83 Table 3. Partial profiles Desription Partial profile pp pp pp pp (b) Obtaining the user profile. The user profile is omputed by aggregating the partial profiles with the weighting vetor W and the order induing variables, (p 1, p 2, p 3, p 4 ), omputed as: p 1 = n j =0 j ]1 p 2 = b j 1 = 1 ( ) = n j =0 j ]2 b j 2 = 1 ( ) =

279 a Q Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio p 3 = p 4 = n j =0 j ]3 n j =0 j ]4 b j 3 = 1 ( ) = b j 4 = 1 ( ) = Then the final user profile obtained is showed in the Table 4 and its omputation is arried out as: 1 fp = F' W 0.83 Q a0.67 = = 0.83 Table 4. Profile FP u FP u (iii) Reommendation. The system will reommend the k-losest items in the database to the user profile aording to its rules introdued in setion 3.3, (see Table 5). Table 5. Reommendations Produt ID Similarity item x item x item x item x Let s suppose in this ase that k = 3. Then the reommended items will be X B = {x 2, x 1, x 21 }beause x 11 X u. 277

280 Luis Gonzaga Pérez Cordón 5. Conlusions From a limited knowledge of users needs and preferenes Reommender Systems will help them to find the most suitable items from a huge range of alternatives ontained in e-shops. Different types of Reommender Systems exist, suh as the Content-based and the Collaborative Filtering Reommender Systems. Generally, both of these systems provide good reommendations. However, they present some drawbaks related to the management of unertainty and to the lak of information that an yield unsuessful results. In order to redue the impat of those drawbaks, we have proposed a Knowledge Based Reommender Systems that gathers an inomplete linguisti preferene relation whih only requires a single row to be provided. From this row the preferene relation an be ompleted by using the onsisteny property in order to exploit it and obtain better reommendations. Suh a system is also less time-onsuming in the information gathering proess for the user. Referenes 1. S. Alonso, F. Chilana, F. Herrera, E. Herrera-Viedma, J. Alalá, and C. Porel, A onsisteny based proedure to estimate missing pairwise preferene values, International Journal of Intelligent Systems 23 (2008) C. Basu, H. Hirsh, and W. Cohen, Reommendation as lassifiation: Using soial and ontent based information in reommendation, Proeedings of the Fifteenth National Conferene on Artifiial Intelligene, Nov 1998, pp D. Ben-Arieh and Z. Chen, Linguisti group deision-making: Opinion aggregation and measures of onsensus, Fuzzy Optimization and Deision Making 5 (2006) G. Bordogna and G. Passi, A fuzzy linguisti approah generalizing boolean information retrieval: A model and its evaluation, Journal of the Amerian Soiety for Information Siene 44 (1993) R. Burke, Knowledge-based reommender systems, Enylopedia of Library and Information Systems R. Burke. Hybrid reommender systems, Survey and experiments, User Modeling and User-Adapted Interation 12 (2002)

281 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 7. R. D. Burke, K. J. Hammond, and B. C. Young, Pro. Knowledgebased navigation of omplex information spaes, Nov. 1996, pp R. D. Burke, K. J. Hammond, and B. C. Young, The findme approah to assisted browsing, IEEE Expert 12 (1997) P. Chang and Y. Chen, A fuzzy multiriteria deision making method for tehnology transfer strategy seletion in biotehnology, Fuzzy Sets and Systems 63 (1994) Z. Chen and D. Ben-Arieh, On the fusion of multi-granularity linguisti lable sets in group deision making, Computers and Industrial Engineering 51 (2006) F. Chilana, F. Herrera, and E. Herrera-Viedma, Integrating three representation models in fuzzy multipurpose deision making based on fuzzy preferene relations, Fuzzy Sets and Systems 97 (1998) R. Degani and G. Bortolan, The problem of linguisti approximation in linial deision making International Journal of Approximate Reasoning 2 (1988) M. Delgado, J.L. Verdegay, and M.A. Vila, Linguisti deision making models, International Journal of Intelligent Systems 7 (1992) M. Delgado, J.L. Verdegay, and M.A. Vila, On aggregation operations of linguisti labels, International Journal of Intelligent Systems 8 (1993) D. Dubois and H. Prade, Fuzzy Sets and Systems: Theory and Appliations (Aademi Press, 1980). 16. J. Fodor and M. Roubens, Fuzzy Preferene Modelling and Multiriteria Deision Support (Springer, 1994). 17. D. Goldberg, D. Nihols, B. M. Oki, and D. Terry, Using ollaborative filtering to weave an information tapestry, Communiations of the ACM 35 (1992) H.R. Guttman, Merhant Differentiation through Integrative Negotiation in Agent-mediated Eletroni Commere, Ph.D. Thesis, K.J. Hammond, Case-Based Planning: Viewing Planning as a Memory Task, (Aademi Press In, 1989). 279

282 Luis Gonzaga Pérez Cordón 20. F. Herrera and E. Herrera-Viedma, Linguisti deision analisys: Steps for solving deision problems under linguisti information, Fuzzy Sets and Systems 115 (2000) F. Herrera, E. Herrera-Viedma, and J.L. Verdegay, A sequential seletion proess in group deision making with linguisti assessment, Information Siene 85 (1995) F. Herrera and L. Martínez, A 2-tuple fuzzy linguisti representation model for omputing with words, IEEE Transations on Fuzzy Systems 8 (2000) F. Herrera and L. Martínez, A model based on linguisti 2-tuples for dealing with multigranular hierarhial linguisti ontexts in multiexpert deision-making, IEEE Transations on Systems, Man and Cybernetis 31 (2001) E. Herrera-Viedma, F. Herrera, F. Chilana, and M. Luque, Some issues on onsisteny of fuzzy preferene relations, European Journal of Operational Researh 154 (2004) E. Herrera-Viedma, L. Martínez, F. Mata, and F. Chilana, A onsensus support system model for group deision-making problems with multigranular linguisti preferene relations, IEEE Transations on Fuzzy Systems 13 (2005) B. Krulwih, Lifestyle finder: intelligent user pro ling using largesale demographi data, AI Magazine 18 (1997) M. Lalla, G. Fahinetti, and G. Mastroleo, Ordinal sales and fuzzy set systems to measure agreement: An appliation to the evaluation of teahing ativity, Quality and Quantity 38 (2004) C.K. Law, Using fuzzy numbers in eduational grading systems, Fuzzy Sets and Systems 83 (1996) H. Lee, Group deision making using fuzzy sets theory for evaluating the rate of aggregative risk in software development, Fuzzy Sets and Systems 80 (1996) L. Martínez, L.G. Pérez, and M. Barrano, A multi-granular linguisti ontent-based reommendation model, International Journal of Intelligent Systems 22 (2007) F. MCarey, M. Cinn eide, and N. Kushmerik, Rasal: A reommender agent for agile reuse, Artifiial Intelligene Review 24 (2006)

283 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 32. D. MSherry, Inreasing dialogue effiieny in ase-based reasoning without loss of solution quality, In Proeedings of the Eighteenth International Joint Conferene on Artifiial Intelligene, Aapulo, Mexio, 2003, pp M. J. Pazzani, J. Muramatsu, and D. Billsus, Syskill webert: Identifying interesting web sites, AAAI/IAAI, Vol. 1, Nov. 1996, pp J.B. Shafer, J.A. Konstan, and J. Riedl, E-ommere reommendation appliations, Data Mining and Knowledge Disovery 5 (2001) T. Tanino, Fuzzy preferene orderings in group deision making, Fuzzy Sets and Systems 12 (1983) T. Tanino, Non-Conventional Preferene Relations in Deision Making hapter Fuzzy Preferene Relations in Group Deision Making (Springer-Verlag, 1988) pp T. Tanino, Multiperson Deision Making Using Fuzzy Sets and Possibility Theory hapter On Group Deision Making under Fuzzy Preferenes (Kluwer Aademi Publisher, 1990) pp M. Tong and P.P, Bonissone. A linguisti approah to deision making with fuzzy sets, IEEE Transations on Systems, Man and Cybernetis 10 (1980) Zeshui Xu, Inomplete linguisti preferene relations and their fusion, Information Fusion 7 (2006) R.R. Yager, Fuzzy Logi: State of the Art hapter Fuzzy Sreening Systems (Kluwer Aademi Publisher, 1993) pp R.R. Yager, L.S. Goldstein, and E. Mendels, FUZMAR: An approah to aggregating market researh data based on fuzzy reasoning, Fuzzy Sets and Systems 68 (1994) R.R. Yager, An approah to ordinal deision making, International Journal of Approximate Reasoning 12 (1995) R.R. Yager, Indued aggregation operators, Fuzzy Sets and Systems 137 (2003) R.R. Yager, Fuzzy logi methods in reommender systems, Fuzzy Sets and Systems , Y. Yang, Expert network: Effetive and effiient learning from human deisions in text ategorization and retrieval, Proeedings of the 17th Annual International ACM-SIGIR Conferene on Researh 281

284 Luis Gonzaga Pérez Cordón and Development in Information Retrieval (Dublin, Ireland, Jul. 1994) pp L. A. Zadeh, The onept of a linguisti variable and its appliation to approximate reasoning- I, II, III, Information Sienes, 8-9 (1975) , ,

285 D.8. REJA. Reommender system of restaurants in Jaén In this hapter we will introdue a reommender system for restaurants in the provine of Jaén that implements some of the proposals presented in our memory. The development of this system was supported by a projet of the Offie of Turism, Commere, and Athletis of the Andalusian Government (Consejería de Turismo, Comerio y Deporte de la Junta de Andaluía) as part of the 2006 offiial programme Subsidies for the development of ampaigns to raise publi awareness of the touristi quality of Andalusia and thanks to a grant published the 21st of Marh 2006, and granted the 16th of August REJA is a highly funtional hybrid reommender system implemented upon a database of restaurants in the provine of Jaén. The reommender system is omposed of two different reommender models: 1. A ollaborative filtering reommender system 2. A knowledge based reommender system with linguisti preferene relations. Our aim with this system was to develop a reommender system that an make reommendations where, due to the features of the ontexts, lassi reommender systems are unable to make them. For example, it is hard in some situations to implement reommender systems of restaurants or leisure entres, sine, they present they following problems: Many of their users are asual users that will not interat with the system again, or they will hardly ever interat. Classi reommender systems are unable to make reommendations as they do not have any historial information about them. Most of the users will have knowledge based on expetations about what they want or need. It is ommon that they system deals with users that do not want to reeive reommendations based on their historial information. It ould be aused beause they want to elebrate something not related with their usual behaviour, for example, a birthday. In suh ases, the historial information is not relevant, and it should not be used. 283

286 Luis Gonzaga Pérez Cordón Following we will explain the reommender systems mentioned and the user interfae of REJA. D.8.1. Hybridation outline In this reommender system, it was used the ommutation mehanism for hybridizing the reommendations algorithm [31]. The ommutation mehanism hoose whih reommendation algorithm is going to be used depending on the situation. This way of hybridation presents several advantages: It is easy to implement, sine it is very straightforward. As the reommendation algorithms are independent, their implementation is the same as they were used by its own without any hybridation. This hybridation was used, sine it seemed to be the best option for our purposes. If users want to reeive reommendations, they must indentify themselves in the system. Depending on how they want to reeive these reommendations, and the information they have provided, the system will hoose the ollaborative filtering algorithm or the knowledge based one: It will use the ollaborative filtering one, when users want to reeive reommendations based on their historial information. It will use the knowledge based one, when users want to reeive reommendations by giving examples that represent their neessities. The model implemented here, is the same as the RRPI mode presented in setion D.7. Collaborative System In the ollaborative reommender system the reommendations are exlusively based on the resemblane terms among the users. The operation of this type of reommender system runs as follows (see figure D.5): 1. The system saves a profile for eah user whih inludes the database items that the user knows and has evaluated. 2. The degree of resemblane among the different users is measured on the basis of their profiles. Hene, groups of users with similar harateristis are reated. 284

287 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio 3. The system will use all the information obtained in the previous ations in order to make the reommendations. It will reommend to eah user items they have not evaluated yet and that have been positively evaluated by the remains of the group. Figure D.5: How ollaborative filtering algorithm works Consequently, these reommender systems do not take into aount the ontents and harateristis of the produts they reommend, but the taste of those users who share a similar profile with the user who requires the servie. In REJA we have used a ollaborative filtering engine alled CoFE that ould found in the url ( Due to the fat, that there is a great variety of olaborative filtering reommender system in the literature and we have used a standard implementation based on CoFE, we will not present in detail how this model works sine all the information an be found in [178, 66, 70, 71, 73, 74, 72, 75, 112, 141, 149]. Knowledge based reommender system The most ommonly used reommender systems (ollaborative and ontent-based) have a series of onstraints that an have an influene on the quality of the generated reommendations. These reommender systems need historial ratings (or information ) of the past ations of the users in order to generate reommendations. However, this information is seldom useful, adequate, or available, when the users are under the irumstanes as ustomers who visit the ity for the first time -and, therefore, it is the first time they use our system-; users that have used the system before, but they wish to have lunh in a restaurant for a speial oasion (birthday party, retirement elebration...) unrelated to any of 285

288 Luis Gonzaga Pérez Cordón their past ations; or users who, have not provided yet enough information to allow the ollaborative system to make aurate reommendations. This module is based on the reommender system model RRPI presented in setion D.7. The phases of this model an be seen in figure D.6. Figure D.6: REJA. Phases This implementation presents a slightly differene with the model presented in setion D.7. Meanwhile in the model users hoose four examples of their neessities, in the implementation users hoose the first one, and the others are hosen by the system. Two of them are the most 286

289 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio reent user rated restaurants and the other one is the furthest similar to the seleted one. D.8.2. User interfae REJA is a web site with information about restaurants that, offers a hybrid reommender system of restaurants in the provine of Jaén. Here we present an example of how REJA works. One, the user visits the web site, the system will show a sreen as it appears in figure D.7. Figure D.7: REJA. Initial sreen To obtain information about a restaurant, users an lik on the option Restaurants on the left part main sreen. One the user has liked this option, it will appear a sreen (see figure D.8) where they an hoose the restaurant by alphabeti order or by the type of restaurant. One one of the options has been hosen, the user must hoose the restaurant he/she wants to get information. The system then will show all the information about it (see figure D.9). 287

290 Luis Gonzaga Pérez Cordón Figure D.8: REJA. Restaurants Figure D.9: REJA. Information about a restaurant Moreover, this system provides a Geographi Information System module (see figure D.10) that lets users know the loation of the restaurant and show a route to go there. Optionally, it an show interesting plaes nearby the restaurant. 288

291 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figure D.10: REJA. Geographi Information Systems Now, we will show, the use of the ollaborative filtering and knowledge based modules. Collaborative Filtering Module First of all, the user has to be identified in our system. Hene, users introdue their login and their password in the right area of the initial sreen (see figure D.7). This login and password have to be provided by the system after ustomer requirement. One we have logged in, the system will show a welome sreen as we see in the figure D.11. In this sreen the system offers two options: 1. To add a new rating: in whih we an provide more information about the restaurants we have visited by giving the opinion about them. 2. To obtain reommendations: in whih the system will provide reommendations to the users. When users hoose the first option, to add a new rating, the system goes to the sreen showed in figure D.12 where the ratings an be added. In order to do that, users must hoose a restaurant, and then they will give a rating by using the sale: very bad, bad, regular, good, very good. This 289

292 Luis Gonzaga Pérez Cordón information will be used by the ollaborative module in order to make reommendations. Figure D.11: REJA. Main sreen one users have been identified Figure D.12: REJA. Add ratings to the restaurants One users have introdued enough ratings, they an reieve reommendations made by ollavorative filtering algorithm liking the option Obtaining reommendations in the wellome sreen (see figure D.11) and the system will provide reommendations, see figure D

293 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figure D.13: REJA. Reommendations from the ollaborative filtering module When the users lik in one of the restaurants, the system will show information about the restaurant (see figure D.14), and they an also provide their ratings. Figure D.14: REJA. Reommendations made by the ollaborative module 291

294 Luis Gonzaga Pérez Cordón Moreover, REJA offers another option related to the ollaborative filtering module. The option My ratings that users an find on the left part of the welome sreen. If an user lik it, they system will show the user profile used by the ollaborative filtering module, that is, all the ratings the user has provided about the restaurants the user has visited and rated (see figure D.15). Figure D.15: REJA. User profile used by the ollaborative filtering module RRPI Module To use this knowledge based reommendation system, the users should log in the system from the initial sreen. One in the welome sreen (figure D.11). They will lik the option Reomendations on the left side and the users will see the interfae for the knowledge based reommendation system (see figure D.16). In this sreen, users have to provide a restaurant that represents their neessities. The system then will offer others three restaurants (two restaurants previously rated by the user and another the furthest similar to the seleted one to the seleted one) that users must ompare with the first one (see figure D.18) in order to provide a inomplete preferene relation. In order to do that, users provide the preferene of the hosen restaurant over the others using a linguisti sale: muh better, better, equal, worse and muh worse. In the figure D.17, we an see in whih phase the RRPI model is at this point. 292

295 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio Figure D.16: REJA. Reommendations to registered users Figure D.17: Model RRPI in REJA. The user provides an example and a preferene relation over the examples 293

296 Luis Gonzaga Pérez Cordón Aording to these preferenes, the system will assemble a preferene matrix whih will be essential to ompute the user s profile (see figure D.19). Figure D.18: REJA. Providing preferene information to the knowledge based reommendation system Figure D.19: Model RRPI in REJA. Obtaining the user profile 294

297 Modelos de reomendaión on falta de informaión. Apliaiones al setor turístio From this user profile, the system will make the reommendation (see figure D.20) that will be given to the users (see figure D.21). Figure D.20: Model RRPI in REJA. Making the reommendations Figure D.21: REJA. Obtained reommendations 295

298 Luis Gonzaga Pérez Cordón The same as the previous ollaborative reommender module, when users lik on the restaurant name, the system will show the information about suh a restaurant (see figure D.22). Figure D.22: REJA. Information about a restaurant D.8.3. Conlusions In this setion, we have presented an implementation of a hybrid reommender system for making reommendations of restaurants in the provine of Jaén. The hybridization tehnique used by this system is known as ommutation. This system is omposed of two modules: 1. A ollaborative filtering module. 2. A knowledge based reommendation module based on the RRPI model presented in setion D.7. In the beginning of this summary, we stated our aims. The main was to develop a prototype of a reommender system. In this hapter, we have presented this prototype, a hybrid reommender system of restaurants in the provine of Jaén. The main ontributions and features are the following ones: 296