IIC 3633 - Sistemas Recomendadores

Documentos relacionados
IIC Sistemas Recomendadores. Denis Parra Profesor Asistente, DCC, PUC CHile

IIC Sistemas Recomendadores

Personalización de Sistemas de Recomendación

IIC Sistemas Recomendadores

IIC Sistemas Recomendadores

Integrando Información de Fuentes Relevantes para un Sistema Recomendador

IIC Sistemas Recomendadores. Denis Parra Profesor Asistente, DCC, PUC CHile

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

Propuesta de proyecto de investigación: desarrollo de un rastreador web capaz de aprender a identificar la información más relevante

INVENTARIO INTRODUCCIÓN RESUMEN DE PASOS

Factorización Matricial en Sistemas Recomendadores Clase de Introducción. Denis Parra 22 de Sep;embre de 2015

Ellos asegurarse de que el sitio tiene un ambiente único que atrae a los usuarios de Internet

Capítulo 4. Sistemas de recomendación

- saber qué son la World Wide Web y las páginas Web - aprender a usar el navegador Explorer - conocer el sitio Web del Portal EDUCANTABRIA

- La realización a su debido tiempo de las actividades y los trabajos que se le encomienden.

Caso práctico 1: Determinación del coste de capital de REGRESENGER.

EJERCICIOS DE LIDERAZGO Profesor: Sergio Rojas Rachel MBA

RELACIONES DE RECURRENCIA

Manual de uso de Moodle para alumnos

IIC Sistemas Recomendadores

Clasificación Bayesiana de textos y páginas web

CRM VENTAS UTILIDAD CARACTERÍSTICAS

IIC Sistemas Recomendadores

Tema: CREACIÓN DE CONSULTAS E INFORMES EN UNA BASE DE DATOS CON MICROSOFT ACCESS 2013.

d s = 2 Experimento 3

ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS

Movimiento a través de una. José San Martín

AUMENTA TUS SEGUIDORES EN

FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B

Clasificación de las mejores Clínicas Dentales Costa Rica

TransUnion República Dominicana. Preguntas frecuentes sobre los modelos de score de TransUnion

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

GESTINLIB GESTIÓN PARA LIBRERÍAS, PAPELERÍAS Y KIOSCOS DESCRIPCIÓN DEL MÓDULO DE KIOSCOS

Recuperación de información desde diferentes perspectivas

Qué son los rangos de usuarios?

Capítulo IV. Implementación del Sistema

Tabla de contenido. Manual B1 Time Task

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

Prof. Claudio del Pino O.

Manual de uso Hacesfalta.org para ONG

MANUAL DE USO DE GLPI

Resultado Encuesta de Satisfacción

Introducción a los sitios de SharePoint en Office 365

IDEA DE NEGOCIO EDUGER LOGISTIC GERMAN EDUARDO BALSERO MORALES PROFESOR: GERARDO ANDRES ARCOS CELIS

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores

Arquitectura de un Sistema Recomendador

Árboles AVL. Laboratorio de Programación II

Lección 14: Problemas que se resuelven por sistemas de ecuaciones lineales

x

MANUAL DE USUARIO DE LA APLICACIÓN DE ACREDITACION DE ACTIVIDADES DE FORMACION CONTINUADA. Perfil Entidad Proveedora

Publicidad de Respuesta Directa y de Correo Directo

MANUAL DE USUARIOS DEL MODULO DE EVALUACIÓN DE DESEMPEÑO SISTEMA DE ADMINISTRACIÓN DE SERVIDORES PÚBLICOS (SASP)

Carteleras. Elaborar una agenda de conciertos y actividades musicales

DIFERENCIAS ESPERADAS EN LA PROGENIE.Y OTRAS COSAS

Ministerio de Educación Nuevo Bachillerato Ecuatoriano. Programación lineal

4.3 INTERPRETACIÓN ECONÓMICA DE LA DUALIDAD

ADAPTAEMPLEO INFORME ACCESIBILIDAD. octubre Versión 1.0

SISTEMA UNICO DE MATRICULA. Universidad Nacional Mayor de San Marcos. Guía de usuario del Sistema Único de Matrícula

Covarianza y coeficiente de correlación

SCGDoc. SisConGes & Estrategia

Presentación de Servicios. Sistema de Fidelización de Clientes

-Base de conocimiento: Crea una base de conocimiento

Para obtener una cuenta de padre

MÓDULO EMPRESA E INICIATIVA EMPRENDEDORA

Uso de la Herramienta Taller de Moodle para la Corrección entre alumnos en la asignatura de Informática del Grado de Biología.

Estructura de Computadores I Arquitectura de los MMOFPS

A practicar: Interactivos de matemáticas para niños

Aplicaciones Lineales

Análisis del comportamiento de un almacén ante diferentes velocidades de recepción/salida de mercancía.

EJERCICIOS DE PROGRAMACIÓN RELACIÓN VII (EJERCICIOS DE REPASO)

GUÍA DE APRENDIZAJE DEL CURSO ENCONTRANDO TESOROS EN LA RED

Unidad 5 Utilización de Excel para la solución de problemas de programación lineal

Editores * : Francisco Meneses Alvaro Parra Luis Zenteno

Introducción a la Programación en MATLAB

SUBMÓDULO DE PEDIDOS SUBMÓDULO DE ADQUISICIONES

02 Búsqueda, selección y evaluación de proveedores

Ingeniería Técnica en Informática de Gestión

Regresión múltiple. Modelos y Simulación. I. Introducción II. Marco teórico III. Aplicación IV. Conclusiones V. Bibliografía

[8 ] Contenidos: tipologías y organización.

Grupo Execom CONTENIDO. Soluciones verdaderas

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

Práctica 5. Curso

REPORTES MODULO FACTURACION MENÚ / REPORTES / FACTURACIÓN / DOCUMENTOS CAPTURADOS

CAPÍTULO 1: INTRODUCCIÓN. El presente capítulo muestra una introducción al problema de Optimizar un Modelo de

Acronis License Server. Guía del usuario

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

Roberto Quejido Cañamero

Guía para la Oficina Virtual

Nuevas tecnologías aplicadas a la vida: Smartphone, Tablet e Internet

Este instructivo ha sido ordenado de manera tal de ir explicando las distintas secciones, que son las siguientes:

NOTAS TÉCNICAS SOBRE EL SIT: Entidades y Cuentas

DOMINIO Y RANGO DE UNA FUNCIÓN I N D I C E. martilloatomico@gmail.com. Página. Titulo:

H E R R A M I E N T A S D E A N Á L I S I S D E D A T O S HERRAMIENTAS DE ANÁLISIS DE DATOS

Costos por actividad. Pensamiento Crítico Vol. 19 N 2, pp The activity-based cost. Raimundo Renaun Pacheco Mexzon* 1 RESUMEN

Contenido. cursos.cl / Teléfono:

SITIOS WEB DE LOS DESTINOS TURÍSTICOS DE EUSKADI. Presentación del estudio. Mayo de 2014.

Análisis de Datos. Práctica de métodos predicción de en WEKA

Cuadernillo de Autoaprendizaje Correo Electrónico Microsoft Outlook Express

Transcripción:

Recomendador Slope One IIC 3633 - Sistemas Recomendadores Denis Parra Profesor Asistente, DCC, PUC CHile Page 1 of 16

TOC En esta clase 1. Resumen últimas clases 2. Control de lectura próxima semana y Tarea 3. Recomendador Slope One 4. Ejemplo pequeño 2/16 Page 2 of 16

Resumen últimas clases Ranking no personalizado: Ordenar items considerando el porcentage de valoraciones positivas y la cantidad total de valoraciones. Filtrado Colaborativo basado en el usuario: buscar K usuarios más parecidos, luego predecir rating de items no consumidos por el active user. Filtrado Colaborativo basado en items: pre-calcular directamente similaridad entre items co-rated, saltándose búsqueda de K-vecindario. 3/16 Page 3 of 16

Control de Lectura Próxima semana Preguntas tipo Describir la idea y fundamento del método o algoritmo Escribir las fórmulas para cálculo de similaridad y la predicción Calcular un ejemplo pequeño (traer calculadora) Identificar pros y contras de cada método Efecto de diferentes parámetros 4/16 Page 4 of 16

Lecturas a Evaluar How not to sort by Average Rating, Evan Miller Blog Resnick, P., Iacovou, N., Suchak, M., Bergstrom, P., & Riedl, J. (1994, October). GroupLens: an open architecture for collaborative filtering of netnews. In Proceedings of the 1994 ACM conference on Computer supported cooperative work (pp. 175-186). ACM. Sarwar, B., Karypis, G., Konstan, J., & Riedl, J. (2001, April). Item-based collaborative filtering recommendation algorithms. In Proceedings of the 10th international conference on World Wide Web (pp. 285-295). ACM. Herlocker, J. L., Konstan, J. A., Borchers, A., & Riedl, J. (1999, August). An algorithmic framework for performing collaborative filtering. In Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval (pp. 230-237). Lemire, D., & Maclachlan, A. (2005, April). Slope One Predictors for Online Rating-Based Collaborative Filtering. In SDM (Vol. 5, pp. 1-5). 5/16 Page 5 of 16

Tarea 1 Será anunciada el martes 19 de Agosto (Próxima semana) Considerando un dataset que nosotros les entregaremos, deben implementar los recomendadores vistos hasta ahora y elegir el mejor. Con ese "mejor recomendador" realizarán dos tareas sobre un Hold Out dataset: predecir ratings y generar una lista topn de recomendaciones. PREDICCIÓN RECOMENDACIÓN TOP-N 6/16 Page 6 of 16

Recomendador de Pendiente Uno Lemire, D., & Maclachlan, A. (2005, April). Slope One Predictors for Online Rating-Based Collaborative Filtering. In SDM (Vol. 5, pp. 1-5). Los autores se enfocan en 5 objetivos: 1. Fácil de Implementar y mantener 2. Actualizable en línea: nuevos ratings deberían cambiar las predicciones rápidamente. 3. Eficiente al momento de consulta: costo principal debería llevarlo el almacenamiento. 4. Funciona con poco feedback del usuario 5. Razonablemente preciso, dento de ciertos rangos en los que una pequeña ganancia en exactitud no signifique un gran sacrificio de simplicidad y escalabilidad. 7/16 Page 7 of 16

Idea Principal Si observamos las diferencias de ratings entre pares de items, podemos hacer una predicción. 8/16 Page 8 of 16

Fórmula principal y Ponderación Ecuación Lineal de Pendiente uno f(x) = x + b v i w i i = 1..n f(x) = x + b predecir w usando v. Luego, tratamos de minimizar la expresión Si tenemos dos vectores con ratings y donde, buscamos el mejor predictor de la forma para n i=1 ( v i + b w i ) 2 Derivando con respecto a b e igualando la expresión a 0, nos queda b = ( ) i v i w i n 9/16 Page 9 of 16

Implementación Normal y Ponderaciones Implementación Normal u j u i de v =, desviacion promedio entre dos items i, j card( (χ)) u S(χ) S 1 P(u ) j = (de v + ), prediccion en base a varios items i card( R j ) u i i Rj P(u ) S1 1 j = ū + de v, aproximacion cuando S(u) card( R j ) R j i Rj Métodos de Ponderación - - Weighted Bipolar 10/16 Page 10 of 16

Métodos de Ponderación Weighted Slope One: Algunos pares de items han sido evaluados por muchos usuarios, otros no tanto P(u ) ws1 i S(u) {j} (de v + u i ) c j =, donde c i,j = card( S (χ)) i S(u) {j} c Bi-Polar: los items evaluados positivamente son considerados distintos a los evaludos negativamente. de v like u j u i =, desviacion media entre dos items liked card( S like (χ)) u S like (χ) p like = de v like + u i, y de modo similar, p dislike = de v dislike + u i Combinando ambos, like y dislike, la predicción queda: P(u ) bps1 j = i S(u) like {j} p like c like + i S(u) dislike {j} p dislike c dislike i S(u) like {j} c like + i S(u) dislike {j} c dislike 11/16 Page 11 of 16

Resultados en paper de Lemire (2005) 12/16 Page 12 of 16

Ejercicio :-) (A pedido de A.P.) Usando Weighted Slope One, calcule qué rating le daría U3 a Spiderman*: USER HARRY POTTER BATMAN SPIDERMAN U1 5 3 4 U2? 2 4 U3 4 2? 13/16 Page 13 of 16

Usando Weighted Slope One, calcule qué rating le daría U3 a Spiderman*: 1. Desviación promedio entre Spiderman y Batman (en la resta, primero Spiderman) u j u i de v =, j: Spiderman, i:batman card( (χ)) u S(χ) 2. Desviación promedio Spider Man y Harry Potter (en la resta, primero Spiderman) 3. Predicción: Usando el rating que el usuario U3 le dio a Batman y a Harry Potter, calcular rating de U3 a Spiderman S u j u i de v =, j: Spiderman, i:harry Potter card( (χ)) u S(χ) S P(u ) ws1 i S(u) {j} (de v + u i ) c j =, donde c i,j = card( S (χ)) i S(u) {j} c 14/16 Page 14 of 16

Usando Weighted Slope One, calcule qué rating le daría U3 a Spiderman*: Desviación promedio entre Spiderman y Batman (en la resta, primero Spiderman) [(4 3) + (4 2)]/2 = 1, 5 Desviación promedio SpiderMan y Harry Potter (en la resta, primero Spiderman) [(4 5)]/1 = 1 Predicción: Usando el rating que el usuario U3 le dio a Batman y a Harry Potter, calcular rating de U3 a Spiderman - - - Usando Batman (rating the U3 a Batman + desviación) r = 2 + 1, 5 = 3, 5 Usando Harry Potter (rating the U3 a Harry Potter + desviación) r = 4 1 = 3 Considerando ambas predicciones y la cantidad de muestras usadas en cada uno (3, 5 2 + 3 1)/(2 + 1) = 3, 33 15/16 Page 15 of 16

Referencias Lemire, D., & Maclachlan, A. (2005, April). Slope One Predictors for Online Rating-Based Collaborative Filtering. In SDM (Vol. 5, pp. 1-5). *Ejercicio sacado de http://www.slideshare.net/irecsys/slope-one-recommender-on-hadoop-15199798 16/16 Page 16 of 16