Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo

Documentos relacionados
Aprendizaje Automatizado

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

Departamento de Matemáticas, CCIR/ITESM. 9 de febrero de 2011

INDICE. Prólogo a la Segunda Edición

Capítulo 8. Análisis Discriminante

1. Los números reales. 2. Representación. 3. Densidad de los números racionales. 4. Propiedades de los números reales

Análisis de imágenes digitales

4 Análisis de los principales factores AsociAdos A los resultados en ciencias. Portugal

2 = 1 0,5 + = 0,5 c) 3 + = = 2

Aprendizaje basado en ejemplos.

CURSO: ANALISIS ESTADISTICO DE RIESGOS

ANALISIS DE CLUSTER CON SPSS: INMACULADA BARRERA

EL ANÁLISIS DE LOS DATOS EN EL SISTEMA DE INFORMACIÓN GEOGRÁFICA DE CUBA

Localización. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Figura 1: Esquema de las tablas simplex de inicio y general.

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

OBJETIVOS DE MATEMÁTICAS B 4º DE ESO

Introducción. Autoencoders. RBMs. Redes de Convolución. Deep Learning. Eduardo Morales INAOE (INAOE) 1 / 60

Itinerario: Inteligencia Computacional

Son una clase particular de los algoritmos evolutivos.

La forma en que se determina el Elo de un jugador fue ideada para el ajedrez en 1959, por el profesor de matemáticas, el Dr. Élő Árpád.

Clase. 1. Resolución de sistemas de ecuaciones lineales: preliminares

ANÁLISIS DE FRECUENCIAS

Unidad Temática 3: Probabilidad y Variables Aleatorias

Análisis Matemático I

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres

CÁLCULO DE PROBABILIDADES

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

Primero se triangulariza la matriz: Multiplicando la primera fila por (-1/3) y sumando a la segunda fila: ( ) ( )=( ) ( ) ( )

Análisis de. Análisis de. Decisiones:

OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 4 Optimización no Lineal

CRITERIOS DE SELECCIÓN DE MODELOS

Tema 2. Regresión Lineal

Evaluación de Proyectos de Inversión

La importancia de las factorizaciones matriciales no negativas en la minería de datos y el procesamiento de

7.- Teorema integral de Fourier. Transformada de Fourier

White paper Un método para hacer corresponder entre candidatos y un puesto de trabajo Posiciones basadas en un modelado predictivo Presentado por:

Análisis Matemático I

PROJECT GLASS : REALIDAD AUMENTADA, RECONOCIMIENTO DE IMÁGENES Y RECONOCIMIENTO DE VOZ.

Matemática. 00 de Mes de 0000

CURSO: TOMA DE DECISIONES BAJO RIESGO

Implementación de sistema electrostático de aplicaciín para helicópteros en paltos (informe técnico)

Modelos elección discreta y variable dependiente limitada

Tema 8. Análisis de dos variables Ejercicios resueltos 1

PLANES CURRICULARES GRADO9º/ 01 PERIODO

ESTADISTICA. Tradicionalmente la aplicación del término estadística se ha utilizado en tres ámbitos:

Estimación de Máxima Verosimilitud Utilizando la Función optim en R

Teoría de la decisión

Maxima Verosimilitud [Escribir el subtítulo del documento] Valores que hacen mas verosímil la información

Tema 7: Aprendizaje de árboles de decisión

Multiple Linear Regression

Repaso de conceptos de álgebra lineal

BÚSQUEDA INTELIGENTE BASADA EN METAHEURÍSTICAS

Tema 2 Datos multivariantes

Clase No. 13: Factorización QR MAT 251. Joaquín Peña (CIMAT) Métodos Numéricos (MAT 251) / 16

FACULTAD DE INGENIERÍA

Contenidos IB-Test Matemática NM 2014.

INDICE. 92 solución gráfica de ecuaciones lineales 1.5. resolución de sistemas de ecuaciones lineales

Matrices 2º curso de Bachillerato Ciencias y tecnología

Matrices y sistemas de ecuaciones lineales

Aprendizaje Computacional y Extracción de Información

Técnicas de Investigación Social

TEORIA DE DECISIONES

Asignaturas antecedentes y subsecuentes

5. Los objetivos de la Calidad de los Datos (OCD) y la Evaluación de la

Capítulo 3. Polinomios

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4

Análisis Numérico para Ingeniería. Clase Nro. 3

Criterio: Relación entre Clasificaciones de Riesgo de Corto y Largo Plazo

EL PROBLEMA GENERAL DE OPTIMIZACION

El método simplex 1. 1 Forma estándar y cambios en el modelo. 2 Definiciones. 3 Puntos extremos y soluciones factibles básicas. 4 El método simplex.

Análisis Matemático I

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

Unidad 1: Espacio de Probabilidad

OPTIMIZACIÓN Y SIMULACIÓN PARA LA EMPRESA. Tema 5 Simulación

Formulación del problema de la ruta más corta en programación lineal

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

Objetivos. Aprender a construir gráficos p y/o np. Aprender a construir gráficos c y u. Cuando usarlos. Epígrafes

1. (F, +) es un grupo abeliano, denominado el grupo aditivo del campo.

Clase 9 Programación No Lineal

crédito. Por ejemplo si la institución ha fijado que los clientes buenos son aquellos que tienen 500 puntos o más, este cliente sería rechazado.

EJERCICIOS RESUELTOS TEMA 1.

Mapa Curricular: Funciones y Modelos

CAPÍTULO 1. INTRODUCCIÓN. Las empresas de tipo comercial tienen como principal objetivo obtener ganancias. Si

ACV simplificado un rollo de papel base (clases Testliner y Wellenstoff) para la fabricación de cartón corrugado, y su embalaje.

CONCLUSIONES. La teoría de Redes Neuronales Artificiales, presenta grandes ventajas con

SECCIÓN 3 PRESENTACION DE ESTADOS FINANCIEROS

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN

PROGRAMACION CUADRATICA

ÍNDICE CAPÍTULO 0 CANCEPTOS ALGEBRAICOS 1 CAPÍTUO 1 ECUACIONES Y FUNCIONES LINEALES 56 CAPÍTULO 2 FUNCIONES ESPECIALES 133. Prefacio...

ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES ESTADÍSTICA ESPACIAL

Tema 1.- Correlación Lineal

Enseñanza de la Estadística usando el software libre R

Propósitos del software

PLANEACION TACTICA Y OPERATIVA FUNDACIÓN UNIVERSITARIA TECNOLÓGICO COMFENALCO

GLOSARIO ESTADÍSTICO. Fuente: Murray R. Spiegel, Estadística, McGraw Hill.

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Geometría de las superficies

Transcripción:

2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012

2 Aprendizaje para Clasificación con Factorización Matricial Basado Sumario 1. Introducción... 3 2. Estado del Filtrado Colaborativo y del LTR... 4 3. Algoritmos... 5 4. Evaluación y Resultados... 6 5. Conclusiones... 7 6. Referencias... 8

Aprendizaje para Clasificación con Factorización Matricial Basado 3 1. Introducción Actualmente, los sistemas de recomendación de contenido son un importante punto de atención para los investigadores a causa de la gran cantidad de contenido multimedia disponible en Internet al alcance de los usuarios: libros, música, películas, etc. Particularmente, el filtrado colaborativo se ha erigido como una de las técnicas de recomendación más satisfactorias, la cual se basa en la idea de que a un usuario le podrá gustar probablemente un contenido que le gusta a otros usuarios con sus mismas o similares preferencias. El propósito más importante que un sistema de recomendación debe cumplir es el de proveer al usuario de una lista de recomendación de contenido. En base a esta idea, el trabajo que aquí se recoge trata de una extensión escalable a la aproximación de factorización matricial aplicada al filtrado colaborativo denominada ListRank-MF (donde MF viene de Matrix Factorization). Esta aproximación hace uso de una técnica de aprendizaje para clasificación listwise con el fin de clasificar u ordenar los diferentes elementos multimedia para cada uno de los usuarios, donde los usuarios y dichos elementos multimedia son representados como características latentes aprendidas haciendo uso de factorización matricial. La contribución principal de la técnica aquí expuesta es doble: por un lado proporciona un rendimiento superior en términos de recomendación sobre el estado del arte basado en la aproximación de la factorización matricial y, por otro, mantiene una complejidad lineal con la cantidad de ratings observados en la matriz usuario-elemento multimedia dada, pudiendo, por tanto, escalarla con el fin de ser usada en colecciones de contenido realmente grandes. El aprendizaje para clasificación (de ahora en adelante LTR por sus siglas en inglés) es una técnica de machine-learning supervisado que construye automáticamente un modelo de clasificación o ranking a partir de unos datos de entrenamiento. Recientemente, el LTR ha sido objeto de intensivos esfuerzos de investigación, de donde resulta el ejemplo Yahoo! LTR Challenge, pues repercute en beneficios directos sobre las técnicas de recuperación de información (information retrieval) mediante el envío de peticiones, y de recomendación a partir de perfiles de usuario (como es el caso del presente trabajo analizado).

4 Aprendizaje para Clasificación con Factorización Matricial Basado 2. Estado del Filtrado Colaborativo y del LTR El filtrado colaborativo puede ser basado en memoria o en modelo. En general, las aproximaciones basadas en memoria hacen recomendaciones partiendo de la base de las similitudes entre usuarios (basadas en usuarios) o entre elementos multimedia (basadas en elementos multimedia). De otro lado, las aproximaciones basadas en modelo en un primer momento ajustan modelos de predicción basados en datos de entrenamiento y luego usan dichos modelos con el fin de predecir las preferencias de los usuarios sobre determinados contenidos multimedia. Además, las técnicas de factorización matricial han atraído la atención de los investigadores debido a las mejoras que proporciona en términos de escalabilidad y precisión, especialmente en entornos ingentes de contenido multimedia. Las técnicas de factorización matricial normalmente aprenden características latentes de los usuarios y los elementos multimedia a partir de los ratings observados en las matrices usuario/elemento multimedia, posteriormente usadas para predecir ratings no observados. Dentro del área del filtrado colaborativo, la atención en términos de investigación se ha movido desde el problema de la predicción del rating al problema de la calidad en la clasificación o la lista de recomendación que el sistema genera. No obstante, las aproximaciones existentes basadas en lo anterior (como la clasificación probabilística bayesiana) tienen un alto coste de cómputo, lo que limita su escalabilidad. No obstante, ListRank-MF aquí descrito presenta una complejidad lineal con el número de ratings observados dada una matriz de ratings usuario/elemento multimedia. En cuanto al LTR según una aproximación listwise, un ejemplo de entrenamiento individual es una lista de elementos multimedia completa. Las funciones de pérdida para el LTR listwise se formulan para medir la distancia entre la lista de referencia y la lista de salida del modelo de clasificación. Varios algoritmos son aplicados para aprender el modelo de clasificación óptimo local o global. Se propuso a la probabilidad de permutación para representar la lista de clasificación, la cual podía ser simplificada a la probabilidad de que un elemento multimedia dado sea clasificado en primera posición para una lista dada. Esta última probabilidad es la que emplea ListRank-MF para representar la lista de recomendación, haciendo que dicha técnica se acerque al LTR listwise.

Aprendizaje para Clasificación con Factorización Matricial Basado 5 3. Algoritmos El marco de trabajo de la técnica ListRank-MF está basado en la factorización matricial probabilística, cuyos fundamentos se recogen en [2] y donde una factorización matricial es formulada a partir de inferencia estadística sobre distribuciones condicionales de ratings observados, así como sobre distribuciones a priori de ratings de usuarios y de ratings de elementos multimedia. Dicho marco de trabajo se formula como 1, =argmin, 2 + 2 + 2. La factorización matricial probabilística busca representar la matriz de ratings usuario-elemento multimedia,, como dos matrices y, donde es el número de usuarios y es la cantidad de elementos multimedia. Se emplea un conjunto de características latentes d-dimensionales para representar tanto como. Los subíndices de dichas matrices indican una determinada columna de ellas compuesta por un vector de características d- dimensional. De otro lado denota el rating del usuario i-ésimo sobre el elemento multimedia j-ésimo. es una función indicadora que es igual a 1 cuando >0 y 0 en otro caso. Por último, y son coeficientes de regularización donde, normalmente, = =. La función logística se emplea para acotar el rango de su argumento, siendo = 1 1+. La probabilidad de que un elemento multimedia dado (el j-ésimo) sea clasificado en primera posición para una lista dada (la del usuario i-ésimo) se puede calcular como =, donde se ha supuesto la existencia de elementos multimedia para el usuario i-ésimo y es usualmente la función exponencial, pues se precisa que sea estrictamente creciente y estrictamente positiva. El ListRank-MF se formula como la función de pérdida a partir de la entropía cruzada de las anteriores probabilidades de elementos multimedia

6 Aprendizaje para Clasificación con Factorización Matricial Basado en las listas de ejemplo de entrenamiento y en las listas de clasificación a partir del modelo de clasificación:, = log + 2 +. Las listas de ejemplo de entrenamiento consisten en conjuntos de elementos multimedia de entrenamiento en los perfiles de cada usuario. La salida del modelo de recomendación es una lista de recomendación para cada uno de los usuarios compuesta de elementos ordenados de forma descendente en función del rating de acuerdo con el valor de. La anterior función de pérdida representa la incertidumbre entre las listas de entrenamiento y las listas de salida del modelo de clasificación. El modelo de clasificación óptimo debería de proveer la mínima incertidumbre entre las listas de ratings de entrenamiento y las listas de predicciones de salida. En este caso tenemos que la factorización matricial está optimizada para posiciones de clasificación de elementos multimedia en las listas de los usuarios. Finalmente, puesto que la función de pérdida no es convexa conjuntamente sobre y, se escoge usar gradiente descendiente fijando alternativamente y, a partir de los cuales puede obtenerse un mínimo local. El vector gradiente se obtendría de aplicar derivadas parciales sobre la función de pérdida, de la forma,, =., 4. Evaluación y Resultados Según los experimentos llevados a cabo, ListRank-MF logra una mejora en el rendimiento del 15% sobre el método de recomendación colaborativo basado en elementos multimedia y del 10% y 5% sobre el estado del arte constituido por las técnicas CoFiRank-NDGC y CoFiRank-Best, respectivamente. Además, las mejoras son significativas en todas las condiciones de tests evaluadas, aproximadamente. Notar que aunque no hemos especifica-

Aprendizaje para Clasificación con Factorización Matricial Basado 7 do el marco de evaluación, este es esencialmente el mismo para todos los algoritmos, por lo que los resultados mencionados resultan relevantes. En términos aislados, es resaltable que el coeficiente de regularización en el ListRank-MF influye en la convergencia de la función de pérdida y controla el sobreajuste. La siguiente figura muestra la relación entre y la pérdida, observándose cómo el riesgo de sobreajuste comienza cuando el coeficiente de regularización se encuentra por debajo del valor 0.001. Figura 1. Impacto del coeficiente de regularización sobre la convergencia de la pérdida durante el proceso de aprendizaje. Finalmente, notar que la optimización de la función de pérdida lleva a la minimización de la pérdida. Como se observa en la siguiente figura, el rendimiento en la clasificación de los elementos multimedia se torna óptimo y convergente cuando se optimiza la función de pérdida. Figura 2. Efectividad del ListRank-MF para lograr la ganancia acumulada descontada normalizada mediante la minimización de la pérdida. 5. Conclusiones La evaluación llevada a cabo sobre la técnica aquí desarrollada ha demostrado que ListRank-MF mejora la recomendación colaborativa basada en objetos sobre el estado del arte entonces existente. También en la etapa de evaluación fue analizada la complejidad computacional de dicha técnica

8 Aprendizaje para Clasificación con Factorización Matricial Basado verificándose lo expuesto en la introducción, y es que ListRank-MF mantiene una complejidad lineal con la cantidad de ratings observados en la matriz usuario-elemento multimedia dada, pudiendo, por tanto, escalarla con el fin de ser usada en colecciones de contenido realmente grandes propias del mundo real. 6. Referencias [1] Y. Shi, M. Larson y A. Hanjalic, List-wise Learning to Rank with Matrix Factorization for Collaborative Filtering. [2] R. Salakhutdinov y A. Mnih, Probabilistic Matrix Factorization. 2008.