摘要
推荐系统是一种克服信息过载的重要工具,其中最流行的方法是协同过滤。该文提出一种结合潜在因素模型和邻域方法的混合协同过滤方法 LDA-CF。我们首先将评分矩阵转换成伪文档集合,使用LDA(Latent Dirichlet Allocation)主题模型发现用户和物品潜在因素向量;然后在低维潜在因素空间计算用户和物品相似度;最后采用邻域方法预测未知评分。在MovieLens 100k数据集上的实验表明:在评分预测任务中,LDA-CF取得的MAE性能指标优于传统的邻域方法。因此,LDA可以有效地从评分矩阵中发现对计算相似度十分有用的用户和物品低维特征表示,在一定程度上缓解了数据稀疏问题。
Recommender system is an important tool to overcome information overload, where the most popular ap- proach is collaborative filtering. This paper presents a mixture model for collaborative filtering named LDA-CF, which combines latent factor models and neighborhood methods. Firstly we convert the ratings matrix into a collec- tion of pseudo-documents and utilize the LDA. topic model to identify user and item latent factor vectors. Then we compute user-item similarities in the low-dimensional latent factor space. Finally we employ the neighborhood meth- ods to predict unobserved ratings. Experiments on MovieLens 100k dataset demonstrate that LDA-CF outperformed neighborhood methods on the task of rating prediction in terms of MAE.
出处
《中文信息学报》
CSCD
北大核心
2014年第2期129-135,150,共8页
Journal of Chinese Information Processing
基金
国家自然科学基金(61272240
60970047
61103151)
教育部博士点基金(20110131110028)
教育部人文社科基金(12YJC630211)
山东省自然科学基金(ZR2012FM037)
山东省优秀中青年科学家科研奖励基金(BS2012DX012
BS2012DX017)
山东大学研究生自主创新基金(YZC12084)
关键词
推荐系统
协同过滤
主题模型
recommender systems
collaborative filtering
LDA