2018年5月29日星期二

深度协同过滤：用神经网络取代内积建模

本期推荐的论文笔记来自 PaperWeekly 社区用户 @spider。尽管现在很多工作已经把深度学习运用到了推荐的任务当中，但大多只是利用深度学习给一些辅助信息建模，在表示 user 与item 之间的交互时，仍是使用矩阵分解等用内积来建模。

本文是新加坡国立大学发表于 WWW '17 的工作，作者提出用多层神经网络给 user 和 item 进行交互建模，并提出了一种基于神经网络的协同过滤通用框架 NCF。

关于作者：黄若孜，复旦大学软件学院硕士生，研究方向为推荐系统。

■ 论文 | Neural Collaborative Filtering

■ 链接 | https://ift.tt/2ITJbC9

■ 源码 | http://t.cn/ROuhFZP

论文动机

许多利用深度学习来做推荐的工作 focus 在辅助信息的提取上，而对协同过滤最关键的元素——user 和 item 之间的交互作用，这些工作仍然利用的是矩阵分解模型，利用 latent feature 的内积进行推荐，而内积的描述能力是有限的。

Neural Collaborative Ffiltering（NCF）是一种用神经网络取代这个内积部分的技术，以学到 latent feature 之间任意的函数关系。

模型

MF 利用特征向量 pu、qi 的内积评估 u 对 i 的偏好：

由于将 user 和 item 映射到了同样的特征空间，然后使用内积也就是两个向量的 cosine 来衡量相似性；同样的，我们也可以用内积来衡量两个用户的相似性。

使用 jaccard 系数（集合 A 与 B 的交集与并集的比值作为集合的相似度）来作为用户之间真实的相似程度，那么下面评分矩阵用户 123 之间 S23>S12>S13，在 latent space 中的几何关系如右图所示，加入用户 4 时，S41>S43>S42，于是我们让用户 4 的特征靠近 1，然而无论怎么放，都无法使用户 3 比用户 2 更接近用户 4。

这就是使用内积描述相似度的局限性，我们可以增大 K 来解决这个问题，但是存在过拟合的风险。

下图是 NCF 的框架，user 和 item 的 id 先经过 embedding 层得到一个特征，然后输入到 MLP 中得到打分结果，用 pointwise 的目标函数进行训练：