AI 人工智能新闻资讯: 推荐算法不够精准？让知识图谱来解决

2018年6月3日星期日

推荐算法不够精准？让知识图谱来解决

编者按：我们几乎每天都会接收到各种各样的推荐信息，从新闻、购物到吃饭、娱乐。个性化推荐系统作为一种信息过滤的重要手段，可以依据我们的习惯和爱好推荐合适的服务。但传统的推荐系统容易出现稀疏性和冷启动的问题，而知识图谱作为一种新兴类型的辅助信息，近几年逐渐引起了研究人员的关注，本文将向大家介绍知识图谱的相关知识以及知识图谱在推荐系统中可能的应用价值。一起来学习一下吧！

小王是一名程序员。早上八点，他被闹铃叫醒，拿起手机开始浏览手机上的新闻APP推荐的最新消息：

随后，小王想起昨晚放在购物车里的鞋还没有下单。于是，他打开了某购物APP，查看了一下自己的购物车：

但是他觉得下面推荐的板鞋似乎更适合自己，于是他买了一双。

吃完早饭，小王坐地铁去上班。地铁上无聊的小王打开了某音乐APP，系统已经为他选好了推荐的歌曲：

到了公司后，小王开始继续写没有完成的代码，但是始终无法把参数调到满意的水平。有些烦躁的小王想歇一歇，于是打开了某资讯APP，看了几个为他推荐的话题：

就在他认真阅读的时候，经理注意到了他不在干活，很生气，于是严肃地批评了小王。小王感到很委屈，这时手机里的某求职类APP给他发来了推送：

小王觉得这几个职位都挺适合自己的，于是心里有了跳槽的打算。到了午饭时间，小王打开了某外卖APP，查看了一下系统推荐的附近餐厅：

小王一边吃着刚刚送来的外卖，一边浏览着某娱乐类APP，查看适合晚上和女朋友一起观看的演出推荐：

晚上看完演出，小王和女朋友都非常满意，觉得这个APP的系统推荐很棒。

知识图谱

在各种辅助信息中，知识图谱作为一种新兴类型的辅助信息近几年逐渐引起了研究人员的关注。知识图谱（knowledge graph）是一种语义网络，其结点（node）代表实体（entity）或者概念（concept），边（edge）代表实体/概念之间的各种语义关系（relation）。一个知识图谱由若干个三元组（h、r、t）组成，其中h和t代表一条关系的头结点和尾节点，r代表关系。

上图展示的三元组表达了"陈凯歌导演了霸王别姬"这样一条事实，其中h=陈凯歌、t=霸王别姬、r=导演。

知识图谱包含了实体之间丰富的语义关联，为推荐系统提供了潜在的辅助信息来源。知识图谱在诸多推荐场景中都有应用的潜力，例如电影、新闻、景点、餐馆、购物等。和其它种类的辅助信息相比，知识图谱的引入可以让推荐结果更加具有以下特征：

精确性（precision）。知识图谱为物品引入了更多的语义关系，可以深层次地发现用户兴趣；

多样性（diversity）。知识图谱提供了不同的关系连接种类，有利于推荐结果的发散，避免推荐结果局限于单一类型；

可解释性（explainability）。知识图谱可以连接用户的历史记录和推荐结果，从而提高用户对推荐结果的满意度和接受度，增强用户对推荐系统的信任。

这里值得一提的是知识图谱和物品属性的区别。物品属性可以看成是在知识图谱中和某物品直接相连的一跳（1-hop）的节点，即一个弱化版本的知识图谱。事实上，一个完整的知识图谱可以提供物品之间更深层次和更长范围内的关联，例如，"《霸王别姬》-张国荣-香港-梁朝伟-《无间道》"。正因为知识图谱的维度更高，语义关系更丰富，它的处理也因此比物品属性要更加复杂和困难。

一般来说，现有的可以将知识图谱引入推荐系统的工作分为两类：

以LibFM[1]为代表的通用的基于特征的推荐方法（generic feature-based methods）。这类方法统一地把用户和物品的属性作为推荐算法的输入。例如，LibFM将某个用户和某个物品的所有属性记为x，然后令该用户和物品之间的交互强度y(x)依赖于属性中所有的一次项和二次项：

基于该类方法的通用性，我们可以将知识图谱弱化为物品属性，然后应用该类方法即可。当然，这种做法的缺点也显而易见：它并非专门针对知识图谱设计，因此无法高效地利用知识图谱的全部信息。例如，该类方法难以利用多跳的知识，也难以引入关系（relation）的信息。

以PER [2]、MetaGraph[3]为代表的基于路径的推荐方法（path-based methods）。该类方法将知识图谱视为一个异构信息网络（heterogeneous information network），然后构造物品之间的基于meta-path或meta-graph的特征。简单地说，meta-path是连接两个实体的一条特定的路径，比如"演员->电影->导演->电影->演员"这条meta-path可以连接两个演员，因此可以视为一种挖掘演员之间的潜在关系的方式。这类方法的优点是充分且直观地利用了知识图谱的网络结构，缺点是需要手动设计meta-path或meta-graph，这在实践中难以到达最优；同时，该类方法无法在实体不属于同一个领域的场景（例如新闻推荐）中应用，因为我们无法为这样的场景预定义meta-path或meta-graph。

知识图谱特征学习

知识图谱特征学习（Knowledge Graph Embedding）为知识图谱中的每个实体和关系学习得到一个低维向量，同时保持图中原有的结构或语义信息。事实上，知识图谱特征学习是网络特征学习（network embedding）的一个子领域，因为知识图谱包含特有的语义信息，所以知识图谱特征学习比通用的网络特征学习需要更细心和针对性的模型设计。一般而言，知识图谱特征学习的模型分类两类：

基于距离的翻译模型（distance-based translational models）。这类模型使用基于距离的评分函数评估三元组的概率，将尾节点视为头结点和关系翻译得到的结果。这类方法的代表有TransE、TransH、TransR等；

基于语义的匹配模型（semantic-based matching models）。这类模型使用基于相似度的评分函数评估三元组的概率，将实体和关系映射到隐语义空间中进行相似度度量。这类方法的代表有SME、NTN、MLP、NAM等。

由于知识图谱特征学习为每个实体和特征学习得到了一个低维向量，而且在向量中保持了原图的结构和语义信息，所以一组好的实体向量可以充分且完全地表示实体之间的相互关系，因为绝大部分机器学习算法都可以很方便地处理低维向量输入。因此，利用知识图谱特征学习，我们可以很方便地将知识图谱引入各种推荐系统算法中。概括地说，知识图谱特征学习可以：

降低知识图谱的高维性和异构性；
增强知识图谱应用的灵活性；
减轻特征工程的工作量；
减少由于引入知识图谱带来的额外计算负担。

在本篇中，我们分别介绍了推荐系统、知识图谱、以及知识图谱在推荐系统中的应用价值。作为推荐算法的辅助信息，知识图谱的引入可以极大地提高推荐系统的精准性、多样性和可解释性。在下周的文章中，我们将详述将知识图谱引入推荐系统的各种思路与实现，敬请期待！

参考文献

[1] Factorization machines with libfm

[2] Personalized entity recommendation: A heterogeneous information network approach

[3] Meta-graph based recommendation fusion over heterogeneous information networks

[4] Knowledge graph embedding: A survey of approaches and applications

]]> 原文： https://ift.tt/2J8COzb

机器知心

AI 人工智能新闻资讯

2018年6月3日星期日

推荐算法不够精准？让知识图谱来解决

推荐系统

知识图谱

知识图谱特征学习

机器知心

没有评论:

发表评论

DeepSeekV4重磅开源!首次打通华为Ascend，也没丢掉英伟达-InfoQ每周精要No.920

标签

标签