2017 年国际知识图谱构建大赛(Knowledge Base Population,简称 KBP)结果近日揭晓,机器之心获悉腾讯 AI Lab 获得实体发现与链接(Entity Discovery and Linking Track,EDL)任务冠军。
实体发现与链接任务三语总分前十位排名表(各队伍为匿名)
KBP 大赛由美国国家标准与技术研究院(NIST)主办,始办于 2009 年,是国际上影响力最大、水平最高的知识图谱领域赛事。KBP(Knowledge base population)任务的主要目标是知识库扩展和填充,研究的主要内容是传统的结构化知识库如 Freebase,目前它的构建绝大多数都要依靠人的编辑工作。知识库中描述的信息是物理世界的命名实体和实体之间关系的抽取,如「克林顿和希拉里之间是夫妻关系」、「克林顿毕业于耶鲁法学院」这样一个个实体的关系。KBP 公开任务的研究目标,是让机器可以自动从自然书写的非结构化文本中抽取实体,以及实体之间的关系。
EDL(Entity Discovery and Linking)命名实体的发现和连接任务是从自然语言的文本中抽取命名实体,标注它们的类型及实体与已有知识库之间的对应关系。从 2015 年开始,EDL(Entity Discovery and Linking)命名实体的发现和连接任务采用了中文、英文、西班牙文三个语种,需要找到三个语种的文本语料中的实体,并连接在一起。中文的「克林顿」要与英文的「Clinton」、西班牙文的「Clinton」连接到 Freebase 的同一个实体上。2016 年,科大讯飞包揽了当届 KBP EDL 大赛的冠亚军。
2017 年,EDL 任务共 24 支队伍参加,包括 IBM、美国卡耐基梅隆大学和美国伊利诺伊大学香槟分校等国际一流科研机构,及阿里巴巴、北京邮电大学和浙江大学等国内知名企业及院校。
本次比赛,腾讯获得三语实体发现与链接总分第一名,单语上的指标分别是中文和西班牙文两项第一、英文第二。据了解,腾讯 AI Lab 在目前业界领先的 EDL 架构中引入了篇章理解模型和关联图模型。篇章理解模型采用深度学习架构,通过大规模数据的训练能够更精准的理解篇章的语义;关联图模型是将整篇文章的所有重要信息一起建模到一个图结构当中,整体求解以达到全局最优。
TAI 是腾讯 AI 平台部
此外,机器之心还了解到腾讯 AI Lab 建设了一个名叫 TopBase 的知识图谱,目前涵盖 50 多个领域如人物、音乐、影视、体育、诗词等,亿级实体,10 亿级三元组,并已广泛应用到天天快报、微信看一看及搜索业务、腾讯云小微等业务。
TopBase 知识示意图
]]> 原文: http://ift.tt/2ip1tDd |
没有评论:
发表评论