本次组会将会介绍阅读的一篇论文《Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings》,主要从以下几个方面介绍:
科研背景:
知识图谱(Knowledge Graph)由Google于2012年率先提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。
知识图谱多跳问题 (Multi-hop Questions) 指的是那些需要知识图谱多跳推理才能回答的问题。例如,若要回答 ”成龙主演电影的导演是哪些人?“ 这一问题,则需要多个三元组所形成的多跳推理路径 <成龙,主演,新警察故事>, <新警察故事,导演,陈木胜> 才能够回答。
近年来,使用知识图谱嵌入在知识图谱中进行链接预测已经成为一个热门的研究领域,通常的方法是为知识图谱中的三元组(h,r,t)定义一个分数函数,使正确答案的分数高于错误答案的分数。
科研问题:
相比单跳问答,多跳知识图谱问答(KGQA)需要在包含大量知识的知识图谱中找到多个有关联的三元组,并建模多跳长路径,然而知识图谱通常不完整,缺少很多链接,这给KGQA带来了挑战。
- 最近关于多跳KGQA的研究试图使用相关的外部文本来弥补KG稀疏问题,但这些文本并不总是现成的且相关文本的可用性和识别本身就是一个挑战,这限制了此类方法的适用性。
- 在另一项研究中,已经有提出KG嵌入方法,通过执行缺失链接预测来减少KG稀疏性,但迄今为止还没有针对多跳KGQA进行探索。
方法:
本文用三个模块来提高知识图谱多跳问答的性能:
- 知识图谱嵌入模块:为KG中所有实体创建embeddings。
- 问题嵌入模块:得到问题的embedding。
- 答案选择模块:减少候选答案实体并选出最终的答案。
模型: