基于知识的虚假信息检测
科研背景
- 近年来,随着社交媒体与社交平台的发展与普及,极大地改善了人们的生活质量,改变了人们对于信息的获取方式。然而,谣言、骗局、阴谋论等虚假信息的泛滥给社交网络和现实世界产生了恶劣的社会影响。因此,虚假信息检测作为目前热门的一个研究领域,受到了极大的关注。
- 对于网络上存在的大量信息进行人工核查显然是不现实的。因此如何利用模型进行自动的虚假信息检测且检测结果具有较高的准确性是目前研究的一个热点。
科研问题
- 一些信息并不能直接判断出其真假,或者信息包含的内容较少,需要借助外部文本来进行辅助判断。如何从大量的外部文本中找到有用的内容并融合到虚假信息检测中是目前研究存在的一个问题。
- 文本的语义是复杂的,一个词语在不同的语境下可能具有不同的含义。如何对词语在不同语境下进行恰当的表示也是应该考虑的问题。 目前许多的自然语言处理任务都会使用预训练语言模型,但单纯依靠大规模的文本的预训练语言模型可能还是很难理解复杂的问题,那么如果加入充分的先验知识,也许模型会学习到更加精细化的语义表示。
整体思路
提出融入非结构化的文本和结构化的知识图谱来提高虚假信息检测的准确率。