基于表示学习的实体关系预测系统毕业论文
2021-03-19 22:02:39
摘 要
人类智慧的最高表现是抽象的推理和联想,目前的类人智能技术的成功得益于知识图谱的构建与完备。知识图谱构建和完备的过程离不开知识的表示。本文根据知识图谱和知识表示学习的特点,构建了基于表示学习的算法——PTransD模型(Path-based TransD Model),并在PTransD模型的基础上实现了基于Python的实体关系预测系统。论文主要研究包括以下三个方面的工作:
1)针对TransE模型仅从实体之间的直接关系中学习以至于忽略多步骤的相似路径的问题,我们构建了PTransD模型。PTransD模型结合TransD、PTransE模型,解决了TransE等模型存在的面对复杂关系时性能显著下降以及提取实体对间语义关系的能力不足的问题。
2)在公共数据集FB15K上对TransE、TransR、TransD、PTransE和PTransD模型进行训练并做链接预测实验,对最终结果进行对比分析。PTransD模型在面对复杂关系与提取语义关系时性能相较于TransE、PTransE等模型有显著提高。
3)为了对实体关系预测结果进行展示和为知识推理和智能推荐提供平台,本文实现了基于PTransD模型和Python的实体关系预测系统。该系统使用Python的轻量级框架Flask,通过输入的头实体和尾实体,通过PTransD模型进行关系预测,通过Ajax将得到的关系传到前端展示。
关键词:知识表示学习;知识图谱;动态映射矩阵;关系路径
Abstract
Representation learning, especially the deep learning, opens a new door for the development of knowledge. Based on the characteristics of knowledge graph and representation learning, this thesis constructs a Path-based TransD Model based on knowledge representation. The thesis mainly includes the following three aspects:
1) For the TransE model only from the direct relationship between the entities to learn so as to ignore the multi-step similarity path problem, we constructed the PTransD model. PTransD model, which combines with TransD and PTransE model, solves the problems of degradation in performan when facing complex relations and weak capacity of extracting the unknown semantic relations between entities which TransE and others model exist.
2) The PTransD model is trained on the public data set FB15K and the link prediction experiment is compared with the result of the excellent algorithm. Finally, the TransE, TransR, TransD, PTransE and PTransD models are trained and made on the data set GEOGRAPHY Predictive experiments are carried out for comparative analysis. The performance of PTransD model in complex relation modeling and relations extracting is significantly and consistently improved outperforms other baselines including TransE, PTransE model.
3) In order to present the results of entity relationship prediction and provide a platform for knowledge reasoning and intelligent recommendation, this thesis realizes the relation prediction system which is based on PTransD model and Python. The system uses Python's lightweight framework Flask, it`s input header entity and tail entity, through the PTransD model to predict the relation, translating the relation to the front page by Ajax.
Key words:Knowledge representation learning; knowledge graph; dynamic mapping matrix; relation path
目录
摘要 I
Abstract II
第1章 绪论 5
1.1 研究背景及意义 5
1.2 国内外研究现状 5
1.2.1 知识图谱研究现状 5
1.2.2 表示学习研究现状 6
1.3 研究内容 7
1.4 研究方案 8
1.5 本章小结 9
第2章 结合动态空间投影和关系路径的表示学习算法 10
2.1知识表示学习面临的挑战 10
2.2 面向知识图谱补全的表示学习模型 11
2.2.1 翻译模型 11
2.3 基于关系路径和动态空间投影的翻译模型 12
2.3.1 动态映射矩阵的构建 13
2.3.2关系路径建模 14
2.3.4 训练目标 19
2.4 本章小结 20
第3章 PTransD模型实验与结果分析 22
3.1 数据集 22
3.2 负样本构造 22
3.3 实验环境 23
3.4 基于FB15K数据集的知识图谱补全 23
3.4.1 实体预测 24
3.4.2 关系预测 26
3.5 本章小结 27
第4章 实体关系预测系统实现 28
4.1 基于python的后台实现 28
4.1.1 环境搭建 28
4.1.2 功能模块实现 28
4.2 前端实现 29
4.3 系统展示 30
4.4 本章小结 31
第5章 总结与展望 32
5.1 研究总结 32
5.2 研究展望 32
参考文献 34
致谢 36
第1章 绪论
1.1 研究背景及意义
类人智能经过多年的研究与发展,其理论和技术日趋成熟,逐渐被应用到机器人、图像识别、专家系统、自然语言处理等前沿领域。其中,以4:1大比分战胜围棋世界冠军李在石的机器人AlphoGo、百度的超级计算机Minwa取得的成就最令人瞩目。此外,在众多人工智能项目中,三个初现端倪的“人工大脑”(谷歌大脑、IBM人脑模拟芯片、百度大脑)格外引人关注。类人智能技术的关键技术之一是自然语言处理技术,尽管以深度学习为代表的表示学习技术大大推动了自然语言技术的进步。但是想让机器学会理解,必须要依赖于大型的知识库。知识图谱中的知识常常以网络的形式表示(大部分用三元组来表示),这种表示形式面临计算效率低、可移植性差、严重的数据稀疏等问题。
作为搜索引擎方面的顶尖公司,Google在2012年发布了可以使搜索的结果进行知识系统化的知识图谱。通过知识图谱,任何一个输入的关键词都会得到完整的知识体系。紧随Google的步伐,百度、Sogou等公司纷纷建立自己的知识图谱。典型的知识图谱有百度的“知心”和Sogou公司的“知立方”[12]。百度拥有全球最大的中文知识库,能够建立起完善的知识体系,并在此基础上进行关系抽取、关系推理等。