基于知识图谱的物流学者合作网络研究毕业论文
2021-02-28 21:33:34
摘 要
物流学自从七十年代以来,在全球范围内都受到了广泛关注,更是随着经济全球化的进程得到快速发展,为了研究物流学者合作的情况,本文以知识图谱为主要的分析手段,选用Web of Science核心数据库中有关冷链物流主题的论文作为分析的数据,挖掘数据中有用的信息,研究物流学者的合作网络规律和特点。通过提取网络特征和学者特征,本文发现,在冷链物流研究领域存在两个较大的研究团体。而在学者的个人影响力,学者合作者的平均影响力以及学者的合作倾向之间,其实没有明显的相关关系。并且最终通过提取的学者特征构建了一个决策树分类器,对学者的个人影响力作出了较为准确的预测,最终得到的决策树所达到的预测准确率也处在正常的预测范围内。
关键字:知识图谱;可视化;物流;学者;合作网络
Abstract
Since the 1970s, logistics has been widespread concerned in the world. With the rapid development of the process of economic globalization, in order to study the cooperation of logistics scholars, this paper takes the knowledge map as the main analytical method, Web of Science core database on the cold chain logistics theme of the paper as the analysis of data, mining data useful information, research logistics scholars of the cooperative network rules and characteristics. By extracting the characteristics of the network and the characteristics of scholars, this paper found that there are two large research groups in the cold chain logistics research field. There is no obvious correlation between the individual influence of scholars, the average influence of scholar collaborators and the tendency of scholars' cooperation. And finally we constructs a decision tree classifier through the extracted scholar 's characteristics, and makes a more accurate prediction to the scholar' s personal influence. The predicted accuracy of the decision tree is also within the normal forecasting range.
Key Words: Knowledge Graph; Visualization; Logistics; Scholar; Collaboration Networks
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 1
1.3 预期目标和研究内容 2
1.3.1 预期目标 2
1.3.2 研究内容 2
第2章 相关理论 3
2.1 知识图谱的定义 3
2.2 科学知识图谱工具介绍 3
2.3 物流合作网络分析 3
2.4 学者评价常用算法 4
2.4.1 h-index,g-index 4
2.4.2 HITS 算法 5
2.4.3 PageRank 算法 5
2.5 决策树相关理论 7
第3章 物流学者合作网络特征提取 8
3.1 数据预处理 8
3.2 网络特征的提取 8
第4章 实验分析 11
4.1 分析思路 11
4.2 分析过程 12
第5章 结论 22
致谢 23
参考文献 24
附录A 26
附录B 30
第1章 绪论
1.1 研究背景及意义
随着学术合作全球化进程的深入,学者间的合作研究加速了学术产出和学科发展,这在各个研究领域都是一致的。近些年,中国移动互联网的发展速度受到全球瞩目,在一些方面,中国的发展水平是走在世界前列的。物流行业也在这次浪潮中得到了迅猛发展。这其中,冷链物流因为在城市生鲜等物品配送上的重要度,受到各界的广泛关注,但是长期以来因为政策、监管、设备、投入、管理意识和消费意识的缺失,冷链物流的发展并不理想。本文因此缘由,由国际冷链物流的理论研究为入口,通过对历史文献的研究,来探究冷链物流方面的理论研究状况,特别是学者间的合作网络情况。
为了对这一领域有一个较为宏观和综合的认识,知识图谱便可作为一个很好的研究手段。它通过将数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,通过图的方式来表示某一学科领域的结构,历史以及发展朝向等。之所以选择冷链物流领域学者间的合作状况作为主要研究重点,而不是分析该领域研究热点和技术走向的原因就在于理论的发展是通过人来推动的,而发展的效率很大程度上取决与研究者之间的信息共享以及合作频率,所以本文会以知识图谱为主要手段,辅以其他网络研究方式,来进行冷链物流领域学者间合作网络的研究。以期找到学者间的合作特征和合作模式,为的是为后面的理论研究做出更好的启示和参考。
1.2 国内外研究现状
近些年来,在科研合作网络的实证研究方面,研究者都做了较多的尝试,学者合作网络是一种较为典型的社会网络结构。国际上,Newman首先发表了他对美国Los Alamos电子期刊的一系列研究结果;Baraba Si 等发表了对科研网络随时间演化的研究结果;随后有关科研网络的一系列研究成果不断涌现[13]。国内也开展了对合作网络的研究,在物流学上面也有了相关的研究探索。
在物流领域,Phillips,D. M. 和 Phillips J. K.研究发现,期刊在物流研究合作网络中对于促进创新理论及观点的交流扮演了重要角色。Autry and Griffis 运用社会网络分析理论验证了物流团队中的 “思维领袖”的存在,并对研究团队成果具有重要作用[12]。
关于物流学相关领域学者合作的研究状况,国内的研究还处在很初步的阶段,只有很少的几篇文章有所研究。其中胡一竑、朱道立对1990年到2007年中国期刊网数据库主题为供应链或物流以及1990年到2007年ISI web of knowledge数据库中主题为supply chain management的相关论文做了统计分析,指出国内的学者合作模式和国外还是存在较大差距,合作网络也较为分裂,不利于创新。刘则渊、陈立新通过使用CiteSpace软件分析了美国科学信息研究所科学引文索引扩展版数据库1995~2007年主题为logistics的2978条文献数据,展示了国际上物流领域的重要文献、重要学者以及主要研究内容等。殷辉也通过CiteSpace软件分析了2006~2010年主题为“物流”的先关2364篇论文以及3659名作者的情况,指出科研合作网络符合无标度尺度网络的特征,以及国内的物流学者合作网络松散等特征[10]。
1.3 预期目标和研究内容
1.3.1 预期目标
通过分析挖掘冷链物流领域相关文献,找出文献中有研究价值的数据,以学者的特征为主要的切入点,使用知识图谱的一般分析方法,来研究物流学者合作网络的一些特征,并且基于得到的特征,来使用决策树算法实现学者的等级分类,从而在没有作者实际综合能力值的前提下,通过作者的特征就能够判断作者的影响力或者说能力等级。
1.3.2 研究内容
研究的主要内容有两方面,一个是知识图谱的相关内容;另一个就是合作网络的相关内容。具体来讲,在知识图谱中需要了解知识图谱的一般分析策略与手段,知识图谱的分析方式方法,以及量化分析所需要的分析工具,包括相关的软件以及开发工具等;而关于合作网络分析,需要了解合作网络分析的一般研究方法,包括应该提取哪些特征,以及特征之间的分析策略,更细节的包括特征的提取手段。
第2章 相关理论
2.1 知识图谱的定义
知识图谱在某种层面上可以看作是一个语义的网络,也是一种依托图的数据结构,其组成部分有节点和边。在知识图谱中,网络中的每一个节点对应现实世界中的一个实际对象,而网络中的连接则为实际对象之间的关系表示。所以,知识图谱是表示关系的最有效的方式。换句话说,知识图谱其实就是把所有不同类别的信息连接在一起而构成的一个关系网络。这也是为什么知识图谱提供了从关系的角度去分析网络,去理解问题的能力。