用数据图、信息图、知识图和智慧图来描述知识图的体系结构外文翻译资料
2021-12-28 23:10:23
英语原文共 6 页,支付完成后下载完整资料
用数据图、信息图、知识图和智慧图来描述知识图的体系结构
摘要
知识图已被广泛采用,这在很大程度上归功于其具有更少数据库对象集的性质。它使知识图能够连续增长,并允许根据需要添加新的关系和实体。知识图已成为以标记有向图的形式来表示知识和为文本信息提供语义的强大工具。知识图是一种以每一个对象、实体和用户作为节点,用边来交互连接节点而组成的图。知识图具有丰富的自然语义,可以包含各种更完整的信息。它的表达机制接近自然语言。然而,我们仍然缺乏知识图的统一定义和标准表达形式。 我们建议澄清知识图表作为一个整体的表达。我们分别从数据,信息,知识和智慧这几个方面阐明知识图的结构。 我们建议用四种基本形式(包括数据图、信息图、知识图和智慧图)以渐进的方式描述知识图。
关键词:知识图;数据;信息;知识;智慧
1 介绍
在我们所处的现实世界中存在不同种类的离散数据。如果数据仅以离散形式存在,则不能使用这些数据。但这并不要紧,因为我们可以简单的通过提供特定的环境来使得数据有意义。从这点来说,在我们所提供的特定环境下,数据可以获得真正的含义。数据是逐步变得有用的,并且是以信息的方式呈现给我们的,然后我们可以得到许多片段表达式。例如,“李明的身高是177厘米”是可以用来回答有关李明身高的问题的信息。显然,获取信息只是一个开始。通过这些片段表达式,即我们上面提到的“信息”的概念,我们可以结合多个信息来回答更复杂的有关如何做的问题。通过抽象和转换给定上下文中的信息和数据以及应用数据和信息,“知识”便出现了[2]。此时,通过定义属性和分类总结,我们可以从数据中挖掘信息,并且可以从信息中总结知识。更进一步,对同一类别知识的综合理解将有助于做出有利判断、精确预测和巧妙规划。当然,对既得知识的使用超出了其字面意义的类别,也就是我们应当称之其为“智慧”。在本文中,我们建议从数据图,信息图,知识图和智慧图四个方面以及分析这四个概念的实际意义来描述知识图的结构。图1显示了从数据到智慧的转换。作为离散形式存在的数据是没有语义的。信息是经过概念映射和关系连接处理后的数据。 用户是在过滤有价值的信息后使用的信息并将这些信息内化为知识。当信息被充分理解消化时,它就会产生知识,同时更新个体智力信息存储,并将有利于他的发展和他所生活的社会的发展。
图1 从数据到智慧的转换过程
在本文的其余部分,我们首先分别在第2,3,4和5节详细阐述了数据图、信息图、知识图和智慧图的表达方式。 然后,我们将在第6节中描述数据、信息、知识和智慧之间的渐进关系。在第7节中,详细的阐述了相关的工作。在第8节中,我们在总结了所做的工作。
2 数据图的表示
数据是世界可观察属性的符号表示。 数据是通过观察基础个体项目的数字或其他信息获得的,但它们自身在没有上下文的情况下,是没有任何意义的。存储数据是不会改变数据本身,但它有许多表达形式。如图2所示,数据可以被存储在许多不同类型的数据结构中,包括数组,堆栈,链表等。数据可以是结构化的,半结构化的和非结构化的,关系型的或非关系型的。数据结构可以存储大量不同类型的数据,包括数字,字符串甚至其他数据结构。一般来说,数据可以被表示为多个初始离散元素[8]。图3显示了一系列原始离散数据点,我们可以分别使用数组,链表,树,图以及四种结构的组合来表示数据。 在没有上下文本的情况下,原始离散数据点是没有意义的。 例如,值120可以是诸如心率的临床测量,并且还可以表示紧急中心的电话号码。将他们从具体情况中割离,将使我们无法确定其确切含义。 我们使用集合D {d1,d2,...,di,...,dn}来表示数据集,其中di表示离散元素。例如,如果我们输入一系列描述软件工程风险评估的离散元素的集合,它可以表示为D(风险)。在没有上下文的情况下,我们无法理解每个元素的具体含义以及这些元素的内部关系。
图 2 数据的存储方式不会改变数据本身
图3 数据与数据表达式的解释
3 信息图的表示
信息是通过关系连接而被赋予意义的数据。这个“意义”可能有用,但不一定需要。信息项包括信息元素和信息元素之间的关系。在信息图上,信息元素显示为节点,信息之间关系显示为边。 信息体现了对某种关系的理解,信息现象的本质已经被描述为在消息的发送者和接收者之间发生的通信过程的发生。不同概念和关系的概念映射称为概念映射[3]。本文给出两个概念O1,O2及其相关集合C1和R1以及C2和R2,概念映射用于定义潜在对:(c1,c2)或(r1,r2),其中clisin;Cl,c2isin;C2,rlisin;Rl,r2isin;R2。 以这种方式,概念c1和关系r1可以各自被转换为实例c2和实例r2,同时保留它们的原始含义。我们定义了一个概念映射函数F,它作用于两个概念C1和C2。在概念C1和概念C2之间定义相似度函数,并定义一个0到1的值来描述C1与C2的相似度。概念Ci的逻辑表示是L(Ci),其中函数F被评估为C1和C2之间的逻辑表示的相似性。 函数S用于定义关于L(C1)和L(C2)的逻辑相似性评估。
F(C1,C2)=S(L(C1),L(C2)) (1)
这需要从不同方面应用专业人员的概念语义。相应地,不同的语义可以由独立的逻辑语句表示,函数F可以精确定义如下:
F(C1,C2)=sum;iW(l)lowast;S(Li(C1,Li(C2)) (2)
其中i表示一种特征,其逻辑表达式定义为Li。w(i)是一个应用于i(由进行应用的专业人员确定)以测量每个i在评估C1和C2的相似性中的重要性的协作函数应用程序。图4描述了可以通过概念映射转化为信息一系列原始数据。通过概念映射获得的信息之间的关系与原始概念之间的关系一致。在信息图上,数据点之间存在简单的组合关系。信息的文本关联性是有限的,并且在不同的文本中我们可以建立不同的分类和组合规则。在图5,我们可以发现这里有三种数据:风险因子、这些因子的结合类型以及通过概念映射结合的类型的相应概率。然后我们可以更完整地描述可以表示为D(A,C,P)的风险,并将描述存储在关系数据库中。 A表示可能导致风险的因子。 C表示这些因子的组合类型,P表示每种组合类型的相应概率。 A = {系统类型,开发经验,软件和硬件设备}。 C包括三个因子的八种组合类型,P包括相应的八种概率。
图4 从数据到信息的关系映射
图5 关系连接后的信息图
4 知识图的表示
知识是由认知处理和验证而组织构成的信息。信息是引出和构建知识的必要媒介或材料。 知识能够通过学习获得。对于要传递的知识,需要将知识编码为信息并再次解码为知识。 知识和信息不尽相同,但具有共生关系[9]。 知识可以是明确的(例如书面指导),也可能是隐形的(例如人的经验和直觉)。知识的目的是改善我们的生活。在风险评估的背景下,知识的目的是降低风险率或尽可能地避免企业及其利益相关者的风险。知识表示和知识推理也可以表达有关事实和一般知识所要解决的问题[11]。 例如,有人可能会问迈克说什么语言。 回答这类问题不但需要描述性知识也需要推理能力。
- 知识图上的抽象
数据和信息很复杂,我们从中提取有价值的部分作为知识。因此,我们能够减少可用的信息容量。当利益相关者获得风险描述时,他们能够筛选出有价值的信息并将这些信息保存为知识。对于图5所示的例子,决策者将选择具有较低风险率的程序,如图7所示。页面排名算法的工作原理是计算页面链接的数量和质量,以粗略估计对网站重要程度。基本假设是更重要的网站可能会从其他网站收到更多链接[15]。我们采用页面排名算法的思想来过滤无用的信息并保留有价值的信息。相关性是通过被检索到的资源实际包含的假定用户在定义查询上所用的时间的关系。如图7所示,我们给定信息中包含的每个原始数据一定的初始权重。 表示为R(infor),其可以被(3)计算得到:
R(infor)=WAilowast;WBjlowast;WCklowast;lowast;hellip;lowast;WNn,
i,j,k,nsub;[1,2hellip;n] (3)
其中A表示概念,Ai表示概念A的原始数据元素.WAi表示元素Ai的权重。在计算信息的等级后,我们可以过滤掉不符合用户查询定义的信息。
图6 信息等级的计算
图7 过滤掉无用信息后的抽象知识图谱
B 知识图的转换
利益相关者可以借助知识做出更正确的决策。知识图的上下文可以被创建。知识图提供了开放的知识访问接口,并且在一定程度上它反映了真实世界中的实体间关系。 图8中的知识图的图结构不受形式的限制。知识图可以表达丰富的自然语义,并可以在项目之间补充相关信息。知识图的基于图的性质使得与其他图的链接成为可能,从而使得多种信息的集成变得容易,并增强了信息完整性。通过探索图表,可以发现和利用项目和用户之间的新的连接和共性。
图8 知识图的语义补充
5 智慧图的表示
智慧是一个外推过程,包括道德和道德框架中的知识。智慧是我们辨别是非,善与恶的过程。 凭借智慧,我们可以从有限到无限,从已知到未知。智慧是指将最合适的行为付诸行动的能力,同时考虑已知(知识)和最佳(道德和社会考虑因素)。许多知情人士知道做什么,不少知识渊博的专家知道该怎么做,但只有少数知情人士知道并且可以完全说明为什么要这样做。根据这些想法,将暗喻应用于图9,数据:“知道是谁”,信息:“知道什么”,知识:“知道怎么样”和智慧:“知道为什么”。 智慧作为认知的最终单元是数据,信息,概念和知识的分层处理的结果。 知识是“知道如何”做某事,智慧是“知道为什么,做什么,怎么做”。
智慧还延伸到知识在行动中的应用。 智慧与知识之间关系的简单表示体现在以下表达式中:智慧 = 知识 伦理 行动。 在表1中,我们以软件工程风险分析的整个过程为例,列出了风险分析过程中的数据、信息、知识和智慧的关系。在风险评估的初始阶段,我们收集了一些有关风险评估的数据,这些数据可以存储在数组,堆栈,列表等中。根据我们收集的数据,我们可以通过概念映射和关系连接获得有关风险的描述性信息。然后根据分类的概念,我们将信息存储在关系数据库中。获得此风险描述后,利益相关者可以做出有利的决策,最终智慧可以帮助利益相关者进行未来的规划和预测。
图9 使用智慧图来预知未知元素
表1 从数据、信息、知识与智慧角度的案例解释
6 数据,信息,知识和智慧的渐进关系
在图10中,我们通过金字塔形式显示数据、信息、知识和智慧之间的渐进关系。数据是信息的主要形式之一。它基本上包括用于人或机器之间交换的交易或事件的记录。因此,除非用户理解所收集数据的上下文,否则数据没有意义。 单词、数字或符号可以被用来描述业务结果,它们赋予了数据意义,这意味着数据具有信息性。信息在更广泛的背景下扩展了数据的概念。因此,信息包括数据,但它还包括人在给定物理环境中作为社会组织成员关联的所有信息。像数据这样的信息通过符号传递。这些符号具有复杂的结构和规则。信息有各种形式,例如书写、陈述、统计、图或表。当个人接受并保留信息作为对现实的真实理解和对现实的有效解释时,信息就变成了个人知识。相反,组织或社会知识在被一群人的共识所接受时就存在。常识不需要被所有成员共享,事实上,一组内部人员认为这是一个充分条件。 这也是真实的“公共领域”知识[10]。 知识在规模上更进了一步。 它涉及理解和利用数据和信息来回答问题、解决问题、做出决策等能力。 当人类的头脑利用这种知识在选择之间做出选择时,行为就变得明智了。 最后,当价值观和承诺引导智能行为时,行为可以说是基于智慧。智慧水平包括所有必需的组件,如数据、信息、知识以及以做出明智的决定。
图10 数据、信息、知识与智慧之间的关系
7 相关工作
知识表示是人工智能中的一个关键主题,目前嵌入作为知识表示的关键分支,采用的是实体和关系的数字组合形式的统计模型。 然而,大多数嵌入方法仅仅集中于三重拟合并忽略显式语义表达,导致无法解释的表示形式[12][13]。 传统的嵌入方法不仅会降低性能,还会限制许多潜在的应用。 在[7]中,作者提出了一种知识图的语义表示方法,它强加了一个两级分层的生成过程,全局提取了许多方面,然后在每个方面为每个三元组本地分配一个特定的类别。 因为每一个方面和类别都与语义相关,所以每个方面中的类别集合被视为该三元组的语义表示。 在[14]中,作者提出用逻辑,哲学和计算基础来表示知识。作为价值驱动设计实践中的指导实例,在[16]中,作者提出了从价值计算到质量设计测量的系统化的形式,通过框架将设计工件的修改和变更与商业价值战略联系起来。在服务设计过程中管理质量属性。
8 结论
知识图这些年来已被广泛采用,但知识图的表达通常仅限于三元组的形式。 我们越来越意识到知识图的语义功能。在本文中,我们阐述了数据、信息、知识和智慧之间的关系,旨在从四个层面:数、信息、知识和智慧中阐明知识图的表达。 我们建议从“数据图、信息图、知识图和智慧图”四个方面指定知识图的体系结构。 对于具有复杂信息需求的
资料编号:[3097]