登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 管理学类 > 信息管理与信息系统 > 正文

城市垃圾危机知识库毕业论文

 2020-02-19 20:09:33  

摘 要

随着中国城镇化进程的加快,城市垃圾产生的数量和速度日渐增多,但垃圾处理的技术远远赶不上垃圾增长的速度,这种情况下,城市垃圾危机问题日益凸显,其中垃圾焚烧厂产生的“邻避”事件尤其具有代表性。我国对城市垃圾危机的预防办法和解决方案缺乏理论和数据支撑,因此本设计将对众多垃圾危机案例进行数据集成分析,引入本体和知识库相关概念,使用protégé平台构建城市垃圾危机案例本体模型。同时引入Jena推理机进行知识推理和应用,构建了一个智能推理城市垃圾危机知识库。本研究还创新性的将决策树算法引入推理机规则,使知识预测结果误差更小,给出的决策建议更科学智能。本设计利用智能工具解读城市垃圾危机数据,使得纷繁杂乱的案例资料具有关联性和代表性。知识推理功能可以挖掘出更具启迪性的隐形知识,为城市规划者提供更科学智能的决策建议,为解决城市垃圾危机提供新思路。

关键词:邻避效应;城市垃圾危机;知识库;本体建模;知识推理;决策树

Abstract

As China's cities continue to grow in size,the quantity and speed of urban garbage is increasing, but the technology of garbage disposal is far behind the speed of garbage growth. Under this circumstance, the problem of urban garbage crisis has become increasingly prominent, including the waste incineration plant. The “neighborhood” incident is particularly representative. China lacks theoretical and data support for the prevention methods and solutions for urban garbage crisis. Therefore, this design will analyze the data integration of many garbage crisis cases, introduce the concepts of ontology and knowledge base, and construct the urban garbage crisis case ontology model using the protégé platform. At the same time, Jena inference engine is introduced for knowledge reasoning and application, and an intelligent reasoning urban garbage crisis knowledge base is constructed. This research also innovatively introduces the decision tree algorithm into the inference engine rules, making the error of knowledge prediction results smaller, and the decision-making suggestions are more scientific and intelligent. This design uses intelligent tools to interpret urban garbage crisis data, making the complicated and complicated case data relevant and representative. The knowledge reasoning function can mine more invisible knowledge, provide more scientific and intelligent decision-making suggestions for urban planners, and provide new ideas for solving urban garbage crisis.

Key Words:Neighborhood avoidance effect; Urban garbage crisis; Knowledge base; Ontology modeling; Knowledge reasoning; Decision tree

目 录

I

第1章 绪论 1

1.1研究目的及意义 1

1.1.1研究目的 1

1.1.2研究意义 1

1.2国内外研究文献综述 2

1.3基本内容和技术方案 3

第2章 基本概念和理论 5

2.1知识元相关概念 5

2.2.1 知识元的概念 5

2.2.2 知识元的理论 5

2.2本体相关概念 5

2.1.1 本体的概念 5

2.1.2 本体描述语言 6

2.1.3 OWL本体语言 7

第3章 城市垃圾危机知识库模型设计 8

3.1城市垃圾危机案例元本体模型 8

3.2数据库设计 8

3.3城市垃圾危机本体模型 9

3.4知识规则定义与规范化 11

第4章 城市垃圾危机知识库构建 12

4.1 数据清洗 12

4.2 文本抽取 13

4.3 protégé·表示知识 15

4.4 知识推理技术 17

4.5 邻避事件知识推理应用 18

第5章 全文总结与研究展望 22

5.1全文总结 22

5.2创新点 22

5.3研究展望 23

参考文献 24

致谢 25

第1章 绪论

1.1研究目的及意义

1.1.1研究目的

随着城市人口的不断增多以及城镇化规模的进一步扩大,城市内生活垃圾的数量也在呈直线上涨趋势,影响范围也在持续不断的扩散。在我国,城镇生活垃圾产量很大,但垃圾处理的理念和技术体系不完善,垃圾处理也不够及时和妥善,这不仅会对城市发展有不利影响,同时也对严重破坏了民众的生活环境。为了应对各类的城市垃圾危机,我国许多城市已经从最初单一的垃圾处理模式转变成为多元化垃圾处理模式[1]。每个城市由于自身地理环境条件、经济条件、垃圾来源以及技术条件不同,对于垃圾的处理方式各不相同。在这种现状下,构建城市垃圾危机知识库能够更好的整合现有垃圾处理数据,通过智能化分析,解决潜在的城市垃圾危机。

本系统通过构建城市垃圾危机知识类和属性,并分析类、属性及其之间的关系,结合本体学习、决策树算法等理论与方法,对OWL本体描述语言进行模糊扩展,对城市垃圾危机相关知识元进行实词分析及关键词提取。分析知识元之间的属性关联,构建知识元的类和属性关系图。通过本体开发工具(以开源Protégé为主)设计城市垃圾危机所涉及的本体模型,通过推理机(映射与融合)实现原始数据向知识本体的转化。本系统基于C/S模式,智能解读城市垃圾危机相关案例和数据。

1.1.2研究意义

(1)理论价值

本设计通过对大量城市垃圾危机真实案例数据的集成分析,引入本体和知识元等概念, 构建了一个“城市垃圾危机大数据”网络本体,对于本体和知识库在城市垃圾领域的研究具有重要理论价值。同时,还将Jena推理机和决策树算法巧妙的结合应用,也为知识库如何更好地挖掘隐形知识提供了全新思路。

(2)实际意义

目前中国城市产生的垃圾总量已经处在世界前几位,垃圾产生的年增长率更是居世界第一[2]。每年,全国的670个城市都将制造多达1.6亿吨的垃圾,超过世界总量的四分之一。根据相关预测,2030年中国城市垃圾达到4.09亿吨,2050年达到5.28亿吨[3]。与垃圾增长率上升形成鲜明对比的是,焚烧和填埋依旧是中国目前处理垃圾的主要方式。估计在2020年时,垃圾焚烧处理的比例将超过50%,卫生填埋达到40%以上,其他方式仅占很少的比例。在这种现状下,将本体和知识库等概念引入垃圾处理领域,充分利用互联网的优化和集成作用,剖析城市垃圾问题并整合解决对策,改变传统的研究模式和服务方式,智能匹配和解决不同类型的垃圾危机,对进一步完善我国城市垃圾危机处理体系有着深刻的实际意义。

1.2国内外研究文献综述

随着社会信息的大爆炸以及城市现代化进程的加快,我国已经进入知识经济时代。从表面上看,知识的高量级增长使人们不再为获取知识而苦恼,随手触及大量信息。但实际上,丰富的知识资源掩盖着着更深层次的问题。一方面,庞大的信息量使知识获取的效率极大降低;另一方面,复杂无序的信息也更难被人们有效利用。在这种背景下,对知识进行规则管理成为不二选择。

目前,知识管理已经在现代服务业、医药业、高等教育、科技创新等方面有了广泛的应用。将传统的知识载体精细化成知识元,对于知识的获取、传播和利用有着极其重要的意义。知识管理是将知识元作为其基本单位,能够对碎片化的知识进行集成管理并根据不同知识元的特征构建知识元库,通过知识的量化分析进而发掘更多启迪性的隐藏知识。知识元在数字图书馆、突发事件应急管理领域和教育领域都有了广泛的应用。刘薇对数字图书馆的知识元结构做出定义,初步完成了对数字图书馆学科的标引[4]。王宁创新性地构建了非常规突发事件的应急管理知识元模型,并提出了知识元之间的属性关系,为研究突发事件应急管理提供了与众不同的研究思路。知识库与传统的数据库相比,模式化、层次性、置信测度等都具有明显的优越性。知识库在分布式网络实现时,性价比、任务效率和分布性也都较高。

近年来,国内群众环保诉求更加强烈,民众对周边生活环境的要求也更为严格。更重要的是公众的社会参与度和维权意识也日益增加。虽然垃圾处理厂是一个很重要的功用设施,但民众从自身角度出发,均不愿意垃圾焚烧厂建设在居住地附近,这就造成了“邻避效应”。城市垃圾邻避效应的案例近年来层出不穷。2018年10月29日,湖北省黄冈市浠水县发布关于停建“山水环保发电项目”的通告[5]。山水环保发达项目按规定向社会公开发布公示,因为该项目拟选址周边多数群众均不同意,因此项目审批不予通过,项目停止建设。但国内外也有许多妥善解决"邻避效应"的案例。为了从源头处解决垃圾处理的难题,广东省正式出台了有关垃圾处理设施地址选择的相关决定,文件对垃圾处理厂的选址、运营管理以及补偿机制等都做出了明确规定[6]。国内关于本体在知识库方面的研究在航空航天、高校教育、生物技术等领域都有很大的突破,但对于城市垃圾危机的管理和应用方面仍有欠缺。鉴此,本课题将研究将基于语义本体的知识库应用到城市垃圾危机管理上,旨在实现对城市垃圾危机知识的智能解读,为城市垃圾危机管理研究提供新的思路。

1.3基本内容和技术方案

本设计的主要内容是建立一个城市垃圾危机知识库,同时将人工智能技术和本体模型构建相结合。将城市垃圾危机概念、案例和相关数据集成为一个城市垃圾危机本体模型,使得纷繁复杂的城市垃圾危机案例数据规具有关联性和规范性,智能解读城市垃圾危机案例和相关知识。

本设计需要重点解决的问题主要有三个:

1.使原有城市垃圾数据结构化:编写网络爬虫,在网络平台搜集关于城市垃圾危机的相关知识文本,再借助语义平台将获取的文本通过分词得到关键词,凝练字段,构造城市垃圾危机数据库和关联规则。

2.城市垃圾危机知识库模型设计:使用Protégé来实现城市垃圾危机本体知识库的构建。根据获取的城市垃圾危机关键词表,构建本体概念关系模型,对本体定义知识规则。

3. 实现城市垃圾危机知识推理功能:引入城市垃圾危机实际案例,使用protégé本体建模工具将每个案例进行形式转换,创建城市垃圾危机案例库。构建好相关实例库后,定义知识规则,建立规则库进行推理,使城市垃圾危机知识库能够自主挖掘隐形知识。

技术方案如图1.1所示。

图1.1 技术路线图

第2章 基本概念和理论

2.1知识元相关概念

2.2.1 知识元的概念

为满足公众在知识获取和利用上越来越精细的需求,将传统知识载体碎片化为知识元是一个重要途径[7]。有很多学者一直致力于知识元相关研究,关于知识元的文献数量也很多,但对于知识元的概念、类型和表示方式都没有形成统一的共识,不同时期的学者对于知识元的解读存在着一定区别。弗拉基米尔·斯拉麦卡提出了早期知识元的概念。

当时的他称之为“数据元”,是知识的控制单位。国内的学者对知识元概念理解的主要差异体现在对知识元粒度大小的界定。大多数的学者认同知识元是不能够进一步分割的最小单位,但仍有少数学者坚持知识元可以继续细分[9]

2.2.2 知识元的理论

目前知识元分类仍没有形成固定统一的标准,但多数学者都是从概念、方法和事实等几个方面来界定。王延章等把知识元按对象、属性和属性映射关系进行划分。原小玲将知识元分为两大类。一类为理论方法型,包括思想、公理、原理、观念与技巧等。另一类为事实和数值型知识元,包括各种数据、自然现象、事实等。

国内学者知识元的抽取方法大致上可以分为两类。一类是以姜永成和周宁为代表以文本结构为前提的知识元抽取方法。这种方法是先对文章进行结构分析,建立起上下文的逻辑关系,并抽取出带有引导性质的向导元素。再通过这些向导性元素建立整个文本和知识元之间的关系,从而抽取知识元。另一类是以蒋玲为代表以规则为前提的知识元抽取。这种方法首先要对文本进行分句和分词处理,然后分析文本属性建立知识元句法模型,即建立知识规则。然后通过人工筛选出知识元描述[9]。本研究采用的是以构建规则为前提的知识元抽取方法。

知识元可以通过框架、模型、符号等进行表示。对知识元进行表示为了将其转化成便于机器读取和处理的形式。知识元的表示方法大体上分为两种,一种是基于框架的表示法,一种是本研究所采用的的基于本体的知识元表示方法。

2.2本体相关概念

2.1.1 本体的概念

本体概念起源于于哲学,客观实体之间的关联是其主要研究内容[10]。本体可以对某个领域的概念进行深层次的说明阐释,从而使得某个概念更易于理解接受。亚里士多德的哲学思想和存在论也对本体的起源有一定影响。牛津字典中对本体论的解释是客观存在的科学研究;韦伯斯特词典将本体论解释为客观事物存在的本质和联系的研究理论分支。

从浅层次角度看,哲学领域和信息技术领域之间似乎没有关联,但宇宙间的事物都存在着千丝万缕的联系。哲学领域和信息技术领域的交叉就是本体,想要在信息技术领域构建完整可行的本体模型,就一定需要本体哲学内容的支撑。虽然两个领域中的本体论有很大的区别,但是其基本的概念框架和解释大体上是相同的。本体的概念,主要包含以下内容:

(1)本体对指定方面进行概念化的阐释;

(2)本体的概念指的是客观存在的对象在指定属性空间里出现的投影;

(3)客观对象的投影本身十分复杂,最终的结果要经过转换才可能得到;

(4)在同一领域里,不同的本体概念也可能有相同的特点;

(5)任何本体概念都不会包含客观对象的全部属性,只能包含某一范围内的属性。

不同的研究领域对于本体概念的解释都有一定差异,就本体概念本身而言,也存在着诸多争议。但有一点不可否认,本体在信息技术领域中的地位及其重要,特别是在信息交流的过程中,本体论的作用不可替代。本体在信息技术中的概念有两个方面:

(1)出现在某个特定的主题和领域中。表示性词汇。

(2)描述特定领域的术语。表示性词汇。

2.1.2 本体描述语言

Web起源于超文本语言HTML[11]。随着超文本语言的发展,文档变化更加结构化,从而使得HTML语言也更加规范。此外,随着网络时代各行各业的快速发展,许多行业的工作都对Web应用程序的发展提出了更高的要求,bane已经无法对网络语法和语义进行合理表达,超文本语言必须开始改变。在这种情况下,可拓展标记语言XML诞生了。XML开发者可以根据不同工作的要求和定义进行创建。但是,XML语言仍然不可以提供相应的规范交换术语和数据描述。

RDF,即资源描述架构可以在定义语法协定和简单的数据模型时,将其可处理的数据语义反映出来。RDF是以对象属性和数值为基础建立的数据模型。RDFS相比于RDF而言,内容更多,表现形式也更丰富。将RDFS作为气垫的时候,相关类、类的属性及其约束范围等内容都会存在于Web本体语言内[12]。在RDFS的基础上,还形成了一些其他的本体语言。各个本体语言之间的关联如图2.1所示[13]

图2.1 各本体语言层次关系图

2.1.3 OWL本体语言

W3C在2003年向全世界宣布OWL(Web ontology)语言,并根据相关推荐标准制定了OWL规则。OWL通过对类、类的属性及其之间关系的描述形成关系网络。逻辑的秒速推理功能可以应用在OWL本体上。OWL语言又包括Lite、DL和Full三类[14]。OWL本体所具有的最大优势就是可以进行推理,且不受主题和领域的局限。构建完成且制定了标准的XML Schema体系都可以进行推理。

第3章 城市垃圾危机知识库模型设计

3.1城市垃圾危机案例元本体模型

从网上获取的城市垃圾危机知识显示事故发生的种类繁多,成因复杂,范围广泛,因此在对实际案例进行聚类分析后,构建城市垃圾危机案例元本体模型,模型涉及的概念及其存在的关联如图3.1所示。

图3.1 城市垃圾危机案例元本体模型图

模型图中涉及的概念及关系解释如下:

(1)隐患:表示在垃圾危机事故发生之前,可能存在的导致危机发生的各类隐患。隐患如果没有被及时发现和处理,就会进一步发展为成因。隐患间接导致了事故后果的产生。

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图