
  • 登录
  • 忘记密码?点击找回


  • 获取手机验证码 60
  • 注册


  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 自动化 > 正文


 2020-04-15 21:53:16  

摘 要




Multi-classifier integrated system based on rough set attribute reduction


With the progress of human society and the devasdelopment of the Internet, morasde and mdwqore informgqation of natural scieasdnce appears in our world. These information hides many valuable and significant data, and the multi-classifier integration system is used to help us find the important information we need from a variety of information. For large data sets, we can not proofread every attribute, so we need to use rough set theory to reduce these uncertain and fuzzy attributes to obtain deterministic and distinguishable data, so that the multi-classifier integration system has better classification ability.

In this paper classification istinguishable, a multi-classifier ensemble the reduced data set rough set attribute reduction is studied. By calculating the original data, these data are simplified and the reduced data set is obtained. After training several groups of individual classifierssystem based on for several reduced data sets, a genetic algorithm is used to set several groups of individual classifiers according to the relative majority voting method. Individual classifiers from different reduced datasets provide different information, which complement and cooperate with each other. The resulting multi-classifier integration system has better classification ability than a single individual classifier, and only a small number of individual classifiers are used.

Key Words: ensemble learning; rough set;attribute reduction;Multi-classifier integration

目 录

摘 要 I

Abstract II

第一章 绪论 5

1.1 本课题研究的背景和实际意义 5

1.2 国内外研究现状 6

1.2.1 决策树分类方法 7

1.2.2 K近邻(k-nearest neighbors,KNN) 分类方法 7

1.2.3 贝叶斯分类方法 8

1.2.4 神经网络分类方法 8

1.2.5 支持向量机(SVM,Support Vector Machine)分类方法 9

1.2.6 模糊集分类方法 10

1.2.7 粗糙集分类方法 10

第二章 相关理论知识 11

2.1 粗糙集的发展历史 11

2.2 粗糙集的基本概念 11

2.3 集成系统 13

第三章 实验部分 14

3.1 总体设计流程 14

3.2 实验步骤 16

3.2.1 对x求原始数据中关于条件属性的等价类 16

3.2.2 计算对象x的条件概率 16

3.2.3 计算集合X的上近似,下近似 17

3.2.4 计算相对正域和决策属性对所有条件属性子集R的依赖度 18

3.2.5 求所有条件属性的依赖度 19

3.3 实验结果以及分析 20

第四章 总结 23

参考文献 24


1.1 本课题研究的背景和实际意义


由于人类自身的发展,对自然的探索,互联网时代的到来,在各个领域之中,都产生了海量的数据资料,并且这些数据也会随着人类的活动无时无刻的在增长。例如:北京的交通摄像头监控系统监管着五百多万辆的汽车;在2018年“双十一”活动中淘宝仅仅一天就产生了十五亿笔的交易记录。这些数据蕴含了丰富的有用信息与知识,人们使用数据库将这些数据进行收入、排版、和统计,但是还是无法发现这些数据之间存在着怎样的关系“信息泛滥,知识匮乏”的局面依然普遍存在。 如何从庞大的、有噪声的数据中获得有价值的、有意义以及对我们有帮助的知识成为目前科学界的一个重要的研究对象。

人们想要通过对这些庞大的数据信息的各个方向、各个层次进行分析,在企业发展、科学研究、政府统筹等方面给予他们所需要的信息。所以对于“信息泛滥”来说我们迫切的需要数据库知识发现(KDD)方法来解决这个问题,把“信息泛滥”变成真正对人们有价值的重要知识。 Fayyad和Piatetsky-Shapiro在二十世纪末给出了广泛接受的知识发现定义。知识发现是一个非常重要的过程,可以把繁多、冗长的数据中的有意义的,新颖的,可能是有用的信息提取出来。

您需要先支付 50元 才能查看全部内容!立即支付


Copyright © 2010-2022 毕业论文网 站点地图