电子文件智能分类系统设计与实现开题报告
2022-01-13 21:46:48
全文总字数:5524字
1. 研究目的与意义及国内外研究现状
目的:随着网络的快速发展,人类已经进入了大数据时代,在这个时代里,我们会接触到越来越多的电子文件,为了使我们能更高效地进行工作和生活,我们就必需对这些电子文件进行分类,电子文件的表现形式多种多样,有文字,图象,音频,视频等,电子文件的分类如果一成不变地沿用传统的纸质文件的分类方法,是无法适应现代社会发展的需求的。随着计算机的出现,人工智能有了突破性的进展,计算机不仅能代替人脑的某些功能,而且在速度和准确性上也大大超过人脑,它不仅能模拟人脑部分分析和综合的功能,而且越来越显示某种意识的特性,计算机真正成了人脑的延伸和增强,并且我们只有使用科学的分类方案才能让电子文件分类达到事半功倍的效果,所以我们要利用计算机来处理这些电子文件,实现文件的智能分类。
意义:考虑到快速增长的电子文件数量,分类的准确率,以及依据我国电子文件前端控制的需要,我们需要按照一定的原则和方法,让电子文件实现自动分类。近年来,人工智能的理论和技术日益成熟,应用领域也不断扩大,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,它是计算机科学的一个分支,企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等,它可以让计算机去做过去只有人才能做的智能工作,构造具有一定智能的人工系统,用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术,它具有很高的商业价值,能让人类生活更美好,推动社会和人类的进步,因此我们可以运用人工智能技术实现文件分类。神经网络在人工智能的发展中兴起,神经网络算法是网络模型的一种代表算法,随深度学习的深入发展,它在自然语言处理方面有不错的效果,可被用来进行特征值提取,并且在和贝叶斯算法、决策树、最短路径邻居knn算法等综合比较而言,卷积神经网络算法具有一定的优越性。所以运用卷积神经网络来进行文件分类就不需要消耗大量的人力,可以极大地节约人力资源成本,而且文件按分类高效准确,使文件的自动分类达到一个很好的效果,由此看来文本智能分类技术具有极大的使用价值,有着十分重要的研究意义和广泛的应用前景。
国内外研究现状
在当今整个社会的信息量迅速膨胀,电子文件的数量飞速增加的大数据时代,怎样对大量的电子文件实现有效地管理,对其做出适当的分类,是国内外学界都十分关注的热点问题。国内外都一致认为将电子文件进行分类是一件非常有意义的事情,中国人民大学的刘越男在2009年强调当前电子文件分类被视作电子文件管理软件最基本的系统功能,加拿大、澳大利亚、英国等国从20世纪开始都格外重视电子文件的分类。朱叶吉指出“文件分类并不仅仅是一个工作环节,而是一种全程管理、全程控制的工具。”文件管理的国际标准iso15489给出了电子文件分类的8个好处,刘越男在2009年对文件分类的目的作出了概括性的总结,并且他认为层级式分类结构更能展示文件之间的联系,而且只有以覆盖全面的分类方案为基础才能有效把握一个单位的全部信息资产,才能进行有效的统计和清点,atle skjekkeland在2006年也给出了相关的论述,他指出通过分类管理,可以使文件管理系统有效地对某类文件进行访问控制,进而实现安全管理。
2. 研究的基本内容
要实现对电子文件的智能分类,就要对电子文件分类方案的概念有所理解,并且清楚国内外的电子文件分类方案需求,然后根据我国的方案需求和现代数字网络环境来确定一个基于业务活动的电子文件分类方案。近年来,人工智能被越来越多地运用到我们的工作和生活中,给我们带来很大的便利,人工智能和人类智慧越来越明显的分工会极大地节省人力资源成本,间接地提高能源利用率,有些效率低的工作由智能机器人做更好。比如像文件分类这种重复性高并且耗费人力的工作,如果由智能机器来做不但能节约人力成本而且会极大提高工作的效率。卷积神经网络在人工智能的发展中兴起,起初它被应用于图像处理,后来有学者将图像像素矩阵与文本向量矩阵进行类比,发现卷积神经网络在自然语言方面也有不错的效果。并且卷积神经网络具有分布存储和容错性、大规模并行处理、自学习,自组织和自适应性的优势,用它来实现文件的智能分类具有准确性高和效率高的好处,从而对这种算法进行研究,用它来进行文件的智能分类。所以研究的内容主要是以下几个方面:
一、对电子文件分类方案进行研究
(1)电子文件分类方案的概念
3. 实施方案、进度安排及预期效果
从2.28到3.30 撰写开题报告、译文
从3.31到4.20 论文初稿完成
从4.20到4.30 第一次修改
4. 参考文献
[1] 王大青.电子文件分类方案需求研究[j].档案与建设,2014(10):17-22.
[2] 马林青.电子文件分类方案的建立原则与方法研究[j].档案信息化,2015(3):77-81.
[3] 王大青.电子文件分类方案的设计与实现[j].学术探讨,2015(6):18-21.