应用于自动化网络管理的高效序列模式挖掘技术研究开题报告
2021-12-16 22:40:08
全文总字数:1806字
1. 研究目的与意义及国内外研究现状
数据挖掘(data mining),又称资料探勘、数据挖掘、数据采矿。做数据库知识发现中的一个关键步骤,通常指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常作用于包含大量复杂数据的数据库系统,通过统计、情报检索、在线分析处理、模式识别、专家系统(依靠过去的经验法则)和机器学习等诸多方法完成对关键数据的检索和处理。
序列模式是数据挖掘中的一个重要研究课题。所谓序列模式,即在一组有序的数据列组成的数据集中,经常出现的那些序列组合构成的模式。与关联规则挖掘不同之处在于,序列模式挖掘的对象以及结果都是有序的,即数据集中的每个序列的条目在时间或空间上是有序排列的,输出的结果也是有序的。
自从序列模式挖掘问题被提出以后,就一直成为人们研究的重点,因为它可以被应用在很多领域。随着对序列模式算法的研究,出现了很多比较好的和相对比较成熟的算法。应用于自动化网络管理的高效序列模式挖掘技术作为数据挖掘作用于具体领域的一个实例,可以直观的反应出序列模式挖掘技术对于实际领域的影响,十分有研究价值以及实际的应用潜力。
2. 研究的基本内容
(1) 掌握序列模式数据挖掘基础理论,整理、分析数据挖掘中序列模式挖掘技术原理,对相关算法进行深入研究。
(2) 分析网络环境,确定自动化网络管理具体需求,明确当前的序列式数据挖掘算法应用于自动化网络管理系统的主要问题。
(3) 以理论知识为基础,对aprioriall算法、gsp算法、freespan算法、prefixspan算法进行算法分析,基于实际应用分析算法性能。
3. 实施方案、进度安排及预期效果
本课题以数据挖掘理论为基础,以序列模式挖掘技术中的时间序列算法为工具,利用.net框架下c#的强大功能完成对一种算法的程序实现。通过对程序分析算法的性能优劣性,探究在实际应用中算法的优化空间。
目前本课题处于相关知识准备阶段,通过对数据挖掘算法相关书籍的深入性学习以及对序列模式数据挖掘技术相关论文的整理参考,理解序列模式挖掘的基本概念、序列模式与关联规则的关系以及序列模式挖掘的一般步骤等。 通过程序实现序列模式经典算法,可以直观的对算法做出性能分析。以直观的运行数据进行分析,有助于算法的改进优化。
4. 参考文献
[1]梁栋. 大数据集序列模式挖掘算法研究[d]. 山东师范大学,2015.
[2]董晓莉. 时间序列数据挖掘相似性度量和周期模式挖掘研究[d]. 天津大学,2007.
[3]王宗江. 序列模式数据挖掘算法的并行化研究[j]. 计算机科学,2008,08:249-251 257.