基于深度学习理论的入侵检测技术研究文献综述
2020-04-14 17:25:00
进入二十一世纪,网络技术飞速发展,呈现出一种不可遏制的大趋势。互联网时代到来后,计算机的计算速度与存储容量也飞速上涨。在资源共享的时代,越来越多的个人,企业把信息存储在计算机中。因此,伴随而来的便是各种非法入侵,窃取和篡改个人信息的网络安全威胁。根据《2016年中国互联网网路安全报告》显示,2016年约有9.7万个木马和僵尸网络服务器控制了我国境内1699万余台计算机。这些数据说明,网络就是一把双刃剑,它给人们生活带来极大便利的同时,网民的隐私信息也受到了极大的威胁。
入侵检测技术是目前应用最广泛且最有效的维护网络安全的手段之一。入侵检测技术在维护网络安全方面有诸多优势,能够收集单一计算机系统中或多个网络节点的实时网络数据信息,建立相应的评判机制和分类模型,判断出是否为合法用户并且做出及时回应。所以入侵检测是主动积极的防御机制。传统的入侵检测技术主要是用大量的网络数据建立正常或者入侵模式库,或采用相关的数学模型和学方法进行检测。这种检测方法操作难度大,准确率低,误报率漏报率高,自适应能力弱。在只能算法应用广泛的今天,将深度学习与入侵检测机制结合起来,可以提高检测的准确率和适应能力,可扩展行也能增强。
1980年James P.Anderson在为美国空军做的题为“计算机安全威胁监控与监视”的技术报告中首次提出入侵检测的概念。指出可以通过收集和整理网络相关的审计记录偏离历史正常用户行为数据来发现入侵行为。早期的入侵检测研究知识建立在专家的知识基础上,主要是利用已有的数据对攻击行为建立入侵行为模式库,然后将收集到的数据与建立好的模式库相匹配,匹配成功则是入侵行为。但是随着网络的发展和攻击手段的更新,现有的检测技术已经远远达不到要求。因此Heberlein等人在90年提出基于网络的入侵检测,通过检测网络流量特征主动取追踪可疑的网络行为。90年代到来后,随着数据挖掘技术和机器学习算法的推广人们将智能算法和入侵检测结合起来,比专家系统的判定方式更加有效。Tank于95年提出将多层感知机与入侵检测系统结合起来。通过实验得出,神经网络对网络攻击的检测率更高。99年,Wenke Lee等人将数据挖掘的方法用于入侵检测系统,通过分析大量无需无规律的数据从中挖去有用的信息,利用数据挖掘的特质,利用相关的智能算法对网络数据流进行分析得到检测模型,这种检测模型在一定程度上提高了入侵检测的性能,将智能算法用于入侵检测推入黄金时期。
{title}2. 研究的基本内容与方案
{title}基本内容:
对入侵检测技术当中使用到的关键技术进行研究。针对入侵检测的基本概念、系统结构、只要分类和关键技术进行调研,分析现有技术存在的问题,同时对现有的入侵检测各方面研究做一个概括。
针对数据流量中的高维数据问题,给出相应的解决方案。以往学者对于数据维度过高这一问题,提出的解决方案主要是利用主成分分析法、计算特征的信息熵增益等,但是这些方法的主要问题是会忽略特征之间的相关性甚至丢失部分潜在的有用特征维度。针对这一问题,使用自编码器引入到特征维度当中,在同构误差非常低的基础上可以得到输入和输出的一一映射,然后通过结构寻优方法,利用重构误差来衡量每层神经元特征学习能力,按步长来调整每层神经元的数量选择合适入侵检测的最有神经网络。
针对现有入侵检测的检测精度不高问题结合已提出的自编码器降维算法与深度神经网络模型,利用Dropout方法来防止神经元的过拟合,进一步提高稀有攻击的检测率。
目标:
分析当前深度学习和入侵检测,对深度结构的特征学习进行分析研究,提出一个全新的入侵检测模型来解决当前入侵检测存在的问题。
采用的技术方案: