一种基于负数据库的隐私保护K最近邻分类算法任务书
2020-04-10 16:12:21
1. 毕业设计(论文)主要内容:
目标简介:k最近邻(k-nearest neighbor,knn)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。随着人们对于自身隐私信息的重视,进行隐私保护的数据挖掘变得很有必要。很多高效的安全技术都可以被用到数据挖掘中来保护数据的隐私,例如负数据库技术。负数据库通过压缩存储正数据的补集来保护数据的隐私,它支持基本的数据库操作,同时也支持距离估算。本课题主要设计一种基于负数据库的隐私保护knn分类算法,并对其进行安全性和可用性分析。
设计内容:
2. 毕业设计(论文)主要任务及要求
1、 查阅15篇相关文献(含2篇外文),并每篇书写200—300字文献摘要(装订成册,带封面);
2、 认真填写周记,完成800字开题报告;
3、 完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
3. 毕业设计(论文)完成任务的计划与安排
1、 2018/1/14—2018/3/5:确定选题,查阅文献,外文翻译和撰写开题报告;
2、 2018/3/6—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
3、 2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 主要参考文献
[1]张著英,黄玉龙,王翰虎. 一个高效的knn分类算法[j]. 计算机科学,2008(03):170-172.
[2]闭小梅, 闭瑞华. knn算法综述[j]. 科技创新导报, 2009(14):31.
[3]潘丽芳,杨炳儒. 基于簇的k最近邻(knn)分类算法研究[j]. 计算机工程与设计,2009,30(18):4260-4262.