K-均值聚类算法研究开题报告
2021-02-26 11:15:21
1. 研究目的与意义(文献综述)
21世纪是信息化的时代,信息的形式不再是单纯的语音,而是发展到包括数据、文字、图像、视频等在内的多媒体形式。据统计,人类接受外界的信息中有80%来自图像。图像分割技术是针对性很强的技术,它在人类生产和生活的方方面面起到了越来越重要的作用。
图像分割是指将图像中具有特殊意义的不同区域分开来,并使这些区域相互不相交,且每个区域应满足特定区域的一致性条件。图像一旦被分割,就可作进一步的处理,如基于内容的图像检索、分类及识别等。因此,图像分割是图像处理和模式识别中的一个重要研究领域。目前图像分割的算法主要有阈值分割法、边缘提取法、区域分割法、分水岭分割法等,这些分割算法各有优缺点。
聚类是指将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。聚类分析的研究工作集中在为大型数据库的有效和实际的聚类分析寻求适当的方法,目前的研究方向包括下列几个方面:
2. 研究的基本内容与方案
本文的主要研究工作,是在理论研究方面改进k-means算法本身存在的一些不足。
k-means聚类问题是一个np问题(难解的非指数问题),即问题的复杂度随着比特位数的增长而指数上升,它与其他诸多的聚类和位置问题息息相关。但是该算法却有以下问题:
①算法需要用户指定参数k的值,而不同的k值对聚类分析的效率和结果有较大的影响;
3. 研究计划与安排
第1-2周:查阅相关文献资料,明确研究内容,确定方案,完成开题报告。
第3-6周:学习k-均值聚类算法。
第7-8周:阅读相关英文资料,完成英文资料的翻译。
4. 参考文献(12篇以上)
[1]王守强,朱大铭.求解k-means聚类更有效的算法[j].计算机工程与设计,2008,29(2):378-380.
[2]王洪睿,赵黎明.均衡化的改进k-均值聚类算法[j].吉林大学学报,2006,24(2):172-175.
[3]刘韬,蔡淑琴.基于距离浓度的k-均值聚类算法[j].华中科技大学学报,2007,35(10):50-52