与文本相关的说话人识别系统设计任务书
2020-04-25 20:22:19
1. 毕业设计(论文)的内容和要求
与文本相关的声纹识别,用于确认某段语音是否是指定的某个人所说的,本设计拟定使用mfcc,对特定文本内容的声纹信息进行提取与识别,主要包括两个关键部分:特征提取和模式识别。
整体流程分为五步:预处理、提取特征参数、建立参考模型、带入测试模型、进行匹配。
具体的任务分解如下: 1. 在matlab中用m语言编程实现,基于mfcc特征提取方法,对特定文 本内容的声纹信息进行提取与识别 2. 了解声纹识别采用的多种技术,能够正确获取音频,并对其进行预处理, 提取特征参数,比较本次特征与训练库码本之间的欧氏距离,重复训练、 识别,完成与文本相关的声纹识别系统的matlab仿真 3. 在熟练掌握声纹识别技术的基础上,对目前声纹识别存在的问题予以 发现与解决 4. 撰写毕业论文。
2. 参考文献
[1] 许百林. 基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究。
硕士学位论文. 东南大学. 2005 [2] 声纹识别技术及其应用前景分析 网络安全技术与应用 2013年11期 [3] 基于LPCC和ADTW的声纹识别系统 2018-07-13公开的发明专利 [4] 一种新型的与文本相关的说话人识别方法研 上海师范大学学报 2017年2期 [5] 胡益平. 基于GMM的说话人识别技术研究与实现. 硕士学位论文.厦门大学,2007 [6] 赵力. 语音信号处理[M]. 机械工业出版社,2005 [7] 基于MATLAB的声纹识别系统软件的设计 科技世界2013年22期 [8] 何强 何英. MATLAB 扩展编程[M]. 清华大学出版社,2002 [9] DS Reynold, RC Rose, Robust Test-Inpendent Speaker identification using Gaussian Mixture Speaker Models [J], IEEE Transactions on Speech and Audio Processing, 1995 [10] DA Reynolds, Speaker Identfication and Verification Using Gaussian Mixture Speaker Models [J]. Speech Communication,1995 [11] SS Stevens. Handbook of Experimental Psychology (2nd edition) [M]. New York: Wiley Baddeley,1986 [12] 白莹 用人工神经网络实现的与文本无关的说话人识别. 硕士学位论文. 华北电力大学,2004 [13] 何振亚 顾明亮 王太君 史笑兴. 语音信号的主分量特征. 东南大学应用科学学报, 1999 [14]王炳锡 屈丹 彭煊. 实用语音识别基础[M]. 国防工业出版社,2005
3. 毕业设计(论文)进程安排
2018.10.17-2018.12.21 选题、申报毕业设计(论文)题目 2018.12.21-2019.1.18 广泛查阅资料,完善课题研究方案,完成外文翻译、文献综述和开题报告等 2019.3.1-2019.3.12 实施课题研究方案: 查阅相关资料,学习声纹识别系统基础知识,包括MFCC、VQ等的原理 2019.3.12-2019.3.20 理解系统设计流程,绘制流程图 2019.3.20-2019.4.3 根据课题要求,完成Matlab程序设计 2019.4.3-2019.4.15 对程序进行调试与改进,完成课题设计要求的基础上,发现问题,增加系统功能 2019.4.15-2019.5.15 完成毕业设计说明书、论文写作 2019.5.15.-2019.6.3 审阅、修改完善毕业设计(论文) 2019.6.3-2019.6.14 准备毕业设计(论文)答辩