基于MFCC的语音信号特征提取研究开题报告
2020-04-12 16:02:53
1. 研究目的与意义(文献综述)
1.1背景简介
随着社会经济的发展,互联网络和信息化技术的普及与应用越来越广泛,个人身份认证的数字化、便捷化、隐性化等也就显得越来越重要。例如在自动身份验证、金融安全、军事安全、视觉监控、人机交互技术以及司法侦查等领域,都迫切地希望具备简单易行的、可靠的识别个人身份的方法。传统的身份识别方法,如证件、口令等容易丢失或遗忘,且无法区分真正的拥有者和取得上述身份标识物的冒充者,成为信息安全领域的重大隐患。因此,研究一种快速的、有效的、稳定的身份识别技术成为信息化时代的热点。由于每个人与生俱来就具有唯一的、不容易假冒和伪造的生物特征(如指纹、掌形、脸部、虹膜、声音等),所以通过利用人体所固有的生理特征或行为来进行身份识别的生物识别技术就应运而生。比尔·盖茨认为:“以人类生物特征来进行身份认证的技术,在今后数年内将成为 it 产业最为重要的技术革命。”
在生物特征中,语音是人类最方便、最实用、最自然的一种特征。由于每个人说话时所使用的发声器官,如牙齿、舌、喉、肺以及声道等,在形状和尺寸等方面都会存在着巨大的生理差异,所以不同的人对同一个字的发音所产生的波形都是不相同的,每个人的语音都具有强烈的个人色彩,此外,语音的产生、传输以及提取都是非常容易实现的。因此,利用语音特征来进行身份鉴别的说话人识别技术将成为生物认证技术中最为方便、安全和环保的识别技术。与其他生物识别技术(诸如人脸识别、虹膜识别、指纹识别、掌形识别等)相比较,说话人识别技术具有生物识别技术共同拥有的无需记忆、不会遗失和忘记、使用方便等优点。语音信号的特征向量一般分为两类,第一类为时域特征向量,通常将帧语音信号的各个时域采样值直接构成一个向量。第二个为变换域特征向量,即对一帧语音信号进行某种变换后产生的特征向量。
2. 研究的基本内容与方案
2.1研究的基本内容
首先了解语音信号产生机理以及语音信号基本特征,从时域和频域两个方面了解语音信号特征表示方式并做简单对比,其次要熟悉mfcc的基本原理以及利用mfcc算法进行特征提取的基本步骤,然后在matlab平台编写代码完成基于mfcc的语音信号特征提取,包括特定单字语音及中文语句信号的特征提取。最后利用相关最优化算法完成特征值的优化选择。
2.2设计步骤
3. 研究计划与安排
1-2周:前期调研,文献阅读,熟悉mfcc算法,了解语音信号特征值。
2-5周:提出方案。
6-11周:代码编写,仿真及实测实验。
4. 参考文献(12篇以上)
[1]王光艳,赵晓群,王霞.基于matlab gui的语音信号特征提取系统设计[j].河北工业大学学报,2010(4):14-18.
[2]朱佰泽,卜庆凯.语音信号特征提取算法研究[j].现代电子技术,2016,39(4):9-11.