基于循环神经网络的语音频带扩展技术开题报告
2020-04-13 13:06:20
1. 研究目的与意义(文献综述)
1.目的和意义
语音是人类最主要的交流、交互方式之一。从次声(20hz)到超声(20khz)频率范围的声音,人类都可以感知到。在目前的公共交换电话网和一些无线通信系统中,由于受到通信网络中多方面因素的影响,语音信号在通信过程中仅仅能够保留低频部分进行传输,这一问题严重影响了传输语音的质量。研究表明,语音信号中高频信号的缺失会导致语音质量严重下降。但是受到历史原因和经济成本等诸多因素的约束,现在的通信系统及通信网络很难再较短时间内得到大幅度的提升和更新。因此能够利用输入的频带受限语音,恢复或扩展出由通信系统中信道带宽等因素所导致缺失的高频成分的频带扩展技术,对于提升目前已有通信系统的通信语音整体音质和用户体验具有极其重要的意义。
语音信号频带扩展技术并非仅仅只能应用在实时通讯系统中,一个精准高效的频带扩展算法同样可以结合语音研究领域中其他研究方向的技术方法,可以进一步改善相应研究方向的系统性能。比如频带扩展技术可以应用到自动语音识别中,窄带的电话语音同全带语音相比,其识别正确率往往较低,但经过频带扩展处理的电话音的识别正确率可以得到较为明显的提升。频带扩展同样也可以被应用到语音增强等其他研究方向中,可以进一步提升相应语音的信噪比。因此频带扩展技术对于语音信号处理其他领域的研究也具有一定的参考价值。
2. 研究的基本内容与方案
1、基本内容:
(1)窄带、宽带语音训练库构建:准备不同说话者、不同语言等情况下的宽带语音信号,将宽带语音降频率为窄带语音,降频率后窄带语音和与之对应的宽带语音一同构建成一个较为完备的语音频带扩展训练库;
(2)特征参数提取与深度神经网络训练:首先设定语音信号分析参数,逐帧提取带窄带语音和与之对应的宽带语音的特征参数,然后构建深度神经网络,训练窄带语音与宽带语音在特征参数域内的非线性拟合关系,选择合适的特征参数和训练性能更为优越的深度神经网络是该研究最为核心的部分;
3. 研究计划与安排
(1)2018/1/14—2018/3/5:查阅文献,撰写开题报告,外文翻译;
(2)2018/3/6—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1] 顾宇. 基于神经网络的语音频带扩展方法研究[d]. 合肥: 中国科学技术大学, 2017.
[2] 林胜义. 语音通信系统的频带扩展技术研究[d]. 广东: 广东技术师范学院, 2016.
[3] 林胜义, 肖政宏. 基于线性源滤波器的语音频带扩展方法研究[j]. 自动化与信息工程, 2016.