汉语语音合成韵律控制方法仿真分析研究开题报告
2021-03-11 00:00:44
1. 研究目的与意义(文献综述)
语音合成技术是一项建立有识别文字能力以及将文字转化为语音能力的计算机系统所必需的关键技术,其目的在于实现人机语音通信,使电脑具有类似于人一样的说话和听懂人说话的能力。
语音合成是一门跨学科的技术,它涉及语言学、数字信号处理、人工智能、计算机科学等多个学科技术,是信息处理领域的一项前沿技术。语音合成的研究将推进相关产业,如家电、通信、汽车产业、家庭服务的发展。
语音合成技术发展到今天已经有200多年的历史,但真正进入可应用阶段是自计算机技术被发展起来之后。现在较广使用的语音系统是根据人类言语功能的不同层次所划分的3个层次:
2. 研究的基本内容与方案
本研究主要内容和基本目标如下:
本次设计对隐马尔可夫模型、基于hmm的语音合成系统、汉语的自然特征、基于hmm的语音合成系统的数据准备以及模型训练和合成语音等方面进行研究。之后通过praat语音学软件对组件基于hmm的可训练汉语语音合成系统的关键技术进行分析,完成语音库的设计、录音、标注和设计,根据语音合成系统的基本流程和原理设计实现基于hmm的可训练汉语语音合成系统,并对系统的性能进行评估。其次,根据bp神经网络技术的自我改进原理对电脑合成音的停顿,轻重进行预测和标注。由于matlab中含有相关的工具包,因此本次实验采用matlab进行程序编写。同时,本次实验也将利用到htk工具包,梅尔倒频谱参数(mel-cepstral)加以辅佐,以求得到较为自然、真实的电脑合成语音。
本研究的设计方案和基本措施如下:
3. 研究计划与安排
第1-3周:确定论文方向,搜集相关资料并撰写开题报告;
第4-5周:认真学习与选题有关的算法,下载并熟悉掌握项目所需工具,测试软硬件环境等;
第6-11周:根据搜集的材料,归纳整理实验基本理论,理解有关算法,将其与本次实验相结合,初步完成项目方案;
4. 参考文献(12篇以上)
[1] 张雪英.数字语音处理及matlab仿真[m].北京:电子工业出版社,2011.
[2] 何彬.基于语音识别和语音合成的汉语语音转换技术研究[d].云南:云南大学,2013.
[3] 蔡明琦.融合发音机理的统计参数语音合成方法研究[d].北京:中国科学技术大学,2015.