基于深度学习网络的语音信号识别任务书
2020-02-18 15:22:36
1. 毕业设计(论文)主要内容:
语音识别主要作用就是把一段语音信号转换成相对应的文本信息,系统主要由声学特征提取、语言模型、声学模型和解码器等组成。
训练识别的过程是从原始波形语音数据中提取的声学特征经过训练得到声学模型,与发声词典、语言模型组成网络,对新来的语音提取特征,经过声学模型表示,通过维特比解码得出识别结果。
毕设主要内容包括:
(1) 学习关于深度学习的基本概念和知识;
(2) 掌握利用matlab或python进行构建深度学习网络算法的方法;
(3) 了解和掌握通过深度神经网络提取语音特征的方法、深度神经网络提取声音属性的方法和深度学习搭建声学模型的方法的语音识别系统的基本步骤与方法;
(4) 完成毕业论文。
2. 毕业设计(论文)主要任务及要求
(1) 查阅不少于15篇(其中近5年的外文文献不少于3篇)的相关资料,完成开题报告(设计的目的及意义至少800汉字;基本内容和技术方案至少400汉字)。
(2) 基于深度学习网络,采用matlab软件或python语言构造深度学习网络,进行语音信号识别的基本学习过程。
(3) 完成不少于5000汉字(20000英文印刷符)的英文文献翻译。
3. 毕业设计(论文)完成任务的计划与安排
(1) 第1周—第3周 搜集资料,撰写开题报告;
(2) 第4周—第5周 论文开题;
(3) 第6周—第12周 撰写论文初稿;
(4) 第13周—第15周 修改论文;
(5) 第16周 论文答辩。
4. 主要参考文献
[1] 黄天芸,基于人工智能深度学习的语音识别方法[J].湖北工业大学, 2017.
[2] 张仕良, 基于深度神经网络的语音识别模型研究[D].中国科学技术大学, 2017.
[3] Y Miao, M Gowayyed, F Metze.EESEN: End-to-end speech recognition using deep RNN models and WFST-based decoding. Automatic Speech Recognition amp; Understanding, 2015,167-174.
[4] A Graves,N Jaitly.Towards end-to-end speech recognition with recurrent neural networks.International Conference on Machine Learning,2014,1764-1772.