WAV音频切分及原文匹配技术在数字出版中的研究与应用任务书
2020-04-05 10:44:36
1. 毕业设计(论文)主要内容:
目标简介:wav是微软公司(microsoft)开发的一种声音文件格式,用于保存windows平台的音频信息资源,被windows平台及其应用程序所广泛支持,该格式是最接近无损的音频格式。但在实际使用过程中往往需要把一整段音频信息切分或者按照相应的时间段播放,例如在英语听力过程中,需要将每一段对话分开播放;在有声读物播放过程中,需要将音频和文字匹配起来。虽然对于音频的处理技术已被广泛应用,但是在传统出版行业数字化转型中尚未合理的运用起来,此技术在现代数字出版行业中的研究与应用有着重要意义。本课题拟将基于音轨处理的音频切分技术与语音识别技术相结合,以实现该技术在传统出版行业数字化转型的充分应用。
设计内容:
2. 毕业设计(论文)主要任务及要求
1、 查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);
2、 认真填写周记,完成800字开题报告;
3、 完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
3. 毕业设计(论文)完成任务的计划与安排
1、2018/1/14—2018/3/5:确定选题,查阅文献,外文翻译和撰写开题报告;
2、2018/3/6—2018/4/30:系统架构、程序设计与开发、系统测试与完;
3、2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 主要参考文献
[1] hinton g,deng l,yu d,et al.deep neural networks for acousticmodeling in speech recognition[j].ieee signal processing magazine,2012,29(6):82-97.
[2] sainath t n,kingsbury b,mohamed a,et al.learning the speech front- end withraw waveform cldnns[c]//interspeech,dresden,germany,2015:1-5.
[3] hoshen y,weiss r j,wilson k w.speech acoustic modeling fromraw multichannel waveforms[c]//ieee international conference on acoustics,speech,and signal processing,brisbane,australia,2015:4624-4628.