基于Android的简易语音分类系统设计文献综述

2020-04-15 16:51:20

1．目的及意义

1．目的及意义

1.1主要研究内容和意义

随着机器学习和人工智能的普及以及传播，不但在国际上语音行业涌现出了许多新型产业，并且多处用到了手机的智能运行上。尤其是最近几年，不仅出现了很多国内外的小公司，并且巨头们也开始加速对语音识别行业的布局，加快对手机语音智能化。未来的语音识别市场，预计将会有越来越多的公司参与到手机上的语音识别。手机如果要求能识别不同的语音，当然就不能重复以往的语音对话规则，必然就要考虑到用户说话的环境、周围环境的噪音、用户发音不准或者方言等等诸多因素。所以进行对语音分类系统的构造要求也就越来越高，设计一种高效，准确，迅速的识别系统将极大程度扩大语音的识别能力。

基于Android语音分类系统的设计，将会对以后建立在语音市场的地位有着极大的帮助。

1.2国内外研究现状综述

1.2.1国外研究现状

传统语音识别行业贵族Nuance逐渐没落，但Nuance依旧是全球最大的语音技术公司，掌握着全球最多的语音技术专利。

苹果收购Siri、Novauris Technologies、VocallQ和Emotient

苹果的Siri已经是鼎鼎大名了，也算世界上语音识别的执牛耳者。Novauris有一种可识别整个短语的语音识别技术，这种技术并非简单识别单个词句，而是试图利用超过2.45亿个短语的识别辅助理解上下文。VocallQ可以将语音处理和机器学习技术整合到可穿戴设备。而Emotient开发的情绪引擎可读取人们的面部表情并且预测其情绪状态。

谷歌收购SayNow，Phonetic Arts，Wavii，SR Tech Group

Phonetic Arts可以把录制的语音对话转化成语音库，然后把这些声音结合到一起，从而生成听上去非常逼真的人声对话。Wavii擅长“自然语言处理”技术，可以通过扫描互联网发现新闻，并直接给出一句话摘要及链接。Google Glass使用了语音控制技术，在Android上也整合了语音识别技术等等，Google Now更是拥有了完整的语音识别引擎。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码