基于Android的简易语音分类系统设计文献综述
2020-04-15 16:51:20
1.目的及意义
1.1主要研究内容和意义
随着机器学习和人工智能的普及以及传播,不但在国际上语音行业涌现出了许多新型产业,并且多处用到了手机的智能运行上。尤其是最近几年,不仅出现了很多国内外的小公司,并且巨头们也开始加速对语音识别行业的布局,加快对手机语音智能化。未来的语音识别市场,预计将会有越来越多的公司参与到手机上的语音识别。手机如果要求能识别不同的语音,当然就不能重复以往的语音对话规则,必然就要考虑到用户说话的环境、周围环境的噪音、用户发音不准或者方言等等诸多因素。所以进行对语音分类系统的构造要求也就越来越高,设计一种高效,准确,迅速的识别系统将极大程度扩大语音的识别能力。
基于Android语音分类系统的设计,将会对以后建立在语音市场的地位有着极大的帮助。
1.2国内外研究现状综述
1.2.1国外研究现状
传统语音识别行业贵族Nuance逐渐没落,但Nuance依旧是全球最大的语音技术公司,掌握着全球最多的语音技术专利。
苹果收购Siri、Novauris Technologies、VocallQ和Emotient
苹果的Siri已经是鼎鼎大名了,也算世界上语音识别的执牛耳者。Novauris有一种可识别整个短语的语音识别技术,这种技术并非简单识别单个词句,而是试图利用超过2.45亿个短语的识别辅助理解上下文。VocallQ可以将语音处理和机器学习技术整合到可穿戴设备。而Emotient开发的情绪引擎可读取人们的面部表情并且预测其情绪状态。
谷歌收购SayNow,Phonetic Arts,Wavii,SR Tech Group
Phonetic Arts可以把录制的语音对话转化成语音库,然后把这些声音结合到一起,从而生成听上去非常逼真的人声对话。Wavii擅长“自然语言处理”技术,可以通过扫描互联网发现新闻,并直接给出一句话摘要及链接。Google Glass使用了语音控制技术,在Android上也整合了语音识别技术等等,Google Now更是拥有了完整的语音识别引擎。