基于RT-Thread与ARM平台语音识别系统研究文献综述
2020-05-05 16:49:13
1.研究背景意义 语音是语言的载体,是人类与外界最有效、最方便的一种交流方式,随着科学技术的飞速发展,电子技术、自动化技术、计算机技术等的日趋成熟,人们已近进入到了一个”智能 pc 时代”,越来越多的智能电子设备开始进入人们的生活,而人们需要更加便捷准确稳定的方式去控制这些设备,因而语音控制则显然成为当代最有潜质的控制方式之一[1]。
人类信息技术的不断进步,使语音识别技术成为人机接口中非常重要的部分。
采用语音识别作为人机交换技术具有快捷、实用等显著优点[2]。
语音识别技术的大致发展方向主要可分为两个,一个是大词汇量连续语音识别系统,主要应用于计算化终端的听写输入和基于网络服务器的电话和互联网的语音查询功能等;另一个则是更为灵活地基于一些移动平台的语音交互系统。
有一些专口的硬件设备作为载体,嵌入相应的语音识别算法,实现人机交互的小型化和便携化发展[3]。
当前主流的语音识别技术多基于统计模式,模型训练过程中算法复杂、运算量大,需要PC或工控机实现,在一定程度上制约了语音识别技术的发展;而嵌入式语音识别系统和PC机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域,因此嵌入式语音识别系统逐渐成为了研究的热点[4]。
2.语音识别技术 语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
最早的基于电子计算机的语音识别系统是由贝尔实验室开发的 Audrey 语音识别系统,它能够识别10 个英文数字。
其识别方法是跟踪语音中的共振峰[5]。
语音识别技术的最重大突破是隐马尔科夫模型Hidden Markov Model 的应用[6]。