基于LD3320的LED灯语音控制系统设计文献综述
2020-04-14 22:12:32
1.1研究意义
随着人们对智能化生活的追求,语音控制作为一种方便快捷甚至富有情感的控制方式成为当今时代信息产业的一个重要发展方面。包括人机交互以及其他日常生活领域。语音控制的关键之一在语音识别技术的发展。本次项目主要是利用语音识别芯片设计LED灯的语音控制系统,使得可以用人说话来实现灯的开关及亮度调节等功能。不需要一定用手来控制,方便了人们的生活,尤其对于老人、小孩以及残疾人来说,会是很大的便利。
1.2国内外研究现状
对语音识别的研究,目前国内外整体处于较先进的水平。相较于语音信号处理起步较晚。其研究领域划分主要包括:按词汇规模可分为大、中、小三种词汇量语音识别,按语音时间长短可分为孤立词语音识别和连续语音识别,按说话人不同可分为特定人和非特定人语音识别。
语音识别过程主要包括两个阶段:训练阶段和识别阶段闭。不管是训练还是识别,都必须对输入语音进行预处理和特征提取。训练阶段所做的具体工作是通过用户输入若干次训练语音,经过预处理和特征提取后得到特征参数,最后通过特征参数建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出,从而达到了语音识 别的目的。
语音识别算法中比较常用的有:
(1)动态时间规整(DTW)
动态时间规整属于较为典型的优化问题,它的过程是通过一条有一定条件约束的时间规整函数刻画实验模板和样本模板的时间对应关系,最后求解两者匹配累计最小距离所对应的规整函数。
(2)矢量量化方法(VQ)
矢量量化是一种编码压缩的算法,在图像和语音识别中应用十分广泛。它不仅为量化器编码器提供相关编码方法,还可以对识别及模式匹配做优化。可以把输入数据进行分类,以组为单元进行量化编码。