麦克风阵列语音波束形成算法研究与实现文献综述
2020-04-23 19:38:55
麦克风阵列是一种广泛应用于语音识别、无线通信和医学诊断等领域的一种传感器阵列信号处理系统。随着信息化时代的到来,信息传输带宽更高,为了适应当代人高质量的生活需求以及高效率的信息交流,语音信号研究得到迅速发展,语音消费市场日渐火热。麦克风阵列由于其能够解决近距离场景下语音识别的问题,以保证真实场景下的语音识别率,成为了当前研究的热点。麦克风阵列信号处理作为阵列信号的沿用和发展,其核心技术之一便是波束形成的应用。波束形成的实质是对麦克风阵列各阵元接收到的信号进行空间域滤波,从而实现输出阵列的空间指向性,增强期望信号,抑制噪声和干扰。
音频的发展从单声道到双声道再到立体声,如今还有环绕声。在播放音频方面,随着现在电脑、智能手机以及其它一些相关的智能设备的普及使用,音频的发展取得了令人瞩目的成就。随着VR的流行,听觉信息由于其对VR体验的重要性,必定会进一步受到重视,得到更进一步的发展。日常生活中,我们经常会使用电子设备来存储并传达我们的声音,但通常只是使用单一的麦克风对我们的音频信号进行收录,也因此收录了太多的噪声。基于麦克风语音阵列的波束形成算法,它能够实现增强目标信号,抑制噪声信号,能够实现高质量的音频采集。这一技术在通信、多媒体演讲、教育研究、娱乐等领域具有巨大潜在价值。
国内外研究现状:自1959年VanAtta提出自适应阵列信号处理理论开始,波束形成技术取得了巨大的发展。1972年,Frost最早提出了基于最小功率的线性约束自适应波束形成方法,并开始利用这个原理解决了传声器阵列接收的语音信号处理。随着越来越多的波束形成算法的提出与发展,相关文献逐渐变得增多,Godara对大量的自适应波束形成算法进行了总结;Petrus也在自己的学位论文中对各种算法进行了分类概括。其中盲算法主要包括最大比值合并法(MRC)、盲序列估计法(BSE)、恒模算法(CMA)等;非盲算法主要包括SMI、RLS、LMS、Kalman滤波等算法。麦克风语音阵列系统已经广泛应用于声纳、医学和航空航天、人工智能等诸多领域,目前在我国人工智能语音交互平台上,已经通过麦克风阵列对声音信号进行处理,实现了噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪等功能,进而提高语音信号处理质量,解决远距离拾音痛点。
{title}2. 研究的基本内容与方案
{title}设计的基本内容:
麦克风阵列是将多个麦克风按一定的阵列形状布置的传感器阵列,它在语音信号处理中有着极为广泛的应用。对麦克风阵列采集的多通道语音信号进行处理,可以实现语音的降噪、增强、音源定位与跟踪等。而这些功能的实现均依赖于麦克风阵列语音波束形成,即通过对各通道语音信号的加权处理,增强和衰减特定的一个或多个方向的语音信号,以形成期望的波束指向。本论文拟从麦克风阵列中获取的多通道信号出发,实现语音波束形成算法,绘制语音波束方向图。
设计的目标:
1.实现麦克风语音阵列的安装与调试,获取多通道语音信号。
2. 实现麦克风阵列语音波束形成算法,并画出对应的语音波束方向图。
3. 在Matlab 或 Python GUI中展示算法的实现过程。
拟采用的方案及措施:
算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。故基于麦克风语音阵列的波束形成算法的研究可以分为输入信号的获取、信号的预处理、信号的特征提取、波束形成算法计算、输出信号特征比较,其中波束形成算法的合适程度会决定输出信号的优劣。