基于神经网络的麦克风阵列DOA估计算法开题报告
2022-01-06 22:04:43
全文总字数:5134字
1. 研究目的与意义及国内外研究现状
语音信号易于传递信息,尽管信息传递方式种类繁多,包括早期的烽火台燃烟报告敌情、驿站快马加鞭传递军令,比如qq、e-mail等,仍然改变不了语音通信在人类社会发展过程中至关重要的地位。朋友之间的嘘寒问暖,脍炙人口的乡间小调,私塾老师的传道授业解惑,无不涉及语音。语言能力作为人类特有的功能,以声音作为表达工具,以空气作为传播途径,人类的喜悦、愤怒、悲哀、伤心都可借此表达,甚至声音的响度、音调、音色都在传递着信息。语音信号发展至今,仅仅近距离的实时交流己经远远不能满足人们的日常生活需求,但是远程的语音通信却通常受制于环境噪声等因素,处理性能下降,达不到人们的期望。因此,对语音信号处理的研究迫在眉睫。语音信号处理固然是一门综合学科,信号处理、声学、数学、计算机学甚至生理学等都有所涉及。核心工作如下在于接收和处理携带语音信号特征的语音参数,但是复杂的语音环境使得其中困难重重,即使是经过这么多年来无数学者的努力,仍有巨大的改进空间。得益于先进的阵列处理技术以及计算机处理能力的飞速发展,由多个麦克风构成的麦克风阵列被用于通信和语音识别。单个麦克风接收到太多的噪声和混响,限制了单信道噪声抑制算法的性能。而麦克风阵列使接收到的信号变成一个信号,可以将其看成一个麦克风接收到的信号,只是这个信号拥有更高的方向性。这意味着减少了接收到的噪声和混响,麦克风阵列接收到的信号实现了降噪和减少了混响对其的影响,噪声抑制算法表现更加良好。国内外研究现状
上世纪八十年代,麦克风阵列技术被尝试应用于语音信号等数字信号处理领域。随后,人们提高了对语音数字信号质量的要求,越来越多的国家也开始跟进,投入对这方面的研究当中,成为科研领域一大热点。九十年代至今,基于麦克风阵列的语音处理算法进展火热。尤其是近年来,麦克风阵列技术在理论研究方面掀起了一个新的高潮,各种新的理论和新的算法不断涌出。同时,麦克风阵列技术也早已广泛应用于语音交互和语音通话等系统。我国学者对其研究起步比较晚,但是经过多年来的共同努力,也已取得了长足的进步。
谱空间[1]估计技术促进了子空间技术的声源定位算法的发展,其代表空间范围内各个方向上的能量分布,信号的波达方向即是能量最大处。理论来说,考虑到时域非线性谱估计和空域谱估计两者同为基本非线性参数问题这一相通之处,许多学者致力于研究高分辨谱估计方法,即用时域非线性谱估计的方法放到空域谱估计中。但两者依然不能一概而论,原因在于非线性估计方法是信号源在空间的连续分布,信号是为空间平稳的随机过程,显然这种假设有其局限性。schmidt等人于1979年左右提出的多重信号分类(music)算法可以算得上是子空间类算法的里程碑了。该算法的提出正式确立了music类算法的核心思想:通过特征分解、奇异值分解构造出信号子空间和与之正交的噪声子空间,两者再于空间谱能量最大处构造出谱峰,由此获取信号doa,极大提高了算法分辨精度。
来波信号到达角估计问题一直以来是一个热点问题,无论是在无源定位、声纳测向、地震资源探测以及移动信号通信等诸多研究领域,该问题都广泛为人关注。在过去的几十年中,一些高性能并且有高分辨率的算法实现了该领域的重大突破,如music算法、esprit算法等。尽管它们在一定程度上提供了合理有效的估计,但是这种子空间估计算法仍然需要进行大量的计算,不仅会消耗大量的时间,而且不能达到实时性的要求。
2. 研究的基本内容
本文主要对采用神经网络实现doa估计问题进行研究与探讨。首先分析了研究背景和国内外研究现状,然后建立了麦克风阵列模型应用于研究。在此基础上,比较了粒子群算法和bp算法,建立了pso-bp神经网络算法,即运用pso算法来优化bp神经网络的权阈值,然后再使用bp算法对神经网络进行一定的规范训练,从而能够寻找理想的全局最小值。接着分别对于窄带信号和宽带信号采用pso-bp神经网络算法分析,并进行仿真实验,从而验证结论。
第一章:绪论。首先说明麦克风阵列技术和doa估计方法的研究背景、意义和研究现状,并通过对大量文献的归纳总结,确定了本文的研究思路。
第二章:详细分析了麦克风阵列模型。对于麦克风近场模型进行阵列分析,这是展开本文工作的基础。
3. 实施方案、进度安排及预期效果
实施方案:(1)提出了一种基于pso-bp模型的doa估计方法。不仅由于pso- bp神经网络的输入仅取协方差矩阵的第一行,神经网络的输入特征维数大大减少;而且因为pso- bp神经网络所需隐层神经元个数大大少于rbf神经网络,复杂度大大降低。
(2)对于宽带信号的doa估计,采用相位变换加权广义互相关方法(gcc-phat)计算信号到达个阵元的时间差,作为pso-bp神经网络的输入,该doa估计方法能够大大减少运算量。
(3)对于各个算法进行了仿真比对和分析。在多次仿真比对中,验证了算法的可行性与优越性。
4. 参考文献
[1] 居太亮, 彭启琮, 邵怀宗,等. 基于任意麦克风阵列的声源二维doa估计算法研究[j]. 通信学报, 2005, 26(8):129-133.
[2] 崔玮玮. 基于麦克风阵列的声源定位与语音增强方法研究[d]. 清华大学, 2009.
王君培. 基于麦克风阵列的近场声源定位与跟踪[d]. 西南交通大学, 2014.