环境声事件检测领域还存在很多问题,往往导致在实际场景中的应用不尽如人意。具体问题总结如下: 1、流行声学特征+机器学习环境声事件识别方法在实际场景中表现不佳,信噪比低。例如,在高信噪比下,目标声音事件的召回率高,但准确率低(背景噪声容易识别为目标声音事件)。 );在较低的信噪比下,识别效果普遍较差。 2、语音识别领域缺乏端点检测技术来降低背景噪声对识别的影响。 3. 缺乏大量的环境声数据集来支持环境声事件识别领域的研究。 4、环境声降噪技术研究不足。 在这里,希望通过前辈们的知识积累和后辈们的不断研究,尽快克服困难。
在声源定位过程中,计算出阵列的波束方向图后,一般有两个步骤: 1)找到波束峰——即寻找主瓣的峰,因为主瓣此时的峰(最高的小山)对应的空间角度就是声源的方向,而方向可以获得声源的信息。 2)空间位置映射——计算出声源方向后,可以根据阵列的已知位置信息进行空间映射,计算出声源的相位。正确的位置。 可以看出,整个声源定位的核心步骤是前两步,因为主瓣对应的空间角度的精度直接决定了声源定位系统的精度。前面我们说过,主瓣宽度越窄,相对旁瓣越高,定位精度越高,抗干扰能力越强。 基于这个原因,我们常见的声源定位系统一般选择大孔径的均匀阵列,这是提高声源定位系统精度的最简单粗暴的方法,因为合成波束的主瓣也很高。和狭窄。因此,在常见的声源定位系统中,主瓣宽度(3dB宽度)常被用作一个非常重要的系统指标。
噪声源识别方法大致可分为两类: 第一类是常规声学测量分析方法,包括分离作业法、分离覆盖法、近场测量法、地表速度测量法等。 第二类是声信号处理方法,它是在现代信号分析理论的基础上发展起来的,如声强法、面强法、谱分析、倒谱分析、互相关和互谱分析、相干分析等。到这一类方法。 在不同的研究阶段,可以根据声源的复杂程度和研究工作的需要,选择不同的识别方法或多种方法组合使用。