说起声音检测技术,首先我们需要把它与语音识别和声纹识别区分开来。 从声音特性来看,声音可以分为三类:语音、音乐和环境声。目前主流的语音识别和声纹识别技术都是针对语音信号处理的,技术发展比较成熟。下面提到的声音检测技术主要是针对环境声。 音频信号信息丰富,在很多视觉、触觉和嗅觉不适应的场合都具有独特的优势。声音信号通常被认为与振动信号有较大的相关性,但声音信号是非接触式的,避免了振动信号数据采集的困难。基于通用音频/环境声的CA技术属于AI在音频领域的分支,直接面向社会经济生活的方方面面,在医疗卫生、制造、交通、安防、仓储、农林牧、渔业、水利、环境和公共设施管理、建筑、采矿、日常生活、身份识别、军事等数十个领域,是一项非常实用的技术。 目前,该领域在国内外已开始发展,但在许多研究和应用领域仍接近空白,具有无限广阔的发展前景。
在声源定位过程中,计算出阵列的波束方向图后,一般有两个步骤: 1)找到波束峰——即寻找主瓣的峰,因为主瓣此时的峰(最高的小山)对应的空间角度就是声源的方向,而方向可以获得声源的信息。 2)空间位置映射——计算出声源方向后,可以根据阵列的已知位置信息进行空间映射,计算出声源的相位。正确的位置。 可以看出,整个声源定位的核心步骤是前两步,因为主瓣对应的空间角度的精度直接决定了声源定位系统的精度。前面我们说过,主瓣宽度越窄,相对旁瓣越高,定位精度越高,抗干扰能力越强。 基于这个原因,我们常见的声源定位系统一般选择大孔径的均匀阵列,这是提高声源定位系统精度的最简单粗暴的方法,因为合成波束的主瓣也很高。和狭窄。因此,在常见的声源定位系统中,主瓣宽度(3dB宽度)常被用作一个非常重要的系统指标。
噪声源识别方法大致可分为两类: 第一类是常规声学测量分析方法,包括分离作业法、分离覆盖法、近场测量法、地表速度测量法等。 第二类是声信号处理方法,它是在现代信号分析理论的基础上发展起来的,如声强法、面强法、谱分析、倒谱分析、互相关和互谱分析、相干分析等。到这一类方法。 在不同的研究阶段,可以根据声源的复杂程度和研究工作的需要,选择不同的识别方法或多种方法组合使用。