说起声音检测技术,首先我们需要把它与语音识别和声纹识别区分开来。 从声音特性来看,声音可以分为三类:语音、音乐和环境声。目前主流的语音识别和声纹识别技术都是针对语音信号处理的,技术发展比较成熟。下面提到的声音检测技术主要是针对环境声。 音频信号信息丰富,在很多视觉、触觉和嗅觉不适应的场合都具有独特的优势。声音信号通常被认为与振动信号有较大的相关性,但声音信号是非接触式的,避免了振动信号数据采集的困难。基于通用音频/环境声的CA技术属于AI在音频领域的分支,直接面向社会经济生活的方方面面,在医疗卫生、制造、交通、安防、仓储、农林牧、渔业、水利、环境和公共设施管理、建筑、采矿、日常生活、身份识别、军事等数十个领域,是一项非常实用的技术。 目前,该领域在国内外已开始发展,但在许多研究和应用领域仍接近空白,具有无限广阔的发展前景。
环境声事件检测领域还存在很多问题,往往导致在实际场景中的应用不尽如人意。具体问题总结如下: 1、流行声学特征+机器学习环境声事件识别方法在实际场景中表现不佳,信噪比低。例如,在高信噪比下,目标声音事件的召回率高,但准确率低(背景噪声容易识别为目标声音事件)。 );在较低的信噪比下,识别效果普遍较差。 2、语音识别领域缺乏端点检测技术来降低背景噪声对识别的影响。 3. 缺乏大量的环境声数据集来支持环境声事件识别领域的研究。 4、环境声降噪技术研究不足。 在这里,希望通过前辈们的知识积累和后辈们的不断研究,尽快克服困难。
噪声源识别方法大致可分为两类: 第一类是常规声学测量分析方法,包括分离作业法、分离覆盖法、近场测量法、地表速度测量法等。 第二类是声信号处理方法,它是在现代信号分析理论的基础上发展起来的,如声强法、面强法、谱分析、倒谱分析、互相关和互谱分析、相干分析等。到这一类方法。 在不同的研究阶段,可以根据声源的复杂程度和研究工作的需要,选择不同的识别方法或多种方法组合使用。