说起声音检测技术,首先我们需要把它与语音识别和声纹识别区分开来。 从声音特性来看,声音可以分为三类:语音、音乐和环境声。目前主流的语音识别和声纹识别技术都是针对语音信号处理的,技术发展比较成熟。下面提到的声音检测技术主要是针对环境声。 音频信号信息丰富,在很多视觉、触觉和嗅觉不适应的场合都具有独特的优势。声音信号通常被认为与振动信号有较大的相关性,但声音信号是非接触式的,避免了振动信号数据采集的困难。基于通用音频/环境声的CA技术属于AI在音频领域的分支,直接面向社会经济生活的方方面面,在医疗卫生、制造、交通、安防、仓储、农林牧、渔业、水利、环境和公共设施管理、建筑、采矿、日常生活、身份识别、军事等数十个领域,是一项非常实用的技术。 目前,该领域在国内外已开始发展,但在许多研究和应用领域仍接近空白,具有无限广阔的发展前景。
声音检测技术应用领域——安防 安全防护常采用智能监控方式,根据位置可分为公共场所监控和私人场所监控两种。公共场所包括:公园、车站、广场、商场、街道、学校、电影院、影剧院等,经常拥挤的场所,有效的安防智能监控维护社会治安是最重要的应用。 目前,公共场所的监控系统主要以视频为主,但视线受阻时存在盲区,容易受到光线、恶劣天气等因素的影响。异常事件通常伴随着异常声音的发生。异常声音本身可以有效反映重大事故和危急情况的发生,具有复杂度低、易于获取、不受空间限制等优点。 公共场所和私人场所的音频监控技术框架是一样的,区别在于可能出现的异常声音的种类。异响是指开门、关门、电话铃声、脚步声、谈话、音乐、车辆行驶等除正常声音之外的特殊情况下发出的声音。 研究较多的公共场所的异常声音类型包括枪声、爆炸声、玻璃破碎声和乱扔垃圾声。 在私人场合研究较多的异常声音类型通常是关门声、奔跑声、玻璃破碎声、人类尖叫声、婴儿或儿童哭声、老人摔倒声、求救声、漏水声等。注意这种划分不是绝对的,只是根据发生概率的粗略分类,有时会交叉。
噪声源识别方法大致可分为两类: 第一类是常规声学测量分析方法,包括分离作业法、分离覆盖法、近场测量法、地表速度测量法等。 第二类是声信号处理方法,它是在现代信号分析理论的基础上发展起来的,如声强法、面强法、谱分析、倒谱分析、互相关和互谱分析、相干分析等。到这一类方法。 在不同的研究阶段,可以根据声源的复杂程度和研究工作的需要,选择不同的识别方法或多种方法组合使用。