音频监控作为安防行业近年来迅速发展的一个分支,目前已展现出前所未有的勃勃生机,人们把关注的目光开始从能够看见和听见的需求转向寻求高清的音视频监控。本文将对音频监控的现状和未来做一个初步探讨。
音频监控的核心部件是拾音器。对于音视频一体化监控来说,摄像机是眼睛,拾音器是耳朵。眼睛看到的图像和耳朵听到的声音通过电缆、光纤、网络等神经系统传输到作为大脑的硬盘录像机保存就构成一个基本的影音记录系统。传统的监控系统大都没有声音,就像早年的无声电影,人们只能看到无声的图像。现在很多的监控系统已经要求集成音频,例如检察院审讯同步录音录像系统、公安局预审系统、看守所监狱监管系统等,也有天安门广场、最高法院、国家信访局等重要国家机关,还有北京地铁、首都机场等公共交通枢纽。
过去——需求少、技术低
有人提出疑问,有声电影电视都普及这么几十年了,监控系统为什么长期以来不全部提供声音呢?这里可能有以下几个原因。
一是作为监控系统,大家最希望的是眼见为实,能亲眼看到“小偷进进出出的作案过程”就满足了,认为加上声音没有必要。
二是音频监控可能会涉及到个人的隐私问题,比如私下谈论的某些敏感东西如果“不小心”被记录下来,而监控资料保管不当就造成了隐私泄露。公共场合的视频监控,国家有相关的法律和安装规范,实施有法律保障。音频监控行为虽然与视频监控相比没有什么本质区别,但没有明文规定的东西,难免大家有些疑问。
三是长期以来音频监控技术发展缓慢,噪声处理难度大。人声和噪声经过放大后很容易混淆在一起,就算是装上拾音器听到的也是噪声,音频监控没有达到其目的和意义。拾音器降噪需要解决两方面的问题,一是减少来自电路自身的噪音,二是降低来自环境噪声的干扰。电路自身的噪声比较容易解决,环境噪声问题更为复杂而难于解决。低水平的环境噪声可以通过噪声的自动监测并进行反馈抑制,这个技术能抑制部分环境噪声。但在公路等强噪声环境下,要达到更高要求还必须进一步采用DSP噪声抑制手段。目前最先进的语音降噪算法也只能在保证少失真的情况下降噪20dB左右。
四是远距离音频监控难度大。从声音在空气中传播的物理原理我们得知,一般人说话的声音强度大都在50分贝,传播的距离在30米左右。而繁忙公路上的噪声基本上在60分贝,说话的声音很容易被“淹没”,这就是为什么大家在噪声环境中嗓门会越来越大,这样对方才能听清。然而,人的说话声传播到100米外的声音能量已经趋于0,无论如何放大也是无济于事,加上环境噪声混合在一起,语音的处理难上加难。激光拾音器可以解决听到远距离声音的问题,但成本极高、音质差、指向性强,无法在音频监控领域大面积推广,只能在刑侦领域使用。
五是好的拾音器价格高昂。麦克风咪头作为拾音器关键部件,其性能直接影响到声音的品质。差的咪头成本几毛钱,好的咪头价格上万。要想获得较好的音质就必须采用档次高的咪头,而其成本就占了拾音器总成本的一半以上。加上后端噪声处理的高成本DSP芯片,因此高端拾音器价格一直居高不下。这就是为什么卡拉OK麦克风几百元,而CCTV的播音员为什么要用价格上万的麦克风。 |