噪声广泛存在于现实生活中,所以在对噪声比较敏感的场合下,经常要求对噪声进行分离,由于需要噪声分离的场合对噪声的算法需求及程度的不同,实现噪声抑制的方法也有所区别,下面为大家介绍数字音频处理器在会议系统、法院系统、录播系统、教育系统等应用场景中常见的两种降噪算法:ANS(噪声抑制)&AI CASA(智能语音分离)。
ANS(噪声抑制)
经验让我们总结出了可以针对大多数噪声的特异点,那就是“持续且稳态”;ANS又称自适应噪声抑制算法(Adaptive Noise Suppression),它是以噪声规律为灵感,采集外界的声波信号进滤波器,根据这一逻辑判断其是否是噪声波。然而这种区别人声、噪声的方法相对简单,虽可满足大部分要求不高的场景,但无法做到不影响人声、音乐等一些所需音源;和噪声重合的部分会被压制,较稳态的音乐会被误认为噪声。
同时,这种算法只会对满足逻辑判断条件的音频进行处理,也就是说不满足条件的,都将被认定为有效音频直接通过:
事实上,并不是所有短促无规律的声音都是有效音源,如:金属碰撞声,吃东西,敲键盘、翻书声等。当出现此类噪声时,因其未满足相应条件,所以并不会对此类噪声产生积极的处理,这就导致我们在使用一些降噪设备时,会出现某些噪声无法压制的情况,从而大大影响终端用户的工作及生活体验。这时,AI CASA(智能语音分离)成了更好的选择。
AI CASA(语音分离)
NO“ANS”,IS“CASA”
AI CASA是一种基于宽度学习的声源分离技术。简单来说将CASA声源分离理论借助宽度学习工具与数字音频处理器有机结合,从而实现智能去除非人声信号。
这种算法多用于噪声源多样、声场情况复杂、对声音要求较高的场景(如精品录播课堂,讨论型会议室等),对各类噪声都能做到有效压制且最大程度保障人声的饱满和高还原度。
AI CASA(智能语音分离)特点
CASA声源分离:让计算机模仿人类对听觉信号的处理过程进行建模,从而具备和人类一样从复杂混合声源中感知声音、处理声音、解释声音的能力;
10万+小时宽度学习:将有效音源及噪声样本进行学习的同时能对周围声场环境进行分析,使其对音频的识别能力大大提升,从而最大程度上保证“人声分离”,实现智能去除非人声信号。
总结及使用场景
参考了以上两种算法的介绍,我们不难得出:AI CASA在对噪声的处理上明显优于ANS。ANS降噪能满足大多数的场景,但降噪能力有限,无法对人声和噪声进行精准区分;AI CASA可智能去除非人声信号,提升语音清晰度,同时声音还原度高、延时低。在一些声场环境复杂、噪声源较多且收听质量要求高的场所可以给予现场用户更好的体验。
|