首页 理论教育 双耳线索的统计分布特性分析

双耳线索的统计分布特性分析

时间:2023-06-18 理论教育 版权反馈
【摘要】:各个窗函数的特性如表2-2所示。对声道间时间差ITD参数来说,时域和FFT域下的统计分布特性差异较大。

双耳线索的统计分布特性分析

在空间音频编码中,我们期望利用双耳线索的频带感知特性,准确提取表征声场空间信息的空间参数。这里的“准确表征”包含两个层面:一是从音频信号中提取可表征声场信息的空间参数;二是尽可能去除冗余的空间参数信息。

在2.2.2小节中,我们给出了可定量分析双耳参数JND频率依赖特性曲线,并分析了可能存在的冗余量。但是至此,我们仅能够明确的是,提取的空间参数在某频率某数值范围内是否可被人耳感知。然而,这样的信息仍然是需要让解码端知道,即它至少也要有相关的信息表示位,此时仍然无法达到降低码率提升编码效率的目的。如何最大限度地去除冗余的空间参数信息,降低空间参数码率,提升编码效率,这才是在空间音频编码的目标。

因此,本小节开展对双耳线索统计分布特性的研究,获得在实际立体声信号中可被感知的空间信息的概率,结合JND曲线,最终在空间音频编码中指导空间参数的编码,提升编码效率。

1.统计样本选取和滤波器选择

本小节实验选择了30段典型的立体声音乐片段,包含中国民乐、西洋乐器、自然界声音、流行歌曲及伴奏等音乐素材。各素材均选自国家标准主观听音评价节目源光盘GSBM61001-89、国内音响大展常用的演示曲目、惠威试音碟以及雨果发烧碟(一)及(二)等高品质光盘。我们将这些测试序列分成12类,有关音频序列的相关信息列在表2-1中。为简化起见,本项实验使用的测试序列长度均为10s,采样率为48kHz。

本项研究在进行巴克频带划分时,使用IIR数字滤波器,理由如下:

(1)低阶的IIR滤波器通常比相同性能的FIR滤波器阶数小得多,也就是在考虑相同的滤波器阶数时,IIR比FIR要陡峭得多;

表2-1 典型立体声序列样本信息

(2)IIR滤波器比FIR滤波器系数少,可减少系统运行时间;

(3)IIR滤波器可利用标准的古典滤波器设计,如巴特沃兹(Butterworth)滤波器、切比雪夫(3)(Chebyshev)Ⅰ型滤波器、切比雪夫(Chebyshev)Ⅱ型滤波器、椭圆(Elliptic)滤波器等,设计起来比较简单。

接下来考虑选择合适的窗函数。各个窗函数的特性如表2-2所示。

表2-2 滤波器性能比较表

考虑到巴克带划分较窄,相对于通带相位响应最佳的Butterworth窗来说,还是应该优先选择阻带衰减快的窗函数。值得一提的是,当阶数增大时,由于频带太窄而造成的低频段的窗函数完全变形,不能使用。经过实际测试,选择3阶的ChebyshevⅠ窗,可以较好地完成频带划分。(www.xing528.com)

2.实验结果与分析

图2-10、图2-11和图2-12分别是双耳线索ILD、ITD和IC的统计分布图,图中水平X轴是双耳线索的参数值,纵深Y轴是巴克频带,竖直Z轴是统计的数量。

图2-10 ILD统计分布特性

(1)对声道间强度差ILD参数来说,时域和FFT域下的统计分布特性基本一致,即ILD参数的分布特性受参数提取域的影响较小。

(2)对声道间时间差ITD参数来说,时域和FFT域下的统计分布特性差异较大。时域下数值集中,变换域下数值变化较大。

图2-11 ITD统计分布特性

图2-12 IC统计分布特性

(3)对声道间相关度IC参数来说,时域和FFT域下的统计分布有一定的差异。低频段一致性较好,而中高频带差异相对较大,但整体变化趋势保持一致。

(4)对ILD和ITD参数来说,在0值附近概率最高,并随着频率增大峰值越大。

(5)对IC参数来说,低频时单调上升在1附近概率最大,高频部分出现两个概率最大值点。

从以上分析可以看出,不同域下的参数分布特性差异不大,可以使用时域的分布特性代表本实验系统最终期望获得的立体声空间参数的统计分布特性。因此,我们的研究中拟定采用时域分布特性与恰可感知JND特性联合的方法,指导参数集选取、量化和熵编码,最终实现参数编码效率的提升。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈