2024年3月24日发(作者:乐流婉)
音质评价方法
在音箱评测常用术语解析中,我们曾简洁讨论了音频设备如声卡、音箱音质方面 的内容,在本文中,我们将深入
探讨一下音质的标准及音质评价方法.
音质标准
所谓声音的水平,是指经传输、处理后音频信号的保真度.目前,业界公认 的声音水平标准分为了4级:即数字
激光唱盘CD-DA水平,其信号带宽为了 10Hz~20kHz;调频播送FM水平,其信号带宽为了20Hz~15kHz;调幅播送
AM水平, 其信号带宽为了50Hz~7kHz;电话的话音水平,其信号带宽为了200Hz~3400Hz.可 见,数字激光唱盘的
声音水平最高,电话的话音水平最低.
除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音 质标准.
对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度 越高,音质也越好.如在通信科学中,声音
水平的等级除了用音频信号的频率范 围外,还用失真度、信噪比等指标来衡量.对数字音频来说,再现声音频率的成
分越多,误码率越小,音质越好.通常用数码率(或存储容量)来衡量,取样频率 越高、量化比特数越大,声道数越多,存
储容量越大,当然保真度就高,音质就 好.
声音的类别特点不同,音质要求也不一样.如,语音音质保真度主要表达在 活晰、不失真、再现平面声象;乐音
的保真度要求较高,营造空间声象主要表达 在用多声道模拟立体环绕声,或虚拟双声道 3D环绕声等方法,再现原来
声源的 一切声象.
寸频信号的用途不同,采用压缩的水平标准也不一样.如,电话水平叩频 信号采用ITU-TG 711标准,8kHz取
样,8bit量化,码率播送采用 ITU-TG 722标准,16kHz取样,14bit量化,码率224Kbps.高保真立体声音
频压 缩标准由ISO和ITU -T联合制订,CD11172-3MPEG音频标准为了48kHz、44.1kHz、 32kHz取样,每声道
数码率32Kbps~448Kbps,适合CD -DA光盘用.
对声音水平要求过高,那么设备复杂;反之,那么不能满足应用.一般以 够用, 乂不浪费〞为了原那么.
音质标准的区别
语音音质
评定语音编码水平的方法为了主观评定和客观评定.目前常用的是主观评定, 即以主观打分(MOS)来度量,它
分为了以下五级:5(优),不发觉失真;4(良),刚察 觉失真,但不讨厌;3(中),发觉失真,稍微讨厌;2(差),讨厌,
但不令人反感;1(劣), 极其讨厌,令人反感.一般再现语音频率假设达 7kHz以上,MOS可评5分.这种评 价标准广
泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子邮件、 语音信箱等.
乐音音质
乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响 器材的信号特性(如失真度、频
响、动态范围、信噪比、瞬态特性、立体声别离 度等)、声场特性(如直达声、前期反射声、混响声、两耳问互
相关系数、基准振 动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等.所以,对音响 设备再现音质
的评价难度较大.
评价再现声音的水平有主观评价和客观评价两种方法. 所谓客观评价,是指 使用仪器测试技术指标;而主观评
价那么是指由聆听者凭主观评价各种音效.
不过,由于乐音音质届性复杂,主观评价的个人色彩较浓,而现有的音响测 试技术乂只能从某些侧面反映其保真
度. 所以,迄今为了止,还没有一个能真正定 量反映乐音音质保真度的国际公认的评价标准. 但也有报道,国际电信联
盟(ITU- T)近期已批准一种客观评价音质的被称之为了电子耳的新型测量方法, 可对任何音 响器材的音质进行客
观听音评价,也可用于检测电话通讯语音编码系统的缺陷.
音质的主观评价
通常,据乐音音质听感三要素,即响度、音调和愉快感的改变和组合来主观 评价音质的各种届性,如低频响亮为
了声音饱满,高频响亮为了声音明亮,低频微弱 为了声音平滑,高频微弱为了声音活澄.下面结合声源、声场及信号特
性介绍几种典 型的听感.
① 立体感
主要由声音的空间感(环绕感)、定位感(方向感)、层次感(厚度感)等所构成的 听感,具有这些听感的声
音称为了立体声.自然界的各种声场本身都是富有立体感 的,它是模拟声源声象最重要的一个特征.德 波尔效应证明,
人耳的生理特点 是:人耳在两声源的对称轴上,当声压差 Ap=0dB和时间差△= 0msB寸,感觉两声 源声象相同,分不
出有两个声源;而当习>15dB或△tABms时,人耳就感觉到有两 个声源,声像往声压大或导前的声源移动,每5dB的
声压差相当于lms的时间差. 哈斯效应乂进一步证明,当4=5ms~35msM,人耳感到有两个声源;而当近次反 射声、
滞后直达声或两个声源的时间差 △t>50ms时,即使一次反射声(乂称近次或 前期反射声)或滞后声的响度比直达
声或导前声的响度大许多倍,声源方位仍由 直达声或导前声决定
.
根据人耳的这个生理特点,只要通过对声音的强度、延时、混响、空间效应 等进行适当控制和处理,在两耳人
为了的制造具有一定的时间差 △、相位差
声压差8的声波状态,并使这种状态和原声源在双耳处产生的声波状态完全相 同,人就能真实、完整地感受到重
现声音的立体感.与单声道声音相比,立体声 通常具有声象分散、各声部音量分布得当、活晰度高、背景噪声低的
特点.
② 定位感
假设声源是以左右、上下、前后不同方位录音后发送,那么接收重放的声音应能 将原声场中声源的方位重现出
来, 这就是定位感.根据人耳的生理特点,由同一 声源首先到达两耳的直达声的最大时间差为了 0.44ms~0.5m§同时
还有一定的声压 差、相位差.生理心理学证明:20Hz~200Hz低音主要靠人两耳的相位差定位, 300Hz~4kHz中
音主要靠声压差定位,更高的高音主要靠时间差定位.可见,定 位感主要由首先到达两耳的直达声决定,
而滞后到达两耳的一次反射声和经四面八方屡次反射的混响声主要模拟声 象的空间环绕感.
③ 空间感
一次反射声和屡次反射混响声虽然滞后直达声, 对声音方向感影响不大,但 反射声总是从四面八方到达两耳, 对
听觉判断周围空间大小有重要影响, 使人耳 有被环绕包围的感觉,这就是空间感.空间感比定位感更重要.
④ 层次感
声音高、中、低频频响均衡,高音谐音丰富,活澈纤细而不刺耳,中音明亮 突出,饱满充实而不生硬,低音厚实而无
鼻音.
⑤ 厚度感
低音沉稳有力,重厚而不浑浊,高音不缺,音量适中,有一定亮度,混响合 适,失真小.
除此之外,还有许多评价音质的听感,象力度感、亮度感、临场感、软硬感、 松紧感、宽窄感等.
音质的客观评价与测试
① 失真度
谐波失真,主要引起声音发硬、发炸;而稳态或瞬态互调失真主要引起声音 毛糙、尖硬和混浊.二者均使音质
劣化,假设失真度超过 3%时,音质劣化明显. 音响系统的音箱失真度最大,一般最小的失真度也要超过 1%.
相位失真?:主要引起1kHz以下的低频声音模糊,同时影响中频声音层次和 声象定位.
抖晃失真?:主要是电机转速不稳,主导轴-压带轮压力不稳,磁头拍打磁带 等造成磁带震动和卷带量改变,进而
使信号频率被调制,声音音调出现混浊、颔 抖.抖晃通常用音调改变的均方根值表示,通常,录音机的抖晃率 <0.1%,
Hi-Fi
录音机<0.005%,普通录像机<0.3%,视盘机<0.001%.
② 频响与瞬态响应
频响?:指音响设备的增益或灵敏度随信号频率改变的情况,用通频带宽度 和带内不均匀度表示(如优质功放
的频响1Hz~200kH片ldB).带宽越宽,高、低频 响应越好:不均匀度越小,频率均衡性能越好.通常,30Hz~150Hz
低频使声音有 一定厚度根底,150Hz~500Hz中低频使声音有一定力度,300Hz~500Hz中低频声 压过分增强时,声
音浑浊,过分衰减时,声音乏力 ;500Hz~5kHz中高频使声音有
一定明亮度,过分增强时,声音生硬;过分衰减时,声音散、飘;5kHz~10kHz高频 段使声音有一定层次、色彩;
过分增强时,声音尖刺;过分衰减时,声音暗淡、发 闷.按此规律,可根据各种听感,定量调节音响系统的频响效果.
瞬态响应?:是指音响系统对突变信号的跟随水平.实质上它反映脉冲信号 的高次谐波失真大小,严重时影响
音质的透明度和层次感.瞬态响应常用转换速 率V/叫表示,指标越高,谐波失真越小.如,一般放大器的转换速率
>10V/^s
③ 信噪比
信噪比,表示信号与噪声电平的分贝差,用 S/N或SNR(dB)表示.噪声频率 的上下,信号的强弱对人耳的影响不一
样.通常,人耳对4~8kHz的噪声最灵敏, 弱信号比强信号受噪声影响较突出. 而音响设备不同,信噪比要求也不一样,
如 Hi-Fi 音响要求 SNR>70dB , CD机要求 SNR>90dB.
④ 声道别离度和平衡度
声道别离度,是指不同声道问立体声的隔离程度,用一个声道的信号电平与 申入另一声道的信号电平差来表示.
这个差值越大越好.一般要求 Hi-Fi音响分
离度>50dB.声道平衡度,是指两个声道的增益、频响等特性的一致性.否那么, 将造成声道声象的偏移.
2024年3月24日发(作者:乐流婉)
音质评价方法
在音箱评测常用术语解析中,我们曾简洁讨论了音频设备如声卡、音箱音质方面 的内容,在本文中,我们将深入
探讨一下音质的标准及音质评价方法.
音质标准
所谓声音的水平,是指经传输、处理后音频信号的保真度.目前,业界公认 的声音水平标准分为了4级:即数字
激光唱盘CD-DA水平,其信号带宽为了 10Hz~20kHz;调频播送FM水平,其信号带宽为了20Hz~15kHz;调幅播送
AM水平, 其信号带宽为了50Hz~7kHz;电话的话音水平,其信号带宽为了200Hz~3400Hz.可 见,数字激光唱盘的
声音水平最高,电话的话音水平最低.
除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音 质标准.
对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度 越高,音质也越好.如在通信科学中,声音
水平的等级除了用音频信号的频率范 围外,还用失真度、信噪比等指标来衡量.对数字音频来说,再现声音频率的成
分越多,误码率越小,音质越好.通常用数码率(或存储容量)来衡量,取样频率 越高、量化比特数越大,声道数越多,存
储容量越大,当然保真度就高,音质就 好.
声音的类别特点不同,音质要求也不一样.如,语音音质保真度主要表达在 活晰、不失真、再现平面声象;乐音
的保真度要求较高,营造空间声象主要表达 在用多声道模拟立体环绕声,或虚拟双声道 3D环绕声等方法,再现原来
声源的 一切声象.
寸频信号的用途不同,采用压缩的水平标准也不一样.如,电话水平叩频 信号采用ITU-TG 711标准,8kHz取
样,8bit量化,码率播送采用 ITU-TG 722标准,16kHz取样,14bit量化,码率224Kbps.高保真立体声音
频压 缩标准由ISO和ITU -T联合制订,CD11172-3MPEG音频标准为了48kHz、44.1kHz、 32kHz取样,每声道
数码率32Kbps~448Kbps,适合CD -DA光盘用.
对声音水平要求过高,那么设备复杂;反之,那么不能满足应用.一般以 够用, 乂不浪费〞为了原那么.
音质标准的区别
语音音质
评定语音编码水平的方法为了主观评定和客观评定.目前常用的是主观评定, 即以主观打分(MOS)来度量,它
分为了以下五级:5(优),不发觉失真;4(良),刚察 觉失真,但不讨厌;3(中),发觉失真,稍微讨厌;2(差),讨厌,
但不令人反感;1(劣), 极其讨厌,令人反感.一般再现语音频率假设达 7kHz以上,MOS可评5分.这种评 价标准广
泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子邮件、 语音信箱等.
乐音音质
乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响 器材的信号特性(如失真度、频
响、动态范围、信噪比、瞬态特性、立体声别离 度等)、声场特性(如直达声、前期反射声、混响声、两耳问互
相关系数、基准振 动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等.所以,对音响 设备再现音质
的评价难度较大.
评价再现声音的水平有主观评价和客观评价两种方法. 所谓客观评价,是指 使用仪器测试技术指标;而主观评
价那么是指由聆听者凭主观评价各种音效.
不过,由于乐音音质届性复杂,主观评价的个人色彩较浓,而现有的音响测 试技术乂只能从某些侧面反映其保真
度. 所以,迄今为了止,还没有一个能真正定 量反映乐音音质保真度的国际公认的评价标准. 但也有报道,国际电信联
盟(ITU- T)近期已批准一种客观评价音质的被称之为了电子耳的新型测量方法, 可对任何音 响器材的音质进行客
观听音评价,也可用于检测电话通讯语音编码系统的缺陷.
音质的主观评价
通常,据乐音音质听感三要素,即响度、音调和愉快感的改变和组合来主观 评价音质的各种届性,如低频响亮为
了声音饱满,高频响亮为了声音明亮,低频微弱 为了声音平滑,高频微弱为了声音活澄.下面结合声源、声场及信号特
性介绍几种典 型的听感.
① 立体感
主要由声音的空间感(环绕感)、定位感(方向感)、层次感(厚度感)等所构成的 听感,具有这些听感的声
音称为了立体声.自然界的各种声场本身都是富有立体感 的,它是模拟声源声象最重要的一个特征.德 波尔效应证明,
人耳的生理特点 是:人耳在两声源的对称轴上,当声压差 Ap=0dB和时间差△= 0msB寸,感觉两声 源声象相同,分不
出有两个声源;而当习>15dB或△tABms时,人耳就感觉到有两 个声源,声像往声压大或导前的声源移动,每5dB的
声压差相当于lms的时间差. 哈斯效应乂进一步证明,当4=5ms~35msM,人耳感到有两个声源;而当近次反 射声、
滞后直达声或两个声源的时间差 △t>50ms时,即使一次反射声(乂称近次或 前期反射声)或滞后声的响度比直达
声或导前声的响度大许多倍,声源方位仍由 直达声或导前声决定
.
根据人耳的这个生理特点,只要通过对声音的强度、延时、混响、空间效应 等进行适当控制和处理,在两耳人
为了的制造具有一定的时间差 △、相位差
声压差8的声波状态,并使这种状态和原声源在双耳处产生的声波状态完全相 同,人就能真实、完整地感受到重
现声音的立体感.与单声道声音相比,立体声 通常具有声象分散、各声部音量分布得当、活晰度高、背景噪声低的
特点.
② 定位感
假设声源是以左右、上下、前后不同方位录音后发送,那么接收重放的声音应能 将原声场中声源的方位重现出
来, 这就是定位感.根据人耳的生理特点,由同一 声源首先到达两耳的直达声的最大时间差为了 0.44ms~0.5m§同时
还有一定的声压 差、相位差.生理心理学证明:20Hz~200Hz低音主要靠人两耳的相位差定位, 300Hz~4kHz中
音主要靠声压差定位,更高的高音主要靠时间差定位.可见,定 位感主要由首先到达两耳的直达声决定,
而滞后到达两耳的一次反射声和经四面八方屡次反射的混响声主要模拟声 象的空间环绕感.
③ 空间感
一次反射声和屡次反射混响声虽然滞后直达声, 对声音方向感影响不大,但 反射声总是从四面八方到达两耳, 对
听觉判断周围空间大小有重要影响, 使人耳 有被环绕包围的感觉,这就是空间感.空间感比定位感更重要.
④ 层次感
声音高、中、低频频响均衡,高音谐音丰富,活澈纤细而不刺耳,中音明亮 突出,饱满充实而不生硬,低音厚实而无
鼻音.
⑤ 厚度感
低音沉稳有力,重厚而不浑浊,高音不缺,音量适中,有一定亮度,混响合 适,失真小.
除此之外,还有许多评价音质的听感,象力度感、亮度感、临场感、软硬感、 松紧感、宽窄感等.
音质的客观评价与测试
① 失真度
谐波失真,主要引起声音发硬、发炸;而稳态或瞬态互调失真主要引起声音 毛糙、尖硬和混浊.二者均使音质
劣化,假设失真度超过 3%时,音质劣化明显. 音响系统的音箱失真度最大,一般最小的失真度也要超过 1%.
相位失真?:主要引起1kHz以下的低频声音模糊,同时影响中频声音层次和 声象定位.
抖晃失真?:主要是电机转速不稳,主导轴-压带轮压力不稳,磁头拍打磁带 等造成磁带震动和卷带量改变,进而
使信号频率被调制,声音音调出现混浊、颔 抖.抖晃通常用音调改变的均方根值表示,通常,录音机的抖晃率 <0.1%,
Hi-Fi
录音机<0.005%,普通录像机<0.3%,视盘机<0.001%.
② 频响与瞬态响应
频响?:指音响设备的增益或灵敏度随信号频率改变的情况,用通频带宽度 和带内不均匀度表示(如优质功放
的频响1Hz~200kH片ldB).带宽越宽,高、低频 响应越好:不均匀度越小,频率均衡性能越好.通常,30Hz~150Hz
低频使声音有 一定厚度根底,150Hz~500Hz中低频使声音有一定力度,300Hz~500Hz中低频声 压过分增强时,声
音浑浊,过分衰减时,声音乏力 ;500Hz~5kHz中高频使声音有
一定明亮度,过分增强时,声音生硬;过分衰减时,声音散、飘;5kHz~10kHz高频 段使声音有一定层次、色彩;
过分增强时,声音尖刺;过分衰减时,声音暗淡、发 闷.按此规律,可根据各种听感,定量调节音响系统的频响效果.
瞬态响应?:是指音响系统对突变信号的跟随水平.实质上它反映脉冲信号 的高次谐波失真大小,严重时影响
音质的透明度和层次感.瞬态响应常用转换速 率V/叫表示,指标越高,谐波失真越小.如,一般放大器的转换速率
>10V/^s
③ 信噪比
信噪比,表示信号与噪声电平的分贝差,用 S/N或SNR(dB)表示.噪声频率 的上下,信号的强弱对人耳的影响不一
样.通常,人耳对4~8kHz的噪声最灵敏, 弱信号比强信号受噪声影响较突出. 而音响设备不同,信噪比要求也不一样,
如 Hi-Fi 音响要求 SNR>70dB , CD机要求 SNR>90dB.
④ 声道别离度和平衡度
声道别离度,是指不同声道问立体声的隔离程度,用一个声道的信号电平与 申入另一声道的信号电平差来表示.
这个差值越大越好.一般要求 Hi-Fi音响分
离度>50dB.声道平衡度,是指两个声道的增益、频响等特性的一致性.否那么, 将造成声道声象的偏移.