“音频发烧友” / “Audiophile” 入门及杂谈

目录

最近买了一些新的耳机,但是买完总感觉自己被收智商税了,于是就查查查了好多资料。这篇文章介绍我理解下音频发烧友的一些词汇是什么意思,如果你不烧耳机音响,但是想了解这个群体的,这个文章也能作为一个入门参考~Hifi领域有很多词汇我也没懂的,我也写在文章里了,如果有老烧路过请指教一二。我尝试用我学过的知识来客观解释音频领域的知识,我没上过信号处理,相关课程只上过自动控制和离散控制。

发烧到底追求的是什么

刚好今天有看到一个Youtube视频讲到,为什么音乐人并不care那些高端的音频设备。视频内容本身的观点是:一方面音乐人更关注的是音乐本身能不能打动人,另一方面是音乐人很多也没有那么多闲钱哈哈哈。以及底下的评论有很多人说自己是pro musician,然后疯狂喷audiophile追求的东西是虚无飘渺的。我承认烧音频领域有很多玄学都是脑放(脑补出来的),但是做耳机解码之类的厂家也是有很多pro audo engineer,不能否认这里面也是有很多技术门道的。根据这一帮自称pro musician的发言,我估计他们也没有多牛,他们的观点也有幸存者偏差在里面,并且本身不同级别不同类型的音乐也有不同的需求,因此这些评论也就看看就好。不过有一点我是同意的,听音乐最重要的还是音乐本身,对音质的追求不应放于对音乐本身的追求之上。

再打个比方,对音质的追求和对画质的追求其实是相似的,好的(照片)画质能让我们看清楚世界更多的细节,好的音质能让我们更真切地感受到被乐器包围的感觉。音频处理和视频处理也有很多相似的地方,因为他们都经常被看作信号来处理,后文我也会经常拿画质来打比方。

什么是好的音质

在找到了自己喜欢的音乐之后,我们当然会希望手里的设备能更好的还原音乐本身,能听到每一点细节。因此对音质好的标准在我看来(我相信也是大多数人的观点),指的是耳朵听到的声音感觉和你站在录音的地方听到的声音感觉非常相似。由此可见在现场听,在乐器和人声面前听才能获得完美的音质,这是音质的金标准。当然这个也不是那么统一的,例如我并不觉得在歌手演唱会听到的音乐会比手机放出来的好听,因为演唱会非常嘈杂并且音响素质也不见得很好;但如果是在音乐厅听交响乐,我可以拍胸脯保证听到的声音远超电子设备播放出来的。又比如我还听很多电子音乐,里面很多音色都是直接合成出来的,那就无法通过这样的标准来定义了,这种情况下最好的音质可以定义成你听到的声音和音乐人以及调音师想让你听到的声音一致

上面提到的音质是可以客观定义和测量的,但是另一部分人追求的音质则是他听到的声音符不符合他的口味,例如有些人喜欢温润的女声,有些人喜欢低沉的bass,这些其实都是主观的喜好。这才是发烧友的精髓——定制,就像搞机械键盘什么的,定制和折腾才是发烧友的精髓。不过我对这样的音质并没有什么追求,因为他们通常都可以通过简单的Eq(调整Equilizer)来解决。

听到的声音的几个指标

通常对于音频发烧友来说,音质好不好是个比较笼统的词汇,因为音质好大抵是相似的,而音质差则各有各的差法。为了区分这些方面,audiophile们利用以及发明了很多与音质有关的词汇,我把比较常见的以及他们的意思列在下面了

声音基本概念(声音的本质是声波)
Loudness / 响度声波的振幅,通常会取势能来计算平均振幅
Tone / 音调(简单)声波的频率,真实的声音通常会是多个频率的叠加
Timbre / 音色声波的形状,人通过音色区分声音的来源
音频信号(如何表征一个音频信号)
Spectrogram / 频谱频谱描述信号在各个频率上的幅度,一般通过Fourier变换计算,由于Fourier变换是可逆的,因此频谱可以唯一地对应一段声音
Frequency (Response) / 频率(响应)频率响应描述输入信号和输出信号在频域上的差异
Phase / 相位相位本身指周期信号中信号在周期的哪个位置,但是相位本身很少用,用的更多的是相位差。我们常用的是将相位差推广到非周期信号,然后用来描述多个声道之间的信号时间差
可以量化的词汇(客观描述音质)
Bass / 低频20Hz-20kHz的低频部分
Mid / 中频20Hz-20kHz的中间部分
Treble / 高频20-20kHz的高频部分
Imaging / 声像声音的定位准不准,与信号相位有关。可参考Rtings的测量方法
Sound Stage / 声场感受到的空间大小,听起来音源越分散,声场越大。这个主要是针对耳机还原音箱声场的感觉,具体解释参考豆瓣这篇文章,测量方法参考Rtings的测试流程
Dynamic Range / 动态范围在同一段声音里同时表现幅度很大和很小的信号的能力,可以参考图像的HDR技术。
Transient / 瞬态这个词我是抱有疑问的,虽然控制器确实有响应时间这个参数,但是用在声音信号上感觉并不算很合适。好像一般通过追踪方波输入来看耳机的瞬态响应。
Signal to Noise Ratio (SNR) / 信噪比字面意思,信号对噪声的比。这个噪音通常是音频电路的底噪。
Total Harmonic Distortion (THD) / 总谐波失真输入一个纯净正弦信号,输出里这个信号的谐波就是谐波失真。
Intermodulation Distortion (IMD) / 互调失真输出两个频率的信号,测输出信号的失真
Crosstalk / 串扰多通道之间的信号干扰
玄学词汇(主观描述音质)
Fidelity / Resolution / 解析力这个词可能指的是低失真?有时候感觉也指超高频的频率响应。被各种厂家的广告用烂了,没有统一的解释
Punchy / 力度通常指的是低频非常重
Congested / 拥挤 / Shouty大概指的是声场小,或者是中高频gain太高
Sharp / 锐一般是在频谱的某一小段中高频上有刺突
Clean / Clarity / 通透 / 纯净应该都指的是中高频比较突出
Sound quality / 音质虽然这里我们客观地讨论了什么是好音质,但是在audiophile社区里面这个词并不都是这么定义的
Tonality / 调性这个词我着实没弄懂,本身是用来形容乐曲的谱调的,但是用来形容音质我也摸不找头脑
Layered / 层次感这虽然我知道是什么意思,以及能听出来区别,但是觉得这个词很模糊。我猜测它与声像和声场都有关。

其中低中高频的区别这里贴一张引自crinacle的图1

频率对应图

人能听出多大差别

在定义了什么是好音质以后,还有个问题是人能听出来多大的音质差别?首先一个基本常识是人的听力范围是在20Hz-20kHz之间(也有说16Hz-20kHz的),这是目前通用的标准,包括音频的采样率定在44100Hz也是参考了这个数据。另外在这个知乎回答里面,答主引用了这些数据:

人耳所能感知到的纯单音变化最小幅度为0.3dB 人耳在最敏感的500Hz~2kHz段所能感知到的频率变化一般是0.2% 人耳所能感知的低次谐波失真变化最小量一般在1%上下

以上这些数据可以作为参考,但是它们并不能作为硬性指标,例如说音频信号超过20kHz的部分就是完全没有意义的,我认为是不科学的。一是因为以上都是统计数据,不能否认现实世界有“金耳朵”的存在(不过至少我不是),二是以上数据来源于科学实验,其实验过程与我们听音乐的时候可能并不相同,有可能会导致音频敏感度的差别。不过至少这些数据让我们有一个大概的概念,如果一个音频设备带来的提升远小于这些数,那么极大概率你是听不出他们带来的区别的。

发烧友字典

Hifi界另外一些让人摸不着头脑的地方就是,各种各样的词汇,以及这些词汇似乎指向的东西有时候也很不明确。。。这里把我自己学到的记一下。

音乐播放器系统组成

我们这里不考虑录音室的系统组成,而只考虑用户的系统组成。

音源

好像音源又叫前端?整那么邪乎干啥。。。音源有CD机、电脑、唱片机(俗称转盘turntable?),因为现在都是数字音乐了,因此重要的就是源文件的音质。音频格式有很多说法,首先分PCM和DSD两种,PCM是时域采样而DSD是频域采样。PCM又有很多指标,例如位深指音频每个采样的精度(通常是16bit,HiRes则有24bit以上),采样率指采样的频率,根据Nyquist-Shannon采样定律,频率高于20kHz理论上就能做到无损采样。然后音乐文件的格式又分有损和无损,有损格式如果比特率足够高还行,如果很低那就会非常严重地影响音质。然后音源会输出到数字界面。

数字界面

虽然机油送我了一个数字界面,但是我并不能听出区别,以及我到现在也不是很清楚这个界面是干什么的。根据我知乎看到的资料,数字界面是把USB信号转换成DAC芯片能够直接读取的信号。外置数字界面的好处一个是时钟(可能)比内置更加精确,另一个是给没有USB或者火线(IEEE-1394协议)接口的DAC提供输入。这里就涉及另一个玄学的概念,叫时钟抖动(Jitter)。由于数字信号的采样(指PCM)是恒定频率的,因此如果数字线路的时钟频率不稳定,是会非常影响DAC转换结果的。抖动可以来源于时钟本身(如晶振),也可能来源于数字信号传输的接口芯片。不过就像知乎另一个回答说的,一般这种抖动都非常非常细微,我并不认为这对信号能有太多影响,并且我确实也听不出来。想感受一下多玄学的可以再看看耳机大家庭的文章。。。

解码器(Digital-Analog Converter,DAC)

DAC就是数模转换器,用来将数字信号转成模拟信号。这个过程我觉得挺重要的,因为数模转换(模数转换)带来的信号损失还是很明显的。从控制理论里的零阶保持(ZOH)来理解的话,转换过程会影响信号的相位和高频。DAC的质量在整个音频管道中还是比较重要的。另外一个特性是DAC支持的格式,现在主流的hifi解码都支持高位深和DSD的音频了。

放大器(Amplifier,Amp)

用于音箱的一般称功放(功率放大器),用于耳机的一般称耳放。放大器的作用就是把解码出来的模拟信号放大到合适的音量。很多设备如手机,甚至一些DAC都把功放集成进去了。独立的放大器设备有两个好处,一个的更好的电磁隔离,更少的底噪,另一个是可以提供更大的功率储备,用来推特别难推的耳机(如低阻低灵敏度的耳机),在极端状态下可以减少失真。

耳放还分两种:电子管耳放(胆机),晶体管耳放(石机)。我没听过胆机,但都说胆机声音温润,估计说到底就是胆机削低了高频。因此如果纯音质角度看,选一个低失真的耳放就可以了。

功放有时分前级后级,据我查到的资料说,前级是low-pass filter,用来处理低频,然后后级整体放大?这里我也不懂了,搜到各种不一样的说法,我觉得我还是别管这玩意了。(知乎参考在此

接口

再讲一下不同音频设备之间的连接接口,数字的接口一般就是USB和S/PDIF了,模拟信号主要有TRS,TRRS,XLR等等,可以参考这篇文章。这些接口本身没什么差别,虽然说有人对这个很在意,甚至还有人对墙上插座的接口很讲究,但是我觉得这都是玄学= =(就是不科学)

回放设备

就是音箱或者耳机,这玩意也是有各种产品。音箱分有源音箱和无源音箱,有源就是内置了放大器的。耳机则分入耳(In-ear, IEM),和头戴式耳机(On-ear/Over-ear)。具体这就不展开了。

耳机相关

单元

  • Balanced Armerture / BA / 动铁:平衡铁通过磁场变化,带动振膜运动。
  • Dynamic Driver / DD / 动圈:磁场直接驱动线圈,带动振膜运动。
  • Planar Magnetic / 平板:磁场直接驱动金属板运动。
  • Piezoelectric Ceramic / 压电陶瓷单元:压电晶体带动振膜变形发声。
  • Electrostatic / EST / 静电:电场带动振膜运动。 (可以参见Linus的视频)

线材

首先要说明的是,音频线材对声音的影响微乎其微。线材影响声音的原理是不同线材有不同的阻抗、容抗和感抗曲线(主要是阻抗和容抗),因此可能会微微影响低阻耳机的频率响应。另外,说线材能提升音质的基本就是扯淡。参见该知乎回答

  • TPC: 电解铜
  • OFC: 无氧铜
  • OCC: 单结晶无氧铜
  • 5N/6N/7N:(铜)纯度,几个N就有几个9。
  • Litz/Litz2:绕线方式,参考Litz官网。并不知道不同绕线方法对感抗有没有什么影响。。 现在的线材基本都是无氧铜。个人认为为了好看和功能换线可以,为了换口味换线可以,为了增加屏蔽层减少外部信号噪音可以,但是为了“提升音质”就纯粹是智商税了。另外上面提到的都是传递模拟信号的线材,对那种audio-grade的USB线我是打死都不信有什么区别的,数字信号对这么点阻抗的变化根本不可能有什么反应。

耳塞/耳垫

耳塞(Tip)和耳垫(Pad)可以影响声音在进入耳朵之前的回响,因此也是会改变声音的。耳垫的影响比较大,耳塞我觉得比较小。不过同样的,我认为不同的耳塞耳垫都是相当于给耳机加了EQ,因此不必追求高音质的耳垫。有一点例外,如果耳塞耳垫有漏音的话,会严重影响音质,这种情况下就需要更换了。


这大概就是我对audiophile各种知识的笔记了。在了解这么多之后,我还是觉得,选一个小巧、功能多、性能还过得去的DAC和amp,然后选个音质够用的耳机就行了,不用再换了。音质这玩意到最后音质提升的性价比实在太低了,还是找更多好听的音乐来的实在。

使用 Hugo 构建
主题 StackedJimmy 设计,Jacob 修改