数字的声音——管窥漫步者S2.1D数码音箱(下)
【原创】阅读
人次
2001年12月09日21:21
【文章简介】
数字的声音——管窥漫步者S2.1D数码音箱(下)... (9501 字)
技术篇
“我们要聆听数字的声音!”一部分网友呐喊,呵呵,在正式测试前我们有必要对相关概念交代清楚,使读者对S2.1D的本质有更深入的了解。为了理解上的方便,笔者特地做了一组技术Q&A,标题即是问题的关键所在,同时用表格加说明的形式来加以回答。
Q:USB音箱与数字音箱有什么区别?
A: 先来看看USB音箱与数字音箱的不同
USB音箱
数字音箱
数字处理
电脑主CPU
声卡
数字输出
USB接口(1.1)
光纤、同轴接口
(创新高档音箱还有专用的数字SPDIF DIN接口)
D/A(数模)转换芯片
USB专用解码
达拉斯16bitDS4201
飞利浦20bitUDA1321
20bit/24bitDAC芯片
共同点
数字音频输出由音箱内的D/A转换芯片完成,避免机箱内部复杂的电磁干扰和声卡上D/A转换精度不高的弱点
不同点
无法对应多声道音频流
视芯片而定,支持多声道输出
不能处理3D音频流
声卡支持,如EAX/A3D等
USB接口带宽小,传输杜比信号(即使是压缩过的)困难
视芯片而定,如果是两声道DAC则不能直接处理5.1声道的杜比AC-3数字信号
CPU占用率高,在多USB接口同时使用时容易受到干扰
与CPU无关,只与声卡处理能力有关
纯数字,如果普通电脑无声卡也无USB接口则无法使用
模拟/数字信号两用
我们可以很明显看出数字音箱比USB音箱要“高明”,高明之处就是数字音箱与USB音箱相比差别在于数字音箱仅仅是声卡与音箱喇叭间的D/A接口,所以凡是声卡所具备的功能数字音箱“一个也不能少”,我们可以把它看作模拟音箱的升级版本。USB音箱的声音功能有赖于系统处理,功能方面缺陷很大,同时内部D/A模块性能一般,因此注定了USB音箱只能用于中低档场合,目前还不能取代声卡的地位(大家在磁盘整理的同时用USB音箱听MP3试试看……)。
Q:模拟输出和数字输出有什么不同之处?
A:两者不同之处其实还涉及到声卡本身的数模转换原理,大家请看下表
模拟音箱(声卡)
数字音箱
输出
模拟信号,由声卡CODEC完成
数字信号,声卡直接输出S/PDIF信号
输入(接口)
普通的模拟输入接口
除了模拟输入接口还有光纤、同轴等数字接口
连线
普通单/双头立体声音频线(每两声道)
光纤线或同轴线(创新数字音箱有专用的SPDIF配套连线)
声卡CODEC与数字音箱内部DAC的区别
解码精度
低
高
受干扰程度
高
(因为机箱内部环境复杂)
低
成本
无
高
(音箱内要多做一个D/A模块)
总体性能
由声卡的本身性能决定
由DAC芯片性能决定
看表后,大家可能有个疑问?为什么声音信号要经过D/A(数模)转换呢?其实,这个道理很简单,电脑内部所能处理的都是纯粹的0101数字信号,但是在音箱内部,功放放大的信号(电流)驱动喇叭,这个信号必须是模拟信号(电流可能是数字吗?),就像显卡一样,输出给普通的CRT显示器同样也是模拟信号,所以显卡芯片内部一定要经过RAMDAC转换才行。声卡上负责对声音信号的采样以及编码处理是靠CODEC芯片(多媒体数字信号编解码器)来完成,根据AC97规定,为了提高信噪比和抗干扰能力,一般声卡会将CODEC芯片独立出来(也有例外,如8738则是单芯片集成的CODEC功能,因此信噪比差)。甚至有的专业声卡和高档民用声卡(比如大力神Game Theater XP)将此芯片功能独立到机箱外部做成单独的模块,以避免电磁干扰。这非常符合未来高质量声音的要求,参见笔者去年写的《我眼中的多媒体音箱系统——声卡篇》一文。当然,现在的数码音箱做的正是这一部分,它可以接收带SPDIF信号输出功能的声卡输出的“原汁原味”的量化数字信号,然后通过音箱内部的D/A数码转换器把其变成模拟信号,同样能解决声卡上数模转换后模拟信号容易被干扰的大问题,从而提高了信号的可靠性与保真度。
好了,说了半天可能有某些朋友对一些概念还有些模糊,比如怎么用数字来表达声音呢?还有为什么表格中说明数字音箱内部的DAC比声卡上的CODEC好呢?关于这个问题,涉及到很多方面的内容,我们一个个来解决。
· 音频数字化过程
无论是A/D或是D/A转换,关键点是在于我们如何用0101的数字表示声波的变化,最常见的方法是通过PCM(Pulse Code Modulation的缩写)来进行。PCM的中文意思是脉冲编码调制技术,或者称为间频录制。这种声音采样(Sample)技术的具体做法是录音——通过高性能麦克风把声音转换成连续的电压变化信号(此时还是模拟信号),这时,我们可以画一张表来表示这种电压的变化(同时也表示了声音),那么这张表是如何画的呢?我们用图1来表示:
图中,横座标是时间,单位为秒,纵坐标则是电压的大小,整个电压的起伏变化可以看作是声波的图形。
这张图也可用数字来表示具体的波形,比如我们把时间细分一下,每0.01秒为一个分割单位,就得到图2
图二中,每个时间单位0.01秒的分割线(竖线)与波形的交叉点必定是唯一确定的,数学上用座标位置来表示。从左到右依次为(0.01,11.65)、(0.02,14.00)、(0.03,16.00)、 (0.04,17.74)……(0.18,15.94)、(0.19,17.7)、(0.20,20)。好了,我们现在已经把这个波形以数字记录下来了。由于我们已经知道时间间隔是固定的 0.01 秒,因此我们只要把纵座标记录下来就可以了,得到的结果就是11.65、14.00、16.00、17.74、19.00、19.89、20.34、20.07、19.44、18.59、17.47、16.31、15.23、14.43、13.89、13.71、14.49、15.94、17.70、20.00这一数列。这一串数字就是将以上信号数字化的结果。看吧,我们确实用数字记录了事物。它的变化可以近似地看成是波形的变化——PCM数字信号就是这么来的。
在以上的范例中,我们的采样频率是 100Hz(1/0.01 秒),如果我们把分割的时间单位进一步缩小,则能得到更多的座标点,这些点的集合更近似于原始的波形,数学上称之为最大拟真度。也就是说更多的数字能表示更精确的声音,采样频率我们也称之为采样精度。所以采样精度越高则声音越精确。其实电脑中的 .WAV 档的内容就是类似这个样子,文件头中记录了采样频率和可容许最大记录振幅,后面就是一连串表示振幅大小的数字,有正有负。常见CD唱盘是以PCM格式记录,而它的采样频率(Sample Rate)是 44100Hz,振幅采样精度/位数(声音采样的精度标准)是16Bits(位),也就是说振幅最小可达-32768(-2^16/2),最大可达+32767(2^16/2-1),这个数值表示了声音的动态范围,大家都明白,声音的动态范围越大则声音的波形同样能描述得更精确,16Bit的采样位数能保证声音动态不低于96dB。CD唱片是以螺旋状由内到外储存资料,可以存储74分钟的音乐。CD唱片的规格为什么是 44.1kHz、16Bits呢?关于44.1kHz 这个数字的选取分为两个层面。首先人耳的聆听范围是20Hz到20kHz,根据Nyquist Functions(下文有详细解释),采样的频率要高于两倍的录音频率才能不失真,所以理论上只要用40kHz以上的采样频率就可以完整记录20kHz以下的信号。那么为什么要用 44.1kHz 这个数字呢?那是因为在CD发明前硬盘还很贵,所以主要将数字音频信号储存媒体是录像带,用黑白来记录0与1。而当时的录像带格式为每秒30张,而一张图又可以分为490条线,每一条线又可以储存三个取样信号,因此每秒有30×490×3=44100个取样点,而为了研发的方便,CD唱盘也继承了这个规格,这就是44.1kHz的由来。在这里我们可以发现无论使用多么高的采样精度/数位,记录的数字跟实际的信号大小总是有误差,因此数字化无法完全记录原始信号。我们称这个数字化造成失真称为量化失真。
· DAC的原理和本质
好了,总算费了不少口舌说清了数字与模拟的声波之间的关系,下面我们就电脑上的纯粹数字化的声音还原成原始的音频信号方式作一探讨。一贯以来,电脑声卡中都有一块芯片叫做 DAC(Digital to Analog Converter),中文称数模转换器。DAC的功能如其名是把数字信号转换为模拟信号。我们可以把DAC想像成16个小电阻,各个电阻值是以2的倍数增大。当DAC接受到来自计算机中的二进制PCM信号,遇到0时相对应的电阻就开启,遇到1相对应的电阻不作用,如此每一批 16Bits 数字信号都可以转换回相对应的电压大小。我们可以想像这个电压大小看起来似乎会像阶梯一样一格一格,跟原来平滑的信号有些差异,因此再输出前还要通过一个低通滤波器,将高次谐波滤除,这样声音就会变得比较平滑了。
· 总结:采样芯片的精度与频率决定了数字化声音的质量
从前面的内容可以看出,音频数字化就是将模拟的(连续的)声音波形数字化(离散化),以便利用电脑进行处理的过程,主要参数包括采样频率(Sample Rate)和采样数位/采样精度(Quantizing,也称量化级)两个方面,这二者决定了数字化音频的质量。采样频率是对声音波形每秒钟进采样的次数。根据这种采样方法,采样频率能够再现声音频率的一倍。人耳听觉的频率上限在2OkHz左右,为了保证声音不失真,采样频率应在4OkHz左右。经常使用的采样频率有11.025KHz、22.05KHz和44.lKHz等。采样频率越高,声音失真越小、音频数据量越大。采样数位是每个采样点的振幅动态响应数据范围,经常采用的有8位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0~255)不同量化值,而16位量化级则可表示65536个不同量化值。采样量化位数越高音质越好,数据量也越大。如果采样精度和位数进一步提高的话,比如用48或者96KHz的采样频率,然后用能表示更多振幅变化的20Bit或是24Bit(24Bit时候声音可以用1677万个振幅变化)来记录,失真可以进一步减小,换句话说,我们用更多的数字能表示更好的声音信号——这也是高规格HDCD和DVD-Audio能博得发烧友欢心的根本原因所在。
反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立体声更能反映人的听觉感受。目前,数字化的声音可以做到多声道,让听众有亲临现场的感觉。
除了上述因素外,数字化音频的质量还受其它一些因素(如扬声器质量,录音优劣,计算机声卡A/D与D/A(模/数、数/模)转换芯片品质,各个设备连接线屏蔽效果好坏等)的影响。
综上所述,声音数字化的采样频率和量化级越高,结果越接近原始声音,但记录数字声音所需存储空间也随之增加。可以用下面的公式估算声音数字化后每秒所需的存储量(假定不经压缩):
存储量=(采样频率×采样数位)/8(字节数)
若采用双声道录音,存储量再增加一倍。例如,数字激光唱片(CD-DA,红皮书标准)的标准采样频率为44.lkHz,采样数位为16位,立体声,可以几乎无失真地播出频率高达22kHz的声音,这也是人类所能听到的最高频率声音。CD一分钟音乐需要的存储量为:
44.1×1000×l6×2×60/8=10,584,000(字节)=10.584MBytes
这个数值就是微软Windows系统中WAVE(.WAV)声音文件在硬盘中所占磁盘空间的存储量——大家明白为什么一张680M光盘大约能回放74分钟时间的原因了吗?(CD音轨开销比WAV略少,也不是张张CD都保存了74分钟的声音)。
由MICROSOFT公司开发的WAV声音文件格式,是如今计算机中最为常见的声音文件类型之一,它符合RIFF文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台机器应用程序所广泛支持。另外,WAVE格式支持MSADPCM、CCIPTALAW、CCIPT-LAW和其他压缩算法,支持多种音频位数,采样频率和声道,但其缺点是文件体积较大,所以不适合长时间记录。因此,才会出现各种音频压缩编/解码技术的出现,例如,MP3,RM,WMA,VQF,ASF等等,它们各自有自己的应用领域,并且不断在竞争中求得发展。
· 声卡上的CODEC芯片与数字音箱上的DAC芯片差异谈
CODEC意为“多媒体数字信号编解码器”,它主要承担对原始声音信号的采样混音处理,也就是起到我们前面所提到的A/D、D/A转换功能。为了提高信噪比,Intel公司的AC'97规范建议将CODEC从声卡主芯片中独立出来,以减少电子干扰。前文已经说过了,采样频率和采样精度直接决定了“声音数字化”的完美程度,因此,CODEC义不容辞地承担了“数字”的义务,什么意思呢?就是CODEC本身的性能,标称的数值(采样率/采样精度/信噪比)将是衡量CODEC好坏的重要标准。(A/D信噪比越高说明输出声音混入的杂音越小,这也是一个关键指标)现在较好的Codec支持48KHz的采样率和18Bit的采样精度(A/D、D/A转换),当然,顶级消费类声卡Audigy例外,它采用定制的独立的Philips的UDA1328T作为D/A转换芯片,它能负责向音箱输出6声道24bit/96KHz的声音,性能相当棒!
数字音箱上的DAC与声卡上的CODEC有一定差异,它一般是由专门的消费类家电芯片设计厂家为高音质的小型音响而量身定制的,比如常见的Burr Brown的PCM系列、CS系列、Philip的TDA系列等等,用于解码器、功放、床头迷你音响、DVD/VCD、电视机上,普遍性能指标比声卡上的Codec要高,比如这款S2.1D用的CS4334K,虽然简洁,但比起95%的声卡上的Codec性能要好很多。
我们做了一张表,让常见声卡与S2.1D的(D/A)性能作个比较(Audigy上文已有提及):
SoundBlaster!
FM801
CM8738
S2.1D
采样频率
(最高,下同)
48KHz
48KHz
44.1KHz
96KHz
采样精度
16Bit
18Bit
16Bit
24Bit
信噪比
94dB
95dB
85dB
88dB
性能孰高孰低已经一面了然。不过此张表有两点说明,虽然好像FM801的WM系列Codec信噪比等参数比较高,可是因为主芯片处理能力只有16Bit且电路设计和元器件方面的原因,它根本不可能有SB Live!系列的实际线性输出信噪比好。SB Live!各代产品之间的信噪比也大不相同,九九年八月前出的标准版和Value明显比2000年中以后出的数码版、2001年的5.1豪华版要好,当然,新一代的Audigy隐露王者之相这又是后话了。第二点说明就是再三强调了数字音箱上的DAC评定标准远比声卡上的Codec芯片严格,因此不能因为CS4334K信噪比“低”就认为它不行了,而要经过实际的检验才行。我们要让它进行公平环境下的对比,打个比方说,如果把CS4334K用于高档解码器或者功放,我们会认为它很差,但是如果用于VCD,那么我们会认为它很好……道理是一样的。
最后,需要指出的是数字音箱中进行DAC转换要比声卡上进行DAC优越很多,因为机箱内部的电磁干扰太大了,插在复杂环境下的声卡在进行D/A转换过程和实际输出模拟信号时不可避免会混入“多余”的噪音和损失“原声”。所以Codec的理论值与数字音箱中的DAC理论值具备不可比性。
· PCM是数字输出的方式
最后,我们要来说说数字音箱接收的是数字信号,那么声卡是如何把数字信号不经过CODEC而直接送给数字音箱的呢?
首先,在许多声卡的驱动程序里会提供输出方式选择。(最近的声卡评测中会有这方面内容),在SPDIF输出这个选项打上勾,声卡就能通过SPDIF输出接口输出“数字的声音”,其中抛开创新自己提供的声卡与创新音箱专用线外,一般就是利用同轴线或者光纤线进行传输。这里我们要确认几个概念:
SPDIF接口和SPDIF信号是什么?
所谓SPDIF接口,就是SONY/PHILIPS数码界面(Sony/Philips Digital InterFace),它是由SONY、PHILIPS两大公司联合制订的数字音频传输规范。SPDIFOUT可以绕开声卡自己的CODEC芯片,直接传输立体声的PCM(未压缩数字音频数据流)信号到外部设备上(主要指模拟音箱)。常见的用法与MD相连以达到无损录音的效果。(还有一种是SPDIF IN,与本文没什么大关系,暂且按下不表)
SPDIF里面可以传输多种信号,比如PCM(前面已经解释过了,这是一种通过改变脉冲的振幅来对信息进行编码表示模拟声波的方式,我们把它看成一串未压缩过的数字信号),通常PCM信号是立体声的,此外,SPDIF还能传输杜比AC-3、DTS等多声道压缩的数字信号。大家注意,SPDIF只不过是一个规定传输数字信号的规范而非数字信号本身。除此以外,这些信号必须通过光纤或者同轴线作为载体才能传输。对于S2.1D来说,它能接收光纤或者同轴传输过来的数字信号并且对应PCM格式的数字信号解码,将其还原成双声道模拟信号驱动喇叭进行工作,我们要注意,对于直接传送过来包含五声道信号的Double Digital AC-3,因为S2.1D没有能力进行解码,所以不能将其对应成正确的两声道立体声。具体是无声还是丢声道就让评测表现说话吧。
Q:同轴和光纤输出哪种好?
A:很多朋友接下来会问,同轴和光纤输出哪种好呢?我们再从原理上来讲一下吧。
首先要解释一下数码声音的Jitter问题,Jitter一般翻译作时基误差,是数位音讯音质劣化的杀手。Jitter造成声音的改变不是因为“数字”本身发生错误,而是资料的时间部分出错了。在前文声音数字化的过程中我们知道一个取样点包括振幅和时间这两项资料,而 jitter造成振幅没有在准确的时间呈现出来,因此造成波型扭曲。要避免jitter发生最直接的方法就是re-clock ,将接收的数位讯号先存到缓冲记忆体中,然后用一个精准的时钟重新排列这些数字讯号,并且让后续的数字电路都以这个时钟为运作基准。有些 Hi-End 器材使用不同于一般 S/PDIF 的单线数位传输介面,加入包含时钟讯号的接线用意即在于此。我们也可以看到,高档的器材,比如我们评测S5.1用的新德克XDV-2000有自己的独立超精准石英时钟和BNC专用端子以尽量避免Jitter带来的“危害”。总之,“时基误差”才是影响音质的重要因素,所以衡量数字音响设备传输接口性能的好坏,应以引起时基误差的大小为标准。由于光纤连接的信号要经过发射器和接收器的两次转换,会产生严重影响音质的时基抖动误差,因此光纤接口传输的信号虽能表现出音质较为透明,但数码味极浓,缺乏生气,显得没有韵味——看到这里,大家明白光纤和同轴哪个好了吗?
同轴线
所谓同轴(Coaxial)线应该是75欧姆的屏蔽线,中间只有一根芯线,外面是编织屏蔽网线。同轴线两端都要焊接,相对于普通的信号线,它有个显著的优点:阻抗恒定,频宽高(优质线有几百兆赫),能传输更多的信号,失真小。但是,既然同轴数字线存在阻抗匹配、电容量、信号衰减、电磁波干扰与频宽的问题,所以不同品牌的同轴线会产生不一样的声音表现。同轴线相对于光纤线来说时基误差 (Jitter)是最小的,因此这一传输方式对音质有较好的表现。
光纤线
理论上,不考虑Jitter因素,光纤(Optical)用来传输数字讯号是最好的,它的信号强度衰减较少、抗电磁波干扰能力强,无需考虑接口电平和阻抗,屏蔽的问题相应也少,而且本身不会释放电磁波,一般说来传输频宽也较宽目前长距离的通信。但实际归实际,理论归理论,用专家的话说,都符合质量标准的话,这两种载体的差别微乎其微,甚至有人还说同轴的声音更加“温暖”一些,因为它少了两次电/光和光/电的转换过程,而且制造光纤时,光纤本身的外径、同心度是否均匀一致、端点加工方式以及接头的精密度,都会对光讯号的散逸、反射损失等造成影响。笔者的建议是,买哪种连线其实无所谓啦,光纤线比较贵(笔者去年底买的杂牌价值80大元!),效果不一定比得上同轴,我们完全可以不买,因为漫步者会送,但请某些同志千万不要选购市面上那些极其廉价的所谓“同轴线”,它有很大的信号传输损伤,对音质影响非常大!
最后需要说明的是S2.1D随机赠送的光纤线品质很好,只可惜长度太短,仅仅1M左右。(漫步者申明送测样品和上市产品相同,都送光纤线)……所以长度不够或者不带光纤输出只有同轴输出的声卡,比如SB PCI128D、Diamond MX400、Philips PSC706的用户另外再做一根或者买一根较好的同轴线。(未完待续)
本文部分内容参考了E路英语网站,在此向编译者表示感谢。
【作者:小熊在线-笨笨熊 北京 】 版权作品
未经许可 请勿转载