当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
影音不分家,无损音频知多少?
  • 2014-8-15 18:28:19
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:张晓明
  • 作者:
【电脑报在线】1080P已成为标准,4K正在高速普及,8K也悄然出现。高清视频正掀起一场飓风,鼓动着视频行业的变革。但影音不分家,在高清视频普及的同时,要什么样的音频,才配得上高清的表现?而出色的音频不仅是配合影像出现,极致的音乐表现也一直是HiFi发烧友的追求。


@李剑峰

 

       1080P已成为标准,4K正在高速普及,8K也悄然出现。高清视频正掀起一场飓风,鼓动着视频行业的变革。但影音不分家,在高清视频普及的同时,要什么样的音频,才配得上高清的表现?而出色的音频不仅是配合影像出现,极致的音乐表现也一直是HiFi发烧友的追求。

    还原音色真实,无损压缩是先锋

        由于数码信号的转换,我们接触到的音频文件,大多都是经过压缩的。音频文件体积可不小,双声道16bit 44.1KHz采样频率的原始音频文件,每分钟就是10MB左右。如此庞大的文件,别说在网络带宽不足、存储介质昂贵的时代会产生极大的使用困扰。如果音频文件不进行压缩的话,那么2Mbps的宽带仅能勉强满足音乐实时播放的需求,而8小时的音乐足以将8GB闪存的手机容量用得所剩无几。

        那么什么是有损压缩呢?就如字面显示的那样,就是在压缩过程中对原有信号会产生一定损失的压缩方式,比如我们最经常使用的MP3就是一种有损压缩方式。有损压缩主要利用的是人耳的遮蔽效应,比如人耳对低频不敏感,这时就可以减少低频取样的比特率。另外人耳难以听到与强信号同时发音的、频率相近的弱信号,这样就可以把弱信号屏蔽掉。同时对音乐中的回声、弱信号等,也都进行屏蔽。

而在高压缩率如128Kbps以下的MP3文件中,还对高音部分进行了削波处理。从波形光谱图中就可以看出,128K MP3文件中15kHz以上的高音几乎被削去。凭借这些措施,有损压缩以放弃音乐细节表现能力,甚至牺牲部分高音为代价,可以将音频文件压缩到原来1/10大小,例如128KbpsMP3,指的就是其码率只有128Kbps,这样一分钟文件大小只有960KB(128Kbps/8x60)。因此在带宽和存储都捉襟见肘的时代,以MP3为代表的有损压缩是绝对的主流。

 

图:128Kbps MP3(下)在波形光谱图中就可以发现,其细节与高音较之源文件(上)丢失严重

 

图:APE无损压缩(下)与源文件的波形光谱图几乎一致

 

但随着存储和带宽问题的缓解,让无损压缩音频应用的瓶颈得到缓解。而厂家和使用者对音质的重视,平板、手机所配的耳机音质的提升这些因素,也让有损压缩高音差、细节丢失的缺陷暴露无遗,在这种情况下,无损压缩音频正逐渐普及,扮演音频升级的“高清”角色,如苹果系统的ALAC文件,PC上的APE、FLAC文件等等。

既要做到无损,还要压缩文件空间,那无损压缩是怎么做到的呢?其实无损压缩主要是依靠减少文件中的冗余来实现压缩目的。例如在音乐中我们会发现,左右声道的配音往往是一样或者相似的,分别存储无疑会浪费空间,而无损压缩则依靠建立中点数据,即两个声道平均值和差点值的方式来存储两个声道的文件,这样就可以大大减少左右声道数据相同带来的冗余。

而在数据存储时,以往的数据往往使用的是固定字节方式,即每一个信号都用16bit字长表示。但我们知道,数字前的0是没有意义的,如11000011,数值是一样的,前面诸多的0就显得多余了。而无损压缩使用了不定字节的存储方式,将数据中无用的零去除,并用赖斯编码方式来进行数据位的判断。就可以在无损的情况减少数据量。同时无损压缩是可逆的,即可以通过反运算,得到与源文件一模一样的音频文件。当然如果只是减少冗余数据,也就限制了其压缩率。一般情况下,无损压缩方式的压缩比只有2:1左右。

 

索尼Hi-Res,让音乐纤毫毕现

        无损压缩中的无损,只是针对已经数字化后过的文件而言。而不是说,它和原来的使用一模一样,完全无损。我们知道,声音是一个模拟信号,在电脑中则需要把它变成数字信号。以往模拟信号数字化主要有两个规格,即CD使用的16bit 44.1kHz以及DVDPC使用的16bit 48kHz,表示将模拟信号的大小分为16bit65536级),以每秒钟44.1KHz48KHz的速度,检测模拟信号的电压,看其最接近哪一个点,将这一点的电压用数字信号记录下来。而在播放时,连接这些采样点的信号,就还原成模拟信号。但这样的模数化,也会引起一些失真,毕竟16bit65536级别,并不能精确描述模拟信号的当前电压,在数字信号转化为模拟信号时,就会造成波形畸变。而44.148KHz的采样频率也偏低,我们知道,人耳最高可以听到20kHz的声音,如果用44.1KHz48KHz取样的话,那意味着一个波形,只有两个取样点,在这种情况下,怎么可以保证波形不失真呢?

 

图:模数化采样示意图

图:由于采样点少,在高音采样时,传统音频有明显波形失真,而Hi-Res更接近原波形。

 

        要想要减少数字化时的失真,就必须提高采样精度和采样频率,这也就是索尼近期推出Hi-ResAudio高品质音频的原因。Hi-Res Audio将模数化的采样规格提高到24bit 192KHz,4倍的采样频率提升。这样即便是高音信号,也可以获得较为精准的波形。而采样精度由16bit增加到24bit,那可不是提高1/2,要知道24bit可以产生1600万级的电压,比16bit的65000级电压增加了256倍,这样采样的电压精度大大提高,模拟波形畸变的情况自然也就大大降低。

图:Hi-Res标志

        采样精度的大幅提升,使音乐在源头上就实现了“高清”的目标,让音乐的精度大大提高,细节纤毫毕现。当然这也要付出文件体积膨胀6倍,一分钟未压缩音频文件高达70MB。不过,这对追求极致表现的发烧友来说,并不会造成太大的压力。

  

享环绕,多声道信号要编码

        在享受高清视频大片时,怎少得了音频享受,多声道、环绕声,那才是完美的影音享受。不过声道数量的增加,会令音频文件的体积大增,以蓝光碟片中普遍使用的杜比数字+环绕声技术为例,它使用的采样频率是48KHz20bit,支持7.1声道,在未经压缩时这一信号带宽达到6.72Mb/s,每分钟音频文件体积高达50MB,即便是蓝光光盘那巨大的容量也难于承受,毕竟蓝光光盘不仅要存储图像,还有多语言音轨。因此蓝光光盘要求,一个完整环绕声信号的最高码率不能高于1.7Mb/s,而持续码率要在768Kb/s1.5Mb/s之间。这样就要求杜比数字+环绕声要有510倍的压缩率,才能满足存储和播放需求。

图:杜比数字+标志

图:杜比环绕系统编解码流程。

        因此,杜比数字+环绕声实际上使用的也是有损压缩格式,但其要求较之MP3这类的有损压缩要求又高了不少,音频细节不能过份丢失,否则影响环绕定位感,高音表现不能减弱,否则影响音质表现。因此杜比数字环绕+的编码过程是十分复杂的。首先它应用了无损压缩中使用的多声道混合编码方式和可变字节长度,即只记录声道中间值和差异量,同时对于采样中冗余无用的数字0,进行压缩处理。同时也大量采用了有损压缩时常用的分块压缩,将宽广的音频分切为几个较窄的频带分别压缩,而遮蔽效应,将那些人耳不敏感的声音进行过滤。当然,其使用的改良离散余弦变换算法和指数变化算法,再加上杜比公司对人耳的仿生研究的深入,让其音质衰减几不可闻。

 

结语:高质量音频,设备与爱好是关键

       与高清视频带来的巨大影响不同,高质量音频总显得默默无闻。不少消费者甚至不知道无损压缩,更甭提高采样的Hi-Res,这也难怪,环绕系统只是少数人拥有,而不少手机和平板的音频系统和耳机品质都极为一般,甚至无法听出128K MP3与无损APE文件之间的区别。在这种情况下,使用者怎么有动力去使用更占空间的无损和高采样音乐呢?而即便有部分使用者能感知高质量音频带来的变化,当面对节目源难求,设备升级费用昂贵的问题时,也往往会打退堂鼓。正因为此,高质量音频慢慢成为一种小众玩物,影响力有限,更甭提普及了。

 

 
本文出自2014-08-18出版的《电脑报》2014年第32期 A.新闻周刊
(网站编辑:shixi01)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交