7.1
Eureka 147 DAB国际协议是于1986年由16个欧洲成员组织为制定数字音频广播标准而制定的标准规范。随后又有一些新的组织机构加入到这项协议工作中去,并于1995年形成了第一个DAB的标准。在同一年中,世界范围的DAB论坛也相继成立,它们的目标就是促进世界各地更多的组织机构采用以Eureka 147 DAB为蓝本的数字音频广播的实现。
Eureka 147 DAB系统的设计是用来取代现行的FM广播业务的,它采用COFDM(编码正交频分复用)以便于更好地进行移动接收和克服多径效应,载波采用DQPSK(差值正交相移键控)进行调制,通道编码采用卷积编码,以满足可调整码率的需要。
Eureka 147 DAB系统使用1.536MHz的频谱带宽来传输最大不超过1.5Mb/s的数据,因此对于多声道来说, 如为6个声道,则每个声道的数据率最大不超过256kb/s。对于声道如何分配及使用,则是根据节目数量/ 数据业务与音频质量来折衷考虑的。由于早期的Eureka 147 DAB源编码的发展没有反映出当前最新发展的技术,同时由于历史原因及DAB标准由欧洲制定,而欧洲长期以来都采用的是MPEG技术,考虑到兼容等问题,因此DAB系统中音频编码系统采用的是MPEG Layer II编码方案。不能说MPEG Layer II编码方案有什么不好,但是如果我们综观当前多声道数字音频系统的最新发展,不难看出,有更多更好的方案可以被采用,如在提高声音质量上可采用DTS系统,在增加声道数目上可采用MPEG AAC系统。
7.2
DVB项目是在1993年由220多个世界组织来制定建立的。这些世界组织包括广播业者、制造商、网络管理者和致力于发展数字电视标准的各种组织机构。最早的DVB业务是在欧洲开始的,现在DVB标准不仅是欧洲的数字电视标准,而且它也扩展到亚洲、非洲、美洲及澳大利亚等地区,成为这些地区数字电视的选择标准之一。与此不同的美国采用的是ATSC系统。
在DVB的标准中规定了三个子系统:DVB-S(卫星)、DVB-C(有线)和DVB-T(地面)系统。DVB-S系统是一种单载波系统,是最早实现的DVB标准,它是建立在正交相移键控(QPSK)调制和通道编码(卷积编码和里得-所罗门块编码)的基础之上的,典型的码率为40Mb/s左右。DVB-C系统是以DVB-S系统为基础建立的,不同的是它采用QAM(正交调幅)调制方式,取代了用于DVB-S中的QPSK调制方式。在DVB-C中如果使用64点QAM调制,则可以实现在8MHz的带宽中传输38.5Mb/s的数据。DVB-T系统与以上两者都不同的是采用了COFDM的调制方式,而通道编码则与前两者基本相同。在DVB-T系统中,可以实现在7MHz的带宽中传输19.35Mb/s的数据。
DVB系统的源编码是建立在MPEG-2视频和MPEG-2系统标准上的。同时在DVB中也提供了与立体声相兼容的多声道数字音频系统。同样由于历史及其他一些原因,在DVB音频部分中仍然采用的是MPEG Layer II多声道数字音频系统,在DVB的标准中也同时规定可以采用灵活性更大、质量更高,超过MPEG Layer II MC系统的多声道数字音频系统作为DVB的音频部分。
总之,随着数字广播的不断发展,相信这些已经成熟的各种技术都将有它们各自的用武之地。
8、结语
在本文中,我们主要讨论了当前较流行、较成熟的几种多声道数字音频系统,同时也对它们所采用的编码方法的主要技术做了详尽的分析比较。随着存储媒体及传输带宽技术的不断发展,相信多声道数字音频系统会逐渐取代传统的如CD格式的音频系统;同样应用于多声道数字音频系统中的音频编码及传输方案也会不断的进行更新、发展。更多声道的实现及更高质量的音频系统实现都会成为可能,如新建立的DVD-Audio音频技术中的编码方案已远远超越了PCM音频方式。
总而言之,我们相信在今后的数字广播的发展中,不管是DVB、DAB、数字视频、音频广播,还是ATSC数字电视系统等,都将会采用不受带宽限制(相对而言)、可提供更高质量、更多声道的多声道数字音频系统。
3. 2 AC-3解码过程
解码过程基本上是编码的逆过程。解码器必须同编码数码流同步,检查误码,以及将不同类型的数据(例如编码的频谱包络和量化的尾数)进行解格式化。运行比特指派例行程序,将其结果用于解数据大包(unpack)和尾数的解量化。将频谱包络进行解码而产生各个指数。各个指数和尾数被变换回到时域成为解码的PCM时间样本。
在实际的AC-3解码器中,还包括下述功能:
l假若检测出一个数据误码,可以使用误码掩盖或静噪。
l高频内容耦合在一起的那些声道必须去除耦合。
l无论何时已被重新设置矩阵的声道,必须进行去除矩阵化的过程(在2-声道模式中)。
l必须动态的改变综合滤波器组的分辨率,与编码器分析滤波器组在编码过程中所用的方法
相同。
3. 3 杜比数字AC-3编码数据格式
经过杜比数字AC-3编码器的编码处理,可以将原始的数据PCM信号编码为杜比数字AC-3音频数据流。一个AC-3串行编码的音频数据流是由一个同步帧的序列所组成。如图10所示。

由图可见,每个同步帧包含六个编码的音频样本块(AB)其中每个代表256个新的音频样本。在每个同步帧开始的同步信息(SI)的信头中,包含为了获得同步和维持同步所需要的信息。接着SI后面的是数码流信息(BSI)的信头;它包含描述编码数据流业务的各种参数。编码的音频样本块之后接 着是一个辅助数据(AUX)字段。在每个同步帧结尾处是误码检验字段,其中包含一个用于误码检测的CRC字。一个附加的CRC字位于SI信头中,以供选用。
AB0~AB5的每一块代表一个编码通道,可以被分别独立解码,块的大小可以调整,但总数据量不变。在图中还有两个未标出的CRC,其中第一个位于帧的5/8处,另一个位于帧未。之所以如此安排,目的就是可以减少解码器的RAM需求量,使得解码器不必完全接收一帧后才解码音频数据,而是分成了两部 分进行解码。
AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语声声道,以及15路数据。它可同时传送16套节目,每套节目的音频及数据结构可任意规定。在码率为64kbps/声道的条件下,AAC可以提供很高的声音质量。
根据不同的应用场合,AAC提供了三种类型(Profile)以供选择,即主要类型(Main Profile)、低复杂度类型(Low Complexity Profile)、可放缩采样率类型(Scaleable Sampling Rate, SSR Profile)。因而其可应用范围很广。
5.2 AAC算法结构
为提高音频编码效率,AAC采用了许多先进技术,如霍夫曼编码、相关立体声、声道耦合、反向自适应预测、时域噪声整形、修正离散余弦变换(MDCT)、及混合滤波器组等。
其中,滤波器组与MPEG层III所采用的滤波器组相比,由于层III算法在对滤波器进行选择时考虑了兼容性问题,因而具有固有的结构上的不足;而AAC则直接采用了MDCT变换滤波。同时,AAC增加了窗口长度,由1152点增至2048,使MDCT的性能优于原来的滤波器组。
时域噪声整形(TNS)技术是时域/频域编码中一项新颖的技术。它利用频域的自适应预测的结果来对时域中量化噪声的分布进行整形处理。通过采用TNS技术,可以使特殊环境下的话音信号质量得到显著的提高。
后向自适应预测是一项在语音信号编码系统领域建立起来的技术。它主要利用了某一特定形式的音频信号易于预测的特点。
在量化过程中,通过对量化精度更为精细的控制,可以使给定的码率得到更加有效的利用。在码流复接时,通过对必须传输的信息进行熵编码使冗余度降至最低。
通过以上各种编码技术的运用以及采用一种可变的码流结构,使AAC编码算法在得到大大优化的同时, 也为将来进一步提高编码效率提供了可能性。
事实上,在AAC编码的三种类型中,各种编码技术的使用也是不同的,也就是说,三种类型的算法复杂度是不同的。这一不同考虑了编、解码两端的算法复杂度。例如,后向自适应预测约占解码运算量的45%左右,在LC和SSR类型中都没有采用这一技术。另外,在LC类型中,TNS滤波器的长度被限制为12个系数,但仍保持了18 KHz带宽;在SSR类型中,TNS也只使用12个系数,并且带宽限制为6 KHz,同时该类型也没有采用声道耦合技术,在混合滤波器组的结构及增益控制方面也与另两种类型不同。