模拟通信 数字通信信技术与应用的量化值怎么确定?

量化,编码 - 问通信专家
已解决问题
量化,编码
一首歌音质的好坏与量化,编码(PCM)的关系?
提问者: &提问时间: 19:25:33 &
&的答案& ( 采纳时间:
一楼、二楼都很专业。
&&|&&&&|&&&&|&&
专家指数:11485
Really professional
• PDCCH和PDSCH使用同样的信道编码方式,都是turbo码。是错的,这是为什么
• MCS调制与编码策略与64QAM调制16QAM调制有有什么关系啊
• 编码方式
• 有注册编码么?
• 信令点编码以及GT码是不是只在7号信令中使用?
•  CDMA系统的有效频带宽度1.2288MHz,语音编码速率为9.6kb/s,比特能量与噪声密度比为6dB,则系统容量为
• CDS的下行64QAM的比例编码怎么计算
• 两个不同的网元的信令点编码可不可能一样
其他答案&(2)
数字音频的压缩编码与编码标准
1.数字音频压缩编码概述将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中,一般需要对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,以减少音频的数据量,并以这种形式在计算机内传输和存储。在播放这些声音时,需要经解码器将二进制编码恢复成原来的声音信号播放。声音信号能进行压缩编码的基本依据主要有3点:(1)声音信号中存在着很大的冗余度,通过识别和去除这些冗余度,便能达到压缩的目的。(2)音频信息的最终接收者是人,人的视觉和听觉器官都具有某种不敏感性。舍去人的感官所不敏感的信息对声音质量的影响很小,在有些情况下,甚至可以忽略不计。例如,人耳听觉中有一个重要的特点,即听觉的“掩蔽”。它是指一个强音能抑制一个同时存在的弱音的听觉现象。利用该性质,可以抑制与信号同时存在的量化噪音。(3)对声音波形采样后,相邻采样值之间存在着很强的相关性。按照压缩原理的不同,声音的压缩编码可分为3类,即波形编码、参数编码和混合型编码。(1)波形编码这种方法主要利用音频采样值的幅度分布规律和相邻采样值间的相关性进行压缩,目标是力图使重构的声音信号的各个样本尽可能地接近于原始声音的采样值。这种编码保留了信号原始采样值的细节变化,即保留了信号的各种过渡特征,因而复原的声音质量较高。波形编码技术有脉冲编码调制(PCM)、自适应增量调制(ADM)和自适应差分脉冲编码调制(ADPCM)等。(2)参数编码参数编码是一种对语音参数进行分析合成的方法。语音的基本参数是基音周期、共振峰、语音谱、声强等,如能得到这些语音基本参数,就可以不对语音的波形进行编码,而只要记录和传输这些参数就能实现声音数据的压缩。这些语音基本参数可以通过分析人的发音器官的结构及语音生成的原理,建立语音生成的物理或数学模型通过实验获得。得到语音参数后,就可以对其进行线性预测编码(Linear Predictive Coding,LPC)。(3)混合型编码混合型编码是一种在保留参数编码技术的基础上,引用波形编码准则去优化激励源信号的方案。混合型编码充分利用了线性预测技术和综合分析技术,其典型算法有:码本激励线性预测(CELP)、多脉冲线性预测(MP-LPC)、矢量和激励线性预测(VSELP)等。波形编码可以获得很高的声音质量,因而在声音编码方案中应用较广。下面介绍波形编码方案中常用的PCM编码。2.脉冲编码调制PCM(1)编码原理PCM脉冲编码调制是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称,即它把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储,原理框图如图2-1-4所示。在图2-1-4中,它的输入是模拟声音信号,输出是PCM样本。图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”;“量化器”可理解为“量化阶大小”(Step—Size)生成器或者称为“量化间隔”生成器。
图2-1-4 PCM原理框图
从模拟声音信号到声音信号的数字化,这中间是一个声音信号的处理过程。模拟声音信号的数字化一般有2个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值,可以采用均匀量化、非均匀量化和自适应量化等方式。PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。(2)均匀量化如果采用相等的量化间隔对采样得到的信号进行量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图2-1-5所示。均匀量化PCM就是直接对声音信号作A/D转换,在处理过程中没有利用声音信号的任何特性,也没有进行压缩。该方法将输入的声音信号的振幅范围分成2B个等份(B为量化的二进制位数),所有落入同一等份数的采样值都编码成相同的B位二进制码。只要采样频率足够大,量化位数也适当,便能获得较高的声音信号数字化效果。为了满足听觉上的效果,均匀量化PCM必须使用较多的量化位数,这样所记录和产生的音乐,可以达到最接近原声的效果。当然提高采样率及分辨率,将造成储存数据空间的增大。
图2-1-5 均匀量化
为了适应幅度大的输人信号,同时又要满足精度要求,就需要增加样本的位数。但是,对话音信号来说,大信号出现的机会并不多,增加的样本位数没有充分利用。为了克服这个不足,出现了非均匀量化的方法,这种方法也叫做非线性量化。(3)非均匀量化非线性量化的基本想法是,对输人信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图2-1-6所示。这样就可以在满足精度要求的情况下,用较少的位数来表示。声音数据还原时,采用相同的规则。
图2-1-6 非均匀量化
3.音频编码标准(1)ITU-T G系列声音压缩标准随着数字电话和数据通信容量日益增长的迫切要求,而又不希望明显降低传送话音信号的质量,除了提高通信带宽之外,对话音信号进行压缩是提高通信容量的重要措施。另一个可说明话音数据压缩的重要性的例子是,用户无法使用28.8Kbps的调制解调器来接收因特网上的64Kbps话音数据流,这是一种单声道、8位、采样频率为8kHz的话音数据流。ITU-TSS为此制定了并且继续制定一系列话音(Speech)数据编译码标准。其中,G.711使用μ率和A率压缩算法,信号带宽为3.4kHz,压缩后的数据率为64Kbps;G.721使用ADPCM压缩算法,信号带宽为3.4kHz,压缩后的数据率为32Kbps;G.722使用ADPCM压缩算法,信号带宽为7kHz,压缩后的数据率为64Kbps。在这些标准基础上还制定了许多话音数据压缩标准,如G.723、G.723.1、G.728、G.729、G.729.A等。在此简要介绍以下几种音频编码技术标准:①电话质量的音频压缩编码技术标准电话质量语音信号频率规定在300Hz~3.4kHz,采用标准的脉冲编码调制PCM。当采样频率为8kHz,进行8bit量化时,所得数据速率为64Kbps,即一个数字电话。1972年,CCITT制定了PCM标准C.711,速率为64Kbps,采用非线性量化,其质量相当于12bit线性量化。1984年,CCITT公布了自适应差分脉冲编码调制ADPCM标准G.721,速率为32Kbps。这一技术是对信号和它的预测值的差分信号进行量化,同时再根据邻近差分信号的特性自适应改变量化参数,从而提高压缩比,又能保持一定信号质量。因此,ADPCM对中等电话质量要求的信号能进行高效编码,而且可以在调幅广播和交互式激光唱盘音频信号压缩中应用。为了适应低速率语音通信的要求,必须采用参数编码或混合编码技术,如线性预测编码LPC,矢量量化VQ,以及其他的综合分析技术。其中较为典型的码本激励线性预测编码CELP实际上是一个闭环LPC线性预测编码系统,由输入语音信号确定最佳参数,再根据某种最小误差准则从码本中找出最佳激励码本矢量。CELP具有较强的抗干扰能力,在4Kbps~16Kbps传输速率下,即可获得较高质量的语音信号。1992年,CCITT制定了短时延码本激励线性预测编码LD-CELP的标准G.728,速率16Kbps,其质量与32Kbps的G.721标准基本相当。1988年,欧洲数字移动特别工作组制定了采用长时延线性预测规则码本激励RPE-LTP标准GSM,速率为13Kbps。1989年,美国采用矢量和激励线性预测技术VSELP,制定了数字移动通信语音标准CTIA,速率为8Kbps。为了适应保密通信的要求,美国国家安全局NSA分别于1982年和1989年制定了基于LPC,速率为2.4bps和基于CELP,速率为4.8Kbps的编码方案。②调幅广播质量的音频压缩编码技术标准调幅广播质量音频信号的频率在50Hz~7kHz范围。CCITT在1988年制定了G.722标准。G.722标准是采用16kHz采样,14bit量化,信号数据速率为224Kbps,采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编码,再混合形成输出码流,224Kbps可以被压缩成64Kbps。因此,利用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。③高保真度立体声音频压缩编码技术标准高保真立体声音频信号频率范围是50Hz~20kHz,采用44.1kHz采样频率,16bit量化进行数字化转换,其数据速率每声道达705Kbps。1991年,国际标准化组织ISO和CCITT开始联合制定MPEG标准,其中ISO CDlll72-3作为“MPEG音频”标准,成为国际上公认的高保真立体声音频压缩标准。MPEG音频第一层和第二层编码是将输入的音频信号进行采样频率为48kHz、44.1kHz、32kHz的采样,经滤波器组将其分为32个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。MPEG第三层是在上述处理后再引入辅助子带、非均匀量化和熵编码技术,再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32~448Kbps,适合于CD-DA光盘应用。(2)MP3压缩技术MP3的全名是MPEG Audio Layer-3,简单地说就是一种声音文件的压缩格式。1987年,德国的研究机构IIS(Institute Integrierte Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做EUREKA EUl47,即MP3的前身。之后,这项计划由IIS与Erlangen大学共同合作,开发出一套非常强大的算法。经由150国际标准组织认证之后,符合ISO-MPEG Audio Layer-3标准,就成为现在的MP3。ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案(Perceptual Coding Schemes),按照压缩质量(每bit的声音效果)和编码方案的复杂程度划分为Layer 1、Layer 2、Layer 3。所有这三层的编码采用的基本结构是相同的,在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论,也就是通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,利用滤波器找出噪音电平(Noise Level),然后滤去人耳不敏感的信号,通过矩阵量化的方式将余下的数据每一位打散排列,最后编码形成MPEG的文件。其音质听起来与CD相差不大。MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。以CD音质的Wave文件来说,如采样频率44.1kHz,量化为16bit,,声音模式为立体声,那么存储1秒钟CD音质的Wave文件,必须要用16bit*44100Hz*2 Stereo=l411200bit,也就是相当于1411.2Kb的存储容量,存储介质的负担相当大。不过通过MP3格式压缩后,文件便可压缩为原来的1/10~1/12,每1秒钟CD音质的MP3文件只需112~128Kb就可以了。具体的MPEG的压缩等级与压缩比率,声音品质与MP3压缩比例关系,参见下表。
MPEG的压缩等级与压缩比率
MPEG编码等级
数字流码率/Kbps
声音品质与MP3压缩比例关系
比特率/Kbps
好于调幅广播
类似调频广播
(3)MP4压缩技术MP4并不是MPEG-4或者MPEG Layer 4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。从技术上讲,MP4使用的是MPEG-2 AAC技术,也就是俗称的a2b或AAC。其中,MPEG-2是MPEG于1994年11月针对数码电视(数码影像)提出的。它的特点是,音质更加完美而压缩比更加大(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)在采样率为8~96kHz下提供了l~48个声道可选范围的高质量音频编码。AAC是Advanced Audio Coding,即先进音频编码,适用于从比特率在8Kbps单声道的电话音质到160Kbps多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码/解码。AAC与MP3相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美地再现CD音质。MP4技术的优越性要远远高于MP3,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,MP4是一种商品,它利用改良后的MPEG-2 AAC技术并强加上由出版公司直接授权的知识产权协议作为新的标准;而MP3是一种自由音乐格式,任何人都可以自由使用。此外,MP4实际上是由音乐出版界联合授意的官方标准;MP3则是广为流传的民间标准。相比之下,MP3的灵活度和自由度要远远大于MP4,这使得音乐发烧友们更倾向于使用MP3。更重要的一点是,MP3是目前最为流行的一种音乐格式,它占据着大量的网络资源,这使得MP4的推广普及难上加难。从长远来看,MP4流行是迟早的事(指其优越的技术性)。但是,如果MP4不改进其技术构成(即强加的版权信息)的话,那么,自由的MP3在使用了MPEG-2 AAC技术后,胜负就很明显了。
数字音频的压缩编码与编码标准
1.数字音频压缩编码概述将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中,一般需要对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,以减少音频的数据量,并以这种形式在计算机内传输和存储。在播放这些声音时,需要经解码器将二进制编码恢复成原来的声音信号播放。声音信号能进行压缩编码的基本依据主要有3点:(1)声音信号中存在着很大的冗余度,通过识别和去除这些冗余度,便能达到压缩的目的。(2)音频信息的最终接收者是人,人的视觉和听觉器官都具有某种不敏感性。舍去人的感官所不敏感的信息对声音质量的影响很小,在有些情况下,甚至可以忽略不计。例如,人耳听觉中有一个重要的特点,即听觉的“掩蔽”。它是指一个强音能抑制一个同时存在的弱音的听觉现象。利用该性质,可以抑制与信号同时存在的量化噪音。(3)对声音波形采样后,相邻采样值之间存在着很强的相关性。按照压缩原理的不同,声音的压缩编码可分为3类,即波形编码、参数编码和混合型编码。(1)波形编码这种方法主要利用音频采样值的幅度分布规律和相邻采样值间的相关性进行压缩,目标是力图使重构的声音信号的各个样本尽可能地接近于原始声音的采样值。这种编码保留了信号原始采样值的细节变化,即保留了信号的各种过渡特征,因而复原的声音质量较高。波形编码技术有脉冲编码调制(PCM)、自适应增量调制(ADM)和自适应差分脉冲编码调制(ADPCM)等。(2)参数编码参数编码是一种对语音参数进行分析合成的方法。语音的基本参数是基音周期、共振峰、语音谱、声强等,如能得到这些语音基本参数,就可以不对语音的波形进行编码,而只要记录和传输这些参数就能实现声音数据的压缩。这些语音基本参数可以通过分析人的发音器官的结构及语音生成的原理,建立语音生成的物理或数学模型通过实验获得。得到语音参数后,就可以对其进行线性预测编码(Linear Predictive Coding,LPC)。(3)混合型编码混合型编码是一种在保留参数编码技术的基础上,引用波形编码准则去优化激励源信号的方案。混合型编码充分利用了线性预测技术和综合分析技术,其典型算法有:码本激励线性预测(CELP)、多脉冲线性预测(MP-LPC)、矢量和激励线性预测(VSELP)等。波形编码可以获得很高的声音质量,因而在声音编码方案中应用较广。下面介绍波形编码方案中常用的PCM编码。2.脉冲编码调制PCM(1)编码原理PCM脉冲编码调制是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称,即它把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储,原理框图如图2-1-4所示。在图2-1-4中,它的输入是模拟声音信号,输出是PCM样本。图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”;“量化器”可理解为“量化阶大小”(Step—Size)生成器或者称为“量化间隔”生成器。
图2-1-4 PCM原理框图
从模拟声音信号到声音信号的数字化,这中间是一个声音信号的处理过程。模拟声音信号的数字化一般有2个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值,可以采用均匀量化、非均匀量化和自适应量化等方式。PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。(2)均匀量化如果采用相等的量化间隔对采样得到的信号进行量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图2-1-5所示。均匀量化PCM就是直接对声音信号作A/D转换,在处理过程中没有利用声音信号的任何特性,也没有进行压缩。该方法将输入的声音信号的振幅范围分成2B个等份(B为量化的二进制位数),所有落入同一等份数的采样值都编码成相同的B位二进制码。只要采样频率足够大,量化位数也适当,便能获得较高的声音信号数字化效果。为了满足听觉上的效果,均匀量化PCM必须使用较多的量化位数,这样所记录和产生的音乐,可以达到最接近原声的效果。当然提高采样率及分辨率,将造成储存数据空间的增大。
图2-1-5 均匀量化
为了适应幅度大的输人信号,同时又要满足精度要求,就需要增加样本的位数。但是,对话音信号来说,大信号出现的机会并不多,增加的样本位数没有充分利用。为了克服这个不足,出现了非均匀量化的方法,这种方法也叫做非线性量化。(3)非均匀量化非线性量化的基本想法是,对输人信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图2-1-6所示。这样就可以在满足精度要求的情况下,用较少的位数来表示。声音数据还原时,采用相同的规则。
图2-1-6 非均匀量化
3.音频编码标准(1)ITU-T G系列声音压缩标准随着数字电话和数据通信容量日益增长的迫切要求,而又不希望明显降低传送话音信号的质量,除了提高通信带宽之外,对话音信号进行压缩是提高通信容量的重要措施。另一个可说明话音数据压缩的重要性的例子是,用户无法使用28.8Kbps的调制解调器来接收因特网上的64Kbps话音数据流,这是一种单声道、8位、采样频率为8kHz的话音数据流。ITU-TSS为此制定了并且继续制定一系列话音(Speech)数据编译码标准。其中,G.711使用μ率和A率压缩算法,信号带宽为3.4kHz,压缩后的数据率为64Kbps;G.721使用ADPCM压缩算法,信号带宽为3.4kHz,压缩后的数据率为32Kbps;G.722使用ADPCM压缩算法,信号带宽为7kHz,压缩后的数据率为64Kbps。在这些标准基础上还制定了许多话音数据压缩标准,如G.723、G.723.1、G.728、G.729、G.729.A等。在此简要介绍以下几种音频编码技术标准:①电话质量的音频压缩编码技术标准电话质量语音信号频率规定在300Hz~3.4kHz,采用标准的脉冲编码调制PCM。当采样频率为8kHz,进行8bit量化时,所得数据速率为64Kbps,即一个数字电话。1972年,CCITT制定了PCM标准C.711,速率为64Kbps,采用非线性量化,其质量相当于12bit线性量化。1984年,CCITT公布了自适应差分脉冲编码调制ADPCM标准G.721,速率为32Kbps。这一技术是对信号和它的预测值的差分信号进行量化,同时再根据邻近差分信号的特性自适应改变量化参数,从而提高压缩比,又能保持一定信号质量。因此,ADPCM对中等电话质量要求的信号能进行高效编码,而且可以在调幅广播和交互式激光唱盘音频信号压缩中应用。为了适应低速率语音通信的要求,必须采用参数编码或混合编码技术,如线性预测编码LPC,矢量量化VQ,以及其他的综合分析技术。其中较为典型的码本激励线性预测编码CELP实际上是一个闭环LPC线性预测编码系统,由输入语音信号确定最佳参数,再根据某种最小误差准则从码本中找出最佳激励码本矢量。CELP具有较强的抗干扰能力,在4Kbps~16Kbps传输速率下,即可获得较高质量的语音信号。1992年,CCITT制定了短时延码本激励线性预测编码LD-CELP的标准G.728,速率16Kbps,其质量与32Kbps的G.721标准基本相当。1988年,欧洲数字移动特别工作组制定了采用长时延线性预测规则码本激励RPE-LTP标准GSM,速率为13Kbps。1989年,美国采用矢量和激励线性预测技术VSELP,制定了数字移动通信语音标准CTIA,速率为8Kbps。为了适应保密通信的要求,美国国家安全局NSA分别于1982年和1989年制定了基于LPC,速率为2.4bps和基于CELP,速率为4.8Kbps的编码方案。②调幅广播质量的音频压缩编码技术标准调幅广播质量音频信号的频率在50Hz~7kHz范围。CCITT在1988年制定了G.722标准。G.722标准是采用16kHz采样,14bit量化,信号数据速率为224Kbps,采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编码,再混合形成输出码流,224Kbps可以被压缩成64Kbps。因此,利用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。③高保真度立体声音频压缩编码技术标准高保真立体声音频信号频率范围是50Hz~20kHz,采用44.1kHz采样频率,16bit量化进行数字化转换,其数据速率每声道达705Kbps。1991年,国际标准化组织ISO和CCITT开始联合制定MPEG标准,其中ISO CDlll72-3作为“MPEG音频”标准,成为国际上公认的高保真立体声音频压缩标准。MPEG音频第一层和第二层编码是将输入的音频信号进行采样频率为48kHz、44.1kHz、32kHz的采样,经滤波器组将其分为32个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。MPEG第三层是在上述处理后再引入辅助子带、非均匀量化和熵编码技术,再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32~448Kbps,适合于CD-DA光盘应用。(2)MP3压缩技术MP3的全名是MPEG Audio Layer-3,简单地说就是一种声音文件的压缩格式。1987年,德国的研究机构IIS(Institute Integrierte Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做EUREKA EUl47,即MP3的前身。之后,这项计划由IIS与Erlangen大学共同合作,开发出一套非常强大的算法。经由150国际标准组织认证之后,符合ISO-MPEG Audio Layer-3标准,就成为现在的MP3。ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案(Perceptual Coding Schemes),按照压缩质量(每bit的声音效果)和编码方案的复杂程度划分为Layer 1、Layer 2、Layer 3。所有这三层的编码采用的基本结构是相同的,在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论,也就是通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,利用滤波器找出噪音电平(Noise Level),然后滤去人耳不敏感的信号,通过矩阵量化的方式将余下的数据每一位打散排列,最后编码形成MPEG的文件。其音质听起来与CD相差不大。MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。以CD音质的Wave文件来说,如采样频率44.1kHz,量化为16bit,,声音模式为立体声,那么存储1秒钟CD音质的Wave文件,必须要用16bit*44100Hz*2 Stereo=l411200bit,也就是相当于1411.2Kb的存储容量,存储介质的负担相当大。不过通过MP3格式压缩后,文件便可压缩为原来的1/10~1/12,每1秒钟CD音质的MP3文件只需112~128Kb就可以了。具体的MPEG的压缩等级与压缩比率,声音品质与MP3压缩比例关系,参见下表。
MPEG的压缩等级与压缩比率
MPEG编码等级
数字流码率/Kbps
声音品质与MP3压缩比例关系
比特率/Kbps
好于调幅广播
类似调频广播
(3)MP4压缩技术MP4并不是MPEG-4或者MPEG Layer 4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。从技术上讲,MP4使用的是MPEG-2 AAC技术,也就是俗称的a2b或AAC。其中,MPEG-2是MPEG于1994年11月针对数码电视(数码影像)提出的。它的特点是,音质更加完美而压缩比更加大(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)在采样率为8~96kHz下提供了l~48个声道可选范围的高质量音频编码。AAC是Advanced Audio Coding,即先进音频编码,适用于从比特率在8Kbps单声道的电话音质到160Kbps多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码/解码。AAC与MP3相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美地再现CD音质。MP4技术的优越性要远远高于MP3,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,MP4是一种商品,它利用改良后的MPEG-2 AAC技术并强加上由出版公司直接授权的知识产权协议作为新的标准;而MP3是一种自由音乐格式,任何人都可以自由使用。此外,MP4实际上是由音乐出版界联合授意的官方标准;MP3则是广为流传的民间标准。相比之下,MP3的灵活度和自由度要远远大于MP4,这使得音乐发烧友们更倾向于使用MP3。更重要的一点是,MP3是目前最为流行的一种音乐格式,它占据着大量的网络资源,这使得MP4的推广普及难上加难。从长远来看,MP4流行是迟早的事(指其优越的技术性)。但是,如果MP4不改进其技术构成(即强加的版权信息)的话,那么,自由的MP3在使用了MPEG-2 AAC技术后,胜负就很明显了。
数字音频的压缩编码与编码标准
1.数字音频压缩编码概述将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中,一般需要对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,以减少音频的数据量,并以这种形式在计算机内传输和存储。在播放这些声音时,需要经解码器将二进制编码恢复成原来的声音信号播放。声音信号能进行压缩编码的基本依据主要有3点:(1)声音信号中存在着很大的冗余度,通过识别和去除这些冗余度,便能达到压缩的目的。(2)音频信息的最终接收者是人,人的视觉和听觉器官都具有某种不敏感性。舍去人的感官所不敏感的信息对声音质量的影响很小,在有些情况下,甚至可以忽略不计。例如,人耳听觉中有一个重要的特点,即听觉的“掩蔽”。它是指一个强音能抑制一个同时存在的弱音的听觉现象。利用该性质,可以抑制与信号同时存在的量化噪音。(3)对声音波形采样后,相邻采样值之间存在着很强的相关性。按照压缩原理的不同,声音的压缩编码可分为3类,即波形编码、参数编码和混合型编码。(1)波形编码这种方法主要利用音频采样值的幅度分布规律和相邻采样值间的相关性进行压缩,目标是力图使重构的声音信号的各个样本尽可能地接近于原始声音的采样值。这种编码保留了信号原始采样值的细节变化,即保留了信号的各种过渡特征,因而复原的声音质量较高。波形编码技术有脉冲编码调制(PCM)、自适应增量调制(ADM)和自适应差分脉冲编码调制(ADPCM)等。(2)参数编码参数编码是一种对语音参数进行分析合成的方法。语音的基本参数是基音周期、共振峰、语音谱、声强等,如能得到这些语音基本参数,就可以不对语音的波形进行编码,而只要记录和传输这些参数就能实现声音数据的压缩。这些语音基本参数可以通过分析人的发音器官的结构及语音生成的原理,建立语音生成的物理或数学模型通过实验获得。得到语音参数后,就可以对其进行线性预测编码(Linear Predictive Coding,LPC)。(3)混合型编码混合型编码是一种在保留参数编码技术的基础上,引用波形编码准则去优化激励源信号的方案。混合型编码充分利用了线性预测技术和综合分析技术,其典型算法有:码本激励线性预测(CELP)、多脉冲线性预测(MP-LPC)、矢量和激励线性预测(VSELP)等。波形编码可以获得很高的声音质量,因而在声音编码方案中应用较广。下面介绍波形编码方案中常用的PCM编码。2.脉冲编码调制PCM(1)编码原理PCM脉冲编码调制是对连续语音信号进行空间采样、幅度值量化及用适当码字将其编码的总称,即它把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储,原理框图如图2-1-4所示。在图2-1-4中,它的输入是模拟声音信号,输出是PCM样本。图中的“防失真滤波器”是一个低通滤波器,用来滤除声音频带以外的信号;“波形编码器”可暂时理解为“采样器”;“量化器”可理解为“量化阶大小”(Step—Size)生成器或者称为“量化间隔”生成器。
图2-1-4 PCM原理框图
从模拟声音信号到声音信号的数字化,这中间是一个声音信号的处理过程。模拟声音信号的数字化一般有2个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值,可以采用均匀量化、非均匀量化和自适应量化等方式。PCM方法可以按量化方式的不同,分为均匀量化PCM、非均匀量化PCM和自适应量化PCM等几种。(2)均匀量化如果采用相等的量化间隔对采样得到的信号进行量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图2-1-5所示。均匀量化PCM就是直接对声音信号作A/D转换,在处理过程中没有利用声音信号的任何特性,也没有进行压缩。该方法将输入的声音信号的振幅范围分成2B个等份(B为量化的二进制位数),所有落入同一等份数的采样值都编码成相同的B位二进制码。只要采样频率足够大,量化位数也适当,便能获得较高的声音信号数字化效果。为了满足听觉上的效果,均匀量化PCM必须使用较多的量化位数,这样所记录和产生的音乐,可以达到最接近原声的效果。当然提高采样率及分辨率,将造成储存数据空间的增大。
图2-1-5 均匀量化
为了适应幅度大的输人信号,同时又要满足精度要求,就需要增加样本的位数。但是,对话音信号来说,大信号出现的机会并不多,增加的样本位数没有充分利用。为了克服这个不足,出现了非均匀量化的方法,这种方法也叫做非线性量化。(3)非均匀量化非线性量化的基本想法是,对输人信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图2-1-6所示。这样就可以在满足精度要求的情况下,用较少的位数来表示。声音数据还原时,采用相同的规则。
图2-1-6 非均匀量化
3.音频编码标准(1)ITU-T G系列声音压缩标准随着数字电话和数据通信容量日益增长的迫切要求,而又不希望明显降低传送话音信号的质量,除了提高通信带宽之外,对话音信号进行压缩是提高通信容量的重要措施。另一个可说明话音数据压缩的重要性的例子是,用户无法使用28.8Kbps的调制解调器来接收因特网上的64Kbps话音数据流,这是一种单声道、8位、采样频率为8kHz的话音数据流。ITU-TSS为此制定了并且继续制定一系列话音(Speech)数据编译码标准。其中,G.711使用μ率和A率压缩算法,信号带宽为3.4kHz,压缩后的数据率为64Kbps;G.721使用ADPCM压缩算法,信号带宽为3.4kHz,压缩后的数据率为32Kbps;G.722使用ADPCM压缩算法,信号带宽为7kHz,压缩后的数据率为64Kbps。在这些标准基础上还制定了许多话音数据压缩标准,如G.723、G.723.1、G.728、G.729、G.729.A等。在此简要介绍以下几种音频编码技术标准:①电话质量的音频压缩编码技术标准电话质量语音信号频率规定在300Hz~3.4kHz,采用标准的脉冲编码调制PCM。当采样频率为8kHz,进行8bit量化时,所得数据速率为64Kbps,即一个数字电话。1972年,CCITT制定了PCM标准C.711,速率为64Kbps,采用非线性量化,其质量相当于12bit线性量化。1984年,CCITT公布了自适应差分脉冲编码调制ADPCM标准G.721,速率为32Kbps。这一技术是对信号和它的预测值的差分信号进行量化,同时再根据邻近差分信号的特性自适应改变量化参数,从而提高压缩比,又能保持一定信号质量。因此,ADPCM对中等电话质量要求的信号能进行高效编码,而且可以在调幅广播和交互式激光唱盘音频信号压缩中应用。为了适应低速率语音通信的要求,必须采用参数编码或混合编码技术,如线性预测编码LPC,矢量量化VQ,以及其他的综合分析技术。其中较为典型的码本激励线性预测编码CELP实际上是一个闭环LPC线性预测编码系统,由输入语音信号确定最佳参数,再根据某种最小误差准则从码本中找出最佳激励码本矢量。CELP具有较强的抗干扰能力,在4Kbps~16Kbps传输速率下,即可获得较高质量的语音信号。1992年,CCITT制定了短时延码本激励线性预测编码LD-CELP的标准G.728,速率16Kbps,其质量与32Kbps的G.721标准基本相当。1988年,欧洲数字移动特别工作组制定了采用长时延线性预测规则码本激励RPE-LTP标准GSM,速率为13Kbps。1989年,美国采用矢量和激励线性预测技术VSELP,制定了数字移动通信语音标准CTIA,速率为8Kbps。为了适应保密通信的要求,美国国家安全局NSA分别于1982年和1989年制定了基于LPC,速率为2.4bps和基于CELP,速率为4.8Kbps的编码方案。②调幅广播质量的音频压缩编码技术标准调幅广播质量音频信号的频率在50Hz~7kHz范围。CCITT在1988年制定了G.722标准。G.722标准是采用16kHz采样,14bit量化,信号数据速率为224Kbps,采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编码,再混合形成输出码流,224Kbps可以被压缩成64Kbps。因此,利用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。③高保真度立体声音频压缩编码技术标准高保真立体声音频信号频率范围是50Hz~20kHz,采用44.1kHz采样频率,16bit量化进行数字化转换,其数据速率每声道达705Kbps。1991年,国际标准化组织ISO和CCITT开始联合制定MPEG标准,其中ISO CDlll72-3作为“MPEG音频”标准,成为国际上公认的高保真立体声音频压缩标准。MPEG音频第一层和第二层编码是将输入的音频信号进行采样频率为48kHz、44.1kHz、32kHz的采样,经滤波器组将其分为32个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。MPEG第三层是在上述处理后再引入辅助子带、非均匀量化和熵编码技术,再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32~448Kbps,适合于CD-DA光盘应用。(2)MP3压缩技术MP3的全名是MPEG Audio Layer-3,简单地说就是一种声音文件的压缩格式。1987年,德国的研究机构IIS(Institute Integrierte Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做EUREKA EUl47,即MP3的前身。之后,这项计划由IIS与Erlangen大学共同合作,开发出一套非常强大的算法。经由150国际标准组织认证之后,符合ISO-MPEG Audio Layer-3标准,就成为现在的MP3。ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案(Perceptual Coding Schemes),按照压缩质量(每bit的声音效果)和编码方案的复杂程度划分为Layer 1、Layer 2、Layer 3。所有这三层的编码采用的基本结构是相同的,在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论,也就是通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,利用滤波器找出噪音电平(Noise Level),然后滤去人耳不敏感的信号,通过矩阵量化的方式将余下的数据每一位打散排列,最后编码形成MPEG的文件。其音质听起来与CD相差不大。MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。以CD音质的Wave文件来说,如采样频率44.1kHz,量化为16bit,,声音模式为立体声,那么存储1秒钟CD音质的Wave文件,必须要用16bit*44100Hz*2 Stereo=l411200bit,也就是相当于1411.2Kb的存储容量,存储介质的负担相当大。不过通过MP3格式压缩后,文件便可压缩为原来的1/10~1/12,每1秒钟CD音质的MP3文件只需112~128Kb就可以了。具体的MPEG的压缩等级与压缩比率,声音品质与MP3压缩比例关系,参见下表。
MPEG的压缩等级与压缩比率
MPEG编码等级
数字流码率/Kbps
声音品质与MP3压缩比例关系
比特率/Kbps
好于调幅广播
类似调频广播
(3)MP4压缩技术MP4并不是MPEG-4或者MPEG Layer 4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。从技术上讲,MP4使用的是MPEG-2 AAC技术,也就是俗称的a2b或AAC。其中,MPEG-2是MPEG于1994年11月针对数码电视(数码影像)提出的。它的特点是,音质更加完美而压缩比更加大(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)在采样率为8~96kHz下提供了l~48个声道可选范围的高质量音频编码。AAC是Advanced Audio Coding,即先进音频编码,适用于从比特率在8Kbps单声道的电话音质到160Kbps多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码/解码。AAC与MP3相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美地再现CD音质。MP4技术的优越性要远远高于MP3,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,MP4是一种商品,它利用改良后的MPEG-2 AAC技术并强加上由出版公司直接授权的知识产权协议作为新的标准;而MP3是一种自由音乐格式,任何人都可以自由使用。此外,MP4实际上是由音乐出版界联合授意的官方标准;MP3则是广为流传的民间标准。相比之下,MP3的灵活度和自由度要远远大于MP4,这使得音乐发烧友们更倾向于使用MP3。更重要的一点是,MP3是目前最为流行的一种音乐格式,它占据着大量的网络资源,这使得MP4的推广普及难上加难。从长远来看,MP4流行是迟早的事(指其优越的技术性)。但是,如果MP4不改进其技术构成(即强加的版权信息)的话,那么,自由的MP3在使用了MPEG-2 AAC技术后,胜负就很明显了。将量化后的数字声音信息直接存入计算机将会占用大量的存储空间。在多媒体音频信号处理中,一般需要对数字化后的声音信号进行压缩编码,使其成为具有一定字长的二进制数字序列,以减少音频的数据量,并以这种形式在计算机内传输和存储。在播放这些声音时,需要经解码器将二进制编码恢复成原来的声音信号播放。声音信号能进行压缩编码的基本依据主要有3点:(1)声音信号中存在着很大的冗余度,通过识别和去除这些冗余度,便能达到压缩的目的。(2)音频信息的最终接收者是人,人的视觉和听觉器官都具有某种不敏感性。舍去人的感官所不敏感的信息对声音质量的影响很小,在有些情况下,甚至可以忽略不计。例如,人耳听觉中有一个重要的特点,即听觉的“掩蔽”。它是指一个强音能抑制一个同时存在的弱音的听觉现象。利用该性质,可以抑制与信号同时存在的量化噪音。(3)对声音波形采样后,相邻采样值之间存在着很强的相关性。按MP3压缩技术MP3的全名是MPEG Audio Layer-3,简单地说就是一种声音文件的压缩格式。1987年,德国的研究机构IIS(Institute Integrierte Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做EUREKA EUl47,即MP3的前身。之后,这项计划由IIS与Erlangen大学共同合作,开发出一套非常强大的算法。经由150国际标准组织认证之后,符合ISO-MPEG Audio Layer-3标准,就成为现在的MP3。ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案(Perceptual Coding Schemes),按照压缩质量(每bit的声音效果)和编码方案的复杂程度划分为Layer 1、Layer 2、Layer 3。所有这三层的编码采用的基本结构是相同的,在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论,也就是通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,利用滤波器找出噪音电平(Noise Level),然后滤去人耳不敏感的信号,通过矩阵量化的方式将余下的数据每一位打散排列,最后编码形成MPEG的文件。其音质听起来与CD相差不大。MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。以CD音质的Wave文件来说,如采样频率44.1kHz,量化为16bit,,声音模式为立体声,那么存储1秒钟CD音质的Wave文件,必须要用16bit*44100Hz*2 Stereo=l411200bit,也就是相当于1411.2Kb的存储容量,存储介质的负担相当大。不过通过MP3格式压缩后,文件便可压缩为原来的1/10~1/12,每1秒钟CD音质的MP3文件只需112~128Kb就可以了。MP4压缩技术MP4并不是MPEG-4或者MPEG Layer 4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。从技术上讲,MP4使用的是MPEG-2 AAC技术,也就是俗称的a2b或AAC。其中,MPEG-2是MPEG于1994年11月针对数码电视(数码影像)提出的。它的特点是,音质更加完美而压缩比更加大(1:15)。MPEG-2 AAC(ISO/IEC 13818-7)在采样率为8~96kHz下提供了l~48个声道可选范围的高质量音频编码。AAC是Advanced Audio Coding,即先进音频编码,适用于从比特率在8Kbps单声道的电话音质到160Kbps多声道的超高质量音频范围内的编码,并且允许对多媒体进行编码/解码。AAC与MP3相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美地再现CD音质。MP4技术的优越性要远远高于MP3,因为它更适合多媒体技术的发展以及视听欣赏的需求。但是,MP4是一种商品,它利用改良后的MPEG-2 AAC技术并强加上由出版公司直接授权的知识产权协议作为新的标准;而MP3是一种自由音乐格式,任何人都可以自由使用。此外,MP4实际上是由音乐出版界联合授意的官方标准;MP3则是广为流传的民间标准。相比之下,MP3的灵活度和自由度要远远大于MP4,这使得音乐发烧友们更倾向于使用MP3。更重要的一点是,MP3是目前最为流行的一种音乐格式,它占据着大量的网络资源,这使得MP4的推广普及难上加难。从长远来看,MP4流行是迟早的事(指其优越的技术性)。但是,如果MP4不改进其技术构成(即强加的版权信息)的话,那么,自由的MP3在使用了MPEG-2 AAC技术后,胜负就很明显了。
&&&&专家指数:43&&&&
采样是指用每隔一定时间的信号样值序列来代替原来在时间上连续的信号,也就是在时间上将模拟信号离散化.量化是用有限个幅度值近似原来连续变化的幅度值,把模拟信号的连续幅度变为有限数量的有一定间隔的离散值.编码则是按照一定的规律,把量化后的值用二进制数字表示.
把模拟信号转换成数字信号的过程称为模/数转换,它主要包括:
采样:在时间轴上对信号数字化;
量化:在幅度轴上对信号数字化;
编码:按一定格式记录采样和量化后的数字数据。
采样频率是指一秒钟内采样的次数。奈奎斯特(Harry Nyquist)采样理论:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半,或者说只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列重构原始信号。
根据该采样理论,CD激光唱盘采样频率为44KHz,可记录的最高音频为22KHz,这样的音质与原始声音相差无几,也就是我们常说的超级高保真音质(Super High Fidelity-HiFi)。采样的三个标准频率分别为:44.1KHz,22.05KHz和11.025KHz。
量化位是对模拟音频信号的幅度轴进行数字化,它决定了模拟信号数字化以后的动态范围。由于计算机按字节运算,一般的量化位数为8位和16位。量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需要的存贮空间也越大。
量化位 等份 动态范围(dB) 应用
8 256 48-50 数字电话
有单声道和双声道之分。双声道又称为立体声,在硬件中要占两条线路,音质、音色好,但立体声数字化后所占空间比单声道多一倍。
编码的作用一是采用一定的格式来记录数字数据,二是采用一定的算法来压缩数字数据。压缩编码的基本指标之一就是压缩比:
压缩比通常小于1。压缩算法包括有损压缩和无损压缩;有损压缩指解压后数据不能完全复原,要丢失一部分信息。压缩比越小,丢掉的信息越多、信号还原后失真越大。根据不同的应用,可以选用不同的压缩编码算法,如PCM,ADPC,MP3,RA等等。
数据率=采样频率(Hz)×量化位数(bit)×声道数(bit/s)
&&&&专家指数:20728&&&&
相关资料下载
<font color="#5人关注
<font color="#22人关注
<font color="#1人关注
<font color="#1人关注
<font color="#73人关注
<font color="#29人关注
<font color="#74人关注
<font color="#88人关注
<font color="#6人关注
<font color="#05人关注
聘: 需求人数:3 人
地点:汕尾市,阳江市,云浮市,肇庆市,佛山市
聘: 需求人数:2 人
地点:晋中市
聘: 需求人数:4 人
地点:海外
聘: 需求人数:10 人
地点:兰州市
聘: 需求人数:2 人
地点:铜川市
聘: 需求人数:1 人
地点:北京市
聘: 需求人数:5 人
地点:福建省
聘: 需求人数:50 人
地点:乐山市,雅安市,泸州市,凉山彝族自治州,眉山市
聘: 需求人数:1 人
地点:海外
聘: 需求人数:1 人
地点:大理市
赞助商链接
Powered by}

我要回帖

更多关于 模拟通信 数字通信 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信