语音差分信号传输原理的传输，识别和控制有什么特点

点击联系发帖人 时间：2016-04-20 08:53

420ma信号传输距离

二、ADPCM的国际标准
采用ADPCM作为长途传输中的一种新的国际通用语音编码方案。这种ADPCM可达到标准64kbit/sPCM的语音传输质量，并具有很好的抗误码性能。
三、增量调制（DM）定义
DM是一种特殊简化的DPCM，是一种极限情况，只用1bit的量化器。最大的特点是简单，易于实现。
五、斜率过载和颗粒噪声
1、斜率过载：在DM中，与量化阶梯Δ相比，当语音波形幅度发生急剧变化时，译码波形不能充分跟踪这种急剧变化而必然产生失真，称为斜率过载。
2、噪声颗粒：在没有输入语音的无声状态时，或者是信号幅度为固定值时，量化输出都将呈现0、1交替的序列，而译码后的波形只是Δ的重复增减，这种噪声称为颗粒噪声。
自适应增量调制ADM是克服斜率过载和颗粒噪声最理想的方法。
六、自适应增量调制ADM的定义
根据输入语信号的幅度或方差变化的信息自适应的改变Δ值。即：在语音信号的幅度变化不大时，取较小的Δ值以减小颗粒噪声；在语音信号幅度变化大时，取较大的Δ值以减小斜率过载失真。
§10.6 子带编码（SBC）
一、频域编码的两个基本原则
1、通过合适的滤波或变换，在频域上得到数目较少、相关性较小的分量，从而提高编码效率；
2、接受者所感知的失真信息是用来提高语音编码的性能。
二、子带编码的概念与实现
SBC也称为频带分割编码，是在频域上寻求语音压缩途径的编码方法。它不对信号进行直接变换，而是首先使
用带通滤波器组将语音信号分割成若干个子带，用调制的方法对滤波后的信号进行频谱平移变成低通信号，再利用奈奎斯特速率对其进行取样，最后进行编码处理。
三、SBC的优点
SBC的优点是对应于人的听觉特性，可以比较容易地考虑噪声的抑制：即各子带可以选用不同的量化参数以分别控制其信噪比，满足主观听觉的要求。量化噪声只能出现在各被分割的频带内，对其他频带没有任何影响，可以较轻易地控制噪声谱。
四、正交镜像滤波法QMF的特点：上子带滤波器的频率响应是下子带滤波器频率响应的镜像。
§10.7 自适应变换编码（ATC）
一、变换编码TC、自适应变换编码ATC的基本概念（大纲）
变换编码是一种优秀的高质量的语音压缩编码方法，它将时域的语音信号变换到频域，变换后的数值表示信号中不同频率分量的强度，然后将这些变换系数按照比特分配的结果进行量化编码。
自适应变换编码是一种变换编码，它与SBC一样，也是在频域上寻求语音压缩的途径，是在频域上分割信号的编码方式，但比SBC增加了相当大的自由度。这种方法是对信号进行正交变换以降低信号相邻样本间的冗余度。
二、DCT和KLT的定义及比较
DCT：离散余弦变换 KLT：简称为卡洛变换 DCT具有的优点：
1、DCT与KLT相比，频域变换明确，与人的听觉频率分析机理相对应，容易控制噪声的频率范围。
2、DCT提供的性能一般在KLT的1-2dB之内，KLT计算量大。
3、DCT运算量少、数据量少，无需传输特征矢量。 4、DCT比DFT变换效率高。
5、DCT与DFT相比，在端点取出波形的影响较小，在频域区的畸变小。
Ch11 语音编码（2）――声码器技术及混合编码
§11.1 概述
一、语音参数编码、声码器的基本概念
1、语音参数编码通过对语音信号的参数进行提取
及编码，力图使重建语音信号具有尽可能高的可懂度，即保持原语音的语意。这类编码的优点是编码率低，可低至2.4kbit/s以下。
2、参数编码的基础是语音产生的数学模型。实现参数编码的器件称为声码器，主要用于窄带信道的语音通信。
3、为了充分发挥声码器的性能而必须的三个重要因素：
（1）去掉语音波形中的冗余部分，提取对于听觉所需的重要参数。
（2）对参数进行有效编码。
（3）根据编码的参数，尽可能忠实地将语音还原出来。
§11.2 声码器的基本结构
一、声码器的基本结构及实现过程
1、声码器的基本结构包括分析和合成两部分。 2、实现过程：语音信号经过分析得到谱包络和基音以及清浊音判别，编码后送入信道传输；在接收端，压缩后的语音由合成器加以恢复。
二、声码器的局限
1、由于声道滤波器阶数有限，因而合成的语音的频谱精度收到一定限制。
2、浊音激励是规则的准周期脉冲，含有语音中将会出现的人为规则的特性。
3、采用了清浊音二元判决，或产生纯粹的清音，或产生纯粹的浊音，与实际的语音有区别。
4、语音合成模型中参数更新的速率受到限制。 5、语音合成器中的激励源只有两个，每次只能产生一个音。
三、目前常用的声码器包括：通道声码器、共振峰声码器和LPC声码器。
§11.5 线性预测声码器
一、LPC参数的变换和量化包括：反射系数、对数面积比和预测多项式的根。
二、为什么要对反射系数进行量化
对反射系数的研究表明，各反射系数幅度值的分布是不相同的：k1和k2的分布是非对称，对于多数浊音信号，k1接近于-1，k2接近于+1；而较高阶次的反射系数
k3、k4等趋向于均值为零的高斯分布。此外，反射系数的谱灵敏度也是非均匀的，其值接近于1时，谱的灵敏度越高，此时反射系数很小的变化将导致信号频谱的较大偏移。
上面的分析表明，对反射系数的值在（-1，+1）区间作线性量化是低效的，一般都是进行非线性量化。
§11.6 混合编码
一、混合编码的概念（大纲）
混合编码是波形编码和声码器两种优点的结合：既利用了语音生成模型，通过对模型中的参数进行编码，减少了波形编码中被编码对象的动态范围或数目；又使编码的过程产生接近原始语音波形的合成语音，以保留说话人的各种自然特征，提高了合成语音质量。
二、混合编码包括：多脉冲线性预测声码器（MPLPC）和码激励线性预测编码（CELP）。前者是使用一个数目有限、幅度和位Z可调整的脉冲序列作为激励源；后者是使用一个波形码矢量作激励源，它通常从高斯白噪声序列构成的码本中选取。
三、MPLPC与CELP的特点
MPLPC具有LPC和ADPCM的预测编码结构，采用感知加权进行设定，通过改进激励模型提高LPC的性能，采用几个脉冲作为一个语音帧的激励信号；脉冲数量事先选好，但需考虑复杂性和语音音质。
CELP的目的是将MPLPC中使用的混合编码方法扩展到低比特范围，它是中低速率编码中最成功的一种方案，它以高质量的合成语音及优良的抗噪声和多次转接性能，在9.6kbit/s以下的速率中得到了广泛的应用。
两者的区别：CELP是从矢量激励码本中选择激励信号，然后激励合成系统产生最优合成声音。而MPLPC是通过一个迭代算法，在给定脉冲总数的情况下，寻找能产生最优合成语音的脉冲位Z和幅度。
CELP和MPLPC的区别仅在于激励部分是不同的。
§11.7 各种语音编码方法的比较及语音编码研究方向一、波形编码和声码器优缺点的比较
在波形编码中，利用语音振幅的分布特性对波形作PCM量化处理，当数码率为64kbit/s时能获得高质量的语音。利用波形相关性及频谱特性，可将数码率压缩到
24-32kbit/s。进一步利用音调结构的同时，若进行噪声整形，可以压缩到9.6kbit/s左右，如果数码率继续降低，则语音质量将急剧恶化。
对于声码器，数码率可降低到虽然信息量很多，但由于在性能方面存在着本质上的极限，所以合成语音质量远不如波形编码。在4.8-9.6kbit/s的范围内，将波形编码和声码器的优点结合，可得到MPLPC等。具体参见P170图11-1
二、声码器的比较具体参见P170图11-2
§11.8 语音编码的性能指标和质量评价
一、语音编码的基本性能指标包括编码速率和顽健性。
编码速率：又称比特率，是指一个编码器的信息速率。
顽健性：通过取多种不同来源的语音信号进行编码解码，并对输出语音质量进行比较测试得到的一种指标。
二、编码器的质量评价方法，包括主观评价法和客观评价法。
客观评价准则：信噪比和谱失真测度。主观评价准则：通过人的感觉器官来测试。
三、可懂度与自然度
语音编码后，其再生语音质量包括可懂度和自然度。
可懂度：是衡量语音中的字、单词和句的可懂程度，反映了对语音输出内容的识别程度。
自然度：指语音听起来有多自然，听起来像是机器发出的，不能辨认出说话人是谁。
四、常用的几种语音主观评价标准包括：平均评价测试法MOS、押韵测试DRT和可接受程度测试DAM。
不同编码对应的MOS值 1、64kbit/s PCM――4.2 2、32kbit/s ADPCM――4.0 3、4.8kbit/s CELP――3.2 4、2.4kbit/s LPC声码器――2.2
Ch12 语音编码（2）――声码器技术及混合编码
§12.1 概述
一、语音合成的概念
由人工制作出来的语音称为语音合成，即由机器产生出声音，它是人机语声通信的重要组成部分。
二、用语音合成来传递语言的优点
1、不用特别注意和专门训练，任何人都可以理解。 2、可以直接使用电话网和电话机。 3、无需消耗纸张等资源
三、语音合成技术的两个关键性能
一是正确，一是自然。
§12.2 语音合成原理
一、语音合成的三个基本方法
1、语音合成的三种基本方法：波形合成法、参数合成法和规则合成法。
2、波形合成法、参数合成法和规则合成法的概念（1）波形合成法：把人发音的语音波形直接存储或者进行波形编码后存储，根据需要编辑组合输出。
（2）参数合成法：也称分析-合成法，采用声码器技术，是一种比较复杂的方法。
（3）规则合成法：通过语音学规则产生语音。 3、波形合成法、参数合成法和规则合成法三者在波形、特征参数、语言的符号组合方面的比较
具体参见P177表12-1
Ch13 语音识别 §13.1 概述
一、语音识别的概念
语音识别是语音链中的一环，它是研究使机器能准确地听出人的语音内容的问题，即准确地识别所说的话。
二、用语音识别的优点
1、语音是人们最自然、最方便的交互工具，不需要作专门训练；
2、操作简单，使用方便； 3、语音的反应速度快；
4、同时利用手、脚等，在进行其他工作的同时兼顾周围动作来输入信息；
5、在输入终端可使用麦克风等，非常经济，可直接利用电话网遥控输入信息。
三、语音识别的7种分类方法
1、从所要识别的单位来分：孤立单词语音识别、
选词语音识别、连续语音识别、语音理解。
2、从识别的用词量来分：小词汇（10-50个）、中词汇（50-200个）、大词汇（200个以上）。
3、从讲话人的范围来分：单个特定讲话人、多讲话人、与讲话者无关。
4、从识别的方法分：模板匹配法、随机模型法、概率语法分析法。
（1）模板匹配法：将测试语音与模板的参数一一进行比较与匹配，判决的依据是失真测度最小准则。
（2）随机模型法：一种是用HMM的概率参数来对似然函数进行估计与判决，从而得到识别结果的方法。
（3）概率语法分析法：利用连续语言中的形式语法约束的知识来对似然函数进行估计和判决。
5、从识别的环境分：隔音室、计算机房、公共场合。
6、从传输系统分：高质量话筒、电话、近讲话筒。 7、从说话人的类型分：男声、女声、儿童声。
四、语音识别中存在的几个主要问题
1、语音识别的一种重要应用时自然语言的识别和理解。
2、语音信息的变化很大。 3、语音的模糊性。
4、单个字母及单个词语发音时语音特性受上下文化境的影响，使相同字母有不同的语音特性。
5、环境的噪声和干扰对语音识别有严重影响。
§13.2 语音识别原理
一、根据比较输入模式与标准模式方法不同，模式识别被分为模式匹配法、统计模式识别和句法模式识别。
二、语音识别的两个步骤
第一步是学习或训练；第二步是识别。
三、模板匹配法的三个基本单元
模板匹配法包括三个基本单元：特征提取、模式匹配、参考模式库。
四、语音识别的原理框图（图13-1看懂）
1、预处理：包括反混叠滤波、模/数变换、自动增益控制、去除声门激励及口唇辐射的影响。
2、特征提取：特征提取的基本思想是将信号通过一次变换，去掉冗余部分，而将代表语音本质的特征参数提取出来。特征提取是模式识别的关键问题。
3、距离测度：用于语音识别的测度有多种，包括欧式距离及其变形的距离、似然比测度、加权超音段信息的识别测度等。
4、参考模式库：用训练与聚类的方法，由单讲话或多讲话者的多次重复的语音参数，从原始语音样本中去除冗余信息，保留关键数据，经过长时间的训练，再按照一定规则对数据加以聚类得到。
5、训练与识别方法：语音训练和识别方法很多，如DTW、VW、HMM等。测度估计是语音识别的核心，经典的方法有三种：DTW法、HMM法、VQ法。
6、专家知识库：用来存储各种语言学知识。语音信号处理作业9_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
语音信号处理作业9
上传于||文档简介
&&语音信号处理作业9
阅读已结束，如果下载本文需要使用2下载券
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩3页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢}

常信村百科网