第六讲-VQ语音信号处理第章

上传人:枫** 文档编号:584960611 上传时间:2024-09-01 格式:PPT 页数:33 大小:647.50KB
返回 下载 相关 举报
第六讲-VQ语音信号处理第章_第1页
第1页 / 共33页
第六讲-VQ语音信号处理第章_第2页
第2页 / 共33页
第六讲-VQ语音信号处理第章_第3页
第3页 / 共33页
第六讲-VQ语音信号处理第章_第4页
第4页 / 共33页
第六讲-VQ语音信号处理第章_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《第六讲-VQ语音信号处理第章》由会员分享,可在线阅读,更多相关《第六讲-VQ语音信号处理第章(33页珍藏版)》请在金锄头文库上搜索。

1、1.1.矢量量化基本原理矢量量化基本原理v量化分为两类:量化分为两类: * * 标量量化标量量化:将取样后的信号值逐个地进行量化。:将取样后的信号值逐个地进行量化。 * * 矢量量化矢量量化:将若干取样信号分成一组,即构成一:将若干取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。个矢量,然后对此矢量一次进行量化。v矢量量化(矢量量化(VQVQ,Vector QuantizationVector Quantization)是一种极其是一种极其重要的信号压缩方法。重要的信号压缩方法。VQVQ在语音信号处理中占十分在语音信号处理中占十分重要的地位。广泛应用于语音编码、语音识别和语重要的地

2、位。广泛应用于语音编码、语音识别和语音合成等领域。音合成等领域。v凡是要用量化的地方都可以采用矢量量化凡是要用量化的地方都可以采用矢量量化。VQ的定义vK维欧几里德空间 中的任意矢量 X 到K维空间 有限子集 Y 的映射术语v码本 Codebookv码字 CodeWordv码本大小 Codebook SizevVoronoi Cell 胞腔v矢量量化简约历史矢量量化简约历史早在早在5050和和6060年代就被用于语音压缩编码。年代就被用于语音压缩编码。7070年代线性预测技术被引入语音编码后,矢量量年代线性预测技术被引入语音编码后,矢量量化技术才活跃起来。化技术才活跃起来。7070年代末,年代

3、末,Linda, Buzo Linda, Buzo 等人解决了码本生成问等人解决了码本生成问题题8080年代初,矢量量化技术的理论和应用研究得到年代初,矢量量化技术的理论和应用研究得到迅速发展。迅速发展。v采用矢量量化的压缩作用采用矢量量化的压缩作用对信号波形或参数进行压缩处理,可以获得很对信号波形或参数进行压缩处理,可以获得很好的效益,使存储要求、传输比特率需求或和好的效益,使存储要求、传输比特率需求或和计算量需求降低计算量需求降低. .量化压缩案例量化压缩案例10KHz, 16-bit PCM 160,000bps100 spectral vectors of dimension p=10

4、 1001032 = 32,000bps 51VQ: 1024 codebook 10010 = 1000bps 321采用矢量量化的效果优于标量量化的原因?采用矢量量化的效果优于标量量化的原因?矢量量化能有效的应用矢量中各分量之矢量量化能有效的应用矢量中各分量之间的四种相互关联性质来消除数据中的冗间的四种相互关联性质来消除数据中的冗余度。余度。线性依赖线性依赖( (相关性相关性) )非线性依赖非线性依赖( (统计不独立统计不独立) )概率密度函数的形状概率密度函数的形状矢量量化的维数矢量量化的维数而标量量化仅能利用线性依赖和概率密而标量量化仅能利用线性依赖和概率密度函数的形状来消除冗余度。度

5、函数的形状来消除冗余度。矢量量化研究的目的?矢量量化研究的目的? 针对特定的信息源和矢量维数,设计针对特定的信息源和矢量维数,设计出一种最优化的量化器,在出一种最优化的量化器,在R(量化速率)(量化速率)一定的情况下,给出的量化失真尽可能一定的情况下,给出的量化失真尽可能接近接近D(R)(最小量化失真最小量化失真)。矢量量化的形象说明矢量量化的形象说明 以以K K2 2进行说明进行说明: 当当K K2 2时,所得到的是二维矢量。所有可能时,所得到的是二维矢量。所有可能的二维矢量就形成了一个平面。的二维矢量就形成了一个平面。 记为(记为(a a1 1,a,a2 2), ,所有可能的(所有可能的(

6、a a1 1,a,a2 2)就是一个二维空间。如图就是一个二维空间。如图7-17-1(a a)所示)所示图图7-1 7-1 矢量量化概念示意图矢量量化概念示意图图图7-2 7-2 矢量量化系统的组成矢量量化系统的组成 工作过程工作过程:v在编码端在编码端,输入矢量,输入矢量X Xi i与码书中的每一个码字进行与码书中的每一个码字进行比较,分别计算出它们的失真。搜索到失真最小的比较,分别计算出它们的失真。搜索到失真最小的码字码字 的序号的序号 (或该码字所在码书中的地(或该码字所在码书中的地址),这些序号就作为传输或存储的参数。址),这些序号就作为传输或存储的参数。v在恢复时在恢复时,根据此序号

7、从恢复端的码书中找出相应,根据此序号从恢复端的码书中找出相应的码字的码字 。由于两本码书完全相同,此时失真。由于两本码书完全相同,此时失真最小,所以最小,所以 就是输入矢量就是输入矢量X Xi i的重构矢量。的重构矢量。 特点:特点:传输存储的不是矢量本身而是其序号,所以传输存储的不是矢量本身而是其序号,所以据有高保密性能据有高保密性能收发两端没有反馈回路,因此比较稳定收发两端没有反馈回路,因此比较稳定矢量量化器的关键是编码器的设计,译码器矢量量化器的关键是编码器的设计,译码器只是简单的的查表过程。只是简单的的查表过程。VQ的优、劣势v自由构造量化区域的形状v码本大小可随意选择v量化失真v码本

8、存储一、如何划分一、如何划分M M个区域边界个区域边界 方法是:将大量欲处理的信号的矢量进行统计划分,方法是:将大量欲处理的信号的矢量进行统计划分,进一步确定这些划分边界的中心矢量值来得到码书。进一步确定这些划分边界的中心矢量值来得到码书。二、类中心计算方法二、类中心计算方法三、两矢量的相似度测度三、两矢量的相似度测度 这个测度就是两矢量间的距离,或以其中某一矢这个测度就是两矢量间的距离,或以其中某一矢量为基准时的失真度。它描述了当输入矢量用码书量为基准时的失真度。它描述了当输入矢量用码书所对应的矢量来表征时所付出的代价。所对应的矢量来表征时所付出的代价。四、四、如何准备码本训练集如何准备码本

9、训练集 完备性:根据具体应用而定完备性:根据具体应用而定 2. VQ问题分解问题分解 失真测度是矢量量化和模式识别中一个失真测度是矢量量化和模式识别中一个十分重要的问题,选择合适与否直接影响系十分重要的问题,选择合适与否直接影响系统的性能。统的性能。 失真是将输入信号矢量用码书的重构矢量失真是将输入信号矢量用码书的重构矢量来表征时的误差或所付出的代价。这种代价的来表征时的误差或所付出的代价。这种代价的统计平均值(平均失真)描述了矢量量化器的统计平均值(平均失真)描述了矢量量化器的工作性。工作性。3.3. 失真测度失真测度失真度选择必须具备的特性失真度选择必须具备的特性v必须在主观评价上有意义,

10、即小的失真应该对应于必须在主观评价上有意义,即小的失真应该对应于好的主观语音质量;好的主观语音质量;v必须是易于处理的,即在数学上易于实现,这样可必须是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计;以用于实际的矢量量化器的设计;v平均失真存在并且可以计算;平均失真存在并且可以计算;v易于硬件实现易于硬件实现 失真测度主要有均方误差失真测度(即欧氏距失真测度主要有均方误差失真测度(即欧氏距离)、加权的均方误差失真测度、板仓斋藤离)、加权的均方误差失真测度、板仓斋藤(ItakuraItakuraSaitoSaito)距离,似然比失真测度等,还)距离,似然比失真测度等,还有人提

11、出的所谓的有人提出的所谓的“主观的主观的”失真测度。失真测度。一、欧氏距离均方误差一、欧氏距离均方误差 设输入信号的某个设输入信号的某个K K维矢量维矢量X X,与码书中某个,与码书中某个K K维矢量维矢量Y Y进行比较,进行比较,x xi i,y,yi i分别表示分别表示X X和和Y Y中的各元素中的各元素 ,则定义均方误差为欧氏距离:则定义均方误差为欧氏距离: 几种其他常用的欧氏距离:几种其他常用的欧氏距离:1.1.r r方平均误差方平均误差 2. r2. r平均误差平均误差 3.3.绝对值平均误差绝对值平均误差 4.4.最大平均误差最大平均误差 二、线性预测失真测度二、线性预测失真测度

12、用全极模型表示的线性预测方法,广泛应用于语用全极模型表示的线性预测方法,广泛应用于语音信号处理中。它在分析时得到的是模型的预测系数音信号处理中。它在分析时得到的是模型的预测系数. .仅由预测系数的差值,不能完全表征这两个语音信息仅由预测系数的差值,不能完全表征这两个语音信息的差别。应该直接由这些系数所描述的信号模型的功的差别。应该直接由这些系数所描述的信号模型的功率谱来进行比较。率谱来进行比较。 当预测器的阶数当预测器的阶数 ,信号与,信号与模型完全匹配时,信号功率谱为:模型完全匹配时,信号功率谱为:信号的功率谱信号的功率谱预测误差能量预测误差能量预测逆滤波器的频率响应预测逆滤波器的频率响应相

13、应的,设码书中某重构矢量的功率谱为相应的,设码书中某重构矢量的功率谱为则定义则定义Itakura-Saito距离为距离为 这种失真测度是针对线性预测模型、用最这种失真测度是针对线性预测模型、用最大似然准则推导出来,所以特别适用于大似然准则推导出来,所以特别适用于LPC参参数,描述语音信号的情况,常用于数,描述语音信号的情况,常用于LPC编码中。编码中。我们由此又推导出两种线性预测色失真测度,我们由此又推导出两种线性预测色失真测度,他们比上述具有更好的性能,即他们比上述具有更好的性能,即对比似然比失真测度对比似然比失真测度模型失真测度模型失真测度 注:这两种失真测度都仅仅比较两矢量的注:这两种失

14、真测度都仅仅比较两矢量的功率谱,而没有考虑其他能量信息。功率谱,而没有考虑其他能量信息。三、识别失真测度三、识别失真测度失真测度的定义失真测度的定义加权因子加权因子输入信号矢量的归一化能量输入信号矢量的归一化能量码书重构矢量的归一化能量码书重构矢量的归一化能量当两矢量的能量接近时(即当两矢量的能量接近时(即 ),忽略能量差异引起的),忽略能量差异引起的影响;当两矢量能量相差很大时,即进行线性加权;而当能量差超过门限影响;当两矢量能量相差很大时,即进行线性加权;而当能量差超过门限 时,则为固定值时,则为固定值4 . 最佳矢量量化器和码本的设计最佳矢量量化器和码本的设计最佳设计就是使失真最小最佳设

15、计就是使失真最小1、最佳划分、最佳划分2、最佳码书、最佳码书一、矢量量化器最佳设计的两个条件一、矢量量化器最佳设计的两个条件最佳矢量量化器满足的两个必要条件最佳矢量量化器满足的两个必要条件1)Voronoi分割条件(最近邻准则)分割条件(最近邻准则)对信号空间的分割应满足对信号空间的分割应满足根据该条件可以对信号空间进行最佳划分,根据该条件可以对信号空间进行最佳划分,得到的得到的 称为一个胞腔称为一个胞腔2)Centroid质心条件质心条件子空间分割固定后,子空间分割固定后,Voronoi胞元胞元的质心就是量化器的码字的质心就是量化器的码字 对于一般的失真测度和信源分布,很难找到对于一般的失真

16、测度和信源分布,很难找到质心的计算方法,但对于一般的分布和常用的质心的计算方法,但对于一般的分布和常用的均方失真测度,可以证明均方失真测度,可以证明是是 中包含的矢量个中包含的矢量个数数二、二、LBG算法算法 K-means clustering algorithm 1980年由年由Linde,Buzo和和Gray提出,提出,它是标量量化器中它是标量量化器中Lloyd算法的推广,在矢算法的推广,在矢量量化中是一个基本算法。量量化中是一个基本算法。 LBG算法由于其理论上的算法由于其理论上的严密性严密性、应用、应用上的上的简便性简便性以及以及较好的设计效果较好的设计效果,得到了广,得到了广泛的应

17、用,并常被作为各种改进算法的基础泛的应用,并常被作为各种改进算法的基础LBG算法步骤算法步骤第一步:初始化第一步:初始化 给出训练给出训练VQ码书所需的全部参考矢量码书所需的全部参考矢量X,X的集合用的集合用S表示;设定量化级数,失真控制门表示;设定量化级数,失真控制门限限 ,算法最大迭代次数,算法最大迭代次数L以及初始码书以及初始码书 ;设总失真;设总失真 ;迭代次数的初始;迭代次数的初始化为化为m1第二步:迭代第二步:迭代2)计算失真:)计算失真:1)根据最近邻准则将)根据最近邻准则将S分成分成N个子集个子集 , , , 即当即当 时,时,下式成下式成立:立:4)计算相对失真改进量)计算相

18、对失真改进量 :3)计算新码字)计算新码字将将 与失真门限值与失真门限值 进行比较。进行比较。若若 则转入则转入 6)否则转入)否则转入5););5)若)若 则转至则转至6),否则),否则m加加1,转,转至至1)第三步:结束第三步:结束6)得到最终的训练码书)得到最终的训练码书 ,并输出总失真并输出总失真 为了避免迭代算法无限制循环下去,这里设为了避免迭代算法无限制循环下去,这里设置了两个阈值参数:最大迭代次数置了两个阈值参数:最大迭代次数L和失真控制和失真控制门限门限 。 的值设得远小于的值设得远小于1,当,当 时,表明再进行迭代运算失真得减小是有限的、时,表明再进行迭代运算失真得减小是有限的、可可以停止运算。以停止运算。L是限制迭代次数的参数,防止是限制迭代次数的参数,防止 设置较低时迭代次数过多设置较低时迭代次数过多三、初始码书的选择三、初始码书的选择 随机选取法随机选取法 分裂法分裂法分裂法0.010.05

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号