语音信号处理第3版——第3讲教程

上传人:我** 文档编号:116960314 上传时间:2019-11-17 格式:PPT 页数:28 大小:1.95MB
返回 下载 相关 举报
语音信号处理第3版——第3讲教程_第1页
第1页 / 共28页
语音信号处理第3版——第3讲教程_第2页
第2页 / 共28页
语音信号处理第3版——第3讲教程_第3页
第3页 / 共28页
语音信号处理第3版——第3讲教程_第4页
第4页 / 共28页
语音信号处理第3版——第3讲教程_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《语音信号处理第3版——第3讲教程》由会员分享,可在线阅读,更多相关《语音信号处理第3版——第3讲教程(28页珍藏版)》请在金锄头文库上搜索。

1、3.1矢量量化 3.1.1矢量量化的基本原理 3.1.2失真测度 3.1.3 线性预测失真测度 3.1.4识别失真测度 3.1.5最佳码本设计 矢量量化(VQ,即Vector Quantization)是一种极其重要 的信号压缩方法。VQ在语音信号处理中占十分重要的地位。 广泛应用于语音编码、语音识别和语音合成等领域。 量化分为两类: * 标量量化:将取样后的信号值逐个地进行量化。 * 矢量量化:将若干取样信号分成一组,即构成一个矢量, 然后对此矢量一次进行量化。 凡是要用量化的地方都可以采用矢量量化。 矢量量化是实现数据压缩的一种有效方法,早在50和60年代 就被用于语音压缩编码。直到70年

2、代线性预测技术被引入语 音编码后,矢量量化技术才活跃起来。80年代初,矢量量化 技术的理论和应用研究得到迅速发展。 采用矢量量化技术对信号波形或参数进行压缩处理,可以获 得很好的效益,使存储要求、传输比特率需求或和计算量需 求降低. 采用矢量量化的效果优于标量量化的原因? 矢量量化能有效的应用矢量中各分量之间的四种相互 关联性质来消除数据中的冗余度。 这四种相互关联的性质是线性依赖(相关性)、非线性 依赖(统计不独立)、概率密度函数的形状和矢量量化的 维数, 而标量量化仅能利用线性依赖和概率密度函数的形状 来消除冗余度。 矢量量化研究的目的? 针对特定的信息源和矢量维数,设计出一种最优化的 量

3、化器,在R(量化速率)一定的情况下,给出的量化 失真尽可能接近D(R)(最小量化失真)。 标量量化是对信号的单个样本或参数的幅度进行量化;标 量是指被量化的变量,为一维变量。 矢量量化的过程是将语音信号波形的K个样点的每一帧, 或有K个参数的每一参数帧构成K维空间的一个矢量,然后 对这个矢量进行量化。 标量量化可以说是K1的矢量量化。矢量量化过程和标量 量化过程相似。将K维无限空间划分为M个区域边界,然后 将输入矢量与这些边界进行比较,并被量化为“距离”最 小的区域边界的中心矢量值。 矢量量化的定义 设有N个K维特征矢量 (X在K维欧几里 德空间 中),其中,第i个矢量记为 可以被看作是语音信

4、号中某帧参数组成的矢量。 把K维欧几里德空间 无遗漏地划分为J个互不相交的子空 间 即满足 子空间 成为胞腔。 在每一个子空间 找一个代表矢量 ,则J个代表矢量可以组 成矢量集 Y是一个矢量量化器,在矢量量化里Y叫作码书或码本, 称为 码矢或码字。矢量个数J叫作码本长度,或者码本尺寸。 不同的划分或者不同的代表矢量选取方法就可以构成不同的 矢量量化器 步骤:1)判断 具体属于哪个子空间 2)输出 ,Q为量化器函数 以K2进行说明: 当K2时,所得到的是二维矢量。所有可能的二维矢 量就形成了一个平面。 记为(a1,a2),所有可能的(a1,a2)就是一个二维空间。如图3-1(a) 所示 矢量量化

5、就是将这个平面划分为M块S1,S2,SiSM,然后从每一块 中找出代表值Yi(i1,2.M),这就构成一个有M个区间的二维矢量 量化器。 图3-1(b)所示的是一个7区间的二维矢量量化器,即K2,M7。 图3-1 矢量量化概念示意图 通常这些代表值Yi称为量化矢量。 对一个矢量X进行量化,首先选择一个合适的失真测度,然 后用最小失真原理,分别计算用量化矢量Yi替代X所带来的 失真。 其中最小失真值所对应的那个量化矢量,就是矢量X的重构 矢量(或恢复矢量) 注:根据香农信息论,矢量越长越好。实际中码书是不完备的 , 即矢量数是有限的,而对于任何一个实际应用来说,矢量通常 是无限的。 在实际运用中

6、,输入矢量和码书中码字不匹配的情况下,这种 失真是允许的。 存在的问题 (1)如何划分M个区域边界。 将大量欲处理的信号的矢量进行统计划分,进一步确定这些划 分边界的中心矢量值来得到码书。 (2)如何确定两矢量在进行比较时的测度。 这个测度就是两矢量间的距离,或以其中某一矢量为基准时的 失真度。它描述了当输入矢量用码书所对应的矢量来表征时所 付出的代价。 图3-2 矢量量化系统的组成 编码端 恢复时 特点: 传输存储的不是矢量本身而是其序号,所以据有高保密性能 收发两端没有反馈回路,因此比较稳定 矢量量化器的关键是编码器的设计,译码器只是简单的的查 表过程。 矢量量化的性能指标除了码书的大小M

7、以外还有由于量 化而产生的平均信噪比。 矢量量化的准则:在给定码本大小K时使量化所造成的 失真最小。 矢量量化的设计:从大量信号样本中训练出好的码书, 从实际效果出发寻找最好的失真测度定义公式,设计出 最佳的矢量量化系统,以便用最少的搜索和计算失真的 计算量,来实现最大可能的平均信噪比。 前面我们讲过设计矢量量化器的关键是编码器的设计。而 在编码的过程中,就需要引入失真测度的概念。 失真测度(距离测度):是将输入矢量Xi用码本重构矢量Yi 来表征时所产生的误差或失真的度量方法,它可以描述两个 或多个模型矢量间的相似程度。 失真测度选择的好坏直接影响到聚类效果和量化精度,从 而影响到语音信号矢量

8、量化处理系统的性能 失真度选择必须具备的特性 必须在主观评价上有意义,即小的失真应该对应于好的主观 语音质量; 必须是易于处理的,即在数学上易于实现,这样可以用于实 际的矢量量化器的设计; 平均失真存在并且可以计算; 易于硬件实现 失真测度主要有均方误差失真测度(即欧氏距离,满足对称 性+正值性)、加权的均方误差失真测度、板仓斋藤( ItakuraSaito)距离,似然比失真测度等,还有人提出的 所谓的“主观的”失真测度。 一、欧氏距离均方误差 设输入信号的某个K维矢量X,与码书中某个K维矢量Y进 行比较,xi,yi分别表示X和Y中的各元素 ,则定 义均方误差为欧氏距离: 几种其他常用的欧氏距

9、离: 1.r方平均误差 2. r平均误差 3.绝对值平均误差 4.最大平均误差 优点在于:计算简单、硬件 容易实现 5.加权欧式距离测度 3.1.3线性预测失真测度线性预测失真测度 用全极模型表示的线性预测方法,广泛应用于语 音信号处理中。它在分析时得到的是模型的预测系数. 仅由预测系数的差值,不能完全表征这两个语音信息 的差别。应该直接由这些系数所描述的信号模型的功 率谱来进行比较。 当预测器的阶数 ,信号与模型完 全匹配时,信号功率谱为: 信号的功率谱 预测误差能量 预测逆滤波器的频率响应 相应的,设码书中某重构矢量的功率谱为 则定义I-S距离为 这种失真测度是针对线性预测模型、用最大似然

10、准则 推导出来,所以特别适用于LPC参数,描述语音信号的情 况,常用于LPC编码中。我们由此又推导出两种线性预测 色失真测度,他们比上述具有更好的性能,即 对比似然比失真测度 模型失真测度 注:这两种失真测度都仅仅比较两矢量的功率谱,而没有 考虑其他能量信息。 3.1.4 识别失真测度 失真测度的定义 加权因子 输入信号矢量的归一化能量 码书重构矢量的归一化能量 当两矢量的能量接近时(即 ),忽略能量差异引起的影响;当两矢量能 量相差很大时,即进行线性加权;而当能量差超过门限 时,则为固定值 3.1.5 矢量量化器最佳码本设计 矢量量化器最佳设计的两个条件? 目的:最佳设计就是使失真最小 最佳

11、设计中,重要的问题是如何划分量化区间和确定量化矢 量。这两个条件回答了两个问题。 (1)最佳划分 (2)最佳码书 为实现失真最小这一目的,应该遵循以下两条原则 1) 最近邻准则NNR 2) 质心条件 是 中包含的矢量个数 基于最近邻准则和质心条件,可以设计出一种码本设计的 递推算法LBG算法 1980年提出,它是标量量化器中Lloyd算法的推广,在矢量 量化中是一个基本算法。 LBG算法由于其理论上的严密性、应用上的简便性以及较 好的设计效果,得到了广泛的应用,并常被作为各种改进 算法的基础 LBG算法步骤 第一步:初始化 给出训练VQ码书所需的全部参考矢量X,X的集合用S表 示;设定量化级数

12、,失真控制门限 ,算法最大迭代次数 L以及初始码书 ;设总失真 ;迭 代次数的初始化为m1 第二步:迭代 2)计算失真: 1)根据最近邻准则将S分成J个子集 , 即当 时,下式成立: 4)计算相对失真改进量 : 3)计算新码字 将 与失真门限值 进行比较。若 则转入 6 )否则转入5); 5)若 则转至6),否则m加1,转至1) 第三步:结束 6)得到最终的训练码书 , 并输出总失真 为了避免迭代算法无限制循环下去,这里设置了两个 阈值参数:最大迭代次数L和失真控制门限 。 的值 设得远小于1,当 时,表明再进行迭代运算失 真得减小是有限的、可以停止运算。L是限制迭代次数的 参数,防止 设置较低时迭代次数过多 三、初始码书的选择 随机选取法 分裂法 链映射法

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号