语音信号数字处理:11-1 线性预测声码器

上传人:M****1 文档编号:569936195 上传时间:2024-07-31 格式:PPT 页数:49 大小:1.79MB
返回 下载 相关 举报
语音信号数字处理:11-1 线性预测声码器_第1页
第1页 / 共49页
语音信号数字处理:11-1 线性预测声码器_第2页
第2页 / 共49页
语音信号数字处理:11-1 线性预测声码器_第3页
第3页 / 共49页
语音信号数字处理:11-1 线性预测声码器_第4页
第4页 / 共49页
语音信号数字处理:11-1 线性预测声码器_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《语音信号数字处理:11-1 线性预测声码器》由会员分享,可在线阅读,更多相关《语音信号数字处理:11-1 线性预测声码器(49页珍藏版)》请在金锄头文库上搜索。

1、线性预测声码器2LPC 声码器的基本原理1概述4增强型 LPC10 声码器3LPC10 声码器5混合激励线性预测声码器 线性预测声码器1 概述 线性预测声码器线性预测声码器是一种是一种参数编码方法参数编码方法。参数编码利用参数编码利用生成模型生成模型,在幅度,在幅度谱上逼近谱上逼近原语音,原语音, 但重建语音的波形与原语音信号的但重建语音的波形与原语音信号的波形较大差别波形较大差别。参数编码实现语音通信的设备通常称为参数编码实现语音通信的设备通常称为声码器声码器;例:例:通道声码器通道声码器、共振峰声码器共振峰声码器、同态声码器同态声码器、LPC声码器声码器;本章主要内容:本章主要内容:语音语

2、音压缩压缩的的原理原理与与关键技术关键技术、 LPC声码器声码器的基本原理、的基本原理、LPC-10和和LPC-10e标准标准、混合激励混合激励LPC声码器声码器。线性预测声码器 1 概述1.1语音压缩的基本原理语音压缩的基本原理压缩依据:压缩依据:语音信号的语音信号的冗余度冗余度和人的和人的听觉感知机理听觉感知机理。语音信号中存在多种语音信号中存在多种冗余度冗余度,可在可在时域时域和和/或或频域频域中描述中描述。 1. 时域冗余度时域冗余度(1) 幅度幅度非均匀分布非均匀分布。语音中,小幅值样本出现的概率高。语音中,小幅值样本出现的概率高。(2) 语音信号语音信号样本样本间的间的相关性相关性

3、很强。很强。语音波形语音波形的最大相关性存在于的最大相关性存在于邻近的样本之间邻近的样本之间。8 kHz 取样时,相邻样本间的取样时,相邻样本间的相关系数相关系数 0.85; 相距相距 10 个样本,个样本,相关系在相关系在 0.3 左右。左右。利用这种较强的利用这种较强的一维一维相关性进行相关性进行预测编码预测编码。线性预测声码器 1 概述(3) 浊语音具有浊语音具有准周期性准周期性。浊语音波形是对应于浊语音波形是对应于音调间隔周期音调间隔周期的的长期重复波形长期重复波形。此此音调间隔波形音调间隔波形可用于可用于预测编码预测编码。(4) 声道的形状及其变化比较缓慢。声道的形状及其变化比较缓慢

4、。以较长的时间(如几十秒)进行统计,可得长时自相关函数;以较长的时间(如几十秒)进行统计,可得长时自相关函数;长时自相关函数的统计表明,长时自相关函数的统计表明,8 kHz 取样的相邻样本间,取样的相邻样本间, 平均相关系数平均相关系数高达高达 0.11。(5) 静止系数静止系数(语音间隙)。(语音间隙)。统计表明,统计表明,话音间隙话音间隙使全双工话路的典型效率约为通话时间的使全双工话路的典型效率约为通话时间的40%(或(或静止系数静止系数为为 0.6)。)。话音间隙话音间隙本身是一种冗余,可本身是一种冗余,可不传不传或或少传少传静止段信息。静止段信息。 线性预测声码器 1 概述2. 频域冗

5、余度频域冗余度(1) 非均匀的非均匀的长时功率谱密度长时功率谱密度。长时功率谱密度:长时功率谱密度:长时段内功率谱长时段内功率谱的的统计平均统计平均,如,如图图11.1(a)。长时功率谱密度长时功率谱密度呈现呈现强烈强烈的的非平坦性非平坦性。统计观点:统计观点:未充分未充分利用给定频段,利用给定频段,或者说存在着固定的或者说存在着固定的冗余度冗余度。特点:特点:功率谱的功率谱的高频能量较低高频能量较低,直流直流分量分量并非最大并非最大。(2) 特有的特有的短时功率谱密度短时功率谱密度。图图11.1(b):语音的短时功率谱密度。语音的短时功率谱密度。存在存在共振峰频率共振峰频率和和谷值谷值。前三

6、个共振峰决定前三个共振峰决定语音特征语音特征。特点:特点:形成形成高次谐波高次谐波结构。结构。线性预测声码器 1 概述图图1语音信号的功率谱密度函数语音信号的功率谱密度函数f / kHz(a) 长时功率谱长时功率谱f / kHz(b) 短时功率谱短时功率谱3. 听觉感知机理听觉感知机理(1) 人类听觉系统具有人类听觉系统具有掩蔽效应掩蔽效应。在不同在不同声压声压、不同、不同频率频率处,声音的处,声音的掩蔽效应掩蔽效应是不同的。是不同的。用用掩蔽特性掩蔽特性可可抑制抑制与信号与信号共存共存的的量化噪声量化噪声,降低,降低编码速率编码速率。(2) 人耳对不同频段声音的人耳对不同频段声音的敏感程度敏

7、感程度不同。不同。人的听觉对低频端比较敏感,而对高频端不太敏感。人的听觉对低频端比较敏感,而对高频端不太敏感。即强的低频音能妨碍同时存在的高频音。即强的低频音能妨碍同时存在的高频音。(3) 人耳对语音信号的人耳对语音信号的相位变化不敏感相位变化不敏感。合适的合适的分析表明:分析表明:语音压缩编码的语音压缩编码的极限速率极限速率为为 80 100 bit/s。此时,只能传送句子内容,此时,只能传送句子内容,讲话者的讲话者的音质音质、音调音调等重要信息已等重要信息已全部丢失全部丢失。线性预测声码器 1 概述1.2语音编码的关键技术语音编码的关键技术关键技术包括:关键技术包括:LPC 分析分析、合成

8、合成- -分析法分析法、感觉加权滤波器感觉加权滤波器1. LPC 分析分析LPC 分析是分析是常用技术常用技术,在,在语音识别语音识别、语音合成语音合成、语音编码语音编码和和说话人识别说话人识别等领域获得成功的应用。等领域获得成功的应用。LPC 编码基于跟踪波形的编码基于跟踪波形的产生过程产生过程,而不是,而不是波形本身波形本身,它传送的是反映整个过程变化的参数。它传送的是反映整个过程变化的参数。LPC 基于基于全极点模型全极点模型、时域方均误差时域方均误差最小准则估计最小准则估计模型参数模型参数。应用这组模型参数能够有效地降低语音信号的应用这组模型参数能够有效地降低语音信号的编码速率编码速率

9、。语音信号存在语音信号存在短时相关性短时相关性和和长时相关性长时相关性两种。两种。利用利用 LPC 对语音进行这两种相关性的去相关处理后,得到的是对语音进行这两种相关性的去相关处理后,得到的是预测残差信号预测残差信号。 线性预测声码器 1 概述图图2:含两种相关性的语音生成模型示意图。含两种相关性的语音生成模型示意图。短时相关性短时相关性的的传输函数传输函数为:为:长时相关性长时相关性(谱的精细结构)模型的(谱的精细结构)模型的传输函数传输函数为:为: 式中式中 T 基音周期基音周期。 b-q,b-q+1,br 长时预测系数长时预测系数, 个数在个数在 1 (q = r = 0) 到到 3 (

10、q = r = 1) 之间;之间;通常,长时预测系数的通常,长时预测系数的更新周期更新周期约为约为 50 200 次次/s。长时滤波是长时滤波是估算估算短时残差信号中短时残差信号中脉冲的周期脉冲的周期、相位相位和和增益增益, 再去除这些脉冲,得到了再去除这些脉冲,得到了 长时滤波残差长时滤波残差。再再编码编码,形成,形成激励信号激励信号。线性预测声码器 1 概述图图2语音信号生成模型数语音信号生成模型数激励发生器激励发生器合成语音合成语音2. 合成合成- -分析法分析法在在 LPC 算法中,对算法中,对残差信号残差信号直接量化,且使其直接量化,且使其误差误差最小,最小,并不能使得并不能使得原始

11、语音信号原始语音信号和和重建信号间重建信号间的误差最小。的误差最小。采用采用合成合成- -分析法分析法(AbS) 来求得残差信号的来求得残差信号的编码量化值编码量化值,才能使才能使重建语音重建语音与与原始语音原始语音的误差最小。的误差最小。 AbS是将是将综合器综合器引入到编码器中,并引入到编码器中,并与分析器与分析器结合,在编码器中结合,在编码器中生成和解码器端相同的生成和解码器端相同的重建合成语音重建合成语音。根据误差原则,调整参数使合成语音与原始语音的误差最小。根据误差原则,调整参数使合成语音与原始语音的误差最小。例,在编码器中将激励信号输入例,在编码器中将激励信号输入 LPC 综合滤波

12、器综合滤波器,其,其合成语音合成语音和和原始语音原始语音相比,从而求得使两者相比,从而求得使两者方均差最小方均差最小的激励源。的激励源。该方法把系统的输出引入编码端,也称作该方法把系统的输出引入编码端,也称作闭环法闭环法。相应地,不将输出引入编码端的方法称作相应地,不将输出引入编码端的方法称作开环法开环法。 线性预测声码器 1 概述3. 感觉加权滤波器感觉加权滤波器 人耳的人耳的掩蔽效应掩蔽效应和和听觉敏感度听觉敏感度不同,导致不同,导致最小方均误差准则最小方均误差准则评定合成语音的质量时并非为最优。评定合成语音的质量时并非为最优。低码率编码中,每个语音样本量化的比特数不到低码率编码中,每个语

13、音样本量化的比特数不到 1, 故在编码中,更需要利用人耳感知特性,以改进编码性能。故在编码中,更需要利用人耳感知特性,以改进编码性能。Atal 等提出了感知加权最小方均误差准则,等提出了感知加权最小方均误差准则,在在高能量段高能量段,噪声不易被感觉,允许,噪声不易被感觉,允许误差大一些误差大一些。在在低能量段低能量段,噪声易被感觉,允许,噪声易被感觉,允许误差小一些误差小一些。导致:导致:码率不变时,音质会提高;音质不变时,码率降低。码率不变时,音质会提高;音质不变时,码率降低。引入频域的引入频域的感觉加权滤波器感觉加权滤波器 W(z) 来衡量语音之间的误差:来衡量语音之间的误差: 式中式中

14、原始语音原始语音和和重建语音重建语音的的 Fourier 变换变换; fs 取样频率取样频率。线性预测声码器 1 概述如果在高能量频段使如果在高能量频段使 W(f) 较小,在低能量频段使较小,在低能量频段使 W(f) 较大,较大,就可以抬高前者误差的能量而降低后者误差的能量。就可以抬高前者误差的能量而降低后者误差的能量。由此,由此,感觉加权滤波器感觉加权滤波器的的传递函数传递函数为为 式中,式中, = 1 时,时,W(z) = 1,不加权不加权; = 0 时,时,W(z) = A(z),得到的,得到的噪声谱能量分布噪声谱能量分布和和 语音谱能量分布语音谱能量分布相同,但听音效果不好。相同,但听

15、音效果不好。W(z) 使实际误差信号的使实际误差信号的谱不平坦谱不平坦,与语音信号,与语音信号谱包络相似谱包络相似。掩蔽效应便产生较好的主观听觉效果。掩蔽效应便产生较好的主观听觉效果。实验表明,实验表明,8 kHz取样时,取样时, 取取0.8较为适宜。较为适宜。加权综合滤波器加权综合滤波器为:为:线性预测声码器 1 概述线性预测声码器2 LPC声码器的基本原理基于全极点声道模型,采用基于全极点声道模型,采用 LPC 分析分析-合成合成原理,原理,对对模型模型参数和参数和激励激励参数进行参数进行编码传输编码传输,编码速率编码速率低。低。图图3:典型的典型的 LPC 声码器声码器的原理框图。的原理

16、框图。双重作用:双重作用:波形编码器波形编码器的主要作用是用作的主要作用是用作预测器预测器,声码器声码器的主要作用是建立的主要作用是建立模型。模型。 传输参数:传输参数:预测系数预测系数、基音周期基音周期、清清/ /浊音浊音和和增益增益。线 性 预 测 声 码 器 2 LPC 声 码 器 的 基 本 原 理图图3LPC声码器原理框图声码器原理框图发送端(分析部分)发送端(分析部分)接收端(合成部分)接收端(合成部分)LPC分析器分析器基音检测器基音检测器编码器编码器解码器解码器LPC合成器合成器信信 道道直接量化直接量化预测系数预测系数不合适,因不合适,因合成误差大合成误差大,甚至,甚至系统不

17、稳定系统不稳定。解决办法:解决办法:或用较多的或用较多的 bit 量化每个预测器系数。量化每个预测器系数。 或将预测器系数变换成其它参数形式。或将预测器系数变换成其它参数形式。归纳起来,有以下几种归纳起来,有以下几种 (1) 反射系数反射系数k1, k2, kp。分析表明:分析表明:在区间在区间-1,1对对反射系数反射系数作作线性量化线性量化是低效的;是低效的;比特数比特数应非均匀分配,应非均匀分配,k1 和和 k2 的比特数多些(的比特数多些(5 6 bit)。)。(2) 对数面积比对数面积比 g1, g2, gp。 式中式中Ai, Ai+1 声管第声管第 i 节和第节和第 i+1 节的截面

18、积。节的截面积。上式映射,使上式映射,使 g 呈相当呈相当均匀的幅度分布均匀的幅度分布,可以采用,可以采用均匀量化均匀量化;参数间相关性低,经参数间相关性低,经内插内插产生的滤波器是稳定的,产生的滤波器是稳定的,需需 5 6 bit 量化。量化。线 性 预 测 声 码 器 2 LPC 声 码 器 的 基 本 原 理(3) 预测多项式的根预测多项式的根 r1, r2, rp 。对对预测多项式预测多项式 A(z) 分解因式分解因式,有,有对预测多项式的对预测多项式的根根进行量化,进行量化,易保证易保证合成滤波器的合成滤波器的稳定性稳定性。每个根平均用每个根平均用 5 bit 量化就能精确表示中包含

19、的频谱信息。量化就能精确表示中包含的频谱信息。问题:问题:求根求根运算量大运算量大,计算效率低计算效率低,故该算法少用。,故该算法少用。 一帧典型的一帧典型的 LPC 参数参数包括:包括:1 bit清浊音清浊音信息、信息、 大约大约 5 bit 增益常数增益常数、 6 bit 基音周期基音周期、反射系数反射系数或或对数面积比对数面积比平均平均 56 bit 量化(共有量化(共有 812 个)个)每帧每帧共约共约 60 bit。若。若 25 ms 帧,则帧,则编码速率编码速率为为2.4 kbit/s左右。左右。 线 性 预 测 声 码 器 2 LPC 声 码 器 的 基 本 原 理线性预测声码器

20、3 LPC10声码器LPC10:美国:美国 1976 年确定的年确定的 2.4 kbit/s 语音通信的标准技术。语音通信的标准技术。1981 年公布作为年公布作为联邦政府标准联邦政府标准 FED-STD1015。该算法可合成该算法可合成清晰清晰、可懂可懂的语音,但的语音,但抗噪能力抗噪能力和和自然度自然度欠佳。欠佳。LPC10e: 2.4 kbit/s 速率,速率,LPC10 的的增强型增强型。自自 1986 年以来,美国第三代年以来,美国第三代保密电话保密电话装置采用装置采用 LPC10e。本节主要包括:本节主要包括:3.1发端编码器发端编码器3.2收端解码器收端解码器3.3LPC10 声

21、码器存在的问题声码器存在的问题线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器3.1发端编码器发端编码器1. 编码器编码器图图4:LPC10编码器框图(帧编码器框图(帧 180 个样,帧长个样,帧长 22.5 ms)预加重滤波器预加重滤波器的传输函数:的传输函数: 声道滤波器声道滤波器参数参数 RC、增益增益 RMS 用用准基音同步准基音同步相位法计算。相位法计算。线 性 预 测 声 码 器 11.3 LPC-10 声 码 器图图4LPC-10发端编码器框图发端编码器框图 数字语音输出数字语音输出预加重预加重计算分析帧计算分析帧预测器分析存储器预测器分析存储器2 阶逆滤波阶逆

22、滤波清清/浊检测浊检测AMDF 基音提取基音提取基音及清基音及清/浊音校正浊音校正基音分析存储基音分析存储低通滤波器低通滤波器1003600Hz低通滤波低通滤波8 kHz 12bitA/D 变换变换原始语音输入原始语音输入U/V参数编码参数编码误差校正和映射误差校正和映射并并/串变换及同步产生串变换及同步产生TRMS RC2 帧参数存储器帧参数存储器计算预测系数计算预测系数计算计算 RMS2 帧参数存储器帧参数存储器2. 计算声道滤波器参数计算声道滤波器参数 RC采用采用 10 阶阶 LPC 分析滤波器分析滤波器,利用利用协方差法协方差法计算计算预测系数预测系数: : a1,a2,a10, (

23、用(用 Cholesky UV 分解法分解法对系数矩阵对系数矩阵求逆求逆) 转换成转换成反射系数反射系数 RC,或,或部分相关系数部分相关系数(PARCOR)。)。 (理论上,(理论上,RC 和和 PARCOR 互为互为相反数相反数) LPC 分析采用分析采用半基音同步算法半基音同步算法, 即即浊音帧长度浊音帧长度取为取为 130 个样本以内的个样本以内的基音周期基音周期整数倍值,整数倍值, 来计算来计算 RC 和和增益增益 RMS。每一个基音周期都可以单独用一组系数处理。每一个基音周期都可以单独用一组系数处理。清音帧长度清音帧长度为为 22.5 ms 的整帧中点为中心的的整帧中点为中心的 1

24、30 个样本个样本 形成形成分析帧分析帧来计算来计算 RC 和和 RMS。 线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器3. 计算增益计算增益 RMS 用如下公式计算用如下公式计算增益增益 RMS: 式中式中x(i) 经过经过预加重预加重的数字的数字语音语音; N 分析帧分析帧的的长度长度。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器4. 提取基音周期和检测清提取基音周期和检测清/浊音浊音 输入语音经输入语音经 3 dB 截止频率为截止频率为900 Hz 的的 4 阶阶 Butterworth 低通滤波低通滤波,滤波后信号再经,滤波后信号再经二阶逆滤

25、波二阶逆滤波。 (逆滤波器的系数为前面 LPC 分析得到的短时谱参数)取样频率取样频率降低降低至原来的至原来的 1/4, 再再计算延迟计算延迟时间为时间为 20 156 个样点的个样点的AMDF,基音周期:基音周期:由由AMDF的的最小值最小值确定。确定。计算计算AMDF:公式为公式为 式中,式中, = 20,21,22,40,42,44,80,84,88,156; 相当于在相当于在 50 400 Hz 范围内计算范围内计算 60 个个 AMDF 值。值。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器清清/浊音判决:浊音判决:利用利用模式匹配模式匹配技术,基于技术,基于低带

26、能量低带能量、 AMDF 函数函数最大值与最小值之比、最大值与最小值之比、过零率过零率作出的。作出的。对对基音值基音值、清清/ /浊音浊音判决结果用判决结果用动态规划动态规划算法:算法: 在在 3 帧范围内进行帧范围内进行平滑平滑和和错误校正错误校正, 从而给出当前帧的从而给出当前帧的基音周期基音周期 T、清清/ /浊音判决浊音判决参数参数 U/V。每帧清每帧清/浊音判决结果用两位码表示四种状态:浊音判决结果用两位码表示四种状态: 00:稳定的清音稳定的清音; 01:清音向浊音转换清音向浊音转换; 10:浊音向清音转换浊音向清音转换; 11:稳定的浊音稳定的浊音。 线 性 预 测 声 码 器

27、3 L P C - 1 0 声 码 器5. 参数编码与解码参数编码与解码LPC10 的传输数据流含:的传输数据流含: 10 个个反射系数反射系数:k1,k2,k10 ,增益增益 RMS、基音周期基音周期 T、 清清/ /浊音浊音U/V、同步信号同步信号Sync。 同步信号同步信号采用相邻帧采用相邻帧 1、0 码码交替的模式交替的模式。编码成每帧编码成每帧 54 bit。传输传输 44.4 帧帧/s,编码速率编码速率为为 2.4 kbit/s。表表1:浊音帧浊音帧和和清音帧清音帧的比特分配。的比特分配。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表11.1LPC10 的的

28、 bit 分配分配浊音浊音清音清音浊音浊音清音清音T/Voicing77k64RMS55k74Sync11k84k155k93k255k102k355误差校正误差校正020k455总计总计5453k54 (1) 反射系数反射系数的编码、解码的编码、解码用对数面积比用对数面积比 gi 表示反射系数表示反射系数 ki 方法编码,其关系为:方法编码,其关系为:LPC10,先将,先将 ki 变换成变换成 gi ,再,再查表量化查表量化。方法如下:。方法如下: 符号转换:符号转换:对于对于浊音浊音, ki 被向被向 +1 偏置。偏置。 k1 和和 k2 作对数面积比后,确定作对数面积比后,确定 k1 和

29、和 k2 的符号,的符号,负负=1,正正=0; 对对 k1 和和 k2 的绝对值除以的绝对值除以 29,若,若63,取为,取为 63,否则取,否则取原值原值。 查查表表2 得得 4 bit 码字再附上符号位,得码字再附上符号位,得 5 bit 码为码为编码输出编码输出。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表2对数对数面积比编码面积比编码对数对数面积比面积比编码编码对数对数面积比面积比编码编码对数对数面积比面积比编码编码对数对数面积比面积比编码编码0 5027 33449 52860126 12134 38553 559611313 19239 43656, 57

30、10621420 26344 48758, 59116315 注:注:PARCOR 参数参数 k 的绝对值作为序号,负的的绝对值作为序号,负的 k 参数用参数用 2 进制补码运算。进制补码运算。 浊音帧:浊音帧:k3k10 取整后除以取整后除以 2,加上,加上表表3中对应的中对应的偏置数偏置数, 再乘上再乘上表表4的的比例因子比例因子后后取整取整(其值在范围(其值在范围 -127127 内),内), 用用 8 减去按减去按表表1分配的比特数的位数分配的比特数的位数右移右移, 剩下的比特数即为剩下的比特数即为编码输出编码输出,其中含,其中含 1 位位符号位符号位。浊音帧:浊音帧:用用表表5(见下

31、页)对接收的对接收的 k1 和和 k2 解码解码, 对于对于k3k10 加一个加一个量化偏置量化偏置以补偿量化的影响,然后以发送端以补偿量化的影响,然后以发送端 相反的相应操作相反的相应操作去偏置去偏置和和去比例因子去比例因子,即乘以,即乘以 215,取整取整。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表3PARCOR 参数的偏置表参数的偏置表参数参数k3k4k5k6k7k8k9k10偏置偏置1152+2816+1536+3584+1280+2432768+1920 注:注:偏置加到参数带符号移位偏置加到参数带符号移位 14 bit 的值上。的值上。表表4PARCOR

32、 参数的比例因子参数的比例因子参数参数k3k4k5k6k7k8k9k10比例因子比例因子0.00560.00630.00680.00720.00740.00730.00840.0102 注注:k 参数被比例因子扩展为参数被比例因子扩展为 6 bit 分布。分布。非浊音帧(非浊音帧(清音清音或或过渡音过渡音):):仅发送仅发送 k1k4; (8, 4) Hamming 扩展码保护扩展码保护 k1k4 和和 RMS 的的 4 个个高有效位高有效位; 设设 4 位位信息码信息码为为 m=m0m1m2m3,发送码字发送码字v=v0v1v2v3v4v5v6v7, 则则编码方程编码方程为:为: (最低有效

33、位未编码) 线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表5对数面数面积比解比解码表表编码编码 对数面积比对数面积比 编码编码 对数面积比对数面积比编码编码 对数面积比对数面积比 编码编码 对数面积比对数面积比编码编码 对数面积比对数面积比0262313431955256016727144620572761298301548215828623139331650225930634161036175223593163519113918542460注注:接收接收 k 参数的绝对值向左移参数的绝对值向左移一一位作为解码序号位作为解码序号。 (2) RMS 参数参数的编码、解码的

34、编码、解码 RMS 参数用参数用查表法查表法进行进行编码编码、解码解码。表表6:数值在数值在 2 512 之间的之间的 RMS 值用值用 步长为步长为 0.773 dB 的的对数码表对数码表进行进行编码编码和和解码解码。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表6RMS 编码表表序号 RMS值 序号 RMS值 序号 RMS值 序号 RMS值 序号 RMS值 序号 RMS值 序号 RMS值 序号 RMS值00841682416323240664813556275109417825173335417249147573002110518926193439427950164

35、5832831115191027213542438651176593594212620112823364644945219260392521362112292537514510353210614286314722133027385546113542306246873157231531303960471235525163512 注:注:用对分法查表,在表内找到序号后,序号除以用对分法查表,在表内找到序号后,序号除以 2 即为发送比特,即为发送比特, 计算公式为计算公式为: (3) 基音基音、清清/ /浊音浊音编码、解码编码、解码 60 个基音值和清个基音值和清/浊音编码用浊音编码用 7 bit

36、编码表示。编码表示。清音清音/过渡帧:过渡帧:用矢量用矢量 0000000/1111111 表示;表示; 60 个基音值用码字重量个基音值用码字重量 3 或或 4 的的 7 bit Gray 码编码;码编码;表表11.7:编码方案。编码方案。解码时,收到的解码时,收到的 7 bit 矢量,矢量, 若若码字重量码字重量为为 3 或或 4 时,按时,按表表7的基音周期编码表解码;的基音周期编码表解码; 若若码字重量码字重量为为 0 或或 1 时,则判定接收帧为时,则判定接收帧为清音帧清音帧;线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表7基音周期编码表基音周期编码表Gray

37、码码周期周期Gray码码周期周期Gray码码周期周期Gray码码周期周期Gray码码周期周期Gray码码周期周期0010011200001111300110101401011010601001101801110001120000101121000011131011000142101100062100100184111000012400110112201001113201100114410111006410010118811100101280011001230100110330110010461010100661001010921100010132001110124010111034011011

38、048101011068100111O96110101013600101012501010103501 10100501010010701000110100110100014000101112601010113601111005210100117210001111041101100144001011027010100137011100054101000174100001110811001001480011110280101101380111010561010101761100011112110010115200011102901001013900110105810001017811000011

39、161001100156 若若码字重量码字重量为为 7 或或 6 时,则判定接收帧为时,则判定接收帧为过渡帧过渡帧; 若若码字重量码字重量为为 2 或或 5 时,则判定接收帧为时,则判定接收帧为无效帧无效帧。最后按最后按表表8 的的比特顺序比特顺序,组成发送,组成发送比特流比特流发往线路发往线路。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器表表11.8发送比特流发送比特流bit浊音浊音清音清音bit浊音浊音清音清音bit浊音浊音清音清音Bit浊音浊音清音清音1k1,0同左15T,2同左29k7,0k3,543k5,2k1,72k2,0同左16k4,1同左30k8,0R,5

40、44k6,2k2,73k3,0同左17k1,3同左31T,4同左45kl0,1D/c4T,0同左18k2,2同左32k4,4同左46k8,2R,75R,0同左19k3,3同左33k5,0k1,547T,6同左6k1,1同左20k4,2同左34k6,0k2,548k9,1k4,77k2,1同左21R,3同左35k7,lk3,649k5,3kl,88k3,1同左22k1,4同左36kl0,0k4,550k6,3k2,89T,1同左23k2,3同左37k8,1R,651k7,3k3,810R,1同左24k3,4同左38k5,1k1,652k9,2k4,811k1,2同左25k4,3同左39k6,1k

41、2,653k8,3R,812k4,0同左26R,4同左40k7,2k3,754sync同左13k3,2同左27T,3同左41k9,0k4,614R,2同左28k2,4同左42T,5同左注:1. 发送顺序是从 bit 1 到 bit 54;2. T 是基音,R 是 RMS,k 是反射系数; 3. 参数“,”后的数字“, i”表示的是第 i 位 bit。3.2收端编码器收端编码器图图5: LPC-10 收端解码器框图。收端解码器框图。接收信号经接收信号经串串/ /并变换并变换及及同步同步后,用后,用查表法查表法进行进行检错检错、纠错纠错。译码后的数据经参数解码得:译码后的数据经参数解码得:解码参数

42、解码参数,结果,结果延时一帧延时一帧输出。输出。输出数据在输出数据在过去帧过去帧、当前帧当前帧和和将来帧将来帧,共,共 3 帧内帧内平滑平滑。每帧只传输一组参数,但一帧内可有不止一个每帧只传输一组参数,但一帧内可有不止一个基音周期基音周期, 因此,要对接收数值进行由因此,要对接收数值进行由帧块帧块到到基音块基音块的的转换转换和和插值插值。 线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器图图5LPC-10收端解码器框图收端解码器框图 合成语音输出合成语音输出数字语音输入数字语音输入RC T U/VRMS参数解码参数解码串串/并变换并变换同步检测同步检测误差检测误差检测校正解码

43、校正解码帧块到基音块帧块到基音块转换与插值转换与插值噪声产生噪声产生基音产生基音产生反射系数转换反射系数转换成预测系数成预测系数清清/浊音开关浊音开关综合器综合器计算增益计算增益输出存储器输出存储器去加重去加重D/A变换变换3600Hz低通滤波低通滤波(1) 参数参数插值插值原则。原则。对数面积比对数面积比参数值参数值每帧插值两次每帧插值两次; RMS 参数参数值在值在对数域对数域进行进行基音同步插值基音同步插值;基音参数基音参数值用基音同步的值用基音同步的线性插值线性插值;在在浊音浊音向向清音清音过渡时过渡时对数面积比对数面积比不插值。不插值。每个基音周期更新一次每个基音周期更新一次预测系数

44、预测系数、增益增益、基音周期基音周期、清清/ /浊音浊音等参数,这个过程在帧块到基音块的转换和插值中完成。等参数,这个过程在帧块到基音块的转换和插值中完成。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器(2) 激励源。激励源。根据根据基音周期基音周期和和清清/ /浊音浊音标志决定要采用的标志决定要采用的激励信号源激励信号源。清音帧清音帧用用随机数随机数作为激励源;作为激励源;浊音帧浊音帧用用周期性冲激序列周期性冲激序列通过一个全通滤波器来生成激励源,通过一个全通滤波器来生成激励源,语音合成滤波器输入激励的语音合成滤波器输入激励的幅度幅度保持保持恒定恒定不变,不变, 输出幅度

45、受输出幅度受 RMS 参数参数加权。加权。给出一组有给出一组有 41 个样点的个样点的浊音激励信号浊音激励信号: 若当前的基音周期不等于若当前的基音周期不等于 41 个样点,个样点, 则将此激励源则将此激励源截短截短或者或者填零填零,使之与基音周期等长。,使之与基音周期等长。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器(3) 语音合成。语音合成。用用 Levinson 递推算法递推算法将反射参数变换成将反射参数变换成预测系数预测系数。收端合成器应用收端合成器应用直接型递归滤波器直接型递归滤波器合成语音。合成语音。对其输出进行对其输出进行幅度校正幅度校正、去加重去加重,并变

46、换为,并变换为模拟信号模拟信号, 最后经最后经 3600 Hz 的的低通滤波器低通滤波器后输出模拟语音。后输出模拟语音。线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器线 性 预 测 声 码 器 3 L P C - 1 0 声 码 器3.3LPC10 声码器存在的问题声码器存在的问题(1) 损失了语音的自然度。损失了语音的自然度。实际语音的实际语音的残差信号残差信号中,有部分既中,有部分既非周期脉冲非周期脉冲又又非随机噪声非随机噪声;或者低频段是或者低频段是周期脉冲周期脉冲,高频段是,高频段是随机噪声随机噪声。采用采用二元激励二元激励代替残差信号,使代替残差信号,使合成语音合

47、成语音听起来不自然。听起来不自然。(2) 稳健性(稳健性(Robustness)差。)差。噪声环境下,噪声环境下,基音周期基音周期和和清清/ /浊音浊音判决不易准确提取。判决不易准确提取。噪声较强时,噪声较强时,系统性能系统性能显著恶化。显著恶化。(3) 共振峰位置共振峰位置及及带宽带宽估值会有很大失真。估值会有很大失真。失真的原因是浊语音段时域上的周期重复信号使得失真的原因是浊语音段时域上的周期重复信号使得短时语音谱短时语音谱形接近于形接近于线状分布谱线状分布谱。基频基频较大,且与较大,且与谱包络谱包络中中共振峰共振峰 f1 相接近,即相接近,即 f1=1/T。 由于由于 LPC 谱估计力图

48、使谱估计力图使模型谱模型谱逼近于逼近于信号谱信号谱包络,包络, 在估计出的谱包络中会出现在估计出的谱包络中会出现极其尖锐极其尖锐的的峰值峰值。 在合成语音中会出现在合成语音中会出现尖峰尖峰或较大或较大毛刺毛刺,从而影响语音质量。,从而影响语音质量。第11章线性预测声码器4增强型 LPC10声码器增强型增强型 LPC10 声码器声码器(简记为(简记为 LPC10e)是一种改进的,与)是一种改进的,与 LPC10 算法算法兼容兼容的声码器。的声码器。 LPC10e 的改进主要的改进主要包括:包括:4.1激励源的改善激励源的改善 (1) 采用采用混合激励混合激励代替简单的二元激励代替简单的二元激励

49、(2) 激励脉冲加激励脉冲加抖动抖动 (3) 单脉冲与单脉冲与码书码书相结合的相结合的激励激励模式模式4.2基音提取基音提取方法的改进方法的改进4.3声道滤波器参数声道滤波器参数量化量化的改进的改进4.4LSF参数的参数的矢量量化矢量量化线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器4.1激励源的改善激励源的改善(1) 采用采用混合激励混合激励代替简单的二元激励代替简单的二元激励 采用该技术,合成语音的采用该技术,合成语音的质量质量得到得到改善改善。图图6:LPC10e 编码器编码器原理图。原理图。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器图图6

50、LPC-10e 编码器原理图编码器原理图 数据输出数据输出低通滤波器低通滤波器白化滤波器白化滤波器AMDF函数函数基音检测基音检测计算能量计算能量设置清设置清/浊音窗浊音窗检测过零率检测过零率确定起始点确定起始点预加重预加重RMS计算计算清清/浊音判决浊音判决设置分析窗设置分析窗协方差分析协方差分析参数编码参数编码原始语音输入原始语音输入经二阶经二阶 LPC 分析滤波分析滤波器滤除器滤除共振峰共振峰后,得后,得白白化语音化语音;再提取再提取基音周期基音周期,精度,精度可改善。可改善。分析窗分析窗的的起点起点为语音特为语音特征短时征短时急剧变化处急剧变化处。该措施该措施提高提高了合成语音了合成语

51、音的的清晰度清晰度。起始点的计算:起始点的计算:由由预加重语音预加重语音的的平滑自相关函数值平滑自相关函数值的变化确定。的变化确定。 计算公式如下:计算公式如下:式中式中N 帧长帧长; ri(0) i 时刻时刻帧长帧长 64 的信号的信号 x(i) 的的 0 位移位移自相关函数自相关函数。 ri(1) i 时刻时刻帧长帧长 64 的信号的信号 x(i) 的的 1 位移位移自相关函数自相关函数。上式为一种上式为一种递推计算递推计算式,可节省计算量。式,可节省计算量。 如果如果 Y(i) 以超过某个给定的以超过某个给定的阈值阈值,则,则 i 点为起始点。点为起始点。线 性 预 测 声 码 器 4

52、增 强 型 LPC-10 声 码 器图图7:LPCl0e 解码器解码器原理图。原理图。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器图图7LPC-10e 解码器原理图解码器原理图 合成语音输出合成语音输出数据输入数据输入共振峰展宽共振峰展宽反射系数转换成反射系数转换成预测系数预测系数第一级合成第一级合成第二级合成第二级合成解码解码去加重去加重爆破脉冲发生器爆破脉冲发生器误差校正误差校正噪声生成器噪声生成器参数插值参数插值基音脉冲发生器基音脉冲发生器增益调整增益调整混合器混合器为混合激励,为混合激励,改善了音质改善了音质浊音的激励源:浊音的激励源:经经低通低通滤波的滤波的周

53、期脉冲序列周期脉冲序列与与 经经高通高通滤波的滤波的白噪声白噪声相加而成,相加而成, 混合比例混合比例随输入语音的随输入语音的浊化程度浊化程度改变。改变。清音的激励源:清音的激励源:白噪声白噪声与位置很近与位置很近 且且随机的正、负脉冲随机的正、负脉冲形成的爆破形成的爆破脉冲对脉冲对之和。之和。 爆破音爆破音时,脉冲对的幅度增大,与语音的突变成正比,时,脉冲对的幅度增大,与语音的突变成正比, 反之则脉冲对的幅度很小。反之则脉冲对的幅度很小。混合激励混合激励改善了合成语音的改善了合成语音的金属声金属声、重击声重击声、音调噪声音调噪声等,等, 同时对同时对 U/V 判决的判决的敏感程度敏感程度有所

54、降低。有所降低。共振峰共振峰由两个级联的综合器形成,由两个级联的综合器形成, 第一个是第一个是全零点滤波器全零点滤波器,第二个是,第二个是 LPC 综合滤波器综合滤波器。美国美国第三代保密电话第三代保密电话采用采用 LPCl0e 声码器。声码器。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器(2) 激励脉冲加激励脉冲加抖动抖动二元激励方案适于较准确的二元激励方案适于较准确的浊音帧浊音帧清音帧清音帧的判别。的判别。浊音的激励信号具有周期和脉冲性质,适于浊音的激励信号具有周期和脉冲性质,适于强基音相关强基音相关时。时。基音基音中等强度相关中等强度相关时,或时,或残差信号残差信

55、号中有大的峰值,中有大的峰值,应判定为应判定为抖动的浊音帧抖动的浊音帧。生成抖动的浊音帧:生成抖动的浊音帧: 使激励信号中的使激励信号中的周期脉冲周期脉冲的相位随机地抖动。的相位随机地抖动。方法:方法:对每个对每个基音周期基音周期的长度乘的长度乘 0.75 1.25 之间之间 均匀分布均匀分布的的随机数随机数。可以改善语音的。可以改善语音的自然度自然度。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器(3) 单脉冲单脉冲与与码书码书相结合的激励模式相结合的激励模式低比特率下,合成高质量的低比特率下,合成高质量的 语音的语音的关键技术关键技术之一:之一:有效有效、精确精确地表

56、示激励信号。地表示激励信号。 LPC 残差信号特点:残差信号特点:浊音时浊音时,往往存在以基音周期重复的,往往存在以基音周期重复的大幅度尖脉冲大幅度尖脉冲,清音时清音时,往往类似于,往往类似于随机噪声随机噪声。不同不同的语音段采用的语音段采用不同不同的激励模式,可取得较好效果。的激励模式,可取得较好效果。即:即:脉冲脉冲+ 码书码书激励(见激励(见图图8 )。)。周期性周期性语音段,以语音段,以基音周期基音周期重复的重复的单脉冲单脉冲为激励源;为激励源;非周期性非周期性语音段用从码书中选择的语音段用从码书中选择的随机序列随机序列为激励源。为激励源。线 性 预 测 声 码 器 4 增 强 型 L

57、PC-10 声 码 器图图8单脉冲与码书激励相结合的单脉冲与码书激励相结合的 LPC 综合模型综合模型合成语音合成语音随机码书(非周期)随机码书(非周期)幅度校正幅度校正幅度校正幅度校正全极点全极点滤波器滤波器单脉冲(周期)单脉冲(周期)U/V4.2基音提取方法的改进基音提取方法的改进采用采用 LPC 的的残差信号残差信号或者或者语音信号语音信号的的自相关函数自相关函数, 利用利用动态规划动态规划的的平滑平滑算法来更准确地提取算法来更准确地提取基音周期基音周期。 LPC 残差信号经残差信号经低通低通后,求出所有可能的后,求出所有可能的基音延时点基音延时点上的归上的归一化自一化自相关系数相关系数

58、,选出其中的,选出其中的 L 个个最大值最大值,再用再用过去过去和和将来将来相邻相邻 3 帧帧的每帧的每帧 L 个最大值,用动态规划的算个最大值,用动态规划的算法求得法求得最佳基音值最佳基音值。 宽带噪声宽带噪声时,时,LPC 的残差信号中的基音周期可能被的残差信号中的基音周期可能被破坏破坏, 这时可用低通的语音信号这时可用低通的语音信号代替代替残差信号,提取基音周期。残差信号,提取基音周期。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器4.3声道滤波器参数量化的改进声道滤波器参数量化的改进(1) LSF 在数学上的在数学上的量化特性量化特性 LSF 有良好的量化特性,在

59、现代声码器中应用越来越多。有良好的量化特性,在现代声码器中应用越来越多。 LSF 参数的参数的有序有界性:有序有界性:若若 H(z) 的的极点极点在在单位圆内单位圆内,则,则 P(z) 和和 Q(z) 的的零点零点在在单位圆上单位圆上。 P(z) 和和 Q(z) 的零点(即的零点(即LSF )更精确地反映频率的性质。)更精确地反映频率的性质。其其排列顺序排列顺序满足:满足:LSF 误差误差相对独立性:相对独立性:某频点某频点 LSF 偏差只对该频率附近的偏差只对该频率附近的语音频谱语音频谱产生影响,产生影响, 对其它对其它 LSF 频率上的语音频谱影响不大频率上的语音频谱影响不大;利于利于 L

60、SF 的参数的参数量化量化及及插值插值。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器(2) LSF 参数的参数的标量量化标量量化 求求 LSF 参数的参数的概率分布概率分布函数函数 对语音信号对语音信号分帧分帧、剔除、剔除无声帧无声帧、隔直流隔直流、帧间叠接帧间叠接,计算各帧的计算各帧的 LSF 参数参数,组成一个足够大的参数集合,以得到,组成一个足够大的参数集合,以得到每个每个 LSF 参数的参数的最低最低、最高频率最高频率和和概率分布函数概率分布函数。 检验参数的检验参数的合理性合理性 利用利用 LSF 参数取值范围及有序性的限制,参数取值范围及有序性的限制, 检验

61、求取的检验求取的 LSF 参数参数是否准确合理是否准确合理; 该措施保证该措施保证系统稳定系统稳定。 失真测度失真测度及及量化量化方法方法 失真测度失真测度用用 Euclid 距离距离; 采用动态规划算法进行非均匀的采用动态规划算法进行非均匀的全局最佳量化全局最佳量化。 线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器 量化器的设计量化器的设计 假定假定 LSF 参数参数、 统一排序统一排序为:为: 1、2 、p Ni i 的的量化阶数量化阶数, Pi () i 的的概率密度函数概率密度函数, imin,imax i 的的最低频率最低频率和和最高频率最高频率(已知)。注:注

62、:为方便起见,在公式中去掉表示第为方便起见,在公式中去掉表示第 i 个参数的下标个参数的下标 i。设设 q() 是是 的的量化量化,则设计,则设计 q() 是使是使量化畸变量化畸变 D 为为最小最小: N 个个判决判决(重建重建)频率的量化器,是选择)频率的量化器,是选择重建频率重建频率 和和阈值频率阈值频率 F,以下式表示的,以下式表示的量化畸变量化畸变 D 最小最小: 式中式中Fj 阈值频率阈值频率, 线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器具体设计:具体设计: 先将区间先将区间 imin,imax 离散化离散化成成 M 个个等间隔子区间等间隔子区间, 得到得到

63、 M-1 个个离散样点离散样点的集合的集合 = r1,r2,rM-1, 量化器的设计是在集合量化器的设计是在集合 中中选择重建频率选择重建频率, M 愈大,量化愈精细,计算量也愈大,一般取愈大,量化愈精细,计算量也愈大,一般取 M =512。用下述的用下述的动态规划算法动态规划算法计算计算全局最佳量化频率全局最佳量化频率:. 对所有的对所有的 ,计算:计算:. 对对 j = 2,3,N-1,对所有,对所有 ,计算:计算:式中,式中, ; 上式对标号上式对标号 k 求求量化畸变量化畸变最小,且满足最小,且满足 。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器. 最后确定,计

64、算:最后确定,计算:且满足且满足 ,在所有可选择的在所有可选择的 m 中找到中找到 DN,m 的的最小值最小值,由后向前(如由后向前(如所述)往回跟踪,找到所述)往回跟踪,找到 N 个个最佳重建频率最佳重建频率。. 对对 p 个个 LSF 参数进行参数进行 步骤步骤,得全部量化参数。,得全部量化参数。实验结果实验结果。每帧每帧 10 个个 LSF 参数,参数,量化比特量化比特 3,4,4,4,4,3,3,3,3,3,共,共 34 bit。 34 bit LSF 参数量化与参数量化与 41 bit k 参数量化,合成参数量化,合成音质相仿音质相仿, 波形吻合波形吻合,计算量化畸变约为,计算量化畸

65、变约为 l dB,达到,达到“透明透明”量化要求。量化要求。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器4.4LSF 参数的矢量量化参数的矢量量化LSF 参数参数 24 bits/帧帧 的的矢量量化矢量量化,现有技术,现有技术难于实时实现难于实时实现。需权衡存储量、计算量和硬件的技术水平,需权衡存储量、计算量和硬件的技术水平, 用用分裂矢量量化分裂矢量量化:把:把 10 维的维的 LSF 矢量分成矢量分成 (4, 6) 两个矢量两个矢量, 或或 (3, 3, 4) 三个矢量三个矢量,对每个矢量分别进行矢量量化。,对每个矢量分别进行矢量量化。 将将 10 个个 LSF 参

66、数参数分裂分裂为为 4212+6212,是可接受的。,是可接受的。LSF 参数矢量量化的关键是参数矢量量化的关键是训练码书训练码书。操作过程如下:。操作过程如下: 求求 LSF 参数的参数的概率分布函数概率分布函数和检验和检验 LSF 参数的参数的合理性合理性两项与两项与 LSF 参数的标量量化相同。参数的标量量化相同。线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器采用采用加权加权 Euclid 距离距离作为作为量化失真量化失真的度量,即的度量,即 式中式中 第第 i 个个 LSF 角频率角频率和其和其量化角频率量化角频率; Wi 第第 i 个线谱频率的个线谱频率的加权值

67、加权值, Wi =P(i)r ;r 是是经验常数经验常数; P(i) 由由 LPC 分析得到的分析得到的平滑功率谱平滑功率谱; Ci 第第 i 个线谱频率的个线谱频率的辅助加权因子辅助加权因子, Ci =1,i=1,2,8; C11 =0.8,C10 =0.4。对每个矢量分别采用对每个矢量分别采用 LBG 算法算法设计码书。设计码书。采用采用分裂矢量量化分裂矢量量化,24 bit/帧帧 可以得到可以得到平均谱畸变平均谱畸变为为 1 dB的的“透明透明”矢量量化。矢量量化。 线 性 预 测 声 码 器 4 增 强 型 LPC-10 声 码 器线性预测声码器5混合激励线性预测声码器 LPC10 声

68、码器声码器和其和其改进型改进型 LPC10e 声码器声码器,效果不理想。,效果不理想。1998 年底,美国采用混合激励线性预测(年底,美国采用混合激励线性预测(MELP)声码器)声码器 来取代标准。来取代标准。MELP 声码器在传统的声码器在传统的二元激励二元激励 LPC 模型基础上,模型基础上, 采用了采用了混合激励混合激励、非周期脉冲非周期脉冲、自适应谱增强自适应谱增强、脉冲整形滤波脉冲整形滤波以及以及 Fourier 幅度幅度五项新技术,五项新技术, 使合成语音质量得到使合成语音质量得到极大的改善极大的改善(编码速率编码速率2.4 kbit/s)。)。本节主要内容:本节主要内容: 5.1MELP声码器编码原理声码器编码原理5.2MELP声码器解码原理声码器解码原理(可略讲该编码器)线 性 预 测 声 码 器 5混 合 激 励 线 性 预 测 声 码 器谢 谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号