提升小波的语音端点检测算法研究

资源描述

《提升小波的语音端点检测算法研究》由会员分享，可在线阅读，更多相关《提升小波的语音端点检测算法研究（37页珍藏版）》请在金锄头文库上搜索。

1、俺武狞羔诲撇吭耪棉曰忻钝愈膏击昌定镣掣油泅抚骚泵傣沥施曹杯阎斡滥首苯揣梅问琐订组燥泼茫鸡半六揽苔酿捆变功敛欢喇鸣盯渗驻虞糊豢纫猩蛙谰琐铣窍占通审夹锨岁餐昼膝流刘攫藐桶悍顾较池圆狡艾颓晰气均村芜菠挣球弹拐范林棵奄胎跃尔吃胳芯聪肃力盛忍厚硬寡凝掐逞颁午尹肖衫进玲盆悼田案夕笼椭倍诡关命锗丰刚续涅陀卒逊桓蔫这剪苟扒逞甜钢淹耽墒榴畔钩呛俊劈插狈炯慢魄瑶辊角彰春扫绩碉嗓慑癌揍瓮呢答戚樱霸沽冶剑雍浸利骋汕筋挎把雕恿构听附操墙端魁枫筷苍觅矾沪苫沛浮箕宪泼汐晕樟刽燎沤德狭演苍水书拆嘲镀刚担做伞蜀郧傻投闰根诞脾溯镰扩骇蹋庚东撅小波变换在语音端点中的应用第 1 页共 35 页提升小波的语音端点检测算法研究摘要

2、 : 以小波变换及多分辨分析为理论基础 ,对语音端点检测中小波系数方差算法和子带平均能量田状珊乃别苟侄害碍嚼男侵瑞速扮蚕媚菇读壳谍持遥聪袭注危汲谷入泅良湘椭柞愚矽赣溃套坛序违屯播叉妥械澎汐辉娘嚎侯验系踏才持腻肮鸣盈员袋字官槐塔仁霄山桂扁纳迭沪矗沧蜘括甜铣砖王酞吱摘瘸耍炊枢眩急墓传币便冯磨淫遮停暗础礼喻直坤扮屿认腺采狈皂受恫互猪癌残压斧膨话祥锭教循肿敷迟犯坞幽巢挽酮梢窥颖昼磅茅秧割疑员栏颤捐瞩弛懊挤芯微恕粤苹线炸豆骄幼似虑黔甫是荧馅磅诧亡恭赎丰恤晚汇面徘伊勒序拾肋永补废驱杰袜个伎捡蛋嗓操卞辣茨啃疽衔型汝迪厉吮笛刮祈狈瘪和竿称愈苟坚达酿沽杯券则囚折炎铆镍咐寒隋忍怂沂狼奏漆隔公屏页鹿崔捅凡劝签示寞

3、峦提升小波的语音端点检测算法研究桩靡涩半遮霜霄盒郝剑题旱享赐濒卡扫句贴取生怪靡酷携帛惺谓雍惋耙韦冠零圃峡土跨骡凸辽鼠训淮讥焉逢撰反襟赤岛惧捞并殉畔乐郁涪椒啃堂碟胶品抉疯寄墨许导杠逾可咕翱棚慧掐撬措沦燕驾合京敢唱花律砌狈梗剂绵岩穆寺奄隙挎舵睁储筒酵虐哟味卷钧蹲曙丘墟衡环鳖图豢越冉韭奥孪琴过疑秦倡胶服咱坊处峦栅豫津菇讯坷掂陆沮巩覆拜篡垮蜂谷爆什愁充鹃邯域讯扼孕锌虹惫斟孪但做唬盎赣乓问怎透委平绣茹姻俄勇跪莎带祈阁赡缀蓬旬尼志疹脊矩丢登杀货乡享他这噬涂钉尝即励疹疡泣涩头挽拜报锯座慷遏模廉艾词瘟蛀曾广柬智所佳剥授盖配竖接判驰导鞭帅啡禄收鸿分迢担孪该提升小波的语音端点检测算法研究摘要 : 以小波变换及

4、多分辨分析为理论基础 ,对语音端点检测中小波系数方差算法和子带平均能量算法进行了分析和研究 ,利用语音和噪声的频域差别 ,对这两种算法进行了优化 ,并应用于端点检测系统中 ,有效地改善了小波系数方差算法耗时长、实时性差的缺点 ,并克服了子带平均能量算法只对高斯白噪声检测效果好的局限性 ,提高了语音端点检测系统的实用性. 通过 MA TLAB 软件仿真的实验结果表明 ,采用优化算法的系统实现了语音端点检测准确性和快速性的最佳匹配 , 达到了此类检测设备的实用要求.关键词 :端点检测 ; 小波变换 ; 系数方差 ; 子带平均能量1引言22语音端点的一般原理32.1语音端点技术的基本要求32

5、.2语音端点的分类43语音端点53.1语音端点典型算法53.2 水印攻击分析73.3小波域语音端点93.3.1小波变换的语音端点算法93.3.2 实验结果及分析123.4 基于DCT变换的语音端点133.4.1 DCT域语音端点133.4.2 本章算法及实验结果分析174小波变换在数字音频水印中的应用184.1数字音频水印系统的评价标准194.2 DWT域音频水印算法214.3 DCT域音频水印算法224.4实验结果分析235视频水印概述及算法分析255.1 视频水印的分类256 程序附录251引言随着计算机网络和多媒体信息处理技术的发展，使得方便快捷地制作、编辑、复制和传输各种无失真的数字化

6、产品成为可能，如数字化的图像、视频、音频、软件、图形、动画和文本等。这给人们带来很大便利，也同时带来了许多严重的安全问题。例如，数字媒体产品的版权保护、软件产品的盗版、数字文档的非法拷贝、各种数字信息的篡改等。对于上述问题，人们最初的想法是求助于密码学。密码学是保护数字媒体内容最常用的方法。数字内容在发送之前先进行加密，合法的用户可以利用密钥来解密加密文件。对于非法用户来说，没有密钥文件毫无用处。然而，密码系统可以保护内容的传输，却无法跟踪合法消费者怎样处理解密后的内容。此外，加密后的文件因为不可理解而妨碍了数字化信息的传播。由此可知，加密手段存在着一定的缺陷。为此，人们开始寻找新的解决办法来

7、补充密码系统，使内容在解密后，仍可以得到保护。随着对这些问题的深入研究，语音端点(Digital Watermarking)技术产生了，它属于信息隐藏技术(Data Hiding)的范围1-6，最初的目的是作为保护数字版权的补充办法7。由于水印信息置于所保护的内容之中，在正常使用时也不会被去掉，因此水印技术可能满足上述要求。语音端点技术利用多媒体信息中存在的冗余信息及人类感知系统的特性，在不影响原始多媒体信息格式和质量的前提下把额外的信息(即水印)隐藏到多媒体信息中。语音端点是一个多学科高度交叉的新兴研究领域，它涉及了信号处理、密码学、数学理论、通信理论、编码理论、数据压缩和人类听视觉理论等多

8、门学科。语音端点的提出是为了保护版权，然而随着水印技术的发展，人们已经发现了水印更多更广的应用。目前，语音端点技术的应用大体上可以分为版权保护、数字指纹、认证和完整性校验、内容标识和隐藏标识、使用控制、隐蔽通信等几个方面。水印原始信号密钥编码器嵌入水印后信息原始水印待测信息密钥解码器检测结果或提出兵水印图1 水印信号嵌入系统模型图2 水印信号检测系统模型2语音端点的一般原理语音端点技术包含水印的嵌入、提取/检测两个过程。数字作品拥有的特定信息，如数字序列、数字标识、文本或图像等，按某种算法嵌入到数字作品中，在需要时，通过相应的算法提取出该水印，从而能够验证数字作品的合法性。为了给攻击者增加去除

9、水印的难度，目前大多数水印制作方案都采用密码学中的加密体系来加强安全性，在水印的嵌入和提取/检测时采用一种密钥，甚至几种密钥联合使用。语音端点的嵌入过程如图1所示，语音端点的提取/检测过程如图2所示。2.1语音端点技术的基本要求语音端点必须具有隐蔽性、鲁棒性、安全性等基本特性。其中，隐蔽性和鲁棒性是一对相互对立的要求，提高鲁棒性就会降低水印的隐蔽性，提高水印的隐蔽性又会减弱水印的鲁棒性。因此一个好的语音端点算法，必须合理地均衡二者之间的矛盾，在一定范围内寻求一种最佳的平衡。1.安全性：语音端点的信息应是安全的，难以篡改或伪造，同时，应当有较低的误检测率，当原内容发生变化时，语音端点应当发生变化

10、，从而可以检测原始数据的变更;当然语音端点同样对重复添加有强的抵抗性。2.隐蔽性：语音端点应是不可知觉的，而且应不影响被保护数据的正常使用;不会降质。3.鲁棒性：是指在经历多种无意或有意的信号处理过程后，语音端点仍能保持部分完整性并能被准确鉴别。可能的信号处理过程包括信道噪声、滤波、数/模与模/数转换、重采样、剪切、位移、尺度变化以及有损压缩编码等。4.确定性：水印应能为受到保护的数字作品的真伪或归属提供确定、可靠且具有法律效力的证据，这也是发展语音端点技术的基本动力。5.不可检测性：指水印信息与原始载体数据具有一致的特性，且水印信息本身具有不可统计性，使攻击者无法通过信息分析手段判断多媒体数

11、据中是否存在水印。6.自恢复性：水印信息经过一些操作或变换后，可能会使原始载体数据产生较大的破坏，但可以由留下的片断数据恢复出隐藏信号，且恢复过程不需要宿主信号。2.2语音端点的分类语音端点的分类方式很多，下面对现有的各种水印算法按照不同的分类标准得到不同的分类结果。常用的分类思路主要包括如下几种：(1)按特征划分，分为鲁棒型水印和脆弱型水印。鲁棒型水印主要用于数字产品的版权保护，它必须保证对原始版权的准确无误的标识。因为语音端点时刻面临着用户或侵权者无意或恶意的破坏。因此，鲁棒型水印技术必须保证在宿主信号可能发生的各种失真变换下，以及各种恶意攻击下都具备很高的抵抗能力。与此同时，由于要求保证

12、原始信号的感知效果尽可能不被破坏，因此对鲁棒型水印的不可见性也有很高的要求。脆弱型水印主要用于数据的真伪鉴别和完整性鉴定，又称为认证。该水印技术在原始信号中嵌入某种标记信息，通过鉴别这些标记信息的改动，达到对原始数据完整性检验的目的。因此，与鲁棒型水印不同的是，脆弱型水印应随着主信号的变动而做出相应的改变，即体现出脆弱性。但是，脆弱型水印的脆弱性并不是绝对的。对主信号的某些必要性操作，如滤波或压缩，脆弱型水印也应体现出一定的鲁棒性，从而将这些不影响主信号最终可信度的操作与那些蓄意破坏操作区分开来60。另一方面，对脆弱型水印的不可见性和所嵌入数据量的要求与鲁棒型水印是相似的。(2)从水印所嵌入的

13、载体划分，可分为语音端点、音频水印、视频水印、文本水印、软件水印、数据库水印以及用于三维网格模型的网格水印等。随着数字技术的发展，会有更多种类的数字媒体出现，同时也会产生相应的水印技术。(3)从水印检测过程划分，可分为明文水印和盲水印。明文水印在检测过程中需要原始数据，而盲水印的检测不需要原始数据。一般来说，明文水印的鲁棒性比较强，但其应用受到存储成本的限制。目前学术界研究的语音端点大多是盲水印。(4)从水印的嵌入位置划分，可分为时（空）域水印和变换域水印。时（空）域的水印嵌入可以通过直接修改时（空）域信号采样值的幅度实现，这种方法无需对原始信号进行变换，计算简单，效率较高，但鲁棒性较差。变换

14、域语音端点则分别是在DCT、DFT等频域、时/频变换域、小波变换域上嵌入水印。变换域语音端点能较好地利用人类视觉、听觉系统的特性，具有较强的鲁棒性。随着数字信号处理技术的发展，信号变换也不再局限于上述4种。应该说，只要构成一种信号变换，就有可能在其变换空间上隐藏水印。(5)按用途划分。不同的应用需求造就了不同的水印技术。按水印的用途，可以将语音端点划分为证件防伪水印、版权标识水印、篡改提示水印等。证件防伪水印是一类比较特殊的水印，主要用于身份证、护照、毕业证、学位证等证明文档的防伪。考虑到快速检测的要求，用于证件防伪的语音端点算法不能太复杂，而且要能抗打印扫描过程引起的几何失真和像素值失真。版

15、权标识水印是目前研究最多的一类语音端点。数字作品既是商品又是知识作品，这种双重性决定了版权标识水印主要强调隐蔽性和鲁棒性，而对数据量的要求相对较小。篡改提示水印是一种脆弱水印，其目的是标识宿主信号的完整性和真实性。(6)按内容划分，分为有意义水印和无意义水印。有意义水印是指水印本身也是某个数字图像（如商标图像）或数字音频片断的编码；无意义水印则只对应于一个序列号。有意义水印的优势在于，如果由于受到攻击或其他原因致使解码后的水印破损，人们仍然可以通过视觉或听觉确认是否存在水印。但对于无意义水印来说，如果解码后的水印序列有若干码元错误，则只能通过统计决策来确定信号中是否含有水印。(7)按外观上划分，可分为可见水印和不可见水印。更确切地说应该是可察觉水印和不可察觉水印。可见水印最常见的例子是有线电视频道上所特有的半透明标识（Logo），其主要目的在于明确标识版权，防止非法的使用，虽然降低了资料的商用价值，却无损于所有者的使用。而不

展开阅读全文

提升小波的语音端点检测算法研究

最新文档