压缩采样介绍讲解

上传人:我** 文档编号:113587380 上传时间:2019-11-09 格式:DOCX 页数:23 大小:576.03KB
返回 下载 相关 举报
压缩采样介绍讲解_第1页
第1页 / 共23页
压缩采样介绍讲解_第2页
第2页 / 共23页
压缩采样介绍讲解_第3页
第3页 / 共23页
压缩采样介绍讲解_第4页
第4页 / 共23页
压缩采样介绍讲解_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《压缩采样介绍讲解》由会员分享,可在线阅读,更多相关《压缩采样介绍讲解(23页珍藏版)》请在金锄头文库上搜索。

1、压缩采样介绍一个与传统数据采集不同的传感、采样范例Emmanuel J. Cands and Michael B. WakinIEEE信号处理杂志 2008年3月对信号和图像采样的传统方法遵循著名的香农定理:采样速率必须至少是当前信号最大频率的两倍(也称奈奎斯特速率)。事实上,这个定理几乎是所有信号采集方式的基础,被大规模应用在消费性音频视频电子设备、医学成像设备、收音机等等。(对于某些信号,例如并非是原始的天然影像,采样率就不是由香农定理所规定,而是取决于需要的空间或时间分辨率。然而,这些系统经常在采样前使用反锯齿低通滤波器保持信号,使得香农定理扮演一个幕后的角色。)例如在数据转换领域,标准

2、模数转换器(ADC)技术使用量化香农定理:信号一律以大于或等于奈奎斯特速率来采样。这篇论文研究了压缩采样的理论,该理论亦被称为压缩传感或CS,是一项新颖的与传统数据采集不同的传感、采样技术。CS理论声称可以比传统方法使用更少的采样信号和测量来恢复特定信号和图形。为了实现这一点,CS依靠两个准则:稀疏性,不连贯性。u 稀疏性,表示连续时间信号的信息率可能比由带宽决定的还要小,或者离散时间信号自由度远小于其有限的长度。更准确的说,CS方法发现许多自然信号是十分稀疏并可压缩的,当用适当的基础表述时,他们就能有简明的表达。u 传感形式不连贯延续了时间和频率的二元性,并表明目标在有一个稀少的特征并一定会

3、在他们已得的范围内扩展,正如时域里面的狄拉克或冲击信号在频域也可展开表示。另外,不连贯表明它与信号特征不同,采样、传感的波形在有一个非常密集的表示。最重要的是我们可以设计有效的传感、采样规则,来获取有用的信息并将其嵌入到稀疏的信号中,加入到一小段数据中。这些规则仅十分简单的要求把信号同一些固定的波形相关联,这些波形也都没什么根据。关于这些采样规则,最不同寻常的是它们可以使用一个传感器,从稀疏的信号中高效的获取信息,并且也不需要分析这些信号。甚至它还能使用数字化最优方法,仅依靠一小段获得的数据来重建全部信号。换句话说,CS是一种非常简单并高效的数据获取方法,它采用信号独立方式,采样率低,依靠看起

4、来不完整的一系列测量,经过计算来重建信号。我们这篇论文意图概述13中出现的基本的CS理论,展现该理论所包含的关键数学思想,并调查该领域一些重要的结论。我们的目标是尽可能清楚的解释CS理论,因而这篇文章主要是指导性的。该理论最吸引人之处是它涉及了许多不同的学科分支,包括应用数学、概率论。在本文中,我们决定突出这一方面,特别是随意性可以导致有效的感觉机制。我们也会讨论重要的含义,解释为何CS是同步传感、压缩数据的明确规则(如题所言),通过回顾重要的应用来总结我们的探索。传感问题在本文中,我们将讨论一种传感机制,该机制由线性泛函获取记录信息的信号f(t). , k=1,m. (1)我们简单的将想要取

5、得的目标同波形相联系。这是一个标准的方案。如果传感波形是狄拉克-德尔塔函数(尖形),例如,y是f在时域或空间域的一个矢量采样值。如果传感波形是像素的指标函数,那么y是由数码相机传感器收集的典型图像数据。如果传感波形是正弦曲线,那么y就是一个傅里叶系数的矢量;这是磁共振成像(MRI)使用的传感形式。还有很多其他的实例。虽然人们可以对连续的时域或空间域信号发展一种CS理论,但是我们的注意力集中在离散信号。原因是两方面的:第一它在概念上较简单;第二,现有的离散CS理论还不成熟(但是显然为连续理论铺平了道路也被视为“应用”)。说到这里,我们由此对正在采样的情形颇感兴趣,此时测量的数值m比信号f的度量n

6、要小得多。由于多方面的原因,这类问题十分常见。例如,传感器的数量可能受到限制。或者由于特定成像过程需经过中子散射,使得测量过程极其昂贵。又或者传感过程十分缓慢,人们只能在IMR中对目标进行有限次测量。诸如此类。 这些情况蕴含重要的问题。是否只能在mn时才能精确重建?是否可能设计mn的传感波形来获取几乎全部的关于f的信息?人们如何能够由这些信息得到近似的f?诚然,这种情况看起来很让人畏缩,因为这样就需要求解线性待定方程组。用A表示mn的传感矩阵,以矢量为一行(是a的复变换),当mn时,从中恢复的过程一般是不稳定的:满足的信号有无穷多。但是我们或许能够依靠目标f存在的实际模型,来找出一种解决办法。

7、香农定理告诉我们,如果f(t)带宽实际上很低,那么少量的采样就能满足恢复的需要。下文我们就将看到,信号恢复实际上可以在更宽的信号模式上成功。非连续及稀疏信号传感本部分展示CS理论包含的两个基本前提:稀疏和间断性。稀疏当以适当的基础表达时,许多自然信号有着简明的表示。例如,在图1(a)中的图片和它在(b)中的小波变换。虽然几乎所有的图片像素都为非零值,波形系数提供了一个简明的摘要:大部分系数都很小,因而少数相对较大的系数就包含了大部分信息。波形参数图1:(a)一个原始百万像素图像,像素为0,255,(b)它的波形参数变换(为增强清晰度而随机扩展)。相对来说少量波形参数获得了大部分信号能量;许多这

8、类图像可以深度压缩。(c)对除了25000较大值的小波形扩展参数进行清零而完成重构后的图片(像素值为0,255)。几乎看不出与原始图片有差别。正如我们在“采样过疏和稀疏信号重建”中描述的,图片可以仅依靠96,000个非连续测量实现完美的重建。从数学上讲,我们有一个矢量(例如图1中的图像像素),可将其在规范正交基(例如小波基)=内扩展如下: (2)这里x是f的一项参数,。可以方便的将f表示为(是以为一列的nn矩阵)。稀疏的含义现在清楚了:当信号扩展时,我们可以将较小的参数丢弃而不会有大的误差。一般认为,通过保持与式(2)中的最大值S的相应关系,可以得到。根据定义,在此及下文,是参数的矢量,S的最

9、大值设定为零。这个矢量严格的说是稀疏的,它的少数值为零;在S几乎为非零值时,将这些目标称为S-稀少。既然是标准正交基,我们有,如果x是稀疏或可压缩的衰减很快,那么x就由很好的近似,因此,的误差很小。简单说来,我们可以舍弃一大部分参数而没有较大误差。图1(c)展示了一个例子,舍弃了97.5%的参数而获得的近似图像,同原百万像素图片几乎分辨不出差别。 这个规则构成了现代有损编码标准,如JPEG2000以及其他标准,数据压缩的一个很简单的方法就可以从f计算出x,然后把重要参数S的位置、大小进行编码。这样一个过程需要知道参数x所有的n,重要信息的位置可能提前并不知道(它们依赖于信号);在我们的例子中,

10、它们一般唯一图像的边缘。更普遍的是,稀疏是一个基本建模工具,它允许高效的基本信号变换;例如,准确的统计学估计和分类,高效数据压缩等等。本文是关于更加令人震惊而深远的影响,然而,稀疏在获得程序本身上有重要的支持作用。稀疏决定究竟多么高效地非自适应地获得信号。间断性采样假设我们有一对属于的正交的(、)。第一个用于传感式(1)中的目标f,第二个用于表示f。对这对正交基的限制并不是必须的,仅仅会简化我们的研究。定义一和之间的连系是: 式(3)在通俗英语中,相关性度量和的任何元素之间关系;也可见5。如果和包含相关的元素,相关性就大。否则就小。不管多大多小,它都按照线性代数的规定。 压缩采样主要被认为是低

11、相关的,我们这就给出这样的例子。在我们的第一个例子中,是标准基,而是傅里叶基,。由于是传感矩阵,对应在时域和空间域的经典采样方法。时间-频率遵守,因此,我们可以有最大化的间隔。还有,锥形和正弦曲线在多个方面达到最大化间隔, 我们的第二个例子用小波形、noiselets表示。这里,Noiselets和Harr小波之间的一致性为,Noiselets与Daubechies D4和 D8小波间的一致性分别为2.2,2.9。这也可以延伸到更高的维数。(Noiselets与Spikes,傅里叶基同样达到最大非一致性)。我们对Noiselets的兴趣来自以下事实(1)它们与提供图像数据和其他类型数据稀疏表达

12、的系统有非一致性(2)它们来自快速算法;Noiselet变换运行时间为o(n)时间,正如傅里叶变换,Noiselets矩阵不必存储成向量应用。这对于CS有效的数值计算是至关重要的。最后,随机矩阵与任何固定基间均有较大的非一致性。均匀随机的选择一个正交基,这可以通过独立均匀的在单位球面上采样n个正交化的向量得到。然后很大概率上,和间的一致性大约为。还有,具有独立同分布项(i.i.d.)的随机波形(),高斯或者二值项,将与任意固定表述之间具有较低的一致性。注意这里很奇怪的指示;如果非相干系统的传感很好,那么高效的机制应当取得与随机小波形的相互关系,例如白噪声!采样过疏及稀疏信号重建理想的,我们想测

13、量f的所有n个系数,但是我们只能观测这些数据的子集,并获取数据 (4)其中是mn的子集。有了这样的信息,我们决定通过范数最小恢复信号;提出的重建为,其中是凸面最优规划的解( ) 服从 (5)这就是说,在所有与数据组成目标中,我们选择范数最小的系数序列。(众所周知,最小的服从线性方程约束,如同线性方程使得更多的有效运算法则达到应用一样,改进非常容易。)使用范数作为稀疏促进方程可以追溯到几十年前。一个早期的应用是反射地震学,从数据组7,8中寻找出稀疏反射函数(标志着地层中有意义的变化)。然而最小化范数不是恢复稀疏结果的唯一方法,其他方式比如贪婪算法9也已经提出了。我们的第一个结果断言,当f足够稀疏

14、时,经过范数最小的恢复是准确的。原理110固定,假设在基下f的系数序列x是S稀疏的。在域均匀随机的选择m个测度。然后如果 (6)对于正常量C,(5)的解在极大概率下是准确的。(如果,那么成功的可能性就会超过1-。)还有,结果只是保证几乎所有信号x序列有固定支点,详见10。我们作三个注释:(1)一致性的角色是非常显然的;一致性越小,需要的样本越小,因此我们的重点在前面部分的低一致性系统。(2)我们可以无损的利用任意m个系数,这些系数可能远小于信号大小显然需要的。如果等于或者接近1,那么按足够样本Slogn顺序的代替n。(3)通过最小化凸面函数,信号f可以从我们压缩的数据中准确恢复,这个函数没有假

15、设关于非零坐标x的任何先验信息,他们的位置,或他们的幅度我们假设全部没有先验知识。我们只是运行算法,如果信号正好是足够稀疏的,那么精确恢复就可实现。这个定理事实上表明了一个具体的获取协议:在非一致域中非自适应的采样,在采样后调用线性规划。按照这样的协议将获取到具有压缩形式的信号。我们需要的是一个解码器去解压数据,这是最小范数的角色。事实上,这个非一致采样理论拓展了早期关于稀疏信号采样的结果1,表明随机1)可以成为一个非常有效的传感机制,2)经得起严密论证的考验,因而这触发了很多我们见到的、现在仍然见证的CS发展者。假设我们对采样超宽带信号但是谱稀疏形式,t=0,n-1,感兴趣,其中n很大但是非零项的数量小于等于S(我们可以想的比较小)。我们不知道在哪些频率上是活跃的,而且不知道其幅度。因为活跃集合不一定是连续整数的子集,奈奎斯特/香农采样定理很可能没有用(因为无法在初始时限制带宽,可能导致所有的n时间采样都是需要的)。在这种特定情形下,原理1主张我们可以重建具有任意未知频率支撑集S的信号,利用Slogn时间采样顺序,见【1】。更多的是,这些采样是不必仔细选择的;几乎任何具有这样采样集合

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号