第十五章 三维运动估计.doc

上传人:pu****.1 文档编号:550527883 上传时间:2023-05-18 格式:DOC 页数:20 大小:929.51KB
返回 下载 相关 举报
第十五章 三维运动估计.doc_第1页
第1页 / 共20页
第十五章 三维运动估计.doc_第2页
第2页 / 共20页
第十五章 三维运动估计.doc_第3页
第3页 / 共20页
第十五章 三维运动估计.doc_第4页
第4页 / 共20页
第十五章 三维运动估计.doc_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《第十五章 三维运动估计.doc》由会员分享,可在线阅读,更多相关《第十五章 三维运动估计.doc(20页珍藏版)》请在金锄头文库上搜索。

1、第十五章 三维运动估计三维运动估计是指从二维图象序列来估计物体三维运动参数以及三维结构。具体地说,假定三维物体上一点相对于摄象机坐标系从时刻的位置运动到时刻的位置,它在二维图象平面上的投影从运动到,然后,通过分析二维运动来恢复物体的三维运动及物体上感兴趣点的深度值。这一点类似于立体视觉的深度恢复,不过立体视觉是从立体图象对来恢复深度值,而三维运动分析是从图象序列中恢复参数。三维运动估计有着广泛的应用,如机器人视觉,自主导航,目标跟踪,图象监控,智能车辆高速公路系统,基于物体的图象压缩等。三维运动估计仍然是一个不适定问题,必须增加适当的约束才能得到有效解。三维运动估计和分析也可以是基于场景的深度

2、图像序列,其方法与基于二维图像序列完全不同。基于深度图像序列的三维运动估计是一个适定问题,求解方法要比基于二维图像序列要简单一些,主要问题是数据量十分巨大,因此许多研究人员一开始就以实现大规模集成电路(VLSI)作为三维场景估计的基础。我们将不讨论深度图像序列运动估计问题,感兴趣的读者可以查阅有关文献Wheeler 1996,Jiar 1996.151 基于成象模型的对应点估计 首先回顾一下第十二章引入的三维刚体运动方程。假定三维场景中有一个刚性物体,其上一点从时刻的位置经过旋转和平移,运动到时刻的位置。设旋转矩阵和平移向量分别是和,则三维刚体运动模型重新表示为 (15.1)用欧拉角的形式表示

3、上述旋转矩阵(见式(12.2),(12.3)),并假定旋转角较小,则旋转矩阵可以表示为 (15.2) 其中,分别表示绕 轴逆时针旋转小角位移。1511 正交投影模型 当物体深度变化范围不大时,正交投影是透视投影的一个很好的逼近。其它逼近方法还有弱透视投影,超透视投影,正交透视投影等Dementhon 1992。 设空间点在图象平面上的投影为。如果成象模型为正交投影(参见图1.8),则有 (15.3)所以,式(15.1) 可表示为 (15.4)上述方程包含有6个参数,即,和,表示第帧图象像素到第帧图象像素的仿射映射关系。显然,正交投影模型是无法确定物体点到成象平面的距离,因为垂直于图像平面的一条

4、直线,其上的所有点都将投影到该图象平面上一点(见图1.8)。但是,如果在物体上选择一个参考点,并设该点的深度值为,则通过上式有可能估计出物体上其它点相对于这个参考点在垂直图像平面方向上的距离。实际上,我们无法得到真实的相对深度值,只能得到关于一个尺度系数的相对深度值,即 (15.5)从方程15.4中,我们看到和缩小,放大,方程仍然成立,因此产生多义性。文献Ull79证明三帧或三帧以上图象上的四点就可以克服这个问题。1512 基于正交投影的运动估计 将(15.2)小角度旋转矩阵代入(15.1),得到如下的正交投影模型: (15.6)在该方程中,对于每一个给定的对应点和,共有6个未知参数,其中5个

5、是全局运动参数,一个是深度参数。另外,这个方程是一个双线性方程,因为与未知参数和是乘积关系。理论上,给定三点,就可以根据(15.6)列出6个方程,从而解出六个未知参数。但实际上,由于数值计算误差,常常需要多个点,这样有可能得到较好的结果。文献Aizawa 1989 基于上述正交投影模型提出了基于两帧图象的两步迭代法:首先,根据上一次迭代得到的深度估计值,确定运动参数,然后再使用新的运动参数更新深度估计值。具体实现见算法15.1 算法15.1 基于两帧图像的运动估计两步迭代算法 给定个对应点坐标对和深度估计值,且,这样方程(15.6)可重新写为 (15.7)个对应点对应着个方程,而未知参数仅有5

6、个,因此,可以通过最小二乘法来求解这5个运动参数。深度参数的初始估计值可以根据场景的先验模型来设置,深度估计值应在预先设定的范围内选定,这主要是为了避免解的不唯一性。 根据得到的运动参数估计值,再对深度值进行估计。将式(15.7)重新写为 (15.8)由于每一个深度值对应两个方程,即方程(15.8)是一个超定方程,因此,可以用最小二乘法来求解。 重复上述两步,直到两次迭代值之差小于给定的某一个阈值。请注意,在上述算法中,运动估计误差和深度估计误差有着密切的关系。由方程(15.7)和(15.8)可知,深度估计的随机误差会重复反馈到运动估计上。因此,当深度估计不够准确或深度的初始值设置不当时,都可

7、能导致迭代算法的错误收敛或收敛在一个局部最小值。为了避免这种错误的收敛,Bozdagi 1994提出了改进的算法,该算法的基本思想是在每一次修正后,在深度估计值上加一个随机扰动。改进的算法如算法15.1所示。算法15.2 基于两帧图像运动估计扰动迭代算法: 初始化深度值,置迭代计数器。 在给定深度值下根据式(15.6)估计运动参数 根据当前的运动估计和深度参数,由公式(15.6)计算对应点的坐标 计算预估误差: (15.9) 其中,和是已知的对应点真实坐标。 如果小于预定的误差阈值,即,则终止迭代,否则,置。 给深度参数赋一个扰动值 (15.10) 其中和是常系数,是零均值高斯分布函数,其方差

8、。 回到第步 实验证明,这种改进的迭代算法在初始深度值有50%的误差的情况下,也能很好地收敛到正确的运动参数值。1513 透视投影模型 设空间点在图象平面上的投影为。如果成象模型为透视投影,则 (15.11)根据(15.1)式有 (15.12)由于成象系统的焦距是一个常数,因此,不乏一般性,取,即规范化透视投影。上式右边分子分母同除以,得到图象平面坐标表示式: (15.13)按照图像平面坐标,透视投影模型(15.13)是一个非线性方程。因为每一点对应的深度值是一个自由参数,因此,这个模型适合于任意表面形状三维物体的运动估计。1514 外极线方程和基本矩阵由方程(15.13)可见,在透视投影情况

9、下,运动和结构参数之间的关系是非线性的。早期人们使用迭代方法求解运动参数,但迭代过程往往不收敛,比如两步迭代法。Huang 1986证明,使用八个对应点或更多对应点来求取外极线约束方程并估计运动参数是可以改进两步迭代法的收敛性能。本节主要讨论外极线方程及其性质,关于估计运动参数,将在下一节介绍。 将方程15.1缩写为 (15.14)或 (15.15)令 (15.16)其中“”表示矢量积。为了书写简单,在不引起混淆的情况下,可以把下标去掉,即: (15.17)方程(15.15)可以重新写为 (15.18)下面引进一个反对称矩阵: 因此式(15.17)可表示为 (15.19)是一个矩阵,称为基本矩

10、阵(essential matrix),矩阵元素称为基本参数Huang 1986。下面首先看一下矩阵的一些性质Faugeras 1993:1) 2) 3) 4),其中,称为Frobenius模。 在性质1)中,是反对称矩阵,因此该性质是成立的; 对于性质2),; 对于性质3),; 性质4)显然是成立的。 用除以等式(15.18)的两边得 (15.20)根据规范化透视投影方程(15.11),得到外极线方程: (15.21)和是物体上一点在第帧和第帧图像上的投影点坐标,其齐次坐标分别为和,则外极线方程(15.21)可以表示为 (15.22)该方程的几何意义十分明显,从图15.1可见,三条线,和是共

11、面的,将这三个矢量变换到第二个坐标系中,其表示式分别为,和。第帧图像上一点对应矢量表示的射线上所有点的投影,射线上任何一点可以表示为,。根据针孔模型,射线上任何一点在第帧图像平面上的投影是,而整个射线在第帧图像平面上的投影是一条直线,表示成为第帧图像上一点在第帧图像平面上的外极线。这条直线可以用两点来表示,一点是,对应第帧图像光学中心在第帧图像平面上的投影,常称为极点(epipole);另一点是无穷远点,。则外极线可以表示为(15.23)第帧图像上一点在第帧图像平面上的对应点应该位于该直线上。图15.1 基于对应点的外极线约束恢复运动参数示意图 方程(15.22)是包含9个未知参数的齐次线性方

12、程,齐次线性方程无解或有无穷解。因此,可以令基本矩阵的一个系数为1,这样待估计的参数有八个。另外,矩阵是一个斜对称矩阵和一个旋转矩阵的乘积,它们并不是独立的。矩阵的前三个性质构成三个约束方程,这样,方程(15.22)只包含5个未知的独立的参数,这也和运动参数的自由度数量相一致,即三个旋转自由度,二个平移自由度(或三个关于一个比例系数的平移自由度),实际上,由方程(15.15)可见,平移量乘以任何不为零的系数都不影响方程成立,也就是说,当用同一个比例系数改变物体形状或运动平移量时,所得到的图像完全一样。因此,从运动恢复形状和从图像序列恢复运动参数,只能在关于一个比例系数的意义下进行。*1515

13、从基本矩阵估计运动参数由于基本矩阵只有5个未知独立参数,因此可以采用所谓的5-点算法(5-points algorithm)来求解基本矩阵,然后,基于基本矩阵恢复运动参数。不过由于5-点算法比较复杂,且得到的解很不稳定,因此,实用价值不大,在这里不作讨论,感兴趣的读者可以参见文献Faugerous 1990.为了得到唯一解,一般选取8个以上的对应点通过最小二乘法来求解。Longuet 1981提出一种8-点算法,通过8个点直接估计基本矩阵的8个未知参数,然后,在基本矩阵的基础上,估计运动参数。将基本矩阵表示为:方程(15.22)可以重新写为 (15.24)设,将上式缩写为 (15.25)如果有个对应点,每一个对应点生成一个方程,则共有个方程 (15.26)其中。由于是关于一个比例系数的矩阵,因此,实际上只需要求解8个未知参数。所以,求解该方程的最小点数是8个。已知空间中有8个点及其在第帧和第帧图像上的投影点坐标,则通过求解方程(15.26)得到基本矩阵参数。显然,只用8点求解基本矩阵,对噪声十分敏感,因此,一般采

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号