三维交互技术算法及FPGA实现

上传人:鲁** 文档编号:502326774 上传时间:2023-07-05 格式:DOCX 页数:16 大小:228.35KB
返回 下载 相关 举报
三维交互技术算法及FPGA实现_第1页
第1页 / 共16页
三维交互技术算法及FPGA实现_第2页
第2页 / 共16页
三维交互技术算法及FPGA实现_第3页
第3页 / 共16页
三维交互技术算法及FPGA实现_第4页
第4页 / 共16页
三维交互技术算法及FPGA实现_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《三维交互技术算法及FPGA实现》由会员分享,可在线阅读,更多相关《三维交互技术算法及FPGA实现(16页珍藏版)》请在金锄头文库上搜索。

1、三维交互技术算法及FPGA实现概述:本算法设计主要采用双摄像头,基于双目视觉技术来定位3维手势。图像采集输入:图像输入只采集亮度信号,并且经过二值化,只采集255和0图像。存入到sdram。手部边缘提取总体思路如下:(1)(2)(3)(4)对获得的图像进彳T腐蚀。使用7*7的结构元,得到 pHand然后再对腐蚀得到的图像进行膨胀。使用7*7的结构元,得至U pHandOpen 。对pHandOpen进行腐蚀运算。使用 3*3结构元,得到pErode 。使用pHandOpen 减去pErode,得到手部边缘,记为 pHand 。0,7,14,21行1,8,15,22行2,9,16,23行3,10

2、,17,24行4,11,18,25行5,12,19,26.行6,13,20,27.行二值化图像输入F640X480*1 RAM小A7X1shifteri I640X480*1 RAM-L7X1shifter1640X480*1 RAMt -7X1shifter640X480*1 RAM7X1shifter640X480*1 RAM640X480*1 RAM640X480*1 RAM7X1shifter7X1shifter7X1shifter最小值写入行缓冲640X480*1 RAM640X480*1 RAM640X480*1 RAM最小值存入SDRAM或输入连通 域计算模块0,7,14,21.

3、行640X480*1RAM7X1shifterI1,8,15,22.行640X480*1RAM7X1shifteri2,9,16,23.行640X480*1RAM*7X1shifter13,10,17,24.行640X480*1RAM.7X1shifterI14,11,18,25.行640X480*1RAM-*7X1shifter115,12,19,26.行640X480*1RAM7X1shifter6,13,20,27.行640X480*1RAM一L7X1shifter连通域判断总体思路如下:对边缘提取的图像进彳亍漫水填充,使用areaNum对连通区域的个数进行计数1 .逐行扫描,当碰到第一

4、个非0数据时(红色格),使用四连通进行填充,并且逐行进行,直到把这个连通域填充完毕,并把这个区域设为值1。2 .继续逐行扫描,碰到非0和非1的数据时(绿色格),使用四连通进行填充,并且逐行进行,直到把这个连通域填充完毕,并把这个区域设为值2.3 .以此类推NOTE:这里最多能有256个连通区域,值得注意算法实现考虑:考虑一个3*2窗口:Pn-1(0)1涓Pn(1)Pn(0)P为像素值,为。或1.考虑块的标记值:如下:N-1行由这里看出,需要存储由标记值标记灰度的图像。以便后来进行去除其它干扰点时使用。以及在做标记处理的时候。必须同步读取标记好的数据。从头搜索像素:第一个点或第一行,左边点和上边

5、点扩充0值。其他空白处不考虑。标记值初始化为1:连通域像素点个数计数值:开辟一个数组Sum口:同时开辟等价关系数组K:等价关系数组为1个下标代表联通块,数组值代表这块标记的灰度值,如果两块的灰度标记值相等,则认为这两块是连通的。下面用lab()来表示K数组里面的值。1 .Pn(0)如果为0.则窗口继续移动,如果1:判断ifPn(0)=Pn-1(0),则Ln(0)=Ln-1(0)ElseifPn(0)=Pn(1)则Ln(0)=Ln(1),else都不等:Pn(0)=Z,把Z写入Z为下标的K数组,Z+;计数:判断ifPn(0)=Pn-1(0),则下标为Ln-1(0)的Sum数组值+1;Elseif

6、Pn(0)=Pn(1)则Ln(1)的Sum数组值+1.2 .两个块等价关系判断:如果Pn(0)=Pn(1),Ln(0)!=Ln(1)而说明这两块是等价的。Ln(0)和Ln(1)标记是等价的。步骤一:如果Ln(0)Ln(1):并且lab(Ln(0)=Ln(0)则说明Ln(0)块还未与其他块相连,或者是相连块里面标记最小的。则Lab(Ln(0)=lab(Ln(1),让其与Ln(1)块相连。如果Lab(ln(0)!=Ln(0),则证明Ln(0)块已经于其他块相连,因此需要找到这一个块中标记最小得块,即Lab(t)=t的块,t为块标记。这里我们采取追踪标记的办法,令t=Lab(ln(0);即t是与la

7、b(Ln(0)块相连的块,如果lab(t)=t则t块就是最小的块,以t和Ln(1)块比较。然后再重复步骤一:步骤二:Ln(0)Ln(1):并且lab(Ln(1)=Ln(1),则说明Ln(1)还未与其他块相连,或是相连块中最小标记的。则lab(Ln(1)=Ln(0)。如果lab(Ln(1)!=Ln(1),则证明Ln(1)块已经于其他块相连,因此需要找到这一个块中标记最小得块,即Lab(t)=t的块,t为块标记。这里我们采取追踪标记的办法,令t=Lab(ln(1);即t是与lab(Ln(1)块相连的块,如果lab(t)=t则t块就是最小的块,否则继续追踪,然后以t和Ln(0)块比较。然后再重复步骤

8、一:3 .遍历等价关系表数组,以(标记值内的值)作为数组下标的单元的值去跟新原值:用C语言表示即:*p=*(*p)。4 .把每个等价的计数单元相加,找出最大值。5 .根据等价关系数组更新图像。6 .把除最大连通域部分图像清零。保留最大的连通分量总体思路如下:如果areaNum的值为零,代表这帧图像中没有连通域,则直接返回零值。如果areaNum不为零,进行逐行扫描,建立一个数组pAreaPixsj,比较当前像素的pTempj和areaNum的大小,如果pTeamj的值小于等于areaNum的值且pTeamj的值大于零,则pAreaPixspTeamj-1加一。此时pTeamj的值为上一步中区域

9、的赋值,扫描结束整副图像,最后得到一个数组,其中的最大值为连通域的最大值maxLen,进而得到最大连通域的maxindex(实际上也是areaNum-1)。通过判断pTempj和maxIndex+1的值是否相等,来标记出最大的连通分量,作为手指的区域。提取指尖坐标思路如下:如果没有连通分量,直接返回;有连通分量,寻找轮廓的起始点,遍历所有轮廓点,并将这些点的坐标保存在数组中通过对轮廓曲率的变化找到小于阈值的边缘点进一步对这些边缘点进行判断,得到指尖坐标(4)、(5)步骤如图所示:通过判断角度得到边缘点,使用T判断边缘点是否为指尖点。从最后一行开始扫描:得到第一个点后,判断该点的上,下,左,右。

10、这里可以做一个状态机来实现;状态1:扫描得到第一个点。存储该点坐标,转到状态2状态2:扫描该点的右边点:如果该点为1:则如果该点为上一个点,转到状态3,如不是:存储该点坐标,转到状态1。否则转到状态3.状态3:扫描该点的上边点:如果该点为1:则如果该点为上一个点,转到状态3,如不是:存储该点坐标,转到状态1。否则转到状态4:状态4:扫描该点的上边点:如果该点为1:则如果该点为上一个点,转到状态5,如不是:存储该点坐标,转到状态1。否则转到状态5:状态5:最后一个点扫描结束。求角度:扫描数组里的数据:数据采用FPGA片内RAM实现。绘制指尖所在点计算指尖点的世界坐标思路如下:由空间中某点在左右摄像头中的坐标计算出该空间点的三维世界坐标,世界坐标系与左摄像头的摄像机坐标系重合。具体公式见程序。三维坐标进行IMM滤波卡尔曼滤波:这种技术的多源于kinect,111234511267744551887445599111810711412913131114151513161114141415171716123456789101112131415161718192012345648974913141411161112345112644445518844455991118444499131341414141344141414144441、手部边缘提取原始图象0

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 市场营销

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号