基于空间金字塔和特征集成的智能机器人目标检测算法

上传人:小** 文档编号:34140465 上传时间:2018-02-21 格式:DOC 页数:15 大小:182KB
返回 下载 相关 举报
基于空间金字塔和特征集成的智能机器人目标检测算法_第1页
第1页 / 共15页
基于空间金字塔和特征集成的智能机器人目标检测算法_第2页
第2页 / 共15页
基于空间金字塔和特征集成的智能机器人目标检测算法_第3页
第3页 / 共15页
基于空间金字塔和特征集成的智能机器人目标检测算法_第4页
第4页 / 共15页
基于空间金字塔和特征集成的智能机器人目标检测算法_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《基于空间金字塔和特征集成的智能机器人目标检测算法》由会员分享,可在线阅读,更多相关《基于空间金字塔和特征集成的智能机器人目标检测算法(15页珍藏版)》请在金锄头文库上搜索。

1、基于空间金字塔和特征集成的智能机器人目标检测算法 王万良 朱炎亮 王铮 屠海龙 浙江工业大学计算机科学与技术学院 摘 要: 随着人工智能研究的不断升温, 机器人以其对识别、检测、控制的复杂需求逐渐成为研究热点。以 NAO 足球机器人为例, 针对比赛球场背景复杂、光照视角多变、造成目标识别困难的问题, 提出一种基于空间金字塔和特征集成的目标实时检测算法。算法引入多尺度检测, 通过对原始图像构建高斯金字塔空间, 解决了不同视距下目标检测的难点。提出双通道串行特征集成框架, 利用计算速度快、漏检率低的梯度方向直方图特征基础检测器和线性支持向量机做初步检测, 采用识别精度高、错检率低的三通道尺度不变特

2、征转换描述子改进检测器和随机森林做二次筛选, 然后使用非极大值抑制算法去除冗余标定框。实验结果表明, 该方法在智能机器人目标识别任务上具有很高的鲁棒性和实时性。关键词: 智能机器人; 目标检测; 空间金字塔; 特征集成; 双通道串行检测; 作者简介:王万良 (1957-) , 男, 江苏高邮人, 教授, 博士, 博士生导师, 研究方向:计算机智能自动化、智能调度等;E-mail:;作者简介:朱炎亮 (1992-) , 男, 浙江德清人, 硕士研究生, 研究方向:神经网络、机器视觉;作者简介:王铮 (1986-) , 男, 江苏高邮人, 博士研究生, 研究方向:智能计算与智能系统;作者简介:屠海

3、龙 (1992-) , 男, 浙江德清人, 硕士研究生, 研究方向:大数据分析、智能机器人。收稿日期:2016-09-30基金:国家自然科学基金资助项目 (61572438) Intelligent robot object detection algorithm based on spatial pyramid and integrated featuresWANG Wanliang ZHU Yanliang WANG Zheng TU Hailong College of Computer Science and Technology, Zhejiang University of Tec

4、hnology; Abstract: With the accelerated study of artificial intelligence in recent years, robots had become research hotspot due to complex demand on recognition, detection and control.By taking NAO soccer robots as the example, aiming at the difficulty of object recognition in competition with comp

5、lex background, variable illumination and viewpoints, a real-time object detection method based on spatial pyramid and integrated features was proposed.To address the problem caused by different sights, the multi-scale detection was introduced by constructing Gaussian spatial pyramid space through t

6、he original image.Furthermore, a dual-channel serial detection framework was proposed, and HOG-PCA basic detector with linear support vector machine which had fast speed and low undetected rate were used to make preliminary detection;an advanced RGB-SIFT-PCA/BOVW detector and random forests with hig

7、h precision and low error rate were used for secondary screening.Non-maximum suppression algorithm was adopted to remove redundant bounding boxes.Experimental results demonstrated that the proposed method achieved high robustness and real-time performance in intelligent robot object recognition task

8、.Keyword: intelligent robot; object detection; spatial pyramid; integrated features; dual-channel serial detection; Received: 2016-09-301 问题的提出随着人工智能的快速发展, 智能机器人逐步被应用于工业生产、科研教育和生活服务等领域。其中类人足球机器人成为智能机器人中的热门分支, 其常见于机器人世界杯比赛 (Robot World Cup, RoboCup) 等各类科研竞赛中。机器人系统涉及智能控制、计算机视觉、机电一体化和通讯等前沿领域, 机器人视觉及目标检

9、测在比赛中所起的作用至关重要, 目标实时准确的识别和定位成为比赛制胜的关键因素之一。另一方面, 比赛环境复杂多变, 除了标准的绿色球场、白色界线球门外, 各类复杂的人群背景干扰以及光照视角变化也会对足球识别造成极大的影响。机器人视觉已经成为人工智能中一项重要的研究课题。传统的机器人足球识别方法包括颜色分割、Hough 变换、特征匹配等。颜色分割1-2利用目标足球颜色单一的特点, 在预处理阶段将图像从 RGB 颜色空间转换到 YUV, HSI, HSV 颜色空间, 以提高对光照变化的稳定性, 然后通过阈值分割、区域生长等图像分割算法在目标空间中分割出球体部分。虽然基于颜色分割的识别算法简单高效,

10、 但是对于相似颜色的背景干扰存在误判的可能性。针对该问题, 有学者结合 Hough 变换和颜色分割的球识别算法3, 不仅利用颜色信息对目标进行分割, 还引入 Hough 变换对目标几何形状进行二次检测, 通过双重特性大幅降低背景对目标的干扰。特征匹配算法4-6采用尺度不变特征转换 (Scale-Invariant Feature Transform, SIFT) 对图像进行特征抽取, 通过对目标模板和图像特征点匹配确定目标位置, 然而在复杂的背景下, SIFT 特征描述子计算速度慢, 容易受背景干扰。此外, 区域分割7、视觉词袋 (Bag of Visual Words, BOVW) 算法8、

11、改进 Fisher 向量 (Improved Fisher Vector, IFV) 9、空间金字塔匹配 (Spatial Pyramid Matching, SPM) 算法10、广义分层匹配 (Generalized Hierarchical Matching, GHM) 算法11、分歧引导子类挖掘 (Ambiguity Guided Subcategory, AGS) 算法12、可形变部件模型 (Deformable Part Models, DPM) 13算法等也被提出, 来解决物体检测问题。尽管上述算法抗光照变化能力强、识别准确率高, 但仍存在以下问题:算法对背景复杂性较敏感, 赛场环

12、境复杂度的提升对目标识别的影响大, 易出现机器人找不到目标甚至找到多目标情况;同时 2015 年目标球体花纹增加导致传统算法检测性能大幅降低。近年在计算机视觉领域, 深度学习逐渐取代传统的机器学习算法成为最热门的研究课题。其中基于深度神经网络的算法在 ImageNet, PASCAL VOC 和 MS COCO等大型数据库中全面超越传统方法, 成为最有效的物体检测算法, 算法包括空间金字塔池化网络 (Spatial Pyramid Pooling Net, SPP-Net) 14、区域卷积神经网络 (Region-Based Convolutional Neural Network, R-CN

13、N) 系列15-17、YO-LO (you look only once) 网络18、SSD (single shot multibox detector) 网络19、残差神经网络 (Residual Network, ResNet) 20等流行模型。目前, 深度学习虽然实现了高精度检测, 但在嵌入式应用中受硬件和计算资源的限制。本文通过分析类人足球机器人比赛特点及传统识别算法的不足, 结合基于机器学习的物体识别方法, 在传统方法的基础上进行改进, 提出一种基于空间金字塔和特征集成的智能机器人目标实时检测方法。如图 1 所示, 算法利用方向梯度直方图 (Histogram of Oriente

14、d Gradient, HOG) 特征和线性支持向量机 (Linear Support Vector Machine, LSVM) 计算快、光照变化稳定性强、准确性好的特点对原始图像进行初步检测;采用对光照与颜色尺度不变性鲁棒性强、检测精度高的 RGB-SIFT/BOVW 特征和随机森林 RF 进行二次检测。所提算法弥补了传统颜色分割和单特征匹配在复杂环境下容易错检、漏检的缺陷, 不但在不同比赛环境下具有较好的算法泛化性能, 而且可以最大限度地保证实时性。2 基于空间金字塔与特征集成的检测算法2.1 基于空间金字塔的图像尺度变换通用检测流程中, 滑动窗口的大小和分类类别决定了分类器的数量。传统

15、算法使用固定大小的窗口对图片进行滑动检测来完成目标识别, 在待检测目标尺度一致、显著性强和背景干扰小的前提下, 该算法具有计算复杂度低、特征性能高的优势, 检测效率基本满足实时性和准确性要求。然而在实际比赛中, 机器人与检测目标存在大范围波动的视距差, 导致智能机器人所获取图像中的目标尺度不一致, 增加了算法检测的难度。如图 2a 所示, 近距离目标和远距离目标尺度差异明显, 很难用固定大小的滑动窗口扫描检测, 窗口过大或者过小都会造成目标的漏检或错检。针对该问题, 本文构建图像多尺度空间, 利用固定大小滑动窗口在该空间进行迭代检测。如图 2b 所示, 基于空间金字塔的多尺度检测方法, 通过构

16、建不同尺度的图像空间金字塔, 使用固定大小的滑动窗口在金字塔空间中滑动检测, 配合已训练完毕的分类器, 从而获得目标位置标定框。原始图像大多存在噪声, 因此在构建金字塔时首先需要对图像进行预处理, 常用的方法是滤波, 如归一化滤波、高斯平滑滤波、中值滤波等。检测算法使用高斯平滑滤波, 高斯核函数为式中:z 为归一化因子, 用于保证图像平滑滤波过程中的卷积核权值和为 1;k 为核大小, 检测算法中的高斯核值取 7; 为高斯函数标准差, 式中 sc 为图像金字塔下的采样尺度。如图 2b 所示, 原始图像经过高斯平滑滤波和空间金字塔变换得到不同尺度图像层, 检测过程采用固定大小滑动窗口, 因此只需训练一种分类器, 从而节省计算资源、降低训练复杂度。最后对平滑图像构建空间金字塔, 构建公式为式中 dp 为空间金字塔层高, 两个参数 sc 和 dp 分别取值为 2 和 10。给定图像 I, 具体的金字塔空间算法如下:算法 1 Pyramid (I, s

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号