基于视觉通路目标识别算法的研究

上传人:lizhe****0920 文档编号:46768384 上传时间:2018-06-27 格式:PDF 页数:59 大小:6.56MB
返回 下载 相关 举报
基于视觉通路目标识别算法的研究_第1页
第1页 / 共59页
基于视觉通路目标识别算法的研究_第2页
第2页 / 共59页
基于视觉通路目标识别算法的研究_第3页
第3页 / 共59页
基于视觉通路目标识别算法的研究_第4页
第4页 / 共59页
基于视觉通路目标识别算法的研究_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《基于视觉通路目标识别算法的研究》由会员分享,可在线阅读,更多相关《基于视觉通路目标识别算法的研究(59页珍藏版)》请在金锄头文库上搜索。

1、合肥工业大学硕士学位论文基于视觉通路目标识别算法的研究姓名:宋皓申请学位级别:硕士专业:信号与信息处理指导教师:张旭东2011-04基于视觉通路目标识别算法的研究基于视觉通路目标识别算法的研究 摘摘 要要 基于大脑皮层的目标识别是当前计算机视觉领域研究的热点, 其主要思想是利用各种神经元放电实验,建立数字图像的处理模型。目标识别和计算机视觉的目的都在于研究并体现具有与人类视觉认知水平相当的能力, 因此从人类视觉认知系统出发研究图像处理具有重要的理论意义和应用前景。 论文对于如何用机器算法完成视觉感知任务展开研究,建立了包括视网膜、膝状体、大脑腹侧皮层的完整视觉通路的目标识别算法。 论文主要工作

2、如下: (1)介绍卷积神经网络模型。基于隐层中简单细胞和复杂细胞神经生物学机理与算法作用,分析模型整体构建的思路,总结隐层中学习规则的优越性。 (2)分析稀疏编码算法。解释目标函数的建立和学习规则中的迭代算法,利用 Gabor 滤波器和稀疏编码提取特征,说明稀疏编码的应用。 (3)探讨 HMAX 模型。从模型创建的角度说明其每层的生理学意义与建模算法。将原先 4 层模型结构归结成 2 层算法操作:Coding 和 Pooling 层。在Pooling 层对比平均汇聚算法和原先的最大汇聚算法,实验表明最大汇聚算法在分类精度方面有较好的表现。 (4)建立了符合完整视觉通路的算法结构。利用卷积神经网

3、络,建立 4 层训练框架,每层分为两步:Coding 阶段和 Pooling 阶段。在 Coding 阶段中,选取稀疏编码中的梯度下降算法设计一种非线性滤波器, 模拟视觉信息从视网膜到视皮层 V1 区的处理过程;在 Pooling 阶段中,提出采用 HMAX 模型的最大汇聚算法,模拟视皮层 V2 区到 V4 区的视觉信息处理过程。实验结果表明该算法能够有效减小算法复杂度和提高分类精度。 关键词:关键词:目标识别,卷积神经网络,稀疏编码,HMAX 模型 Study on Object recognition models based on Visual pathway ABSTRACT Obje

4、ct recognition base on Primate Visual Cortex is the current hotspot in computer area,which using various aspects of neuron fire experiment to establish the model of image processing. Object recognition and computer vision both have the aim of studying and embodying the visual cognitive ability of hu

5、man, thus the research on image processing from the perspective of human visual perception system has important theoretical sigificance and application prospect. How using a algorithm to simulate visual perception, a object recognition model based on visual pathway which inlcuding retina, LGN and Pr

6、imate Visual Cortex was established in this paper. Including the following contents in this dissertation: (1) Convolutional Neural Network is introduced. The thought of how to building the overall Convolutional Neural Network structure is analysed through the learning of mechanism and algorithms of

7、simple cell and Complex Cell in Hidden Layer, also the superiority of learning rule in Hidden Layer is summarized. (2) Sparse Coding is analyzed. The objective function and the learning rule are explained, that shows the application through feature extraction using Gabor filter to initialize the Spa

8、rse Coding primary function (3) The physiological meaning and arithmetic in each layer of HMAX model are discussed. Then original max Pooling is compared with average Pooling through data classification experiment, which verifies advantage of max pooling so as to lay a theoretical foundation for mod

9、el selection. (4) An algorithm, four layers model each contain coding and pooling step using convolutional neural network structure is established base on complete visual pathway. In coding step, a nonlinear filter which consistent with neurons from retina to the V1 in visual cortex is designed from

10、 the gradient descent algorithm in sparse coding.In pooling step, max Pooling in HMAX model which consistent with neurons from V2 toV4 in visual cortex was adapt. The experiment results show that the method can effectively reduce algorithm complexity and improve accuracy of classification. Keywords:

11、 object recognition, Convolutional Neural Network, Sparse Coding, HMAX model 插图清单插图清单 图 1-1 一般物体识别系统的工作流程 . 3 图 1-2 一些像素的变动造成人脸认知上的重大改变 . 8 图 1-3 论文逻辑关系结构. 9 图 2-1 卷积神经网络结构.11 图 2-2 卷积神经网络不同神经元联系结构 .14 图 3-1 (a)8 方向,5 尺度的二维 Gabor 核函数的实部 .20 图 3-2 Gabor 小波卷积。(a)原图;(b)实部;(c)均值谱;(d)幅值图谱 .21 图 3-3 实验数据库

12、 Caltech-101 中的任意二幅自然图像 .22 图 3-4 上述算法提取的 144 个基.23 图 4-1 大脑腹侧通路 .25 图 4-2 HMAX 模型结构 .27 图 4-3 部分 Catlech 101 样本.30 图 4-4 部分 PASCAL Visual Object Classes 样本.31 图 5-1 视觉通路与卷积神经网络模型比较 .32 图 5-2 完整视觉通道算法结构 .33 图 5-3 完整视觉通路生理结构 .34 图 5-4 完整视觉通路功能结构 .35 图 5-5 感受野模型.37 图 5-6 Caltech 101 图像集目标和背景干扰类别 .39 图 5-7 干扰背景实例 .

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号