
论文题目: 分层计算感知模拟在目标识别技术中的应用 摘 要 随着人类对生物视觉信息感知机制的深入了解,模拟大脑视觉感知系统以增强计算机视觉的环境感知与认知能力已经成为计算机视觉领域的研究热点之一,其主要思想是针对大脑视觉皮层中视觉信息的层次性感知过程进行模拟,以实现目标识别的目的。近年来,深度学习的发展使机器具备分层视觉特征感知能力成为可能,通过深度学习提取的特征是一种分层次的高度抽象特征,这种特征能够在目标识别等许多领域的问题求解上获得更好的效果。 本文以具备稀疏连接思想和自我学习机制的卷积神经网络为框架,融入分层和仿生的思想,模拟人脑分层信息处理机制,实现显著目标的准确识别。模型首先构建多通道Gabor小波滤波器组模拟视网膜神经节细胞感受野视觉刺激响应, 替代传统卷积神经网络的第一层卷积层; 在此基础上,引入神经细胞间的”侧抑制” 机制,采用局部响应值归一化层对神经元响应进行筛选; 其中,为了模拟生物神经细胞层次间的稀疏激活性,模型引入修正非线性单元作为激活函数; 并利用空间金字塔随机池化层自适应获取目标的全部有效特征,避免由于图像压缩等操作造成的特征损失; 最后,模型仿照生物神经纤维膜内局部电流的随机电化学变化过程, 利用随机DropConnect方法解决神经网络计算常见的过度拟合问题。 所提模型通过模拟腹部通路中V1、V2、V4和IT区的功能,构建了具有分层计算感知不变性特征和具有学习、识别能力的分层计算感知模型。将该模型应用在不同规模数据集进行训练和验证,在同样识别条件下,和其他的目标识别模型对比,具有更好识别精度,识别稳定性。 关键词:目标识别;分层感知;卷积神经网络;冗余抑制;激活函数 目录 Abstract With the deep understanding of human visual information processing mechanism, simulating the brain vision system to enhance the environmental perception and cognitive ability of computer vision has become one of the research hotspots in the field of computer vision. The main idea is to visual information in the visual cortex of the brain Level processing to simulate the target recognition. In recent years, the development of in-depth learning has made it possible for the machine to have a hierarchical visual feature perception. The feature extracted by depth learning is a hierarchical, highly abstract feature that can be solved in many areas such as target recognition. Better results. In this paper, a convolutional neural network with sparse connection and self-learning mechanism is used as a framework to integrate hierarchical and bionic ideas, and simulate the hierarchical information processing mechanism of human brain to realize the accurate identification of significant targets. Firstly, a multichannel Gabor filter bank was constructed to simulate the retinal ganglion cell receptive field visual stimulus response, replacing the first convolution layer of the traditional convolution neural network. On this basis, the "lateral inhibition" mechanism was introduced into the nerve cells , The local response value normalization layer was used to screen the response of neurons. In order to simulate the sparse activation of biological nerve cell layer, the modified nonlinear unit was used as the activation function, and the spatial pyramid random pool layer adaptive Finally, the model simulates the stochastic electrochemical process of the local electric current in the biological nerve fiber membrane, and uses the stochastic DropConnect method to solve the common over-fitting problem of the neural network computation. . By modeling the functions of V1, V2, V4 and IT in the abdominal pathway, the proposed model constructs a hierarchical computing perceptual model with hierarchical computing perceptual invariance and learning and recognition ability. The model is applied to different scale data sets for training and verification. Under the same recognition condition, the model has better recognition accuracy and recognition stability than other target recognition models. Key words: Target recognition;Hierarchical perception;Convolution neural network; Lateral inhibition mechanism;Activation function 目 录 第1章 绪论 1 1.1 课题研究背景及意义 1 1.2 国内外研究现状 2 1.2.1 目标识别的研究现状 2 1.2.2 卷积神经网络在目标识别领域的研究现状 3 1.2.3 深度学习在目标识别领域的应用现状 4 1.3 论文的组织结构 6 第2章 分层计算感知与仿脑计算 8 2.1 生物视觉感知系统 8 2.1.1 视网膜拓扑映射 9 2.1.2 视皮层的腹部通路 11 2.1.3 生物视觉感知的重要机制 12 2.2 分层计算感知 12 2.2.1 人工神经网络 12 2.2.2 反向传播算法 13 2.2.3 Wake-Sleep算法 15 2.3 分层计算感知的特征表示 16 2.3.1 浅层特征表示 16 2.3.2 深层特征表示 18 2.4 仿脑计算的优势和面临的困难 19 2.5 本章小结 21 第3章 基于视神经层次结构的IH-CNN模型 22 3.1 稀疏特性的构建方式 22 3.1.1 局部感知 22 3.1.2 参数共享 22 3.1.3 多核卷积 23 3.2 卷积神经网络 23 3.2.1 卷积层 23 3.2.2 池化层 24 3.2.3 传统卷积神经网络模型 25 3.3 基于视神经层次结构的IH-CNN框架 26 3.3.1 基于随机策略的池化层的构建 26 3.3.2 基于视觉感知侧抑制机制的归一化层的构建 28 3.3.3 模拟下颞叶的回归模型的构建 28 3.3.4 基于视神经层次结构改进的IH-CNN框架 29 3.4 本章小结 33 第4章 生物视觉特征感知模拟 34 4.2 初级视觉特征感知的模拟 34 4.1.1 Gabor小波变换 34 4.1.2 多通道Gabor小波滤波器 35 4.2 中级视觉特征感知的模拟 38 4.2.1 修正线性单元 38 4.2.2 修正非线性单元 39 4.3 高级视觉特征感知的模拟 40 4.3.1 空间金字塔池化思想 41 4.3.2 空间金字塔池化算法 42 4.4 视觉特征感知决策的模拟 44 4.4.1 加入随机Dropout方法的全连接层的构建 44 4.4.2 加入随机DropConnect方法的全连接层的构建 46 4.4.3 加入正则化项的Softmax回归模型的构建 47 4.5 本章小结 48 第5章 基于IH-CNN的分层计算感知模拟模型 50 5.1 HCPS模型的网络结构设计 50 5.2 HCPS模型的网络训练方法 53 5.3 HCPS模型的实验与分析 53 5.3.1 基于NORB数据集的训练 53 5.3.2 与经典模型比较 54 5.3.3 基于Caltech-101数据集的训练 55 5.3.4 与经典模型比较 59 5.4 结果分析 59 5.5 本章小结 60 结 论 61 参考文献 63 致 谢 68 第1章 绪论 第1章 绪论 1.1 课题研究背景及意义 人类的视觉信息处理系统具备先天的信息感知优势,对输入的视觉信息有着卓越的认知识别能力。在应对复杂的自然界信息时,人类把从眼睛输入的图像信息经过多层过滤,将过滤后的极少量感兴趣的信息传输至大脑,大脑从而将该事物识别出来。随着人类对自身视觉信息处理机制的了解越来越深入,模拟大脑视觉系统的典型功能和信息处理机制,以改善计算机视觉的环境感知与物体认知能力,使机器具备人类一样观察和理解事物的能力,仍然是计算机视觉领域的巨大难题[1-2]。 在目标识别任务中,一个线性模型通常就可以很好的表达原始数据信息,因此许多算法的主要工作都集中在特征获取这一环节。然而由于不可控的自然因素,图像目标识

