基于深度卷积神经网络的图像分类

上传人:工**** 文档编号:552404493 上传时间:2022-12-17 格式:DOC 页数:25 大小:1.38MB
返回 下载 相关 举报
基于深度卷积神经网络的图像分类_第1页
第1页 / 共25页
基于深度卷积神经网络的图像分类_第2页
第2页 / 共25页
基于深度卷积神经网络的图像分类_第3页
第3页 / 共25页
基于深度卷积神经网络的图像分类_第4页
第4页 / 共25页
基于深度卷积神经网络的图像分类_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《基于深度卷积神经网络的图像分类》由会员分享,可在线阅读,更多相关《基于深度卷积神经网络的图像分类(25页珍藏版)》请在金锄头文库上搜索。

1、人工神经网课程论文SHANGHAI JIAO TONG UNIVERSITY论文题目:基于卷积神经网络的自然图像分类技术研究姓名: 高小宁专业:控制科学与工程- 19 -基于卷积神经网络的自然图像分类技术研究摘要:卷积神经网络已在图像分类领域取得了很好的效果,但其网络结构及参数的选择对图像分类的效果和效率有较大的影响。为改善卷积网络的图像分类性能,本文对卷积神经网络模型进行了详细的理论分析,并通过大量的对比实验,得出了影响卷积网络性能的因素。结合理论分析及对比实验,本文设计了一个卷积层数为8层的深度卷积网络,并结合Batch Normalization、dropout等方法,在CIFAR10数

2、据集上取得了88.1%的分类精度,有效地提高了卷积神经网络的分类效果。关键词:卷积神经网络,图像分类,Batch Normalization,DropoutResearch on Natural Image Classification Based on Convolution Neural NetworkAbstract: Convolution neural network has achieved very good results in image classification, but its network structure and the choice of parameter

3、s have a greater impact on image classification efficiency and efficiency. In order to improve the image classification performance of the convolution network, a convolutional neural network model is analyzed in detail, and a large number of contrastive experiments are conducted to get the factors t

4、hat influence the performance of the convolution network. Combining the theory analysis and contrast experiment, a convolution layer depth convolution network with 8 layers is designed. Combined with Batch Normalization and dropout, 88.1% classification accuracy is achieved on CIFAR-10 dataset. Whic

5、h improves the classification effect of convolution neural network。Key Words: Convolution neural network(CNN), image classification, Batch Normalization, Dropout目录基于卷积神经网络的自然图像分类技术研究- 1 -1 引言- 3 -2 卷积神经网络的模型分析- 4 -2.1网络基本拓扑结构- 4 -2.2卷积和池化- 5 -2.3激活函数- 6 -2.4 Softmax分类器与代价函数- 7 -2.5学习算法- 8 -2.6 Dropo

6、ut- 10 -2.7 Batch Normalization- 11 -3 模型设计与实验分析- 12 -3.1 CIFAR-10数据集- 12 -3.2 模型设计- 13 -3.3 实验结果与分析- 15 -4 结论- 22 -参考文献- 23 -1 引言1986 年, Rumelhart 等提出人工神经网络的反向传播算法 (Back propagation, BP), 掀起了神经网络在机器学习中的研究热潮.但是由于BP神经网络存在容易发生过拟合、训练时间长的缺陷, 90年代兴起的基于统计学习理论的支持向量机具有很强的小样本学习能力。学习效果也优于BP神经网络,导致了神经网络的研究再次跌入

7、低估.2006 年, Hinton 等人在 Science 上提出了深度学习。 这篇文章的两个主要观点是: 1) 多隐层的人工神经网络具有优异的特征学习能力, 学习到的数据更能反映数据的本质特征,有利于可视化或分类;2) 深度神经网络在训练上的难度, 可以通过逐层无监督训练有效克服。理论研究表明为了学习到可表示高层抽象特征的复杂函数, 需要设计深度网络。深度网络由多层非线性算子构成, 典型设计是具有多层隐节点的神经网络。但是随着网络层数的加大, 如何搜索深度结构的参数空间成为具有挑战性的任务。近年来, 深度学习取得成功的主要原因有:1) 在训练数据上, 大规模训练数据的出现 (如ImageNe

8、t), 为深度学习提供了好的训练资源; 2) 计算机硬件的飞速发展 (特别是 GPU 的出现) 使得训练大规模神经网络成为可能。卷积神经网络 (Convolutional neural networks, CNN) 是一种带有卷积结构的神经网络, 卷积结构采用权值共享的方式减少了深层网络占用的内存量, 也减少了网络的参数个数, 缓解模型的过拟合问题。为了保证一定程度的平移、 尺度、 畸变不变性, CNN 设计了局部感受野、共享权重和空间或时间下采样, 提出用于字符识别的卷积神经网络LeNet-5。LeNet5 由卷积层、下采样层、全连接层构成, 该系统在小规模手写数字识别中取得了较好的结果。2

9、012 年, Krizhevsky等采用称为AlexNet 的卷积网络在 ImageNet 竞赛图像分类任务中取得了最好的成绩, 是 CNN 在大规模图像分类中的巨大成功。AlexNet 网络具有更深层的结构, 并设计了ReLU (Rectified linear unit) 作为非线性激活函数以及 Dropout 来避免过拟合.在 AlexNet 之后, 研究者由提出了网络层数更深的神经网络,例如Google设计的GoogLeNet和MSRA设计的152层的深度残差网络等。表 1 是 ImageNet 竞赛历年来图像分类任务的部分领先结果,可以看出,层数越深的网络往往取得的分类效果更好.为了

10、更好地改进卷积神经网络, 本文在CIFAR10数据集上研究了不同的网络层设计、损失函数的设计、激活函数的选择、正则化等对卷积网络在图像分类效果方面的影响,本文引入了Batch Normalization与dropout结合的方法,通过加深卷层神经网络的层数,有效地提高了卷积神经网络在图像分类准确率。表11 ImageNet历年图像分类任务结果公布时间机构Top-5错误率(%)网络名称网络深度 2015.12。10MSRA3。57ResNet1522014。8.18Google6.66GoogLeNet222013.11.14NYU7。33Clarifai102012。10.13U。Toront

11、o11。7Alexnet82 卷积神经网络的模型分析2.1网络基本拓扑结构卷积神经网络与其他神经网络模型最大的区别是卷积神经网络在神经网络的输入层前面连接了卷积层,这样卷积层就变成了卷积神经网络的数据输输入. LeNet-5是Yan Lecun开发的用于手写字符识别的经典卷积神经网络模型,图21是其结构图. 图21 LeNet-5结构图LeNet-5的体系结构有7层,其中有3个卷积层.第一卷积层由6个特征图 (Feature Maps, FM)组成,故C1包含156可训练参数((6个5X5内核加上6偏值)来创建122304 (156 (2828) -122, 304)个连接.在C1层FM的尺寸

12、为28 x 28,由于边界条件,第二卷积层,C3包含1500权重和16偏置,C3层共有1516个可训练参数以及151600个连接。S2和C3之间的连接如表2-1所示。Lecun设计这些连接最大化的特征由C3提取的数目,同时减少权重的数目.在最后的卷积层C5包含120个FM,输出尺寸为1X1。LeNet5的体系结构还包含有两个子采样层:S2和S4,S2包含6个特征图和S4有16个特征图。层S2有12个可训练的参数与5880连接,而层S4有32个可训练参数与156000连接。表2-1 S2与S3之间的连接总结LeNet5的网络结构,我们得到卷积神经网络的基本结构可以分为四个部分:输入层,卷积层,全

13、连接层和输出层四个部分:输入层:卷积输入层可以直接作用于原始输入数据,对于输入是图像来说,输入数据是图像的像素值。卷积层:卷积神经网络的卷积层,也叫做特征提取层,包括二个部分。第一部分是真正的卷积层,主要作用是提取输入数据特征。每一个不同的卷积核提取输入数据的特征都不相同,卷积层的卷积核数量越多,就能提取越多输入数据的特征。第二部分是pooling层,也叫下采样层(Subsamping),主要目的是在保留有用信息的基础上减少数据处理量,加快训练网络的速度.通常情况下,卷积神经网络至少包含二层卷积层(这里把真正的卷积层和下采样层统称为卷积层),即卷积层-pooling层-卷积层-pooling层

14、。卷积层数越多,在前一层卷积层基础上能够提取更加抽象的特征。全连接层:可以包含多个全连接层,实际上就是多层感知机的隐含层部分。通常情况下后面层的神经节点都和前一层的每一个神经节点连接,同一层的神经元节点之间是没有连接的.每一层的神经元节点分别通过连接线上的权值进行前向传播,加权组合得到下一层神经元节点的输入。输出层:输出层神经节点的数目是根据具体应用任务来设定的.如果是分类任务,卷积神经网络输出层通常是一个分类器,通常是Softmax分类器.2。2卷积和池化2.2。1卷积卷积,一般利用卷积核对图像进行特征提取,其中最重要的就是卷积核。卷积核的设计一般涉及卷积核的大小(size),卷积核的数目(

15、number)以及卷积核的步长(stride)。从理论上来说,卷积核的个数表示从上层中通过卷积滤波得到特征图的个数,提取的特征图越多,网络表示特征空间就越大,学习能力也就越强,最后识别结果就比较准。但卷积核太多(特征图太多),增大网络的复杂度,增加参数的个数,加大了计算的复杂度,易出现过拟合现象,所以有时候卷积核也不并是越多越好,而应根据具体的数据集图像的大小确定卷积核的个数。图像卷积特征提取,通过设定的一个卷积核尺寸为的滤波器,步长(stride)为个像素,对一幅新的图像进行卷积处理,得到一个大小为 的特征图,如图2-2所示。一般来说卷积核尺寸越小,特征提取的质量也就越高,具体大小还应根据输入图像的尺寸决定。图22 图像卷积示意图2。2.2池化对输入的图像邻域进行卷积处理得到图像的邻域特征图(Feature Map),再通过亚采样层使用池化((pooling)技术将小邻域内进行下采样得到新的特征.通过对上层池化,特征结果可以使得参数减少(降低了特征维数),且增强特征使得最后的特征表达保持了某些不变性(旋转、平移、伸缩等),所以说池化的本质是一个降纬的过程.常用的有均值采样(mean- pooling )、最大采

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号