【课件】5.第6章BP神经网络

资源描述

《【课件】5.第6章BP神经网络》由会员分享，可在线阅读，更多相关《【课件】5.第6章BP神经网络（41页珍藏版）》请在金锄头文库上搜索。

1、第6章BP神经网络编者 Outline 1 BP神经网络的结构2 BP网络的学习算法3 设计BP网络的方法4 BP神经网络的局限性5 BP网络相关函数详解6 BP神经网络应用实例 1 BP神经网络的结构 BP神经网络是包含多个隐含层的网络具备处理线性不可分问题的能力误差反向传播算法 ErrorBackPropagtion BP 解决了多层神经网络的学习问题是一种多层前向网络又叫多层感知器 BP网络是前向神经网络的核心部分也是整个人工神经网络体系中的精华广泛应用于分类识别逼近回归压缩等领域在实际应用中大约80 的神经网络模型采取了BP网络或BP网络的变化形式 1 BP神经

2、网络的结构网络由多层构成层与层之间全连接同一层之间的神经元无连接包含一个多多个隐层可以实现复杂的映射关系 1 BP神经网络的结构 BP网络的传递函数必须可微 BP网络一般使用Sigmoid函数或线性函数作为传递函数 Sigmoid函数是光滑可微的函数在分类时它比线性函数更精确容错性较好将输入从负无穷到正无穷的范围映射到0 1或 1 1区间内具有非线性的放大功能 Log SigmoidTan Sigmoid 1 BP神经网络的结构误差反向传播误差信号反向传播修正权值时网络根据误差从后向前逐层进行修正反馈神经网络输出层的输出值又连接到输入神经元作为下一次计算的输入

3、如此循环迭代直到网络的输出值进入稳定状态为止在本书后面的章节中会专门介绍反馈神经网络包括Hopfield网络 Elman网络等 BP神经网络属于多层前向网络工作信号始终正向流动没有反馈结构 BP网络采用误差反向传播算法 Back PropagationAlgorithm 进行学习在BP网络中数据从输入层经隐含层逐层向后传播训练网络权值时则沿着减少误差的方向从输出层经过中间各层逐层向前修正网络的连接权值 2 BP网络的学习算法 BP学习算法的原理与LMS算法比较类似属于最速下降法最速下降法最速下降法可以求某指标目标函数的极小值若将目标函数取为均方误差就得到了LM

4、S算法对于实值函数如果在某点处有定义且可微则函数在该点处沿着梯度相反的方向下降最快因此使用梯度下降法时应首先计算函数在某点处的梯度再沿着梯度的反方向以一定的步长调整自变量的值当步长足够小时反复迭代求得函数最小值 2 BP网络的学习算法最速下降法实例求函数的最小值根据梯度值可以再函数中画出一系列的等值线或等值面在等值线或等值面上函数值相等梯度下降法相当于沿着垂直于等值线方向向最小值所在位置移动 2 BP网络的学习算法 1 目标函数必须可微 2 如果最小值附近比较平坦算法会在最小值附近停留很久收敛缓慢之字形下降 3 对于包含多个极小值的函数所获得的结果依赖初

5、始值算法有可能陷入局部极小值点而没有达到全局最小值点 BP神经网络来说由于传递函数都是可微的因此能满足最速下降法的使用条件 2 BP网络的学习算法最速下降BP法隐含层传递函数为Sigmoid函数输出层传递函数为线性函数 1 工作信号正向传播2 误差信号反向传播权值调整量学习率局部梯度上一层输出信号 2 BP网络的学习算法当输出层传递函数为线性函数时输出层与隐含层之间权值调整的规则类似于线性神经网络的权值调整规则 BP网络的复杂之处在于隐含层与隐含层之间隐含层与输入层之间调整权值时局部梯度的计算需要用到上一步计算的结果前一层的局部梯度是后一层局部梯度的加权和因

6、此 BP网络学习权值时只能从后向前依次计算串行方式在线方式网络每获得一个新样本就计算一次误差并更新权值直到样本输入完毕随机输入样本不容易陷入局部最优陷阱批量方式离线方式网络获得所有的训练样本计算所有样本均方误差的和作为总误差容易并行化速度快 2 BP网络的学习算法动量BP法在标准BP算法的权值更新阶段引入动量因子使权值修正值具有一定惯性本次权值的更新方向和幅度不但与本次计算所得的梯度有关还与上一次更新的方向和幅度有关 1 如果前后两次计算所得的梯度方向相同得到的权值较大可以加速收敛过程 2 如果前后两次计算所得梯度方向相反则说明两个位置之间可能存在一个

7、极小值可以得到一个较小的步长更容易找到最小值点而不会陷入来回振荡 2 BP网络的学习算法学习率可变的BP算法当误差以减小的方式趋于目标时说明修正方向是正确的可以增加学习率当误差增加超过一定范围时说明前一步修正进行地不正确应减小步长并撤销前一步修正过程拟牛顿法牛顿法具有收敛快的优点但需要计算误差性能函数的二阶导数计算较为复杂拟牛顿法只需要知道目标函数的梯度通过测量梯度的变化进行迭代收敛速度大大优于最速下降法拟牛顿法有DFP方法 BFGS方法 SR1方法和Broyden族方法 3 设计BP网络的方法 1 网络层数对于大部分应用场合单个隐含层即可满足需要2

8、输入层节点数输入层节点数取决于输入向量的维数如果输入的是的图像则输入向量应为图像中所有的像素形成的4096维向量如果待解决的问题是二元函数拟合则输入向量应为二维向量 3 隐含层节点数较多的隐含层节点数可以带来更好的性能但可能导致训练时间过长经验公式 BP网络的设计主要包括网络层数输入层节点数隐含层节点数输出层节点数及传输函数训练方法训练参数的设置等几个方面样本数输入层结点数 3 设计BP网络的方法输出层神经元的个数同样需要根据从实际问题中得到的抽象模型来确定在模式分类问题中如果共有n种类别则输出可以采用n个神经元也可以将节点个数设计为个表示最小的不小于

9、的整数由于输出共有4种情况因此采用二维输出即可覆盖整个输出空间 00 01 10和11分别表示一种类别输出层神经元个数传递函数的选择一般隐含层使用Sigmoid函数而输出层使用线性函数如果输出层也采用Sigmoid函数输出值将会被限制在0 1或 1 1之间 3 设计BP网络的方法训练方法的选择使用LM算法收敛速度最快均方误差也较小 LM算法对于模式识别相关问题的处理能力较弱且需要较大的存储空间模式识别问题使用RPROP算法能收到较好的效果SCG算法对于模式识别和函数逼近问题都有较好的性能表现初始权值的确定通常将初始权值定义为较小的非零随机值经验值为权值输入端连

10、接的神经元个数 3 设计BP网络的方法确定以上参数后将训练数据进行归一化处理并输入网络中进行学习若网络成功收敛即可得到所需的神经网络 4 BP神经网络的局限性 BP网络具有实现任何复杂非线性映射的能力特别适合求解内部机制复杂的问题但BP网络也具有一些难以克服的局限性 1 需要的参数较多且参数的选择没有有效的方法隐含层结点个数 2 容易陷入局部最优 3 样本依赖性如果样本集合代表性差矛盾样本多存在冗余样本网络就很难达到预期的性能 4 初始权重敏感性训练的第一步是给定一个较小的随机初始权重由于权重是随机给定的 BP网络往往具有不可重现性 5 BP网络相关函数详解 5

11、BP网络相关函数详解 logsig Log Sigmoid传输函数Log Sigmoid函数的特点是范围的数据被映射到区间可以使用下面的代码将神经网络节点的传输函数定义为Log Sigmoid函数 net layers i transferFcn logsig 5 BP网络相关函数详解 tansig Tan Sigmoid传输函数tansig是双曲正切Sigmoid函数调用形式与logsig函数相同取值范围 x 4 1 4 y tansig x Tag Sigmoid函数 plot x y r title Tan sig函数 xlabel x ylabel y gridon 5 BP网

12、络相关函数详解 dlogsig dtansig Sigmoid函数的导数 x 4 1 4 y logsig x logsig函数 dy dlogsig x y logsig函数的导数 subplot 211 plot x y title logsig subplot 212 plot x dy title dlogsig 5 BP网络相关函数详解 newff 创建一个BP网络新版语法net newff P T S P R Q1矩阵表示创建的神经网络中输入层有R个神经元每行对应一个神经元输入数据的典型值实际应用中常取其最大最小值 T SN Q2矩阵表示创建的网络有SN个输出层节点每

13、行是输出值的典型值S 标量或向量用于指定隐含层神经元个数若隐含层多于一层则写成行向量的形式旧版语法格式net newff P N TF BTF P表示输入向量的典型值 N为各层神经元的个数 TF为表示传输函数的细胞数组 BTF为训练函数 5 BP网络相关函数详解旧版newff默认训练函数为traingdx 学习率自适应并附加动量因子的最速下降法新版默认训练函数为trainlm 新版速度更快但更占用内存新版newff将输入的60 用于训练 20 用于检验 20 用于验证采用了提前终止的策略防止过拟合的情况发生对于同一个问题往往会出现新版最终训练误差大于旧版newff的情况

14、用newff逼近二次函数新版的函数误差比旧版函数大example6 3 m 5 BP网络相关函数详解 feedforwardnet 创建一个BP网络feedforwardnet是新版神经网络工具箱中替代newff的函数feedforwardnet hiddenSizes trainFcn hiddenSizes为隐含层的神经元节点个数如果有多个隐含层则hiddenSizes是一个行向量缺省值为10 trainFcn为训练函数缺省值为 trainlm x t simplefit dataset MATLAB自带数据 x t均为1 94向量 net feedforwardnet view

15、 net net train net x t view net y net x perf perform net y t 5 BP网络相关函数详解 newcf 级联的前向神经网络在新版中使用cascadeforwardnet函数代替 5 BP网络相关函数详解 net newcf P T S1S2 S N 1 P R Q1矩阵每行对应一个神经元输入数据的典型值 T SN Q2矩阵表示创建的网络有SN个输出层节点每行是输出值的典型值 Si 表示隐含层神经元个数若隐含层多于一层则写成行向量的形式与newff比较类似 5 BP网络相关函数详解用newff和newcf对一段数据进行拟合数

16、据输入为向量输出为是一段折线新版替代函数 cascadeforwardnet f2 cascadeforwardnet 3 5 view f2 rng 2 P 012345678910 网络输入 T 01234321234 期望输出 ff newff P T 20 建立一个BP网络包含一个20个节点的隐含层 ff trainParam epochs 50 ff train ff P T 训练 Y1 sim ff P 仿真 cf newcf P T 20 用newcf建立前向网络 cf trainParam epochs 50 cf train cf P T 训练 Y2 sim cf P 仿真 plot P T o 绘图 holdon plot P Y1 m plot P Y2 k title newff newcf legend 原始数据 newff结果 newcf结果 0 6 BP神经网络应用实例 1 基于BP网络的性别识别以班级中男生女生的身高体重为输入经过一定数量的样本训练后可以较好地识别出新样本的性别男生172人女生88人部分数据 6 BP神经网络应用实例

展开阅读全文