周志华机器学习西瓜书全书16章 ppt Chap05神经网络.ppt

资源描述

《周志华机器学习西瓜书全书16章 ppt Chap05神经网络.ppt》由会员分享，可在线阅读，更多相关《周志华机器学习西瓜书全书16章 ppt Chap05神经网络.ppt（29页珍藏版）》请在金锄头文库上搜索。

1、机器学习导论,五、神经网络,什么是神经网络（学习）？ neural networks are massively parallel interconnected networks of simple (usually adaptive) elements and their hierarchical organizations which are intended to interact with the objects of the real world in the same way as biological nervous systems do T. Kohonen, NN88,M-P

2、神经元模型,McCulloch and Pitts, 1943,神经网络是一个很大的学科，本课程仅讨论它与机器学习的交集神经网络学得的知识蕴含在连接权与阈值中,神经网络是一个具有适应性的简单单元组成的广泛并行互联的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。,激活函数, ,理想激活函数是阶跃函数 , 0表示抑制神经元而1表示激活神经元阶跃函数具有不连续、不光滑等不好的性质 , 常用的是 Sigmoid 函数,多层前馈网络结构多层网络：包含隐层的网络前馈网络：神经元之间不存在同层连接也不存在跨层连接，即网络中无环或者回路。隐层和输出层神经元亦称“功

3、能单元”(functional unit)，无隐藏层的又称“感知机(Perceptron)” 多层前馈网络有强大的表示能力只需一个包含足够多神经元的隐层 , 多层前馈神经网络就能以,任意精度逼近任意复杂度的连续函数,Hornik et al., 1989,但是，如何设置隐层神经元数是未决问题. 实际常用“试错法”,神经网络发展回顾 1940年代 -萌芽期： M-P模型 (1943), Hebb 学习规则 (1945) 1958左右 -1969左右繁荣期：感知机 (1958), Adaline (1960), 1969年： Minsky LeCun et al. , 1998,每个卷

4、积层包含多个特征映射 , 每个特征映射是一个由多个神经元构成的“平面” , 通过一种卷积滤波器提取输入的一种特征,采样层亦称“汇合 (pooling) 层” , 其作用是基于局部相关性原理进行亚采样 , 从而在减少数据量的同时保留有用信息,连接层就是传统神经网络对隐层与输出层的全连接,深度学习典型的深度学习模型就是很深层的神经网络（例如微软研究院2015年在ImageNet竞赛获胜使用 152层网络）,增加隐层数目比增加隐层神经元数目更有效不仅增加了拥有激活函数的神经元数, 还增加了激活函数嵌套的层数误差梯度在多隐层内传播时 , 往往会发散而不能收敛到稳定状态，因

5、此，难以直接用经典 BP算法训练,提升模型复杂度提升学习能力增加隐层神经元数目 (模型宽度 ) 增加隐层数目 (模型深度 ) 提升模型复杂度增加过拟合风险；增加训练难度过拟合风险：使用大量训练数据训练困难：使用若干启发式诀窍,常用诀窍 (tricks) 预训练 + 微调, 预训练: 监督逐层训练，每次训练一层隐结点微调：预训练全部完成后, 对全网络进行微调训练，通常使用 BP算法可视为将大量参数分组，对每组先找到较好的局部配置，再全局寻优, 权共享 (weight-sharing) 一组神经元使用相同的连接权值 Dropout, 在每轮训练时随机选择一些隐结点令其权重不被

6、更新(下一轮可能被更新 ),减少需优化的参数可能：降低 Rademacher 复杂度, ReLU (Rectified Linear Units), 将 Sigmoid 激活函数修改为修正线性函数,求导容易；可能：缓解梯度消失现象,绝大部分诀窍并非“新技术”,深度学习最重要的特征：表示学习、联合优化,传统做法：,人工设计特征,学习分类,Feature Engineering,深度学习：,学习,特征,学习,分类,Representation learning,所谓 end-to-end Learning (并非新东西 ),大数据、高性能计算设备,深度学习常用软件包,CAFFE,(Berkeley Vision and Learning Center, BVLC),http:/caffe.berkeleyvision.org/,MatConvNet,(Oxford Visual Geometry Group, VGG),http:/www.vlfeat.org/matconvnet/ Torch http:/torch.ch/ ,前往第六站 ,

展开阅读全文

周志华 机器学习 西瓜书 全书16章 ppt Chap05神经网络.ppt

周志华机器学习西瓜书全书16章 ppt Chap05神经网络.ppt