斯坦福大学-深度学习基础教程

资源描述

《斯坦福大学-深度学习基础教程》由会员分享，可在线阅读，更多相关《斯坦福大学-深度学习基础教程（113页珍藏版）》请在金锄头文库上搜索。

1、UFLDL教程 From Ufldl 说明本教程将阐述无监督特征学习和深入学习的主要观点通过学习你也将实现多个功能学习深度学习算法能看到它们为你工作并学习如何应用适应这些想法到新问题上本教程假定机器学习的基本知识特别是熟悉的监督学习逻辑回归梯度下降的想法如果你不熟悉这些想法我们建议你去这里机器学习课程 http openclassroom stanford edu MainFolder CoursePage php course MachineLearning 并先完成第II III IV章到逻辑回归稀疏自编码器神经网络反向传导算法梯度检验与高级优化

2、自编码算法与稀疏性可视化自编码器训练结果稀疏自编码器符号一览表 Exercise Sparse Autoencoder 矢量化编程实现矢量化编程逻辑回归的向量化实现样例神经网络向量化 Exercise Vectorization 预处理主成分分析与白化主成分分析白化实现主成分分析和白化 Exercise PCA in 2D Exercise PCA and Whitening Softmax回归 Softmax回归 Exercise Softmax Regression 自我学习与无监督特征学习自我学习 Exercise Self Taught Learning Deep

3、Learning Ng wbx 建立分类用深度网络从自我学习到深层网络深度网络概览栈式自编码算法微调多层自编码算法 Exercise Implement deep networks for digit classification 自编码线性解码器线性解码器 Exercise Learning color features with Sparse Autoencoders 处理大型图像卷积特征提取池化 Exercise Convolution and Pooling 注意这条线以上的章节是稳定的下面的章节仍在建设中如有变更恕不另行通知请随意浏览周围并欢迎提交反馈建议

4、混杂的 MATLAB Modules Style Guide Useful Links 混杂的主题数据预处理用反向传导思想求导进阶主题稀疏编码稀疏编码稀疏编码自编码表达 Exercise Sparse Coding 独立成分分析样式建模独立成分分析 Exercise Independent Component Analysis 其它 Deep Learning Ng wbx Convolutional training Restricted Boltzmann Machines Deep Belief Networks Denoising Autoencoders K mean

5、s Spatial pyramids Multiscale Slow Feature Analysis Tiled Convolution Networks 英文原文作者 Andrew Ng Jiquan Ngiam Chuan Yu Foo Yifan Mai Caroline Suen Language English Retrieved from http deeplearning stanford edu wiki index php UFLDL E6 95 99 E7 A8 8B This page was last modified on 7 April 2013 at 18 26

6、 Deep Learning Ng wbx 神经网络 From Ufldl Contents 1 概述 2 神经网络模型 3 中英文对照 4 中文译者概述以监督学习为例假设我们有训练样本集那么神经网络算法能够提供一种复杂且非线性的假设模型它具有参数可以以此参数来拟合我们的数据为了描述神经网络我们先从最简单的神经网络讲起这个神经网络仅由一个神经元构成以下即是这个神经元的图示这个神经元是一个以及截距为输入值的运算单元其输出为其中函数被称为激活函数在本教程中我们选用sigmoid函数作为激活函数可以看出这个单一神经元的输入输出映射关系其

7、实就是一个逻辑回归 logistic regression 虽然本系列教程采用sigmoid函数但你也可以选择双曲正切函数 tanh Deep Learning Ng wbx 1 3 4 8 U f l d l 2 6d e e p l e a r n i n g s t a n f o r d e d u w i k i i n d e x p h p E 4 B 8 A D E 6 9 6 8 7 E 8 A F 9 1 E 8 8 0 8 5 以下分别是sigmoid及tanh的函数图像函数是sigmoid函数的一种变体它的取值范围为而不是sigmoid函数的注意与其它地方

8、包括OpenClassroom公开课以及斯坦福大学CS229课程不同的是这里我们不再令取而代之我们用单独的参数来表示截距最后要说明的是有一个等式我们以后会经常用到如果选择也就是sigmoid函数那么它的导数就是如果选择tanh函数那它的导数就是你可以根据sigmoid 或tanh 函数的定义自行推导这个等式 Deep Learning Ng wbx 1 3 4 8 U f l d l 3 6d e e p l e a r n i n g s t a n f o r d e d u w i k i i n d e x p h p E 4 B 8 A D E 6

9、9 6 8 7 E 8 A F 9 1 E 8 8 0 8 5 神经网络模型所谓神经网络就是将许多个单一神经元联结在一起这样一个神经元的输出就可以是另一个神经元的输入例如下图就是一个简单的神经网络我们使用圆圈来表示神经网络的输入标上的圆圈被称为偏置节点也就是截距项神经网络最左边的一层叫做输入层最右的一层叫做输出层本例中输出层只有一个节点中间所有节点组成的一层叫做隐藏层因为我们不能在训练样本集中观测到它们的值同时可以看到以上神经网络的例子中有3个输入单元偏置单元不计在内 3个隐藏单元及一个输出单元我们用来表示网络的层数本例中我们将

10、第层记为于是是输入层输出层是本例神经网络有参数其中下面的式子中用到是第层第单元与第层第单元之间的联接参数其实就是连接线上的权重注意标号顺序是第层第单元的偏置项因此在本例中注意没有其他单元连向偏置单元即偏置单元没有输入因为它们总是输出同时我们用表示第层的节点数偏置单元不计在内我们用表示第层第单元的激活值输出值当时也就是第个输入值输入值的第个特征对于给定参数集合我们的神经网络就可以按照函数来计算输出结果本例神经网络的计算步骤如下 Deep Learning Ng wbx 1 3 4 8 U f l d l 4

11、 6d e e p l e a r n i n g s t a n f o r d e d u w i k i i n d e x p h p E 4 B 8 A D E 6 9 6 8 7 E 8 A F 9 1 E 8 8 0 8 5 我们用表示第层第单元输入加权和包括偏置单元比如则这样我们就可以得到一种更简洁的表示法这里我们将激活函数扩展为用向量分量的形式来表示即那么上面的等式可以更简洁地表示为我们将上面的计算步骤叫作前向传播回想一下之前我们用表示输入层的激活值那么给定第层的激活值后第层的激活值就可以按照下面步骤计算得到将参数矩阵化

12、使用矩阵向量运算方式我们就可以利用线性代数的优势对神经网络进行快速求解目前为止我们讨论了一种神经网络我们也可以构建另一种结构的神经网络这里结构指的是神经元之间的联接模式也就是包含多个隐藏层的神经网络最常见的一个例子是层的神经网络第层是输入层第层是输出层中间的每个层与层紧密相联这种模式下要计算神经网络的输出结果我们可以按照之前描述的等式按部就班进行前向传播逐一计算第层的所有激活值然后是第层的激活值以此类推直到第层这是一个前馈神经网络的例子因为这种联接图没有闭环或回路神经网络也可以有多个输出单元比如下面的神经网络有两层隐

13、藏层及输出层有两个输出单元 Deep Learning Ng wbx 1 3 4 8 U f l d l 5 6d e e p l e a r n i n g s t a n f o r d e d u w i k i i n d e x p h p E 4 B 8 A D E 6 9 6 8 7 E 8 A F 9 1 E 8 8 0 8 5 要求解这样的神经网络需要样本集其中如果你想预测的输出是多个的那这种神经网络很适用比如在医疗诊断应用中患者的体征指标就可以作为向量的输入值而不同的输出值可以表示不同的疾病存在与否中英文对照 neural networks 神

14、经网络 activation function 激活函数 hyperbolic tangent 双曲正切函数 bias units 偏置项 activation 激活值 forward propagation 前向传播 feedforward neural network 前馈神经网络参照Mitchell的机器学习的翻译中文译者孙逊 sunpaofu 林锋 xlfg 刘鸿鹏飞 just dark 许利杰 csxulijie 神经网络反向传导算法梯度检验与高级优化自编码算法与稀疏性可视化自编码器训练结果稀疏自编码器符号一览表 Exercise Sparse Autoenco

15、der Deep Learning Ng wbx 1 3 4 8 U f l d l 6 6d e e p l e a r n i n g s t a n f o r d e d u w i k i i n d e x p h p E 4 B 8 A D E 6 9 6 8 7 E 8 A F 9 1 E 8 8 0 8 5 Language English Retrieved from http deeplearning stanford edu wiki index php E7 A5 9E E7 BB 8F E7 BD 91 E7 BB 9C This page was last mod

16、ified on 7 April 2013 at 12 34 Deep Learning Ng wbx 反向传导算法 From Ufldl 假设我们有一个固定样本集它包含个样例我们可以用批量梯度下降法来求解神经网络具体来讲对于单个样例其代价函数为这是一个二分之一的方差代价函数给定一个包含个样例的数据集我们可以定义整体代价函数为以上公式中的第一项是一个均方差项第二项是一个规则化项也叫权重衰减项其目的是减小权重的幅度防止过度拟合注通常权重衰减的计算并不使用偏置项比如我们在的定义中就没有使用一般来说将偏置项包含在权重衰减项中只会对最终的神经网络产生很小的影响如果你在斯坦福选修过CS229 机器学习课程或者在 YouTube上看过课程视频你会发现这个权重衰减实际上是课上提到的贝叶斯规则化方法的变种在贝叶斯规则化方法中我们将高斯先验概率引入到参数中计算MAP 极大后验估计而不是极大似然估计权重衰减参数用于控制公式中两项的相对重要性在此重申一下这两个复杂函数的含义是针对单个样例计算得到的方差代价函数是整体样本代价函

展开阅读全文

斯坦福大学-深度学习基础教程

最新文档