突触动力学有监督学习

资源描述

《突触动力学有监督学习》由会员分享，可在线阅读，更多相关《突触动力学有监督学习（17页珍藏版）》请在金锄头文库上搜索。

1、第五章第五章突触动力学突触动力学：有监督学习：有监督学习当现有的先验知识不完全时，就需要学习。学习的方式取决于这一先验信息不完全的程度。在监督学习过程中，假设已知未来学习系统的期望响应，并且使用期望值与实际值的差值（即学习系统的误差）去修正系统的行为。而在非监督学习中是不了解学习系统的期望响应的。神经网络通过向环境获取知识并改进自身性能。一般是按某种预定的度量调节自身的参数（如权值）随时间逐步达到的。本章论述要点：本章论述要点：神经网络的分类：神经网络的分类：按网络结构分为：反馈网络和前馈网络；按学习方式分为：监督学习和非监督学习。本章论述内容：本章论述内容：前馈网络的监督学习算

2、法，包括感知器算法、最小均方误差算法和反向传播（BP）算法。理论基础：理论基础：本章论述了监督学习是对未知平均误差层的随机近似，即给定观察得到的随机矢量样本对：要估计一个未知函数：f : xy，并且使期望误差函数EJ最小。误差定义为期望特性与实际特性之差。前馈网络：前馈网络：上图即为前馈神经网络的结构示意图。各神经元接受前一级输入，并输出到下一级，无反馈无反馈。输入、输出节点称为可见层可见层，其他中间层称为隐层隐层。监督学习：监督学习：有监督学习有时也叫有教师学习，“教师”在这里要对一组给定的输入提供应有的输出结果。这组已知的输入输出数据就称为训练样本集。学习系统如下图：有监督的函

3、数估计有监督的函数估计有监督的学习相当于操作性条件反射有监督的学习相当于操作性条件反射有监督的学习相当于有先验知识的随机模式学习有监督的学习相当于有先验知识的随机模式学习算法，感知器，算法，感知器，LMS，BP论述内容：论述内容：有监督的函数估计：有监督的函数估计：神经网络引进的函数估计的概念为：已知随机样本矢量对，要从这些样本中估计出产生这些样本矢量对的函数，即：其中：是输入空间是输出空间是要估计的泛函所采用的方法为是使一个未知期望的误差函数（也叫目标函数）最小化。有监督的函数估计：有监督的函数估计：设N为一个神经网络的传递函数，那么可以定义瞬时误差为，这是一个随机向量，因为我

4、们不知道联合概率密度函数p(x,y)，所以，无法求出， , 一般用。随机逼近用观测到的随机量来估计期望值，然后在离散的近似算法中使用这些估计量，通常是随机的梯度下降法，举个例子，在Widrows LMS算法中，他用的梯度是随机梯度。幻灯片 5 有监督的学习操作性条件反射有监督的学习操作性条件反射幻灯片 5 v1.操作性条件反射相当于有监督的学习，如果输入与期望的输出不同，就调节权值m 有监督的学习操作性条件反射有监督的学习操作性条件反射幻灯片 5v2.传统条件反射（相对于非条件反射的概念），神经网络直接把输入x耦合到输出y 有效条件强化响应(Operant conditioning re

5、inforce responses)。条件聚类强化了刺激，例如，一个生物体学会了一刺激响应对：在条件刺激 S中加一个条件进行学习，即：这样不断强化刺激，直到输入 B 时反应为 R。这样就有：也就是学会了一条规则。这样的例子如巴普洛夫条件反射试验。，那么返回返回有监督的学习有监督的学习有先验知识的随机模式学习有先验知识的随机模式学习幻灯片 5 例例1：用已知的类隶属度作为随机模式学习的有监督学习模式：模式：定义为模式空间的一个点；时变模式：时变模式：空间中的一条轨迹线；映射映射定义了从时间区间到模式空间中单点的映射。概率密度概率密度:为模式 x 在中的分布的一种描述。模式类：模式类

6、：为空间的子集。目的：目的：是用已知的样本：及模式类来估计有监督的学习有监督的学习有先验知识的随机模式学习有先验知识的随机模式学习幻灯片 5 定义定义是集合的指示函数指示函数指出了模式 x 的类隶属度。如果 S 是将映射到而不是，那么 S 就是一个连续的或者说是多值的（模糊的）集合，即模式 x 以不同的程度隶属于不同的类。分为 k 个不相交的子集：假设将模式样本空间的有监督的学习有监督的学习有先验知识的随机模式学习有先验知识的随机模式学习幻灯片 5 则类概率密度为：为求期望值，且有：我们可以进一步区分有监督和无监督模式学习：贝叶斯学习，因为用到了指示器函数，所以是有监督的学习有监督

7、和无监督模式学习的区别依赖于已有的信息以及学习系统如何利用它。在两种情况下系统都不知道如果知道确定的类，并且学习系统利用了这些信息，那么模式学习就是监督学习。如果不知道或没用类隶属度（指示函数），则模式学习就是非监督的。有监督的学习有监督的学习有先验知识的随机模式学习有先验知识的随机模式学习返回例例2 2：监督随机竞争学习定律：监督随机竞争学习定律：先看噪声随机竞争学习定律:由于上式没有使用类成员信息校正突触矢量，所以是非监督学习。监督随机竞争学习定律为：增强函数为：奖励正确的模式分类1，惩罚错误的模式分类为1。感知器学习算法感知器学习算法感知器模型如下图：感知器模型如下图：感知

8、器是一个具有单层计算机单元的神经网络，并由线性阈值元件组成，可以通过监督学习建立模式判别能力。注意：为方便起见，将阈值注意：为方便起见，将阈值（因为它也需要学习）一同并入（因为它也需要学习）一同并入中，中，令令向量也对应增加一个分量向量也对应增加一个分量这样输出为：这样输出为：感知器学习算法感知器学习算法幻灯片 5 感知器模型如下图：感知器模型如下图：给定初始值：赋给各一个较小的随机非零值。输入一样本和它的希望输出（亦称为导师信号，如果类，，如果类，）；计算实际输出：修正权值：转到步骤2，直到对一切样本均稳定不变为止。Rosenblatt证明：证明：如果两类模式是线性可分，则算法一定收敛，也就是说一定存在，否则，判定边界会产生振荡，以致不收敛。梯度算法梯度算法感知器模型缺点：感知器模型缺点：1.不能推广到一般的前向网络中去；2.函数不是线性可分时，得不到任何结果。梯度算法思想：梯度算法思想：把单元特性改成可微函数如Sigmoid形式。当给定训练集合后，我们的目的寻找，使得于尽可能接近。应使达到最小。梯度算法梯度算法梯度算法：梯度算法：其中： ,则的修改规则为：

展开阅读全文

突触动力学有监督学习

最新文档