机器人的学习研究进展：深度学习及运用

资源描述

《机器人的学习研究进展：深度学习及运用》由会员分享，可在线阅读，更多相关《机器人的学习研究进展：深度学习及运用（85页珍藏版）》请在金锄头文库上搜索。

1、机器人的学习研究进展机器人的学习研究进展深度学习及应用深度学习及应用内容 1 深度学习概述 2 深度学习应用研究 1 深度学习概述 1 1 概述 1 2 背景 1 3 人脑视觉机理 1 4 关于特征 1 5 深度学习的基本思想 1 6 浅层学习 Shallow Learning 和深度学习 Deep Learning 1 深度学习概述 1 7 Deep learning与Neural Network 1 8 Deep learning训练过程 1 9 Deep Learning的常用模型或者方法 1 1 概述 Artificial Intelligence 也就是人工智能就像长生不

2、老和星际漫游一样是人类最美好的梦想之一虽然计算机技术已经取得了长足的进步但是到目前为止还没有一台电脑能产生自我的意识的确如此在人类和大量现成数据的帮助下电脑可以表现的十分强大但是离开了这两者它甚至都不能分辨一个喵星人和一个汪星人 1 1 概述图灵计算机和人工智能的鼻祖分别对应于其著名的图灵机和图灵测试在 1950 年的论文里提出图灵试验的设想即隔墙对话你将不知道与你谈话的是人还是电脑这无疑给计算机尤其是人工智能预设了一个很高的期望值但是半个世纪过去了人工智能的进展远远没有达到图灵试验的标准这不仅让多年翘首以待的人们

3、心灰意冷认为人工智能是忽悠相关领域是伪科学 1 1 概述但是自 2006 年以来机器学习领域取得了突破性的进展图灵试验至少不是那么可望而不可及了至于技术手段不仅仅依赖于云计算对大数据的并行处理能力而且依赖于算法这个算法就是 Deep Learning 借助于 Deep Learning 算法人类终于找到了如何处理抽象概念这个亘古难题的方法 1 1 概述 2012年6月纽约时报披露了 Google Brain项目吸引了公众的广泛关注这个项目是由著名的斯坦福大学的机器学习教授Andrew Ng和在大规模计算机系统方面的世界顶尖专家Jeff Dea

4、n共同主导用16000个CPU Core 的并行计算平台训练一种称为深度神经网络 DNN Deep Neural Networks 的机器学习模型内部共有10亿个节点 1 1 概述这一网络自然是不能跟人类的神经网络相提并论的要知道人脑中可是有150多亿个神经元互相连接的节点也就是突触数更是如银河沙数曾经有人估算过如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来并拉成一根直线可从地球连到月亮再从月亮返回地球深度神经网络在语音识别和图像识别等领域获得了巨大的成功 1 1 概述项目负责人之一Andrew称我们没有像通常做的那样自己框定边界

5、而是直接把海量数据投放到算法中让数据自己说话系统会自动从数据中学习另外一名负责人 Jeff则说我们在训练的时候从来不会告诉机器说这是一只猫系统其实是自己发明或者领悟了猫的概念 1 1 概述 2012年11月微软在中国天津的一次活动上公开演示了一个全自动的同声传译系统讲演者用英文演讲后台的计算机一气呵成自动完成语音识别英中机器翻译和中文语音合成效果非常流畅据报道后面支撑的关键技术也是DNN 或者深度学习 DL DeepLearning 2013年1月在百度年会上创始人兼CEO李彦宏高调宣布要成立百度研究院其中第一个成立的就是深度学习研究所 IDL

6、 Institue of Deep Learning 1 1 概述为什么拥有大数据的互联网公司争相投入大量资源研发深度学习技术听起来感觉deeplearning很牛那样那什么是deep learning 为什么有deep learning 它是怎么来的又能干什么呢目前存在哪些困难呢这些问题的简答都需要慢慢来咱们先来了解下机器学习人工智能的核心的背景 1 2 背景机器学习 Machine Learning 是一门专门研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能重新组织已有的知识结构使之不断改善自身的性能的学科 1959年美国的塞缪尔 Samuel 设计

7、了一个下棋程序这个程序具有学习能力它可以在不断的对弈中改善自己的棋艺 4年后这个程序战胜了设计者本人又过了3年这个程序战胜了美国一个保持8年之久的常胜不败的冠军这个程序向人们展示了机器学习的能力提出了许多令人深思的社会问题与哲学问题 1 2 背景机器学习虽然发展了几十年但还是存在很多没有良好解决的问题 1 2 背景例如图像识别语音识别自然语言理解天气预测基因表达内容推荐等等目前我们通过机器学习去解决这些问题的思路都是这样的以视觉感知为例子 1 2 背景从开始的通过传感器例如CMOS 来获得数据然后经过预处理特征提取特征选择再到推理预测

8、或者识别最后一个部分也就是机器学习的部分绝大部分的工作是在这方面做的也存在很多的学术论文和研究而中间的三部分概括起来就是特征表达良好的特征表达对最终算法的准确性起了非常关键的作用而且系统主要的计算和测试工作都耗在这一大部分但是这块实际中一般都是人工完成的即靠人工提取特征 1 2 背景截止现在也出现了不少优秀特征表示方式好的特征应具有不变性大小尺度和旋转等和可区分性例如Sift的出现是局部图像特征描述子研究领域一项里程碑式的工作由于SIFT 对尺度旋转以及一定视角和光照变化等图像变化都具有不变性并且SIFT具有很强的可区分性的

9、确让很多问题的解决变为可能但它也不是万能的 1 2 背景然而手工地选取特征是一件非常费力启发式需要专业知识的方法能不能选取好很大程度上靠经验和运气而且它的调节需要大量的时间既然手工选取特征不太好那么能不能自动地学习一些特征呢答案是能 Deep Learning就是用来干这个事情的看它的一个别名Unsupervised Feature Learning 就可以顾名思义了 Unsupervised的意思就是不要人参与特征的选取过程 1 2 背景那它是怎么学习的呢怎么知道哪些特征好哪些不好呢我们说机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为

10、的学科那人类的视觉系统是怎么工作的呢为什么在茫茫人海芸芸众生滚滚红尘中我们都可以找到另一个她因为你存在我深深的脑海里我的梦里我的心里我的歌声里 1 2 背景人脑那么优秀我们能不能参考人脑模拟人脑呢注好像和人脑扯上点关系的特征算法都不错但不知道是不是人为强加的为了使自己的研究变得神圣和高雅近几十年以来认知神经科学生物学等等学科的发展让我们对自己这个神秘的而又神奇的大脑不再那么的陌生也给人工智能的发展推波助澜 1 3 人脑视觉机理 1981年的诺贝尔医学生理学奖颁发给了 David Hubel 出生于加拿大的美国神经生物学家和Tor

11、sten Wiesel以及 Roger Sperry 前两位的主要贡献是发现了视觉系统的信息处理机制发现可视皮层是分级的如人见到蛇的情景 1 3 人脑视觉机理我们看看他们做了什么 1958 年 DavidHubel 和 Torsten Wiesel 在 JohnHopkins University研究了瞳孔区域与大脑皮层神经元的对应关系他们在猫的后脑头骨上开了一个3 毫米的小洞向洞里插入电极测量神经元的活跃程度然后他们在小猫的眼前展现各种形状各种亮度的物体并且在展现每一件物体时还改变物体放置的位置和角度他们期望通过这个办法让小猫瞳孔感受不同类型

12、不同强弱的刺激 1 3 人脑视觉机理之所以做这个试验目的是去证明一个猜测位于后脑皮层的不同视觉神经元与瞳孔所受刺激之间存在某种对应关系一旦瞳孔受到某一种刺激后脑皮层的某一部分神经元就会活跃经历了很多天反复的枯燥的试验同时牺牲了若干只可怜的小猫 David Hubel 和Torsten Wiesel 发现了一种被称为方向选择性细胞 Orientation Selective Cell 的神经元细胞当瞳孔发现了眼前的物体的边缘而且这个边缘指向某个方向时这种神经元细胞就会活跃这个发现激发了人们对于神经系统的进一步思考神经中枢大脑的工作过程或许是一个不断

13、迭代不断抽象的过程 1 3 人脑视觉机理这里的关键词有两个一个是抽象一个是迭代从原始信号做低级抽象逐渐向高级抽象迭代人类的逻辑思维经常使用高度抽象的概念例如从原始信号摄入开始瞳孔摄入像素 Pixels 接着做初步处理大脑皮层某些细胞发现边缘和方向然后抽象大脑判定眼前的物体的形状是圆形的然后进一步抽象大脑进一步判定该物体是只气球再比如人脸识别如下图 1 3 人脑视觉机理这个生理学的发现促成了计算机人工智能在四十年后的突破性发展总的来说人的视觉系统的信息处理是分级的从低级的V1区提取边缘特征再到V2区的形状或者目标的部分等再到更

14、高层整个目标目标的行为等也就是说高层的特征是低层特征的组合从低层到高层的特征表示越来越抽象越来越能表现语义或者意图而抽象层面越高存在的可能猜测就越少就越利于分类例如单词集合和句子的对应是多对一的句子和语义的对应又是多对一的语义和意图的对应还是多对一的这是个层级体系 1 3 人脑视觉机理敏感的人注意到这个关键词了分层而Deep learning 的deep是不是就表示我存在多少层也就是多深呢对那Deep learning是如何借鉴这个过程的呢毕竟是归于计算机来处理面对的一个问题就是怎么对这个过程进行建模因为我们要学习的是特征的表达那么关于特征

15、或者说关于这个层级特征我们需要了解地更深入点所以在说 Deep Learning之前我们下面有必要解释一下特征 1 4 关于特征特征是机器学习系统的原材料对最终模型的影响是毋庸置疑的如果数据被很好地表达成了特征通常线性模型就能达到满意的精度那对于特征我们需要考虑什么呢 1 4 关于特征 1 4 1 特征表示的粒度 1 4 2 初级浅层特征表示 1 4 3 结构性特征表示 1 4 4 需要有多少个特征 1 4 1 特征表示的粒度学习算法在一个什么粒度上的特征表示才有能发挥作用就一个图片来说像素级的特征根本没有价值例如上面的摩托车从像素级别根本得不到

16、任何信息其无法进行摩托车和非摩托车的区分 1 4 1 特征表示的粒度而如果特征是一个具有结构性或者说有含义的时候比如是否具有车把手 handle 是否具有车轮 wheel 就很容易把摩托车和非摩托车区分开来学习算法才能发挥作用 1 4 2 初级浅层特征表示既然像素级的特征表示方法没有作用那怎样的表示才有用呢 1995 年前后 Bruno Olshausen和 David Field 两位学者任职 Cornell University 他们试图同时用生理学和计算机的手段双管齐下研究视觉问题他们收集了很多黑白风景照片从这些照片中提取出 400个小碎片每个小碎片的尺寸均为 16x16 像素不妨把这400个碎片标记为 S i i 0 399 接下来再从这些黑白风景照片中随机提取另一个碎片尺寸也是 16x16 像素不妨把这个碎片标记为 T 1 4 2 初级浅层特征表示他们提出的问题是如何从这400个碎片中选取一组碎片S k 通过叠加的办法合成出一个新的碎片而这个新的碎片应当与随机选择的目标碎片T尽可能相似同时 S k

展开阅读全文