机器人的学习研究进展:深度学习及运用

上传人:012****78 文档编号:125635995 上传时间:2020-03-18 格式:PPT 页数:85 大小:1.40MB
返回 下载 相关 举报
机器人的学习研究进展:深度学习及运用_第1页
第1页 / 共85页
机器人的学习研究进展:深度学习及运用_第2页
第2页 / 共85页
机器人的学习研究进展:深度学习及运用_第3页
第3页 / 共85页
机器人的学习研究进展:深度学习及运用_第4页
第4页 / 共85页
机器人的学习研究进展:深度学习及运用_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《机器人的学习研究进展:深度学习及运用》由会员分享,可在线阅读,更多相关《机器人的学习研究进展:深度学习及运用(85页珍藏版)》请在金锄头文库上搜索。

1、机器人的学习研究进展机器人的学习研究进展 深度学习及应用 深度学习及应用 内 容 1 深度学习概述 2 深度学习应用研究 1 深度学习概述 1 1 概述 1 2 背景 1 3 人脑视觉机理 1 4 关于特征 1 5 深度学习的基本思想 1 6 浅层学习 Shallow Learning 和深度 学习 Deep Learning 1 深度学习概述 1 7 Deep learning与Neural Network 1 8 Deep learning训练过程 1 9 Deep Learning的常用模型或者方法 1 1 概述 Artificial Intelligence 也就是人工智能 就像长生不

2、老和星际漫游一样 是人类最 美好的梦想之一 虽然计算机技术已经取 得了长足的进步 但是到目前为止 还没 有一台电脑能产生 自我 的意识 的确如此 在人类和大量现成数据的帮助 下 电脑可以表现的十分强大 但是离开 了这两者 它甚至都不能分辨一个喵星人 和一个汪星人 1 1 概述 图灵 计算机和人工智能的鼻祖 分别对应于其著名的 图灵机 和 图灵测试 在 1950 年的论文里 提出图灵试验的设想 即 隔墙对 话 你将不知道与你谈话的 是人还是电脑 这无疑给计算机 尤其 是人工智能 预设了一个很高的期望值 但是半个世纪过去了 人工智能的进展 远远没有达到图灵试验的标 准 这不仅让多年翘首以待的人们

3、心灰意冷 认为人工智能是忽悠 相关领域是 伪科学 1 1 概述 但是自 2006 年以来 机器学习领域 取得 了突破性的进展 图灵试验 至少不是那 么可望而不可及了 至于技术手段 不仅 仅依赖于云计算对大数据的并行处理能力 而且依赖于算法 这个算法就是 Deep Learning 借助于 Deep Learning 算法 人类终于找到了如 何处理 抽象概念 这个亘古难题的方法 1 1 概述 2012年6月 纽约时报 披露了 Google Brain项目 吸引了公众的广泛 关注 这个项目是由著名的斯坦福大学 的机器学习教授Andrew Ng和在大规模 计算机系统方面的世界顶尖专家Jeff Dea

4、n共同主导 用16000个CPU Core 的并行计算平台训练一种称为 深度神经 网络 DNN Deep Neural Networks 的机器学习模型 内部共有10亿个节 点 1 1 概述 这一网络自然是不能跟人类的神经网络相 提并论的 要知道 人脑中可是有150多亿 个神经元 互相连接的节点也就是突触数 更是如银河沙数 曾经有人估算过 如果 将一个人的大脑中所有神经细胞的轴突和 树突依次连接起来 并拉成一根直线 可 从地球连到月亮 再从月亮返回地球 深度神经网络 在语音识别和图像识别等 领域获得了巨大的成功 1 1 概述 项目负责人之一Andrew称 我们没有像通常做的那样自 己框定边界

5、而是直接把海量数据投放到算法中 让数据 自己说话 系统会自动从数据中学习 另外一名负责人 Jeff则说 我们在训练的时候从来不会告诉机器说 这 是一只猫 系统其实是自己发明或者领悟了 猫 的概念 1 1 概述 2012年11月 微软在中国天津的一次活动上公开演示了一个全自 动的同声传译系统 讲演者用英文演讲 后台的计算机一气呵成 自动完成语音识别 英中机器翻译和中文语音合成 效果非常流 畅 据报道 后面支撑的关键技术也是DNN 或者深度学习 DL DeepLearning 2013年1月 在百度年会上 创始人兼CEO李彦宏高调宣布要成 立百度研究院 其中第一个成立的就是 深度学习研究所 IDL

6、 Institue of Deep Learning 1 1 概述 为什么拥有大数据的互联网公司争相投入大量资源研发深 度学习技术 听起来感觉deeplearning很牛那样 那什么是deep learning 为什么有deep learning 它是怎么来的 又能干什么呢 目前存在哪些困难呢 这些问题的简答都需要慢慢来 咱们先来了解下机器学习 人工智能的核心 的背景 1 2 背景 机器学习 Machine Learning 是一门专门研究计算机 怎样模拟或实现人类的学习行为 以获取新的知识或技能 重新组织已有的知识结构使之不断改善自身的性能的学 科 1959年美国的塞缪尔 Samuel 设计

7、了一个下棋程序 这 个程序具有学习能力 它可以在不断的对弈中改善自己的 棋艺 4年后 这个程序战胜了设计者本人 又过了3年 这个程序战胜了美国一个保持8年之久的常胜不败的冠军 这个程序向人们展示了机器学习的能力 提出了许多令人 深思的社会问题与哲学问题 1 2 背景 机器学习虽然发展了几十年 但还是存在 很多没有良好解决的问题 1 2 背景 例如图像识别 语音识别 自然语言理解 天气预测 基因表达 内容推荐等等 目前我们通过机器学习去解决这些问题的 思路都是这样的 以视觉感知为例子 1 2 背景 从开始的通过传感器 例如CMOS 来获得数据 然后经过预 处理 特征提取 特征选择 再到推理 预测

8、或者识别 最后 一个部分 也就是机器学习的部分 绝大部分的工作是在这方 面做的 也存在很多的学术论文和研究 而中间的三部分 概括起来就是特征表达 良好的特征表达 对最终算法的准确性起了非常关键的作用 而且系统主要的计 算和测试工作都耗在这一大部分 但是这块实际中一般都是人 工完成的 即靠人工提取特征 1 2 背景 截止现在 也出现了不少优 秀特征表示方式 好的特征 应具有不变性 大小 尺度 和旋转等 和可区分性 例如Sift的出现 是局部图 像特征描述子研究领域一项 里程碑式的工作 由于SIFT 对尺度 旋转以及一定视角 和光照变化等图像变化都具 有不变性 并且SIFT具有很 强的可区分性 的

9、确让很多 问题的解决变为可能 但它 也不是万能的 1 2 背景 然而 手工地选取特征是一件非常费力 启发式 需 要专业知识 的方法 能不能选取好很大程度上靠经 验和运气 而且它的调节需要大量的时间 既然手工选取特征不太好 那么能不能自动地学习一 些特征呢 答案是能 Deep Learning就是用来干这 个事情的 看它的一个别名Unsupervised Feature Learning 就可以顾名思义了 Unsupervised的意 思就是不要人参与特征的选取过程 1 2 背景 那它是怎么学习的呢 怎么知道哪些特征好哪些 不好呢 我们说机器学习是一门专门研究计算机怎样模拟 或实现人类的学习行为

10、的学科 那人类的视觉系 统是怎么工作的呢 为什么在茫茫人海 芸芸众 生 滚滚红尘中我们都可以找到另一个她 因为 你存在我深深的脑海里 我的梦里 我的心里 我的歌声里 1 2 背景 人脑那么优秀 我们能不能参考人脑 模拟人 脑呢 注 好像和人脑扯上点关系的特征 算法 都不错 但不知道是不是人为强加的 为了使自己的研究变得神圣和高雅 近几十年以来 认知神经科学 生物学等等学 科的发展 让我们对自己这个神秘的而又神奇 的大脑不再那么的陌生 也给人工智能的发展 推波助澜 1 3 人脑视觉机理 1981年的诺贝尔医学 生理学奖 颁发给了 David Hubel 出生于加拿大的美国神经生 物学家 和Tor

11、sten Wiesel以及 Roger Sperry 前两位的主要贡献 是 发现了视 觉系统的信息处理机制 发现可视皮层是 分级的 如 人见到蛇的情景 1 3 人脑视觉机理 我们看看他们做了什么 1958 年 DavidHubel 和 Torsten Wiesel 在 JohnHopkins University研究了 瞳孔区域与大脑皮层神经元的对应关系 他们在猫的 后脑头骨上开了一个3 毫米的小洞 向洞里插入电极 测量神经元的活跃程度 然后 他们在小猫的眼前 展现各种形状 各种亮度 的物体 并且 在展现每一件物体时 还改变物体放 置的位置和角度 他们期望通过这个办法 让小猫瞳 孔感受不同类型

12、 不同强弱的刺激 1 3 人脑视觉机理 之所以做这个试验 目的是去证明一个猜测 位于后脑皮层的 不同视觉神经元 与瞳孔所受刺激之间 存在某种对应关系 一旦瞳孔受到某一种刺激 后脑皮层的某一部分神经元就会活 跃 经历了很多天反复的枯燥的试验 同时牺牲了若干只可怜的小 猫 David Hubel 和Torsten Wiesel 发现了一种被称为 方向 选择性细胞 Orientation Selective Cell 的神经元细胞 当瞳孔发现了眼前的物体的边缘 而且这个边缘指向某个方向 时 这种神经元细胞就会活跃 这个发现激发了人们对于神经系统的进一步思考 神经 中枢 大脑的工作过程 或许是一个不断

13、迭代 不断抽象的过程 1 3 人脑视觉机理 这里的关键词有两个 一个是抽象 一个是迭代 从 原始信号 做低级抽象 逐渐向高级抽象迭代 人类 的逻辑思维 经常使用高度抽象的概念 例如 从原始信号摄入开始 瞳孔摄入像素 Pixels 接着做初步处理 大脑皮层某些细胞发现边缘和方 向 然后抽象 大脑判定 眼前的物体的形状 是 圆形的 然后进一步抽象 大脑进一步判定该物体 是只气球 再比如人脸识别 如下图 1 3 人脑视觉机理 这个生理学的发现 促成了计算机人工智能在四十年后的突破性 发展 总的来说 人的视觉系统的信息处理是分级的 从低级的V1区提 取边缘特征 再到V2区的形状或者目标的部分等 再到更

14、高层 整个目标 目标的行为等 也就是说高层的特征是低层特征的组合 从低层到高层的特征表 示越来越抽象 越来越能表现语义或者意图 而抽象层面越高 存在的可能猜测就越少 就越利于分类 例如 单词集合和句子的对应是多对一的 句子和语义的对应又 是多对一的 语义和意图的对应还是多对一的 这是个层级体系 1 3 人脑视觉机理 敏感的人注意到这个关键词了 分层 而Deep learning 的deep是不是就表示我存在多少层 也就是多深呢 对 那Deep learning是如何借鉴这个过程的呢 毕竟是 归于计算机来处理 面对的一个问题就是怎么对这个过程 进行建模 因为我们要学习的是特征的表达 那么关于特征

15、 或者说 关于这个层级特征 我们需要了解地更深入点 所以在说 Deep Learning之前 我们下面有必要解释一下特征 1 4 关于特征 特征是机器学习系统的原材料 对最终模 型的影响是毋庸置疑的 如果数据被很好地表达成了特征 通常线 性模型就能达到满意的精度 那对于特征 我们需要考虑什么呢 1 4 关于特征 1 4 1 特征表示的粒度 1 4 2 初级 浅层 特征表示 1 4 3 结构性特征表示 1 4 4 需要有多少个特征 1 4 1 特征表示的粒度 学习算法在一个什么粒度上的特征表示 才有能 发挥作用 就一个图片来说 像素级的特征根本 没有价值 例如上面的摩托车 从像素级别 根本得不到

16、任 何信息 其无法进行摩托车和非摩托车的区分 1 4 1 特征表示的粒度 而如果特征是一个具有结构性 或者说有含义 的时 候 比如是否具有车把手 handle 是否具有车轮 wheel 就很容易把摩托车和非摩托车区分开来 学习算法才能发挥作用 1 4 2 初级 浅层 特征表示 既然像素级的特征表示方法没有作用 那怎样的表示才有 用呢 1995 年前后 Bruno Olshausen和 David Field 两位学 者任职 Cornell University 他们试图同时用生理学和计 算机的手段 双管齐下 研究视觉问题 他们收集了很多黑白风景照片 从这些照片中 提取出 400个小碎片 每个小碎片的尺寸均为 16x16 像素 不妨 把这400个碎片标记为 S i i 0 399 接下来 再从这 些黑白风景照片中 随机提取另一个碎片 尺寸也是 16x16 像素 不妨把这个碎片标记为 T 1 4 2 初级 浅层 特征表示 他们提出的问题是 如何从这400个碎片中 选 取一组碎片S k 通过叠加的办法 合成出一个新 的碎片 而这个新的碎片应当与随机选择的目标 碎片T尽可能相似 同时 S k

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号