人工智能的核心技术

上传人:壹****1 文档编号:498049727 上传时间:2022-07-22 格式:DOCX 页数:8 大小:20.69KB
返回 下载 相关 举报
人工智能的核心技术_第1页
第1页 / 共8页
人工智能的核心技术_第2页
第2页 / 共8页
人工智能的核心技术_第3页
第3页 / 共8页
人工智能的核心技术_第4页
第4页 / 共8页
人工智能的核心技术_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《人工智能的核心技术》由会员分享,可在线阅读,更多相关《人工智能的核心技术(8页珍藏版)》请在金锄头文库上搜索。

1、人工智能的核心技术是什么?人工智能标准化白皮书20181 机器学习机器学习Machine Learning是一门涉及统计学、系统辨识、逼近理论、神经网络、优化 理论、电脑科学、脑科学等诸多领域的交叉学科,研究电脑 怎样模拟或实现人类的学习行 为,以获取新的知识或技能,重新组织已有的知识 结构使之不断改善自身的性能,是人工 智能技术的核心。基于数据的机器学习是 现代智能技术中的重要方法之一,研究从观测数 据样本出发寻找规律,利用 这些规律对未来数据或无法观测的数据进行预测。根据学 习模式、学习方法以及 算法的不同,机器学习存在不同的分类方法。1根据学习模式将机器学习分类为监督学习、无监督学习和强

2、化学习等。监督学习监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一 个模型,实现对 新数据/实例的标记分类 /映射,最典型的监督学习算法包括 回归和分类。监督学习要 求训练样本的分类标签已知,分类标签精确度越高,样 本越具有代表性,学习模型的准确 度越高。监督学习在自然语言处理、信息检索、 文本挖掘、手写体辨识、垃圾邮件侦测等 领域获得了广泛应用。无监督学习无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律,最典型的非监 督学习算法包括单类密度估计、单类数据降维、聚类等。无监督学 习不需要训练样本和人 工标注数据,便于压缩数据存储、减少计算量、提升算法 速度,

3、还可以防止正、负样本偏 移引起的分类错误问题。主要用于经济预测、异 常检测、数据挖掘、图像处理、模式识别 等领域,例如组织大型电脑集群、社 交网络分析、市场分割、天文数据分析等。强化学习强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大。 由于外部环境 提供的信息很少,强化学习系统必须靠自身的经历进行学习。强化学习的目标是学习从环 境状态到行为的映射,使得智能体选择的行为能够获得环 境最大的奖赏,使得外部环境对 学习系统在某种意义下的评价为最正确。其在机器 人控制、无人驾驶、下棋、工业控制等 领域获得成功应用。2根据学习方法可以将机器学习分为传统机器学习和深度学习。传统机器学习传

4、统机器学习从一些观测训练样本出发,试图发现不能通过原理分析获 得的规律,实 现对未来数据行为或趋势的准确预测。相关算法包括逻辑回归、隐 马尔科夫方法、支持向 量机方法、K近邻方法、三层人工神经网络方法、Adaboost算法、贝叶斯方法以及决策树 方法等。传统机器学习平衡了学习结果的有效性与 学习模型的可解释性,为解决有限样本 的学习问题提供了一种框架,主要用于有 限样本情况下的模式分类、回归分析、概率密度 估计等。传统机器学习方法共同 的重要理论基础之一是统计学,在自然语言处理、语音识 别、图像识别、信息检 索和生物信息等许多电脑领域获得了广泛应用。深度学习深度学习是建立深层结构模型的学习方法

5、,典型的深度学习算法包括深度置 信网络、卷积 神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深 度神经网络指层数超 过 3 层的神经网络。深度学习作为机器学习研究中的一 个新兴领域,由 Hinton 等人于 2006 年提出。深度学习源于多层神经网络,其实 质是给出了一种将特征表示和学习合二为 一的方式。深度学习的特点是放弃了可 解释性,单纯追求学习的有效性。经过多年的摸索 尝试和研究,已经产生了诸多 深度神经网络的模型,其中卷积神经网络、循环神经网络是 两类典型的模型。卷 积神经网络常被应用于空间性分布数据;循环神经网络在神经网络中 引入了记忆 和反馈,常被应用于时间性分布数据。深

6、度学习框架是进行深度学习的基础底 层框架,一般包含主流的神经网络算法模型,提供稳定的深度学习API,支持训练模型在 服务器和 GPU、 TPU 间的分布式学习,部分框架还具备在包括移动设备、云平台在内的多 种平台上运行的移植能力,从而为深度学习算法带来前所未有的 运行速度和实用性。目前 主流的开源算法框架有 TensorFlow、 Caffe/Caffe2、 CNTK、 MXNet 、 Paddle-paddle、 Torch/PyTorch、 Theano 等。3此外,机器学习的常见算法还包括迁移学习、主动学习和演化学习等。迁移学习迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,

7、利用另 一领域数据获 得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到 新的模型指导新模型训 练,可以更有效的学习底层规则、减少数据量。目前的迁 移学习技术主要在变量有限的小 规模应用中使用,如基于传感器网络的定位,文 字分类和图像分类等。未来迁移学习将被 广泛应用于解决更有挑战性的问题,如 视频分类、社交网络分析、逻辑推理等。主动学习主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记, 然后用查询到 的样本训练分类模型来提高模型的精度。主动学习能够选择性地获 取知识,通过较少的训 练样本获得高性能的模型,最常用的策略是通过不确定性 准则和差异性准则选取有效的样 本。演

8、化学习演化学习对优化问题性质要求极少,只需能够评估解的好坏即可,适用于求 解复杂的优化 问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、 多目标演化算法等。目 前针对演化学习的研究主要集中在演化数据聚类、对演化 数据更有效的分类,以及提供某 种自适应机制以确定演化机制的影响等。2 知识图谱知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结 构,以符号形 式描述物理世界中的概念及其相互关系,其基本组成单位是“实体 关系实体”三元组, 以及实体及其相关“属性值”对。不同实体之间通过 关系相互联结,构成网状的知识结 构。在知识图谱中,每个节点表示现实世界的“实体”,每条边为

9、实体与实体之间的“关系”。 通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了 从“关系”的角度 去分析问题的能力。知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需 要用到异常分 析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜 索引擎、可视化展示和 精准营销方面有很大的优势,已成为业界的热门工具。但 是,知识图谱的发展还有很大的 挑战,如数据的噪声问题,即数据本身有错误或 者数据存在冗余。随着知识图谱应用的不 断深入,还有一系列关键技术需要突破。3 自然语言处理自然语言处理是电脑科学领域与人工智能领域中的一个重要方向,研究能 实现人与

10、电脑之 间用自然语言进行有效通信的各种理论和方法,涉及的领域较 多,主要包括机器翻译、机 器阅读理解和问答系统等。1机器翻译机器翻译技术是指利用电脑技术实现从一种自然语言到另外一种自然语 言的翻译过程。基 于统计的机器翻译方法突破了之前基于规则和实例翻译方法的 局限性,翻译性能取得巨大 提升。基于深度神经网络的机器翻译在日常口语等一 些场景的成功应用已经显现出了巨大 的潜力。随着上下文的语境表征和知识逻辑 推理能力的发展,自然语言知识图谱不断扩充, 机器翻译将会在多轮对话翻译及 篇章翻译等领域取得更大进展。目前非限定领域机器翻译中性能较佳的一种是统计机器翻译,包括训练及解 码两个阶段。 训练阶

11、段的目标是获得模型参数,解码阶段的目标是利用所估计的 参数和给定的优化目标, 获取待翻译语句的最正确翻译结果。统计机器翻译主要包 括语料预处理、词对齐、短语抽 取、短语概率计算、最大熵调序等步骤。基于神 经网络的端到端翻译方法不需要针对双语 句子专门设计特征模型,而是直接把源 语言句子的词串送入神经网络模型,经过神经网络 的运算,得到目标语言句子的 翻译结果。在基于端到端的机器翻译系统中,通常采用递归 神经网络或卷积神经 网络对句子进行表征建模,从海量训练数据中抽取语义信息,与基于 短语的统计 翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的效果。2语义理解语义理解技术是指利用电脑技

12、术实现对文本篇章的理解,并且答复与篇章 相关问题的过程。 语义理解更注重于对上下文的理解以及对答案精准程度的把控。 随着 MCTest 数据集的发 布,语义理解受到更多关注,取得了快速发展,相关数 据集和对应的神经网络模型层出不 穷。语义理解技术将在智能客服、产品自动问 答等相关领域发挥重要作用,进一步提高问 答与对话系统的精度。在数据采集方面,语义理解通过自动构造数据方法和自动构造填空型问题的 方法来有效扩 充数据资源。为了解决填充型问题,一些基于深度学习的方法相继 提出,如基于注意力的 神经网络方法。当前主流的模型是利用神经网络技术对篇 章、问题建模,对答案的开始和 终止位置进行预测,抽取

13、出篇章片段。对于进一 步泛化的答案,处理难度进一步提升,目 前的语义理解技术仍有较大的提升空间。3问答系统问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是 指让电脑像人 类一样用自然语言与人交流的技术。人们可以向问答系统提交用 自然语言表达的问题,系 统会返回关联性较高的答案。尽管问答系统目前已经有 了不少应用产品出现,但大多是在 实际信息服务系统和智能 助手等领域中的 应用,在问答系统鲁棒性方面仍然存在着问题 和挑战。自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同 层面存在不确 定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可 预测性;三是数据

14、资源 的不充分使其难以覆盖复杂的语言现象;四是语义知识的 模糊性和错综复杂的关联性难以 用简单的数学模型描述,语义计算需要参数庞大 的非线性计算。4 人机交互人机交互主要研究人和电脑之间的信息交换,主要包括人到电脑和计算 机到人的两部分信 息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒 体技术、虚拟现实技术等密切相关的综合学科。传统的人与电脑之间的信息交换主要依靠交 互设备进行,主要包括键盘、鼠标、 操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据 手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。 人机交互技术 除了传统的基本交

15、互和图形交互外,还包括语音交互、情感交互、体感交互 及脑 机交互等技术,以下对后四种与人工智能关联密切的典型交互手段进行介绍。1语音交互语音交互是一种高效的交互方式,是人以自然语音或机器合成语音同电脑 进行交互的综合 性技术,结合了语言学、心理学、工程和电脑技术等领域的知 识。语音交互不仅要对语音 识别和语音合成进行研究,还要对人在语音通道下的 交互机理、行为方式等进行研究。语 音交互过程包括四部分:语音采集、语音识 别、语义理解和语音合成。语音采集完成音频 的录入、采样及编码;语音识别完 成语音信息到机器可识别的文本信息的转化;语义理解 根据语音识别转换后的文 本字符或命令完成相应的操作;语

16、音合成完成文本信息到声音信 息的转换。作为 人类沟通和获取信息最自然便捷的手段,语音交互比其他交互方式具备更 多优势,能为人机交互带来根本性变革,是大数据和认知计算时代未来发展的制高点,具 有 广阔的发展前景和应用前景。2情感交互情感是一种高层次的信息传递,而情感交互是一种交互状态,它在表达功能 和信息时传递 情感,勾起人们的记忆或内心的情愫。传统的人机交互无法理解和 适应人的情绪或心境, 缺乏情感理解和表达能力,电脑难以具有类似人一样的 智能,也难以通过人机交互做到真 正的和谐与自然。情感交互就是要赋予电脑 类似于人一样的观察、理解和生成各种情感的 能力,最终使电脑像人一样能进 行自然、亲切和生动的交互。情感交互已经成为人工智能 领域中的热点方向,旨 在让人机交互变得更加自然。目前,在情感交互信息的处理方式、 情感描述方式、 情感数据获取和处理过程、情感表

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号