机器学习的定义

上传人:壹****1 文档编号:491054262 上传时间:2022-12-02 格式:DOCX 页数:4 大小:10.43KB
返回 下载 相关 举报
机器学习的定义_第1页
第1页 / 共4页
机器学习的定义_第2页
第2页 / 共4页
机器学习的定义_第3页
第3页 / 共4页
机器学习的定义_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《机器学习的定义》由会员分享,可在线阅读,更多相关《机器学习的定义(4页珍藏版)》请在金锄头文库上搜索。

1、机器学习的定义机器学习的定义 从广义上来说,机器学习就是一种能够赋予机器学习的能力以此让 它完成直接编程无法完成的功能的方法。但从实践的意义上来说 ,机器学习就是 一种通过利用数据,训练出模型,然后使用模型预测的一种方法。 机器学习的范围 其实,机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识 别,自然语言处理等领域有着很深的联系。从范围上来说,机器学习跟模式识别,统计学习,数据挖掘就是类似的, 同时,机器学习与其她领域的处理技术的结合,形成了计算机视觉、语音 识别、自然语言处理等交叉学科。因此,一般说数据挖掘时,可以等同于 说机器学习。同时,我们平常所说的机器学习应用,应该就是通用

2、的,不仅仅模式识别 模式识别=机器学习。两者的主要区别在于前者就是从工业界发展 起来的概念,后者则主要源自计算机学科。在著名的 Pattern Recognition And MachineLearning这本书中,Christopher M、Bishop在开头就是这样说 的“模式识别源自工业界,而机器学习来自于计算机学科。不过,它们中的活动可以被 视为同一个领域的两个方面,同时在过去的10年间,它们都有了长足的发展”。 数据挖掘数据挖掘=机器学习+数据库。这几年数据挖掘的概念实在就是太 耳熟能详。几乎等同于炒作。但凡说数据挖掘都会吹嘘数据挖掘如何如何 ,例如 从数据中挖出金子,以及将废弃的数

3、据转化为价值等等。但就是,我尽管可能会挖 出金子,但我也可能挖的就是“石头”啊。这个说法的意思就是 ,数据挖掘仅仅就 是一种思考方式,告诉我们应该尝试从数据中挖掘出知识 ,但不就是每个数据都能挖 掘出金子的,所以不要神话它。一个系统绝对不会因为上了一个数据挖掘模块就 变得无所不能(这就是 IBM 最喜欢吹嘘的),恰恰相反,一个拥有数据挖掘思维的人 员才就是关键,而且她还必须对数据有深刻的认识,这样才可能从数据中 导出模式指引业务的改善。大部分数据挖掘中的算法就是机器学习的 算法在数据库中的优化。统计学习统计学习近似等于机器学习。统计学习就是个与机器学习高度重 叠的学科。因为机器学习中的大多数方

4、法来自统计学,甚至可以认为,统 计学的发展促进机器学习的繁荣昌盛。例如著名的支持向量机算法 ,就 就是源自统计学科。但就是在某种程度上两者就是有分别的 ,这个分别 在于:统计学习者重点关注的就是统计模型的发展与优化,偏数学,而机器 学习者更关注的就是能够解决问题,偏实践,因此机器学习研究者会重点 研究学习算法在计算机上执行的效率与准确性的提升。计算机视觉计算机视觉=图像处理+机器学习。图像处理技术用于将图像处理 为适合进入机器学习模型中的输入,机器学习则负责从图像中识别出相 关的模式。计算机视觉相关的应用非常的多 ,例如百度识图、手写字符 识别、车牌识别等等应用。这个领域就是应用前景非常火热的

5、 ,同时也 就是研究的热门方向。随着机器学习的新领域深度学习的发展 ,大大促 进了计算机图像识别的效果,因此未来计算机视觉界的发展前景不可估语音识别语音识别=语音处理+机器学习。语音识别就就是音频处理技术与 机器学习的结合。语音识别技术一般不会单独使用 ,一般会结合自然语 言处理的相关技术。目前的相关应用有苹果的语音助手siri等。自然语言处理自然语言处理=文本处理+机器学习。自然语言处理技术主要就是 让机器理解人类的语言的一门领域。在自然语言处理技术中 ,大量使用 了编译原理相关的技术,例如词法分析,语法分析等等,除此之外,在理解 这个层面,则使用了语义理解,机器学习等技术。作为唯一由人类自

6、身创 造的符号,自然语言处理一直就是机器学习界不断研究的方向。按照百 度机器学习专家余凯的说法“听与瞧,说白了就就是阿猫与阿狗都会的, 而只有语言才就是人类独有的”。如何利用机器学习技术进行自然语 言的的深度理解,一直就是工业与学术界关注的焦点。可以瞧出机器学习在众多领域的外延与应用。机器学习技术的发 展促使了很多智能领域的进步,改善着我们的生活。局限在结构化数据,还有图像,音频等应用。机器学习的方法1、回归算法在大部分机器学习课程中 ,回归算法都就是介绍的第一个算法。原 因有两个:一、回归算法比较简单,介绍它可以让人平滑地从统计学迁移 到机器学习中。二、回归算法就是后面若干强大算法的基石 ,

7、如果不理 解回归算法,无法学习那些强大的算法。回归算法有两个重要的子类 :即 线性回归与逻辑回归。线性回归就就是我们前面说过的房价求解问题。如何拟合出一条 直线最佳匹配我所有的数据?一般使用“最小二乘法”来求解。“最 小二乘法”的思想就是这样的,假设我们拟合出的直线代表数据的真实 值,而观测到的数据代表拥有误差的值。为了尽可能减小误差的影响,需要求解一条直线使所有误差的平方与 最小。最小二乘法将最优问题转化为求函数极值问题。函数极值在数 学上我们一般会采用求导数为 0 的方法。但这种做法并不适合计算机, 可能求解不出来,也可能计算量太大。计算机科学界专门有一个学科叫 “数值计算”,专门用来提升

8、计算机进行各类计算时的准确性与效率问题。例如,著名的“梯度下降”以及“牛顿法 就就是数值计算中的经典算法,也非常适合来处理求解函数极值的问题 梯度下降法就是解决回归模型中最简单且有效的方法之一。从严格意 义上来说,由于后文中的神经网络与推荐算法中都有线性回归的因子,因 此梯度下降法在后面的算法实现中也有应用。逻辑回归就是一种与线性回归非常类似的算法,但就是,从本质上讲, 线型回归处理的问题类型与逻辑回归不一致。线性回归处理的就是数值问题 , 也就就是最后预测出的结果就是数字,例如房价。而逻辑回归属于分类 算法,也就就是说,逻辑回归预测结果就是离散的分类,例如判断这封邮件 就是否就是垃圾邮件,以及用户就是否会点击此广告等等。实现方面的话,逻辑回归只就是对对线性回归的计算结果加上了一 个Sigmoid函数,将数值结果转化为了 0到1之间的概率(Sigmoid函 数的图像一般来说并不直观,您只需要理解对数值越大,函数越逼近 1,数 值越小,函数越逼近 0),接着我们根据这个概率可以做预测 ,例如概率大 于 0、5,则这封邮件就就是垃圾邮件 ,或者肿瘤就是否就是恶性的等等 从直观上来说,逻辑回归就是画出了一条分类线,见下图。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号