十分钟让你了解python数据挖掘培训路线

上传人:ldj****22 文档编号:37066337 上传时间:2018-04-06 格式:PDF 页数:7 大小:458.37KB
返回 下载 相关 举报
十分钟让你了解python数据挖掘培训路线_第1页
第1页 / 共7页
十分钟让你了解python数据挖掘培训路线_第2页
第2页 / 共7页
十分钟让你了解python数据挖掘培训路线_第3页
第3页 / 共7页
十分钟让你了解python数据挖掘培训路线_第4页
第4页 / 共7页
十分钟让你了解python数据挖掘培训路线_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《十分钟让你了解python数据挖掘培训路线》由会员分享,可在线阅读,更多相关《十分钟让你了解python数据挖掘培训路线(7页珍藏版)》请在金锄头文库上搜索。

1、精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 十分钟让你了解 Python 数据挖掘培训路线学习 Python 数据挖掘,你有明确的路线吗,学任何东西首先你要知道学习它的路线,了解了路线才能更容易学习,学习起来才不会非常费劲,进入正题,看步骤吧。步骤 0:热身开始学习旅程之前, 先回答第一个问题: 为什么使用 Python?或者, Python如何发挥作用?观看 DataRobot 创始人 Jeremy 在 PyCon Ukraine 2014 上的 30 分钟演讲,来了解 Python 是多么的有用。步骤 1:设置你的机器环境现在你已经决心要好好学习了,也是时候设置你的机器环境了。

2、最简单的方法就是从 Continuum.io 上下载分发包 Anaconda。Anaconda 将你以后可能会用到的大部分的东西进行了打包。采用这个方法的主要缺点是,即使可能已经精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 有了可用的底层库的更新,你仍然需要等待 Continuum 去更新 Anaconda 包。当然如果你是一个初学者,这应该没什么问题。如果你在安装过程中遇到任何问题, 你可以在这里找到不同操作系统下更详细的安装说明。步骤 2:学习 Python 语言的基础知识你应该先去了解 Python 语言的基础知识、库和数据结构。Codecademy上的 Python 课程是你

3、最好的选择之一。完成这个课程后,你就能轻松的利用Python 写一些小脚本,同时也能理解 Python 中的类和对象。具体学习内容:列表 Lists,元组 Tuples,字典 Dictionaries,列表推导式,字典推导式。任务:解决 HackerRank 上的一些 Python 教程题,这些题能让你更好的用Python 脚本的方式去思考问题。替代资源:如果你不喜欢交互编码这种学习方式,你也可以学习 PPV 课训练营课程 python 入门。这课程系列不但包含前边提到的 Python 知识,还包含了一些后边将要讨论的东西。精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 步骤 3:学习

4、 Python 语言中的正则表达式你会经常用到正则表达式来进行数据清理,尤其是当你处理文本数据的时候。学习正则表达式的最好方法是参加谷歌的 Python 课程,它会让你能更容易的使用正则表达式。任务:做关于小孩名字的正则表达式练习。如果你还需要更多的练习,你可以参与这个文本清理的教程。数据预处理中涉及到的各个处理步骤对你来说都会是不小的挑战。步骤 4:学习 Python 中的科学库NumPy, SciPy, Matplotlib 以及Pandas从这步开始,学习旅程将要变得有趣了。下边是对各个库的简介,你可以进行一些常用的操作:根据 NumPy 教程进行完整的练习,特别要练习数组 arrays

5、。这将会为下边的学习旅程打好基础。精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 接下来学习 Scipy 教程。看完 Scipy 介绍和基础知识后,你可以根据自己的需要学习剩余的内容。这里并不需要学习 Matplotlib 教程。对于我们这里的需求来说,Matplotlib的内容过于广泛。取而代之的是你可以学习这个笔记中前 68 行的内容。最后学习 Pandas。Pandas 为 Python 提供 DataFrame 功能(类似于 R)。这也是你应该花更多的时间练习的地方。Pandas 会成为所有中等规模数据分析的最有效的工具。 作为开始, 你可以先看一个关于 Pandas 的 10

6、 分钟简短介绍,然后学习一个更详细的 Pandas 教程。您还可以学习两篇博客 Exploratory Data Analysis with Pandas 和 Datamunging with Pandas 中的内容。额外资源:如果你需要一本关于 Pandas 和 Numpy 的书,建议 Wes McKinney 写的“Python for Data Analysis”。在 Pandas 的文档中,也有很多 Pandas 教程,你可以在这里查看。任务:尝试解决哈佛 CS109 课程的这个任务。精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 步骤 5:有用的数据可视化参加 CS109 的

7、这个课程。你可以跳过前边的 2 分钟,但之后的内容都是干货。你可以根据这个任务来完成课程的学习。步骤 6:学习 Scikit-learn 库和机器学习的内容现在,我们要开始学习整个过程的实质部分了。Scikit-learn 是机器学习领域最有用的 Python 库。这里是该库的简要概述。完成哈佛 CS109 课程的课程10 到课程 18,这些课程包含了机器学习的概述,同时介绍了像回归、决策树、整体模型等监督算法以及聚类等非监督算法。 你可以根据各个课程的任务来完成相应的课程。额外资源:如果说有那么一本书是你必读的,推荐 Programming CollectiveIntelligence。这本

8、书虽然有点老,但依然是该领域最好的书之一。精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 此外, 你还可以参加来自 Yaser Abu-Mostafa 的机器学习课程, 这是最好的机器学习课程之一。如果你需要更易懂的机器学习技术的解释,你可以选择来自Andrew Ng 的机器学习课程,并且利用 Python 做相关的课程练习。Scikit-learn 的教程任务:尝试 Kaggle 上的这个挑战步骤 7:练习,练习,再练习恭喜你,你已经完成了整个学习旅程。你现在已经学会了你需要的所有技能。现在就是如何练习的问题了,还有比通过在Kaggle上和数据科学家们进行竞赛来练习更好的方式吗?深入

9、一个当前Kaggle 上正在进行的比赛,尝试使用你已经学过的所有知识来完成这个比赛。步骤 8:深度学习现在你已经学习了大部分的机器学习技术,是时候关注一下深度学习了。很可能你已经知道什么是深度学习,但是如果你仍然需要一个简短的介绍,可以看这里。我自己也是深度学习的新手,所以请有选择性的采纳下边的一些建议。 上有深度学习方面最全面的资源,在这里你会发现所有你想要的东西讲座、数据集、挑战、教程等。你也可以尝试参加 Geoff Hinton 的课程,来了解神经网络的基本知识。附言:如果你需要大数据方面的库,可以试试 Pydoop 和 PyMongo。大数据学习路线不是本文的范畴,是因为它自身就是一个完整的主题。最后千锋教育是一家不错的机构来学习 Python,我相信它会为你的梦想插精品课程 全程面授中国 IT 职业教育领先品牌千锋教育 上翅膀让你尽情翱翔,在这里我也送上我诚挚的祝福,希望所有学习 Python 的学子能够越飞越远,实现自己的梦想,创造更美好的人生。更多详情戳这里:http:/www.mobiletrain.org/

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号