次课件Python基础

上传人:我*** 文档编号:134637933 上传时间:2020-06-07 格式:PPT 页数:470 大小:38.50MB
返回 下载 相关 举报
次课件Python基础_第1页
第1页 / 共470页
次课件Python基础_第2页
第2页 / 共470页
次课件Python基础_第3页
第3页 / 共470页
次课件Python基础_第4页
第4页 / 共470页
次课件Python基础_第5页
第5页 / 共470页
点击查看更多>>
资源描述

《次课件Python基础》由会员分享,可在线阅读,更多相关《次课件Python基础(470页珍藏版)》请在金锄头文库上搜索。

1、Python与大数据分析 对外经贸大学信息学院大数据专业Python教研组 Python与大数据分析 Python基础 5次课 网络爬虫 2次课 期中随堂上机考试 1次课 金融数据分析案例 2次课 文本数据分析案例 3次课 图像数据分析 3次课 6 7 2020 外经贸 信息学院 2 自我介绍 刘宁宁对外经济贸易大学信息学院讲师 专注于对图像分类 VisualObjectClassification 文本处理 NaturalLanguageProcessing 模式识别 PatternRecognition 等方面的研究 6 00 3 2020 6 7 外经贸 信息学院 为什么大数据首选是Py

2、thon呢 2020 6 7 4 外经贸 信息学院 第一部分 初识Python 第二部分 基本概念变量 注释 print函数 数据类型 算术运算符 类型转换 第三部分 数据的容器列表 元组 字典 集合 第四部分 控制结构与推导式 2020 6 7 5 外经贸 信息学院 第五部分 数据的读写操作 2020 6 7 6 外经贸 信息学院 第六部分 错误类型和异常捕获 第七部分 字符编码问题处理 第八部分 编写函数处理数据 第九部分 变量作用域 2020 6 7 7 外经贸 信息学院 第十部分 Python中的模块 第十一部分 Python中的类 第十五部分 Numpy基础知识 第十六部分 Pand

3、as数据分析 第十三部分 正则表达式 第十四部分 日期数据的处理 Python语言的诞生和发展历史 Python语言的特点 运行环境及安装 2020 6 7 8 外经贸 信息学院 Python语言的诞生和发展历史 Python语言是一种解释型 面向对象 动态数据类型的高级程序设计语言Python语言是数据分析师的首选数据分析语言 也是智能硬件的首选语言 数据分析 创建复杂的Web应用程序 游戏开发 动画电影效果 网站开发 智能硬件开发 2020 6 7 9 外经贸 信息学院 Python与蟒蛇有关 GuidovanRossum于1989年在荷兰国家数学和计算机科学研究所设计出来的 Python

4、语言的诞生 BBC MontyPython sFlyingCircus 蒙提 派森的飞行马戏团 GuidovanRossum 人称 龟叔 2020 6 7 10 外经贸 信息学院 Python2 0版本于2000年10月发布 在2008年12月 Python3 0发布 此版本没有完全兼容之前的Python2 0Python也因此分为了Python3 5派系和Python2 7派系两大阵营 Python语言的发展历史 2020 6 7 11 外经贸 信息学院 TIOBEINDEX 编程语言流行程度排行榜 Python语言的TIOBEINDEX 2020 6 7 12 外经贸 信息学院 Pytho

5、n曾在2007年和2010年两度被TIOBE排行榜评为 年度编程语言 现已成为了第五大流行编程语言 截至2016年10月 Python语言的TIOBEINDEX 2020 6 7 13 外经贸 信息学院 Python语言的特点 优点一 优雅 简单 明确 减少花哨 晦涩或以 炫技 为目的的代码 让数据分析师们摆脱了程序本身语法规则的泥潭 更快的进行数据分析 C语言 Python语言 2020 6 7 14 外经贸 信息学院 优点二 强大的标准库完善的基础代码库 覆盖了网络通信 文件处理 数据库接口 图形系统 XML处理等大量内容 被形象地称为 内置电池 batteriesincluded Pyt

6、hon使用者 调包侠 2020 6 7 15 外经贸 信息学院 优点三 良好的可扩展性大量的第三方模块 覆盖了科学计算 Web开发 数据接口 图形系统等众多领域 开发的代码通过很好的封装 也可以作为第三方模块给别人使用 如Pandas Numpy Seaborn Scikit learn等等优点四 免费 开源 2020 6 7 16 外经贸 信息学院 缺点一 运行速度慢缺点二 加密难缺点三 缩进规则缺点四 多线程灾难 Python语言的缺点 2020 6 7 17 外经贸 信息学院 Python语言与Java 动态类型和静态类型Python中一切皆对象括号与缩进应用领域 2020 6 7 18

7、 外经贸 信息学院 Python语言与R语言 机器学习的一把利器可读性强 便于上手灵活性强 可与其他如Web应用程序进行整合 以统计推断为导向数据分析之外的领域有所限制包凌乱且一致性较差 2020 6 7 19 外经贸 信息学院 Python语言与R语言的应用场景对比 网络爬虫连接数据库内容管理系统API构建 统计分析互动式图标 面板 2020 6 7 20 外经贸 信息学院 运行环境及安装 推荐使用Anaconda进行Python安装 环境配置及工具包管理IpythonqtconsolePyCharmJupyterNotebookSpyder 2020 6 7 21 外经贸 信息学院 IPy

8、thon鼓励一种 执行 探索 execute explore 的工作模式输入代码之后 按下回车 便会立即得到代码运行结果 交互式计算和开发环境 IPython 2020 6 7 22 外经贸 信息学院 交互式计算和开发环境 IPython 输入 获得IPython的详细介绍 输入 quickref 获得IPython的快速参考 2020 6 7 23 外经贸 信息学院 交互式计算和开发环境 IPython 输入 help 查看IPython的帮助文档 使用内省 pandas 查看Pandas的帮助文档 2020 6 7 24 外经贸 信息学院 基于Qt框架的GUI控制台 qtconsole 为

9、终端应用程序提供诸如内嵌图片 多行编辑 语法高亮之类的富文本编辑功能启动命令 jupyterqtconsole缺点 功能少 用户友好性不够 2020 6 7 25 外经贸 信息学院 JupyterNotebook Julia Python R Jupyter基于Web技术的交互式计算文档格式支持Markdown和Latex语法支持代码运行 文本输入 数学公式编辑 内嵌式画图和其他如图片文件的插入 是一个对代码友好的笔记本 2020 6 7 26 外经贸 信息学院 JupyterNotebook Jupyter支持包含Rkernel 支持R语言 启动命令 jupyternotebook 2020

10、 6 7 27 外经贸 信息学院 JupyterNotebook 推荐使用JupyterNotebook进行数据分析 并将自己数据分析的思考过程写在其中 方便之后整理思路以及向别人展示数据分析结果 从左至右分别是默认Python终端 IPython和JupyterNotebook 2020 6 7 28 外经贸 信息学院 RNotebook 2016年10月 R语言的集成环境RStudio也拥有了自己的RNotebook了 2020 6 7 29 外经贸 信息学院 集成开发环境IDE PyCharm Spyder 2020 6 7 30 外经贸 信息学院 数据科学计算平台 Anaconda l

11、eadingopendatascienceplatformpoweredbyPython自动配置Python环境 下载并安装JupyterNotebook qtconsole和集成开发环境Spyder包管理器conda 2020 6 7 31 外经贸 信息学院 总结 Python语言的特点 优雅 简单 易学 Python语言的诞生与发展历史 Python语言的运行环境 IPython JupyterNotebook Spyder Python语言的数据科学计算平台 Anaconda 2020 6 7 32 外经贸 信息学院 实践案例1 PyCharm下 HelloWorld通过例子说明Pyth

12、on与其他语言的区别万物皆对象空格控制结构报错 6 7 2020 外经贸 信息学院 33 变量 注释 print函数 数据类型算术运算符 类型转换 2020 6 7 34 外经贸 信息学院 解释型语言Python Python语言是一种解释型 面向对象 动态数据类型的高级程序设计语言 2020 6 7 35 外经贸 信息学院 数据集变量及相关含义 公开数据集资源UCI数据集Kaggle数据集Yahoo 股票价格数据 2020 6 7 36 外经贸 信息学院 用来存储一些之后可能会变化的值对科比投篮ID为1的一次投篮进行分析 那么我们就可以创建一个名称为shot id的变量 并且将1值储存在变量

13、shot id中如果之后我们想要分析科比的另外一次投篮 比如投篮ID为2的投篮 我们只需要修改变量shot id的赋值 将shot id赋值为2即可 变量和常量 变量 2020 6 7 37 外经贸 信息学院 变量名必须是大小写英文字母 数字或下划线 的组合 不能用数字开头 并且对大小写敏感关键字不能用于命名变量 31个 如and as assert break class continue def del等 变量命名规则 2020 6 7 38 外经贸 信息学院 通过赋值运算符 变量名和想要赋予变量的值连接起来 变量的赋值操作就完成了声明和定义的的过程 在其他语言中需要制定类型 同一变量可以

14、反复赋值 而且可以是不同类型的变量 这也是Python语言称之为动态语言的原因 变量赋值 2020 6 7 39 外经贸 信息学院 常量表示 不能变 的变量Python中是没有常量的关键字的 只是我们常常约定使用大写字母组合的变量名表示常量 也有不要对其进行赋值 的提醒作用 常量 2020 6 7 40 外经贸 信息学院 如同我们在看书时做笔记一样Python语言会通过注释符号识别出注释的部分 将它们当做纯文本 并在执行代码时跳过这些纯文本在Python语言中 使用 进行行注释 注释 2020 6 7 41 外经贸 信息学院 多行注释使用连续单个单引号或者双引号 2020 6 7 42 外经贸

15、 信息学院 在Python2 x版本中 同时兼容print和print 在Python3 x版本中 print函数为带括号的print 如果想要看变量的值 则直接在print后面加上变量名即可 如果是想要输出提示信息 如一句话 那我们需要将提示信息用 单引号包裹起来 这使得内容构成一个字符串 print函数 2020 6 7 43 外经贸 信息学院 使用逗号 隔开变量与其他剩余内容 则print在输出时会依次打印各个字符串或变量 遇到逗号 时会输出一个空格 print函数不仅可以打印变量值 也可以打印计算结果 2020 6 7 44 外经贸 信息学院 Python语言的数据类型包括整型 浮点型

16、 字符串 布尔型和空值整型 int 整型的取值为整数 有正有负 如2 666 666等 在科比投篮数据集中 shot id game event id game id loc x loc y minutes remaining period playoffs seconds remaining shot distance shot made flag team id都是整型变量 数据类型 2020 6 7 45 外经贸 信息学院 浮点型的取值为小数 当计算有精度要求时被使用 由于小数点可以在相应的二进制的不同位置浮动 故而称为浮点数如3 14 6 66等 但是如果是非常大或者非常小的浮点数 就需要使用科学计数法表示 用e代替10 科比投篮数据集中的lat和lon为浮点型变量 浮点型 float 2020 6 7 46 外经贸 信息学院 字符串 str 字符串是以两个单引号或两个双引号包裹起来的文本字符串JumpShot包括J u m p 空格 S h o t这9个字符 字符串 str 2020 6 7 47 外经贸 信息学院 转义字符 字符串里常常存在一些如换行 制表符等有特殊含义的字

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号