数据科学的常用数据集推荐_光环大数据培训

上传人:gua****an 文档编号:52361879 上传时间:2018-08-20 格式:DOCX 页数:6 大小:40.85KB
返回 下载 相关 举报
数据科学的常用数据集推荐_光环大数据培训_第1页
第1页 / 共6页
数据科学的常用数据集推荐_光环大数据培训_第2页
第2页 / 共6页
数据科学的常用数据集推荐_光环大数据培训_第3页
第3页 / 共6页
数据科学的常用数据集推荐_光环大数据培训_第4页
第4页 / 共6页
数据科学的常用数据集推荐_光环大数据培训_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《数据科学的常用数据集推荐_光环大数据培训》由会员分享,可在线阅读,更多相关《数据科学的常用数据集推荐_光环大数据培训(6页珍藏版)》请在金锄头文库上搜索。

1、 光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/数据科学的常用数据集推荐数据科学的常用数据集推荐_光环大数据培训光环大数据培训数据科学的常用数据集数据集推荐。以下是光环大数据培训整理编译的 17 个常用数据集,并列举了适用的典型问题,从菜鸟到老司机,总有一款适合你。菜鸟入门1.Iris 数据集在模式识别文献中,Iris 数据集恐怕是最通用也是最简单的数据集了。要学习分类技术,Iris 数据集绝对是最方便的途径。如果你之前从未接触过数据科学这一概念,从这里开始一定没错,因为该数据集只有 4 列 150 行。典型问题:在可用属性基础上预测

2、花的类型。2.泰坦尼克数据集泰坦尼克数据集也是全球数据科学殿堂中出镜率最高的数据集之一。借助一些教程和指导,泰坦尼克数据集可以让你深入了解数据科学。通过对类别、数字、文本等数据的结合,你能从该数据集中总结出最疯狂的想法。该数据集更重视分类问题,共有 12 列 891 行。典型问题:预测泰坦尼克号上生还的幸存者人数。3.贷款预测数据集在所有行业中,最为倚重数据分析技术的就是保险业。贷款预测数据集可以让保险公司对即将面对的挑战、选择的应对方式和影响有一个清晰的认识。与泰坦尼克数据集相同,它光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/也是

3、一个分类问题,该数据集共有 13 列 615 行。典型问题:预测贷款申请能否得到批准。4.大市场销售数据集零售业也是数据分析技术的重度使用者之一,它们可以利用分析数据来优化整个商业流程。利用数据科学技术,管理人员可以准确的完成产品分配、库存管理、供货和打包等复杂流程。这一数据集的名字已经透露出了它的属性,它就是商店的交易记录,主要解决回归问题。该数据集共有 12 列 8523 行。典型问题:预测销售情况。5.波士顿数据集该数据集也是模式识别文献中的典型数据集,该数据集得名是因为波士顿的房地产行业,同时它也是一个回归问题。该数据集共有 14 列 8506 行。因此,即使你手上的笔记本电脑性能较弱

4、也能 Hold 住该数据集。典型问题:预测房屋售价的中间值。进阶级别1.人类活动识别该数据集是由 30 个受试人智能手机内置的传感器收集的。许多机器学习课程中该数据集是学生联手的重要助手。该数据集属于多标记分类问题,共有 561 列 10299 行。光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/典型问题:预测人类活动的类别。2.“黑五”数据集该数据集主要是由零售店的交易记录组成的,它在数据集界资格很老,可以帮助商家了解自己商店每天的购物体验。 “黑五”数据集也是个回归问题,它共有 12 列 550069 行。典型问题:预测消费者购物量

5、。3.文本挖掘数据集该数据集包含航空公司飞行数据中关于航空安全问题的报告,属于多标记分类的高维问题,雷锋网了解到它共有 30438 列 21519 行。典型问题:根据标签为文档分类。4.访问历史数据集该数据即来源于美国的一个单车分享服务,想掌握它,你必须拥有专业的数据整理技巧。该数据集 2010 年第四季度开始每季度都会总结出一个新文档,每个文档则拥有 7 列。它属于典型的分类问题。典型问题:预测用户的类型。5.百万歌曲数据集是不是觉得很新奇,原来这项技术还能用在娱乐业啊。该数据集能帮你完成回归问题,它包括 515345 个观察值和 90 个变量。不过,这还只是百万首歌曲数据库中的一个小子集。

6、光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/典型问题:预测发行歌曲的最佳年份。6.人口收入数据集该数据集属于非平衡数据分类和机器学习问题。众多周知,机器学习在解决非平衡问题上效果显著,它可以执行癌症和欺诈检测等任务。该数据集共有 14 列 48842 行。典型问题:预测美国人的收入阶层。7.电影镜头数据集利用该数据集,你能搭建一个推荐引擎。同时,该数据集也是数据科学行业的老兵之一,它可运用在许多领域。它数据相当庞大,共有 4000 部电影和 6000 多位用户发出的超过100 万个评分。典型问题:为用户推荐新电影。老司机级别1.数字

7、定义数据集该数据集能让你学习、分析并认识图片中的各种元素,它就是相机中图片和面部识别的技术基础。该数据技术与数字识别问题,共有 2828 大小的图片 7 千张,大小为 31MB。典型问题:在图片中定义数字。2.Yelp 数据集光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/该数据集诞生于著名的 Yelp 数据集挑战赛第 8 轮。它由 20 万张图片组称,3 个 json 文档的大小都达到了 2GB。这些图片包含了 4 个不同国家 10 大城市本地企业的信息,你需要通过文化、季节、数据挖掘、社交图挖掘和类别推断等方式来洞察复杂的数据。典型

8、问题:从图片中找亮点。3.ImageNet 数据集ImageNet 数据集可以运用在多种问题中,包括目标检测、定位、分类和屏幕解析。眼下,其图片引擎中共有 1419 万多张图片,容量达到了 140GB,你可以任选图片并围绕其打造自己的项目。典型问题:问题的解决要围绕下载的图片展开。4.KDD1999 数据集说到数据集,KDDCup 这一大名可不能不提,它是世界上首个国际知识发现和数据挖掘竞赛。KDD1999 数据集属于分类问题,它共包含 48 列和 400 万行,文档体积约为 1.2GB。典型问题:判断网络入侵探测器是否完成了任务。5.芝加哥犯罪数据集如今,能否 Hold 住大型的数据集已经是

9、检验数据专家是否合格的试金石了。许多数据分析公司不再依靠简单的模型,它们开始使用完整的数据。通过该数据集,你能掌握大量在自己电脑上分析大型数据集的经验。想解决这一问题不难,但学会数据管理并不容易。芝加哥犯罪数据集中共有 600 万个观察值,属于典型的多标记分类问题。光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/典型问题:预测犯罪的类型。光环大数据培训作为大数据培训机构的典范,师资力量雄厚,拥有强大的研发团队。光环大数据培训的老师坚持“教学为本”的方针;坚持“用良心做教育”的理念。全心全力帮助每一位学生。秉承对学生负责的基本原则,光环多年来坚持面对面教学,传授真正实用的技能知识。大数据培训,就选光环国际-大数据培训!为什么大家选择为什么大家选择光环大数据光环大数据!大数据培训、人工智能培训、Python 培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。【报名方式、详情咨询】光环大数据官方网站报名:http:/ /mobile/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 数据结构与算法

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号