南开大学22春《数据科学导论》离线作业二及答案参考82

上传人:博****1 文档编号:458020311 上传时间:2023-04-28 格式:DOCX 页数:12 大小:14.32KB
返回 下载 相关 举报
南开大学22春《数据科学导论》离线作业二及答案参考82_第1页
第1页 / 共12页
南开大学22春《数据科学导论》离线作业二及答案参考82_第2页
第2页 / 共12页
南开大学22春《数据科学导论》离线作业二及答案参考82_第3页
第3页 / 共12页
南开大学22春《数据科学导论》离线作业二及答案参考82_第4页
第4页 / 共12页
南开大学22春《数据科学导论》离线作业二及答案参考82_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学22春《数据科学导论》离线作业二及答案参考82》由会员分享,可在线阅读,更多相关《南开大学22春《数据科学导论》离线作业二及答案参考82(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春数据科学导论离线作业二及答案参考1. 层次聚类适合规模较( )的数据集。A.大B.中C.小D.所有参考答案:C2. python中内置了round函数来进行小数的四舍五入操作,请选择round(3.1415923, 4)对应的结果( )。A.3.142B.3.14C.3.1416D.3.0参考答案:C3. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C4. 下列选项是BFR的对象是( )。A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD5. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法

2、D.随机选取参考答案:AB6. ECR系统由哪些部分组成的?ECR系统由哪些部分组成的?参考答案:ECR系统的基本结构包括两个部分,即基础设施和管理系统,其中,基础设施包括信息系统和物流系统,管理系统包括营销管理和组织革新。7. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A8. 阶跃函数具有不光滑、不连续的特点。( )A.正确B.错误参考答案:A9. 地下城与勇士(DNF)已满18岁,填写资料后为什么没生效?地下城与勇士(DNF)已满18岁,填写资料后为什么没生效?1、身份信息的添加

3、将在一个小时后生效,请尝试退出后重新登录。2、如果您填写信息正确并已通过验证,1小时后登录游戏仍然受到限制,请您到我们的客服中心 填单反馈。10. 函数是一段具有特定功能的、可重用的语句组,用函数名来表示并通过函数名进行功能调用。( )A.正确B.错误参考答案:A11. QQ炫舞连接下载服务器.QQ炫舞连接下载服务器.版本或者网络差异导致更新缓慢,或者优化个人网络。12. 简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放。( )A.正确B.错误参考答案:A13. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社

4、交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T14. K均值(K-Means)算法是密度聚类。( )A.正确B.错误参考答案:B15. 剪枝是决策树学习算法对付“过拟合”的主要手段。( )A.正确B.错误参考答案:A16. 选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。( )A.正确B.错误参考答案:A17. 组合数据类型可以分为三类:序列类型、集合类型和映射类型。( )A.正确B.错误参考答案:A18. 使用SVD方法进行图像压缩不可以保

5、留图像的重要特征。( )A.正确B.错误参考答案:B19. 基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。( )T.对F.错参考答案:T20. 整数和整数之间的运算结果一定的是整数。( )A.正确B.错误参考答案:B21. 在回归分析中,自变量为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量参考答案:D22. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B23. 下列哪一种不是Python的特性?( )A.跨

6、平台特性B.解释型语言C.编译型语言D.面向对象参考答案:C24. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T25. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC26. 聚类的主要方法有( )。聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC27. 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。( )T.对F.错参考答案:T28. 特征选择和

7、降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。( )A.正确B.错误参考答案:A29. 程序语句len(str(3.1415)的输出结果为( )。A.4B.5C.6D.7参考答案:C30. 给定关联规则AB,意味着:若A发生,B也会发生。( )A.正确B.错误参考答案:B31. 关于import引用,下列选项中描述错误的是( )。A.使用import turtle可引入turtle库B.使用from turtle import setup可引入turtle库C.使用import turtle as t可引入turtle库,取别名为tD.import关键字用于导入模块或者模块中的对

8、象参考答案:B32. 对于多层感知机,( )层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC33. 统计图表的可视化方法主要包括( )A.散点图B.折线图C.条形图D.饼图参考答案:ABCD34. 末日求生沙盒游戏H1Z1解锁国区IP了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。35. 决策树内部结点表示一个类,叶结点表示一个特征或属性。( )A.正确B.错误参考答案:B36. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C.海量级

9、数据分析D.巨量级数据分析参考答案:ABC37. 怪物猎人OL如何捕获怪物?怪物猎人OL如何捕获怪物?捕获怪物也是游戏中的一个特色玩法,当攻击怪物到达一定程度,怪物瘸腿逃走的时候,在地上放置麻痹陷阱或落穴陷阱,然后引诱怪物走到陷阱上,当触发陷阱功效后,对怪物连续使用2次捕获用麻醉玉即可完成对大型怪物的捕获。捕获的好处:提升获得素材的数量以及获得稀有素材的几率。38. 给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。( )A.正确B.错误参考答案:B39. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,

10、3,4,5;假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C40. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T41. 数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选。( )A.正确B.错误参考答案:A42. 数据存储要表现出静态数据的特征,反映的是系统中静止的数据。( )T.对F.错参考答案:T43. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性

11、上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC44. 具有偏差和至少( )个S型隐含层加上一个( )输出层的网络能够逼近任何有理数。A.1,线性B.2,线性C.1,非线性D.2,非线性参考答案:A45. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B46. 不满足给定评价度量的关联规则是无趣的。( )不满足给定评价度量的关联规则是无趣的。( )A.正确B.错误参考答案:B47. 两个对象越相似,他们的相异度就越高。( )A.正确B.错误参考答

12、案:B48. 通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。( )T.对F.错参考答案:T49. 一拍档能帮客户买通关单。( )一拍档能帮客户买通关单。( )参考答案:50. 关于网络推广与网络营销,以下表述错误的是( )A:在范围上,网络推广包括网络营销B:在投入上,网络关于网络推广与网络营销,以下表述错误的是( )A:在范围上,网络推广包括网络营销B:在投入上,网络推广投入比较少C:在执行上,网络推广的关键是执行力D:在目的上,网络推广重在“推广”答案:A51. 空间视图提供了交通堵塞的概览。( )T.对F.错参考答案:T52. 在一元线性回归中,通过最小二乘法求得的直线叫

13、做回归直线或( )。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线参考答案:A53. 特征的信息增益越大,则其越不重要。( )A.正确B.错误参考答案:B54. 任何程序中都必须要有分支结构或循环结构。( )A.正确B.错误参考答案:B55. 数据清洗(Data Cleaning)的方法有( )A.填充空缺值B.清除数据中的噪声C.识别或删除离群点并解决不一致性参考答案:ABC56. 上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引客户C.后期可能根据物流数据展示出此拍档的物流服务能力,以吸引客户D.没有作用参考答案:ABC57. k值增大意味着整体模型变得复杂。( )k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B58. 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号