南开大学21秋《数据科学导论》在线作业二答案参考71

上传人:工**** 文档编号:470302767 上传时间:2023-01-18 格式:DOCX 页数:13 大小:14.88KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》在线作业二答案参考71_第1页
第1页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考71_第2页
第2页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考71_第3页
第3页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考71_第4页
第4页 / 共13页
南开大学21秋《数据科学导论》在线作业二答案参考71_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》在线作业二答案参考71》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》在线作业二答案参考71(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论在线作业二答案参考1. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B2. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A3. 大数据的技术支撑有( )A.计算速度加快B.存储成本下降C.机器智能化D.数据量增加参考答案:ABC4. 商业智能(BI)可以被描述为“一组用于获取原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具”。( )T.对F.错参考答案:T5. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效

2、率参考答案:ABC6. 第一个提出大数据概念的公司是( )。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司参考答案:A7. 以下选项对Python文件操作描述错误的是( )。A.当文件以文本方式打开时,读写会按照字节流方式进行B.Python能以文本和二进制两种方式处理文件C.文件使用结束后要用close方法关闭,释放文件的使用授权D.Python能通过内置的open函数打开一个文件进行操作参考答案:A8. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T9. 局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用时可以继续使用。( )

3、A.正确B.错误参考答案:B10. 使用SVD方法进行图像压缩不可以保留图像的重要特征。( )A.正确B.错误参考答案:B11. 简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放。( )A.正确B.错误参考答案:A12. 如何测试自己家中的宽带速率?宽带速率如何快速检测?如何测试自己家中的宽带速率?宽带速率如何快速检测?答案:1.停止其它设备的上网行为,只留一台电脑通过网线与光纤猫或路由器连接;2.打开电脑的浏览器,输入“”,进入网站(pc端,手机版需要下载)3.等待网页加载完成后点击“begin”,开始测试。4.测试结果很会显示在网页的正中央,出用户的延迟

4、,下载速率和上传速率都会详细显示。13. 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。( )A.正确B.错误参考答案:A14. 以下不是数据仓库基本特征的是( )A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的参考答案:B15. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B16. 下列不是Python对文件进行读操作的方法是( )。A.readtextB.readlinesC.readD.readline参考答案:A17. 2002年博客引进中国,建立的第一个博客网站是新浪博客。

5、( )2002年博客引进中国,建立的第一个博客网站是新浪博客。( )答案:错误18. 结构化数据是用excel结构表现的数据。( )T.对F.错参考答案:F19. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A20. 内存分析数据量比BI分析数据量大。( )T.对F.错参考答案:F21. 云存储中用户需要按需付费并使用存储服务。( )T.对F.错参考答案:T22. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A23. 在回归分析中,自变量

6、为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量参考答案:D24. 我们需要对已生成的树( )进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左参考答案:B25. 数据隐私和安全是大数据发展面临的挑战。( )T.对F.错参考答案:T26. K-means聚类是发现给定数据集的K个簇的算法。( )A.正确B.错误参考答案:A27. 空间视图提供了交通堵塞的概览。( )T.对F.错参考答案:T28. 下列哪个R语言扩展包可以创建带有点和边的网络图( )A.ggplot

7、2B.networkC.ggmapsD.animation参考答案:B29. 美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。( )T.对F.错参考答案:T30. 以下哪项不是数据可视化工具的特性( )A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可参考答案:D31. 下列选项不属于函数的作用的是( )。A.复用代码B.降低编程复杂度C.提高代码的执行速度D.增强代码的可读性参考答案:C32. 大话西游手游浣彩露有什么用?大话西游手游浣彩露有什么用?浣彩露是人物染色最主要的材料,仙人们浣形易色的必备品,据传为云霞仙子把流动的彩虹吸

8、入琉璃瓶中而成的奇珍妙露。33. python中内置了round函数来进行小数的四舍五入操作,请选择round(3.1415923, 4)对应的结果( )。A.3.142B.3.14C.3.1416D.3.0参考答案:C34. 数据规约是在尽可能保持数据原貌的前提下,最大限度地精简数据量。( )T.对F.错参考答案:T35. 以下关于Python组合数据类型描述错误的是( )。A.序列类型可以通过序号访问元素,元素之间不存在先后关系B.组合数据类型可以分为3类序列类型、集合类型和映射类型C.Python组合数据类型能够将多个同类型或者不同类型的数据组织起来,通过单一的表示使数据操作更有序、更容

9、易D.Python中字符串、元组和列表都是序列类型参考答案:A36. 大数据在电信中的应用有( )A.基于用户、业务及流量分级的多维管控机制B.精准的客户分析及营销C.利用位置和轨迹信息服务社会参考答案:ABC37. 在list对象中添加元素可以使用add( )函数,将要添加的值加入列表尾部。( )A.正确B.错误参考答案:B38. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A39. 下面标识符中不是Python语言的关键字的是( )。A.floatB.exceptC.continueD.global参考答案:A40. 数据

10、采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T41. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。42. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考答案:T43. QQ炫舞连接下载服务器.QQ炫舞连接下载服务器.版本或者网络差异导致更新缓慢,或者优

11、化个人网络。44. 天涯明月刀是否能充值?天涯明月刀是否能充值?能充值,比例为1QB:100点券。45. 在一元线性回归模型中,残差项服从( )分布。A.泊松B.正态C.线性D.非线性参考答案:B46. 随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。( )A.正确B.错误参考答案:A47. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )A.正确B.错误参考答案:B48. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD49. 按照程序

12、设计语言的发展历程进行分类,Python可以归类为( )。A.高级语言B.自然语言C.汇编语言D.机器语言参考答案:A50. 末日求生沙盒游戏H1Z1解锁国区IP了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。51. Jaccard系数只关心个体间共同具有的特征是否一致这个问题。( )A.正确B.错误参考答案:A52. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A53. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错

13、误参考答案:B54. 数据可根据产生主体的不同分为两类少量企业应用产生的数据和量个人用户产生的数据。( )T.对F.错参考答案:F55. 对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。( )A.正确B.错误参考答案:A56. 距离度量中的距离可以是( )。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD57. ECR系统由哪些部分组成的?ECR系统由哪些部分组成的?参考答案:ECR系统的基本结构包括两个部分,即基础设施和管理系统,其中,基础设施包括信息系统和物流系统,管理系统包括营销管理和组织革新。58. Python中,字典是一个键值对的集合,字典以键为索引,一个键只对应一个值。( )A.正确B.错误参考答案:A59. 遍历循环for语句中,不可以遍历的结构是( )。A.字符串B.元组C.数字类型D.字典参考答案:C60. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号