南开大学21春《数据科学导论》在线作业二满分答案_71

上传人:新** 文档编号:466005802 上传时间:2022-12-25 格式:DOCX 页数:13 大小:15.15KB
返回 下载 相关 举报
南开大学21春《数据科学导论》在线作业二满分答案_71_第1页
第1页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_71_第2页
第2页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_71_第3页
第3页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_71_第4页
第4页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_71_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》在线作业二满分答案_71》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》在线作业二满分答案_71(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论在线作业二满分答案1. 上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引客户C.后期可能根据物流数据展示出此拍档的物流服务能力,以吸引客户D.没有作用参考答案:ABC2. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T3. 以下选项中,不是Python对文件的打开模式的是(

2、 )。A.cB.r+C.wD.r参考答案:A4. 拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )参考答案:5. 下面Python关键字中,不用于表示分支结构的是( )。A.elseB.ifC.elseifD.elif参考答案:C6. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。7. 网络营销环境及企业的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销网络营销环境及企业的经营环境都在不断的发展演变中,因

3、此也没有一成不变、永远有效的互联网营销方法,这说明了网络营销发展趋势中的( )A:网络营销将从封闭式向开放式转变B:从企业自有网站为核心到多平台的综合利用C:行业内企业网络营销竞争加剧D:网络营销方法不断调整适应互联网环境发展答案:D8. 聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC9. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A10. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了( )、( )、( )、(

4、)。A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD11. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B12. 下面变量名称命名合法的是( )。A._tempStrB.isC.2018pythonD.123Python参考答案:A13. 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A14.

5、最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的( )等。A.用户行为数据B.日志式的活动数据C.事件信息参考答案:ABC15. 在k近邻法中,选择较小的k值时,学习的“近似误差”会( ),“估计误差”会( )。A.减小,减小B.减小,增大C.增大,减小D.增大,增大参考答案:B16. Apriori算法的加速过程依赖于以下哪个策略?( )A.抽样B.剪枝C.缓冲D.并行参考答案:B17. 对于项集来说,置信度没有意义。( )A.正确B.错误参考答案:A18. 决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得

6、各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。( )A.正确B.错误参考答案:A19. 以下哪一项不是特征工程的子问题?( )A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D20. 当训练集较大的时候,标准BP算法通常会更快的获得更好的解。( )A.正确B.错误参考答案:A21. 大数据在电信中的应用有( )A.基于用户、业务及流量分级的多维管控机制B.精准的客户分析及营销C.利用位置和轨迹信息服务社会参考答案:ABC22. random库采用梅森旋转算法生成伪随机序列。( )A.正确B.错误参考答案:A23. 关于R语言扩展包下列正确的是

7、( )A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具参考答案:AB24. 末日求生沙盒游戏H1Z1解锁国区IP了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。25. 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。( )T.对F.错参考答案:T26. 用一个函数拟合数据来

8、光滑数据称为回归。( )T.对F.错参考答案:T27. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A28. 剪枝是决策树学习算法对付“过拟合”的主要手段。( )A.正确B.错误参考答案:A29. 21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。( )T.对F.错参考答案:T30. 地下城与勇士(DNF)公会技能可以清除后重新点不?地下城与勇士(DNF)公会技能可以清除后重新点不?当前版本中,公会的技能在学习后,无法进行清除和重新学习,还请了解,谢谢!31. 根据映射关系的不同可以分为线性回归和( )

9、。A.对数回归B.非线性回归C.逻辑回归D.多元回归参考答案:B32. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析参考答案:ABC33. 定义和使用函数的主要原因是函数执行速度更快。( )A.正确B.错误参考答案:B34. 下列标识符中哪个是不合法的?( )A.40tempB.tempStrC.listD._124参考答案:A35. 数据变换(Data Transformation)的方法有( )A.光滑B.聚集C.数据泛化D.规范化参考答案:ABCD36. 统计图表的可视化方法主要包括( )A.散点图B.折线图C.条形图D

10、.饼图参考答案:ABCD37. 医疗大数据特点:除了包含了大数据4个“V”的特点之外还有( )A.多态性B.时效性C.不完整性D.冗余性参考答案:ABCD38. 时空数据是指带有地理位置与时间标签的数据。( )T.对F.错参考答案:T39. 下面标识符中不是Python语言的关键字的是( )。A.floatB.exceptC.continueD.global参考答案:A40. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B41. 数据变换的常用方法有( ),( ),( ),( )A.中心化变换B.极差规格化变换C.标准化变换D.对数变换

11、参考答案:ABCD42. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C43. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B44. 程序设计语言中保留字也称为关键字,指被语言内部定义并保留使用的标识符。( )A.正确B.错误参考答案:A45. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获

12、取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也

13、可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。46. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A47. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC48. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B49. 以下哪些不是缺失值的影响?( )A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参考答案:C50. 逗号分隔数值的存储格式叫做csv格式,csv格式一般用来表示二维数据。( )A.正确B.错误参考答案:A51. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B52. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号