南开大学21秋《数据科学导论》在线作业一答案参考60

上传人:pu****.1 文档编号:469339655 上传时间:2022-08-09 格式:DOCX 页数:13 大小:14.47KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》在线作业一答案参考60_第1页
第1页 / 共13页
南开大学21秋《数据科学导论》在线作业一答案参考60_第2页
第2页 / 共13页
南开大学21秋《数据科学导论》在线作业一答案参考60_第3页
第3页 / 共13页
南开大学21秋《数据科学导论》在线作业一答案参考60_第4页
第4页 / 共13页
南开大学21秋《数据科学导论》在线作业一答案参考60_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》在线作业一答案参考60》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》在线作业一答案参考60(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论在线作业一答案参考1. 对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。( )A.正确B.错误参考答案:A2. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C3. 简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放。( )A.正确B.错误参考答案:A4. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C5. 组合数据类型中的序列类型元素之间存在先后关系,可以通过序号访问。( )A.正确B.错误参考答

2、案:A6. 以下哪一项不是特征工程的子问题?( )A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D7. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A8. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A9. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B10. 编写HTML文件不能在哪个软件中编写?( )A.EditB.WordC.WPSD.Windows的画笔参考答案:D11. 实体识别的常见形式:( )A.同名异义B.异名同义

3、C.单位不统一D.属性不同参考答案:D12. 一个HDFS集群由一个( )和( )构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点参考答案:AD13. 相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。( )A.正确B.错误参考答案:B14. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC15. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A16. 商业智能(BI)可以被描述为“一组用于获取

4、原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具”。( )T.对F.错参考答案:T17. 函数可以看作是一段具有名字的子程序,在需要的地方调用执行,不需要在每个执行地方重复编写这些语句。( )A.正确B.错误参考答案:A18. 大话西游手游水陆大会怎么进场?大话西游手游水陆大会怎么进场?到皇宫找魏征19. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A20. 距离度量中的距离可以是( )。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD21. 网络营销规划的步骤依次是( )A:制定网络营销目标、

5、评估企业外部环境、定位网络营销形象、安排预网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预算和组织资源B:定位网络营销形象、制定网络营销目标、评估企业外部环境、安排预算和组织资源C:评估企业外部环境、制定网络营销目标、定位网络营销形象、安排预算和组织资源D:安排预算和组织资源、制定网络营销目标、评估企业外部环境、定位网络营销形象答案:C22. 怪物猎人OL我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?怪物猎人OL我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?这是怪物猎人OL的任务指示器,箭头所指示的方向为你所

6、接取的任务的完成地点,如果你同时接取了多个任务,那么会有多个箭头指向不同的区域,所以新手猎人跟着指示器走即可到达目标区域。23. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD24. Python中的注释是为了让计算机更能理解程序表达的意思。( )A.正确B.错误参考答案:B25. 基于大数据的临床决策支持系统的架构包括( )A.支撑层B.大数据分析层C.网络层D.应用层参考答案:ABD26. 每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。( )A.正确B.错误参考答案:A27. 开放云( )A.价值呈现:大数据应用

7、价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈参考答案:ABCD28. 数据变换的常用方法有( ),( ),( ),( )A.中心化变换B.极差规格化变换C.标准化变换D.对数变换参考答案:ABCD29. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T30. 整数和浮点数混合运算,输出结果是浮点数。( )A.正确B.错误参考答案:A31. QQ炫舞连接下载服务器.QQ炫舞连接下载服务器.版本或者网络差异导致更新缓慢,或者优化个人网络。

8、32. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC33. Apriori算法的加速过程依赖于以下哪个策略?( )A.抽样B.剪枝C.缓冲D.并行参考答案:B34. 梦幻西游手游空间有什么用?梦幻西游手游空间有什么用?玩家可以在空间中上传照片、编辑个性签名,而且还可以放置礼物,让其他玩家来踩,有机会获得踩空间的奖励哦。35. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A36. 朴素贝叶斯分类器有简

9、单、高效、健壮的特点,但某些属性可能会降低分类器的性能。( )A.正确B.错误参考答案:A37. 事件是Flume的基本数据单位。( )T.对F.错参考答案:T38. BFR聚类是用于处理数据集( )的k-means变体。BFR聚类是用于处理数据集( )的k-means变体。A.大B.中C.小D.所有参考答案:A39. 以下程序语句中,哪个是正确利用切片语句取出字符串s=“pi=3.1415926”中的所有数字部分?( )A.s3-1B.s311C.s4-1D.s312参考答案:D40. 内存分析数据量比BI分析数据量大。( )T.对F.错参考答案:F41. 函数体现的是代码复用和模块化设计思

10、想。( )A.正确B.错误参考答案:A42. 对于多层感知机,( )层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC43. 云存储(名词解释)参考答案:云存储是在云计算(cloud rncomputing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术。它是云计算的重要组成部分,也是云计算的重要应用之一。云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。44. 关于函数,以下描述错误的是( )。A.函数能完成特定的功能,对函数的使用不需要了解

11、函数内部实现原理,只要了解函数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D45. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C46. 以下哪些不是缺失值的影响?( )A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参考答案:C47. 多

12、层感知机的学习过程包含( )。多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD48. 以下哪个不是处理缺失值的方法?( )A.删除记录B.按照一定原则补充C.不处理D.随意填写参考答案:D49. 多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD50. 层次聚类适合规模较( )的数据集。A.大B.中C.小D.所有参考答案:C51. 广义的Spark是指Spark生态系统,采用了四层架构。( )T.对F.错参考答案:T52. 末日求生沙盒游戏H1Z1解锁国区I

13、P了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。53. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析参考答案:ABC54. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B55. 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。( )T.对F.错参考答案:T56. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C57. 大数据的技术支撑有( )A.计算速度加快B.存储成本下降C.机器智能化D.数据量增加参考答案:ABC

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号