南开大学21春《数据科学导论》离线作业2参考答案56

上传人:新** 文档编号:489165166 上传时间:2023-09-20 格式:DOCX 页数:11 大小:13.80KB
返回 下载 相关 举报
南开大学21春《数据科学导论》离线作业2参考答案56_第1页
第1页 / 共11页
南开大学21春《数据科学导论》离线作业2参考答案56_第2页
第2页 / 共11页
南开大学21春《数据科学导论》离线作业2参考答案56_第3页
第3页 / 共11页
南开大学21春《数据科学导论》离线作业2参考答案56_第4页
第4页 / 共11页
南开大学21春《数据科学导论》离线作业2参考答案56_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》离线作业2参考答案56》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》离线作业2参考答案56(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论离线作业2参考答案1. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T2. 函数的名称可以任意字符组合形成的。( )A.正确B.错误参考答案:B3. 如何理解计算机网络?如何理解计算机网络?参考答案:计算机网络就是将地理位置不同、具有独立功能的多个计算机系统,用通信线路和通信设备连接起来,在网络软件支持下,实现数据通信和资源共享的系统。4. 朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能。( )A.正确B.错误参考答案:A5. 大话西游手游好心值怎么获得?大

2、话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上限也为200,总共每日最多获得400好心值。6. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于( )。A.异常值B.缺失值C.不一致的值D.重复值参考答案:C7

3、. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A8. PaaS是( )的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务参考答案:B9. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A10. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC11. 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式。( )T.对F.错参考答案:T12.

4、实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B13. Intranet有哪些组成部分?Intranet有哪些组成部分?参考答案:主要由物理网、防火墙、服务器(如Web服务器、邮件服务器、数据库服务器等)、客户机等几个基本部分组成。14. 我们需要对已生成的树( )进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左参考答案:B15. 数据科学运用科学方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。( )A.正确B.错误参考答案:A16. 函数是一段具有特定功能的、可重用

5、的语句组,用函数名来表示并通过函数名进行功能调用。( )A.正确B.错误参考答案:A17. 地下城与勇士(DNF)TP提示码(3,172000xx,x)是什么意思?地下城与勇士(DNF)TP提示码(3,172000xx,x)是什么意思?请查杀病毒和木马,重启机器后再试。18. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC19. 广播变量在广播后可以修改。( )T.对F.错参考答案:F20. 一元回归参数估计的参数求解方法有( )。A.最大似然法B.距估计法C.

6、最小二乘法D.欧式距离法参考答案:ABC21. 概念描述(concept description)对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。( )T.对F.错参考答案:T22. 整数和浮点数混合运算,输出结果是浮点数。( )A.正确B.错误参考答案:A23. 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。( )A.正确B.错误参考答案:A24. 置信度(confidence)是衡量兴趣度度量( )的指标。A.简洁性B.确定性C.实用性D.新颖性参考答案:B25. 相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过

7、程。( )A.正确B.错误参考答案:B26. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B27. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D28. 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A29. 为了解决任何复杂的分类问题,使用的感知机结构应至少包含( )个隐含层。A.1B.2C.3D.4参考答案:B30. 借助于大数据提供的( )和( ),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造

8、成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果参考答案:AB31. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C32. k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B33. 简述云计算的体系架构分层及每层的含义。参考答案:云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架构可分为核心服务、服务管理、用户访问接口三层。1)核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、

9、可用性高、规模可伸缩等特点,满足多样化的应用需求。2)服务管理层为核心服务提供支持,进一步确保核心服务的可靠性、可用性与安全性。3)用户访问接口层实现端到云的访问。34. 关于函数,以下描述错误的是( )。A.函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D35. 以下哪些不是缺失值的影响?( )A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能

10、会使建模过程陷入混乱,导致异常的输出参考答案:C36. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A37. 开放云( )A.价值呈现:大数据应用价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈参考答案:ABCD38. 给定关联规则AB,意味着若A发生,B也会发生。( )A.正确B.错误参考答案:B39. 下列两个变量之间的关系中,哪个是函数关系?( )A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度参考答案

11、:C40. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。41. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD42. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B43. 多层感知机的学习过程包含( )。多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向

12、传播参考答案:AD44. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB45. 聚类是一种( )。A.有监督学习B.无监督学习C.强化学习D.半监督学习参考答案:B46. 以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感性D:购买频率更低答案:D47. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T48. 当训练集较大的时候,标准BP算法通常会更快的获得更好的解。( )A.正确B.错误参考答案:A49. 数据分析师的任务用模型来回答具体问题,了解数据,其来源和结构。( )A.正确B.错误参考答案:B50. 属性或维命名的不一致也可能导致结果数据集中的数据冗余。( )T.对F.错参考答案:T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号