南开大学21春《数据科学导论》在线作业二满分答案80

上传人:公**** 文档编号:498913341 上传时间:2022-12-05 格式:DOCX 页数:13 大小:15.24KB
返回 下载 相关 举报
南开大学21春《数据科学导论》在线作业二满分答案80_第1页
第1页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案80_第2页
第2页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案80_第3页
第3页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案80_第4页
第4页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案80_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》在线作业二满分答案80》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》在线作业二满分答案80(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论在线作业二满分答案1. 数据清洗(Data Cleaning)的方法有( )A.填充空缺值B.清除数据中的噪声C.识别或删除离群点并解决不一致性参考答案:ABC2. 以下不是数据仓库基本特征的是( )A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的参考答案:B3. continue语句只结束本次循环,而不终止整个循环;break语句结束整个循环过程。( )A.正确B.错误参考答案:A4. 对于多层感知机,( )层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC5. 以下程序语句中,哪

2、个是正确利用切片语句取出字符串s=“pi=3.1415926”中的所有数字部分?( )A.s3-1B.s311C.s4-1D.s312参考答案:D6. 多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面。( )T.对F.错参考答案:T7. 实体识别的常见形式:( )A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D8. 按照程序设计语言的发展历程进行分类,Python可以归类为( )。A.高级语言B.自然语言C.汇编语言D.机器语言参考答案:A9. R语言是S语言的实现,是一种B编译语言。( )T.对F.错参考答案:F10. 聚类的最简单最基本方法是(

3、 )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A11. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC12. 怪物猎人OL我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?怪物猎人OL我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?这是怪物猎人OL的任务指示器,箭头所指示的方向为你所接取的任务的完成地点,如果你同时接取了多个任务,那么会有多个箭头指向不同的区域,所以新手猎人跟着指示器走即可到达目标区域。13. 下列选项不属于函数的作用的是( )。A

4、.复用代码B.降低编程复杂度C.提高代码的执行速度D.增强代码的可读性参考答案:C14. 大话西游手游好心值怎么获得?大话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上限也为200,总共每日最多获得400好心值。15. 用于描述相等时间间隔下连续数据随时间变化趋势的是( )A.折线图B.散点图C.条

5、形图D.饼图参考答案:A16. Internet上的电子邮件扩充协议是( )A.FTPB.MIMEC.TCP/IPD.SMTP参考答案:B17. 属性或维命名的不一致也可能导致结果数据集中的数据冗余。( )T.对F.错参考答案:T18. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A19. 大话西游手游水陆大会怎么进场?大话西游手游水陆大会怎么进场?到皇宫找魏征20. 某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。参考答案:数据集市21. 天涯明月刀是否能充值?天涯明月刀是否能充值?能充

6、值,比例为1QB:100点券。22. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C23. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A24. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )T.对F.错参考答案:T25. 层次方法可以分为( )A.K均值算法B.K中心点算法C.凝聚法D.分裂法参考答案:CD26. 在回归分析中,自变量为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量

7、D.连续型变量,连续型变量参考答案:D27. 通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。( )T.对F.错参考答案:T28. 梦幻西游手游空间有什么用?梦幻西游手游空间有什么用?玩家可以在空间中上传照片、编辑个性签名,而且还可以放置礼物,让其他玩家来踩,有机会获得踩空间的奖励哦。29. 给定关联规则AB,意味着:若A发生,B也会发生。( )A.正确B.错误参考答案:B30. 开放云( )A.价值呈现:大数据应用价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈参考答

8、案:ABCD31. 数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选。( )A.正确B.错误参考答案:A32. Jaccard系数只关心个体间共同具有的特征是否一致这个问题。( )A.正确B.错误参考答案:A33. 地下城与勇士(DNF)公会技能可以清除后重新点不?地下城与勇士(DNF)公会技能可以清除后重新点不?当前版本中,公会的技能在学习后,无法进行清除和重新学习,还请了解,谢谢!34. 大数据在电信中的应用有( )A.基于用户、业务及流量分级的多维管控机制B.精准的客户分析及营销C.利用位置和轨迹信息服务社会参考答案:ABC35. 设X=1,2,3是频繁项集,则可由X产

9、生( )个关联规则。A.4B.5C.6D.7参考答案:C36. BFR聚类是用于处理数据集( )的k-means变体。BFR聚类是用于处理数据集( )的k-means变体。A.大B.中C.小D.所有参考答案:A37. 如何测试自己家中的宽带速率?宽带速率如何快速检测?如何测试自己家中的宽带速率?宽带速率如何快速检测?答案:1.停止其它设备的上网行为,只留一台电脑通过网线与光纤猫或路由器连接;2.打开电脑的浏览器,输入“”,进入网站(pc端,手机版需要下载)3.等待网页加载完成后点击“begin”,开始测试。4.测试结果很会显示在网页的正中央,出用户的延迟,下载速率和上传速率都会详细显示。38.

10、 QQ炫舞连接下载服务器.QQ炫舞连接下载服务器.版本或者网络差异导致更新缓慢,或者优化个人网络。39. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B40. 美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。( )T.对F.错参考答案:T41. 我们需要对已生成的树( )进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左参考答案:B42. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D43. 给定一个数据集,如果存在某个超平面

11、S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B44. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T45. 数据存储要表现出静态数据的特征,反映的是系统中静止的数据。( )T.对F.错参考答案:T46. 以下哪个不是处理缺失值的方法?( )A.删除记录B.按照一定原则补充C.不处理D.随意填写参考答案:D47. 交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。( )T.对F.错参考答案:T48. 21世纪时数据信

12、息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。( )T.对F.错参考答案:T49. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B50. 简述云计算的体系架构分层及每层的含义。参考答案:云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架构可分为核心服务、服务管理、用户访问接口三层。1)核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。2)服务管理层为核心服务提供支

13、持,进一步确保核心服务的可靠性、可用性与安全性。3)用户访问接口层实现端到云的访问。51. 对于k近邻法,下列说法错误的是( )。对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C52. 麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。( )T.对F.错参考答案:T53. 下列正确的是( )A.D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用B.D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行C.D3采用的是Selectors API的第一级标准D.基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能参考答案:ABCD54. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD55. 怪物猎人OL如

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号