南开大学21秋《数据科学导论》综合测试题库答案参考17

上传人:工**** 文档编号:457309379 上传时间:2022-11-07 格式:DOCX 页数:12 大小:14.66KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》综合测试题库答案参考17_第1页
第1页 / 共12页
南开大学21秋《数据科学导论》综合测试题库答案参考17_第2页
第2页 / 共12页
南开大学21秋《数据科学导论》综合测试题库答案参考17_第3页
第3页 / 共12页
南开大学21秋《数据科学导论》综合测试题库答案参考17_第4页
第4页 / 共12页
南开大学21秋《数据科学导论》综合测试题库答案参考17_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》综合测试题库答案参考17》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》综合测试题库答案参考17(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论综合测试题库答案参考1. 以下哪项不是数据可视化工具的特性( )A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可参考答案:D2. 如何测试自己家中的宽带速率?宽带速率如何快速检测?如何测试自己家中的宽带速率?宽带速率如何快速检测?答案:1.停止其它设备的上网行为,只留一台电脑通过网线与光纤猫或路由器连接;2.打开电脑的浏览器,输入“”,进入网站(pc端,手机版需要下载)3.等待网页加载完成后点击“begin”,开始测试。4.测试结果很会显示在网页的正中央,出用户的延迟,下载速率和上传速率都会详细显示。3. 数据采集,又称数据获取,是大数据生命周期的第

2、一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T4. Internet Explorer不能识别的格式是( )A.cssB.scriptingC.datD.htm参考答案:C5. 关联规则可以被广泛地应用于通信、金融、交通、健康医疗和Web用户行为分析等领域。( )A.正确B.错误参考答案:A6. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C7. 信息熵越小,样本结合的纯度

3、越低。( )A.正确B.错误参考答案:B8. 按照数据量的大小,可将数据分析分为( )A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析参考答案:ABC9. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B10. 数据科学运用科学方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。( )A.正确B.错误参考答案:A11. 多层感知机的学习过程包含( )。多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD12. 例如将工资收入

4、属性值映射到-1,1或者0,1内属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:B13. 常见的分类方法有( )A.决策树B.贝叶斯网络C.遗传算法D.FP算法参考答案:ABC14. 大话西游手游浣彩露有什么用?大话西游手游浣彩露有什么用?浣彩露是人物染色最主要的材料,仙人们浣形易色的必备品,据传为云霞仙子把流动的彩虹吸入琉璃瓶中而成的奇珍妙露。15. 分拆方法是自底向上的方法。( )A.正确B.错误参考答案:B16. 手游王者荣耀三行情书征集活动到本月几日结束?三行情书征集活动到本月几日结束?3月14日结束。活动时间:3月2日3月14日活动主题:王者

5、峡谷三行情书征集活动17. 地下城与勇士(DNF)公会技能可以清除后重新点不?地下城与勇士(DNF)公会技能可以清除后重新点不?当前版本中,公会的技能在学习后,无法进行清除和重新学习,还请了解,谢谢!18. 在一元线性回归模型中,残差项服从( )分布。A.泊松B.正态C.线性D.非线性参考答案:B19. 末日求生沙盒游戏H1Z1解锁国区IP了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。20. 医疗大数据的来源主要包括( )A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率

6、D.健康管理/社交网络参考答案:ABCD21. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC22. 数据可根据产生主体的不同分为两类少量企业应用产生的数据和量个人用户产生的数据。( )T.对F.错参考答案:F23. 在多分支结构中,Python是通过( )来判断语句是否属于一个分支结构中。A.花括号B.冒号C.括号D.缩进参考答案:D24. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )

7、T.对F.错参考答案:T25. 为了解决任何复杂的分类问题,使用的感知机结构应至少包含( )个隐含层。A.1B.2C.3D.4参考答案:B26. K-means聚类是发现给定数据集的K个簇的算法。( )A.正确B.错误参考答案:A27. 地下城与勇士(DNF)TS 警告码(x,1008, x)是什么意思?地下城与勇士(DNF)TS 警告码(x,1008, x)是什么意思?游戏驱动异常,您的机器存在游戏多开情况或已启动过不支持win8系统的游戏,请重启机器后再试。28. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A29. 地下城与勇士(DNF)宠物学习终结技能的等级

8、地下城与勇士(DNF)宠物学习终结技能的等级学习技能级别根据宠物种类不同而不同,一般在2025级即可自动学习终结技能。30. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC31. 距离度量中的距离可以是( )。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD32. 梦幻西游手游洞察好吗?梦幻西游手游洞察好吗?洞察加的伤害,和面板伤害是相当的。那面板伤害的提高,一些无法破中防单位的情况就会发生变化,就会发生破防,破防后的没点单位伤害提升,是效益最大的。其实,最简单的比

9、较,就是洞察,相当于35个高级强力兽决。33. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A34. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A35. continue语句只结束本次循环,而不终止整个循环;break语句结束整个循环过程。( )A.正确B.错误参考答案:A36. 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A37. 数据分析师的任务用模型来回答具体问题,了解数据,其来源和结构。( )A.正确B.错误参考答

10、案:B38. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A39. 梦幻西游手游出师奖励有哪些?梦幻西游手游出师奖励有哪些?徒弟获得经验奖励、师傅获得经验和良师值奖励特别说明:1、若徒弟等级69级,出师只有少量奖励2、师傅历史收徒数量(包括解除关系的)3时,只有教学成绩达到一定条件,才有奖励。40. 用于描述相等时间间隔下连续数据随时间变化趋势的是( )A.折线图B.散点图C.条形图D.饼图参考答案:A41. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答

11、案:B42. 利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )A.正确B.错误参考答案:A43. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D44. HDFS为海量的数据提供了存储。( )T.对F.错参考答案:T45. for循环和while循环中都存在一个else扩展用法,continue关键字对else没有影响。( )A.正确B.错误参考答案:A46. 广义的Spark是指Spark生态系统,采用了四层架构。( )T.对F.错参考答案:T47. 标准BP算法是在读取全部数

12、据集后,对参数进行统一更新的算法。( )标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )A.正确B.错误参考答案:B48. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B49. 开放云( )A.价值呈现:大数据应用价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈参考答案:ABCD50. 关联规则的评价度量主要有( )。A.支持度B.置信度C.准确率D.错误率参考答案:AB51.

13、逗号分隔数值的存储格式叫做csv格式,csv格式一般用来表示二维数据。( )A.正确B.错误参考答案:A52. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。53. 云存储中用户需要按需付费并使用存储服务。( )T.对F.错参考答案:T54. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )A.正确B.错误参考答案:B55. 最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的( )等。A.用户行为数据B.日志式的活动数据C.事件信息参考答案:ABC56. 交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。( )T.对F.错参考答案:T57. 以下哪些不是缺失值的影响?( )A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号