南开大学21春《数据科学导论》离线作业一辅导答案28

上传人:s9****2 文档编号:491029395 上传时间:2022-10-03 格式:DOCX 页数:11 大小:13.25KB
返回 下载 相关 举报
南开大学21春《数据科学导论》离线作业一辅导答案28_第1页
第1页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案28_第2页
第2页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案28_第3页
第3页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案28_第4页
第4页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案28_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》离线作业一辅导答案28》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》离线作业一辅导答案28(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论离线作业一辅导答案1. 下列不属于Google云计算平台技术架构的是( )A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2参考答案:D2. 函数用于从控制台输入数据,print函数用于将数据输出到控制台显示。( )A.正确B.错误参考答案:A3. IPsec处于OSI七层模型的哪一层( )A、物理层B、链路层C、网络层D、应用层参考答案:C4. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C5. k近邻法的基本要素包括( )。A.距离

2、度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD6. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C7. 数据科学运用科学方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。( )A.正确B.错误参考答案:A8. 关于RSS与EDM的说法,正确的是( )A:RSS、EDM的送达率几乎为100%B:RSS、EDM都可以完美呈现所有图片关于RSS与EDM的说法,正确的是( )A:RSS、EDM的送达率几乎为100%B:RSS、EDM都可以完美呈现所有

3、图片C:RSS的营销成本比EDM要低很多D:RSS相比EDM能更好的实现个性化营销答案:C9. 内存分析数据量比BI分析数据量大。( )T.对F.错参考答案:F10. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A11. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A12. 对于项集来说,置信度没有意义。( )A.正确B.错误参考答案:A13. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A14. 决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据

4、集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。( )A.正确B.错误参考答案:A15. 贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。( )贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。( )A.正确B.错误参考答案:A16. 整数和整数之间的运算结果一定的是整数。( )A.正确B.错误参考答案:B17. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD18. 在函数内部使用global关键字声明简单数据类型变量后,该变量作为全局变量使用。(

5、 )A.正确B.错误参考答案:A19. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD20. 分拆方法是自底向上的方法。( )A.正确B.错误参考答案:B21. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A22. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考答案:T23. 简述云计算的体系架构分层及每层的含义。参考答案:云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架

6、构可分为核心服务、服务管理、用户访问接口三层。1)核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。2)服务管理层为核心服务提供支持,进一步确保核心服务的可靠性、可用性与安全性。3)用户访问接口层实现端到云的访问。24. 地下城与勇士(DNF)使用加百利后,队长怎么无法进行再次挑战等操作?地下城与勇士(DNF)使用加百利后,队长怎么无法进行再次挑战等操作?1、组队后,如果有用户使用加百利秘密商店或者点击出现了加百利商店的交易界面,那么队长无法选择再次挑战、选择其他地下城、返回城镇等菜单;2、加百利只出现三分钟,三

7、分钟后秘密商店自动关闭,届时队长即可进行再次挑战、选择其他地下城及返回城镇等操作。25. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB26. 当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。( )A.正确B.错误参考答案:B27. 在list对象中添加元素可以使用add( )函数,将要添加的值加入列表尾部。( )A.正确B.错误参考答案:B28. 逗号分隔数值的存储格式叫做csv格式,csv格式一般用来表示二维数据。( )A.正确B.错误参考答案:A29. 美国自然(Nature)杂志专刊The next google

8、,第一次正式提出“大数据”概念。( )T.对F.错参考答案:T30. 2002年博客引进中国,建立的第一个博客网站是新浪博客。( )2002年博客引进中国,建立的第一个博客网站是新浪博客。( )答案:错误31. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A32. 数据存储要表现出静态数据的特征,反映的是系统中静止的数据。( )T.对F.错参考答案:T33. 一个HDFS集群由一个( )和( )构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据

9、节点D.若干个数据节点参考答案:AD34. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C35. 发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。( )T.对F.错参考答案:T36. 麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。( )T.对F.错参考答案:T37. 梦幻西游手游空间有什么用?梦幻西游手游空间有什么用?玩家可以在空间中上传照片、编辑个性签名,而且还可以放置礼物,让其他玩家来踩,有机会获得踩空间的奖励哦。38.

10、KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了( )、( )、( )、( )。A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD39. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B40. Python中,字典是一个键值对的集合,字典以键为索引,一个键只对应一个值。( )A.正确B.错误参考答案:A41. 以下不是数据仓库基本特征的是( )A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据

11、仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的参考答案:B42. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C43. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C44. 在数据预处理时,无论什么情况,都可以直接将异常值删除。( )A.正确B.错误参考答案:B45. for循环和while循环中都存在一个else扩展用法,continue关键字对else没有影响。( )A.正确B.错误参考答案:A46. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T47. k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B48. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A49. 任何元组都可以作为集合的元素也可以作为字典的键。( )A.正确B.错误参考答案:B50. 为了解决任何复杂的分类问题,使用的感知机结构应至少包含( )个隐含层。A.1B.2C.3D.4参考答案:B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号