南开大学21春《数据科学导论》离线作业一辅导答案37

上传人:s9****2 文档编号:476183736 上传时间:2023-06-12 格式:DOCX 页数:11 大小:13.24KB
返回 下载 相关 举报
南开大学21春《数据科学导论》离线作业一辅导答案37_第1页
第1页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案37_第2页
第2页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案37_第3页
第3页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案37_第4页
第4页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案37_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》离线作业一辅导答案37》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》离线作业一辅导答案37(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论离线作业一辅导答案1. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD2. IPsec处于OSI七层模型的哪一层( )A、物理层B、链路层C、网络层D、应用层参考答案:C3. 上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引客户C.后期可能根据物流数据展示出此拍档的物流服务能力,以吸引客户D.没有作用参考答案:ABC4. PaaS是( )的简称A.软件即服务B.平台即

2、服务C.基础设施即服务D.硬件即服务参考答案:B5. 在k近邻法中,选择较小的k值时,学习的“近似误差”会( ),“估计误差”会( )。A.减小,减小B.减小,增大C.增大,减小D.增大,增大参考答案:B6. Netware采用的通信协议是( )A.NETBEUIB.NETXC.IPX/SPXD.TCP/IP参考答案:C7. 数据变换(Data Transformation)的方法有( )A.光滑B.聚集C.数据泛化D.规范化参考答案:ABCD8. 美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。( )T.对F.错参考答案:T9. 数据科学运用科学

3、方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。( )A.正确B.错误参考答案:A10. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。11. K均值(K-Means)算法是密度聚类。( )A.正确B.错误参考答案:B12. 数据规约是在尽可能保持数据原貌的前提下,最大限度地精简数据量。( )T.对F.错参考答案:T13. sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。( )A.正确B.错误参考答案:B14. continue结束整个循环过

4、程,不再判断循环的执行条件。( )A.正确B.错误参考答案:B15. 利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )A.正确B.错误参考答案:A16. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A17. 我们需要对已生成的树( )进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左参考答案:B18. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是

5、( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC19. K均值(K-Means)算法是密度聚类。( )A.正确B.错误参考答案:B20. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A21. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC22. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了( )、( )、( )、( )。A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD23. 在有统计学意义的前提下

6、,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B24. 在回归分析中,自变量为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量参考答案:D25. 下列哪个R语言扩展包可以创建带有点和边的网络图( )A.ggplot2B.networkC.ggmapsD.animation参考答案:B26. 子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。( )A.正确B.错误参考答案:A27. 对于多层感知机,( )层拥有激活

7、函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC28. 朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能。( )A.正确B.错误参考答案:A29. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD30. 单层感知机模型属于( )模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型参考答案:A31. 聚类的主要方法有( )。聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC32. 网民在搜索引擎输入关键词

8、后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的信息B:付费的推广信息C:开放平台信息D:网盟推广信息答案:ABC33. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC34. 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。( )T.对F.错参考答案:T35. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A36. 医疗健康数据的基本情况不包括以下哪项?( )A.

9、诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C37. 一拍档能帮客户买通关单。( )一拍档能帮客户买通关单。( )参考答案:38. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C39. 多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面。( )T.对F.错参考答案:T40. 对于项集来说,置信度没有意义。( )A.正确B.错误参考答案:A41. 梦幻西游手游情缘使者在哪?梦幻西游手游情缘使者在哪?点击活动因缘际会,这样就可以自动寻路

10、找到情缘使者了。42. 任何元组都可以作为集合的元素也可以作为字典的键。( )A.正确B.错误参考答案:B43. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考答案:T44. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A45. 简述云计算的体系架构分层及每层的含义。参考答案:云计算可以按需提供弹性资源,它的表现形式是一系列服务的集合。结合当前云计算的应用与研究,其体系架构可分为核心服务、服务管理、用户

11、访问接口三层。1)核心服务层将硬件基础设施、软件运行环境、应用程序抽象成服务,这些服务具有可靠性强、可用性高、规模可伸缩等特点,满足多样化的应用需求。2)服务管理层为核心服务提供支持,进一步确保核心服务的可靠性、可用性与安全性。3)用户访问接口层实现端到云的访问。46. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB47. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C48. 下列选项不属于函数的作用的是( )。A.复用代码B.降低编程复杂度C.提高代码的执行速度D.增强代码的可读性参考答案:C49. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B50. 广播变量在广播后可以修改。( )T.对F.错参考答案:F

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号