南开大学21春《数据科学导论》在线作业三满分答案35

上传人:公**** 文档编号:507809242 上传时间:2023-04-19 格式:DOCX 页数:13 大小:15.27KB
返回 下载 相关 举报
南开大学21春《数据科学导论》在线作业三满分答案35_第1页
第1页 / 共13页
南开大学21春《数据科学导论》在线作业三满分答案35_第2页
第2页 / 共13页
南开大学21春《数据科学导论》在线作业三满分答案35_第3页
第3页 / 共13页
南开大学21春《数据科学导论》在线作业三满分答案35_第4页
第4页 / 共13页
南开大学21春《数据科学导论》在线作业三满分答案35_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》在线作业三满分答案35》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》在线作业三满分答案35(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论在线作业三满分答案1. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB2. 下面哪一项不是中国发展大数据产业的基础( )。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱参考答案:D3. Python程序可以在任何安装了Python解释器的操作系统环境中执行。( )A.正确B.错误参考答案:A4. 任何程序中都必须要有分支结构或循环结构。( )A.正确B.错误参考答案:B5. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连

2、续属性离散化参考答案:C6. 规划一个C类网,需要将网络分为20个子网,每个子网最多5台主机,下列哪个是合适的子网掩码( )A、255. 255. 255.0。B、 255. 255. 255.224。C、 255. 255. 255.240。D、 255. 255. 255.248参考答案:D7. 当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。( )A.正确B.错误参考答案:B8. 层次方法可以分为( )A.K均值算法B.K中心点算法C.凝聚法D.分裂法参考答案:CD9. 具有双隐层的感知机足以用于解决任何复杂的分类问题。( )具有双隐层的感知机足以用于解决任何复杂的分类问

3、题。( )A.正确B.错误参考答案:A10. 置信度(confidence)是衡量兴趣度度量( )的指标。A.简洁性B.确定性C.实用性D.新颖性参考答案:B11. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC12. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A13. 阶跃函数具有不光滑、不连续的特点。( )A.正确B.错误参考答案:A14. 以下关于Python组合数据类型描述错误的是( )。A.序列类型可以通过序号访问元素,

4、元素之间不存在先后关系B.组合数据类型可以分为3类序列类型、集合类型和映射类型C.Python组合数据类型能够将多个同类型或者不同类型的数据组织起来,通过单一的表示使数据操作更有序、更容易D.Python中字符串、元组和列表都是序列类型参考答案:A15. 下列不属于商业大数据类型的是( )A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据参考答案:B16. 主流分布式计算平台有( )A.googleB.IBMC.baiduD.Amazon参考答案:ABD17. 云存储中用户需要按需付费并使用存储服务。( )T.对F.错参考答案:T18. 弹性是指有容错的机制,若一个RDD分片去失

5、,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T19. 基于大数据的临床决策支持系统的架构包括( )A.支撑层B.大数据分析层C.网络层D.应用层参考答案:ABD20. 地下城与勇士(DNF)已满18岁,填写资料后为什么没生效?地下城与勇士(DNF)已满18岁,填写资料后为什么没生效?1、身份信息的添加将在一个小时后生效,请尝试退出后重新登录。2、如果您填写信息正确并已通过验证,1小时后登录游戏仍然受到限制,请您到我们的客服中心 填单反馈。21. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换

6、中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C22. R语言是S语言的实现,是一种B编译语言。( )T.对F.错参考答案:F23. 聚合方法是自底向上的方法。( )A.正确B.错误参考答案:A24. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC25. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C26. 某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。某个主题而在逻辑上或物理上划分出来的数据仓

7、库中的数据子集称为( )。参考答案:数据集市27. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A28. 梦幻西游手游帮派技能上限是多少?梦幻西游手游帮派技能上限是多少?1、帮派技能上限为100级,角色最高学习到自身等级+102、帮派技能20级只需消耗银币学习,20级以上需额外消耗帮贡29. 以下程序语句中,哪个是正确利用切片语句取出字符串s=“pi=3.1415926”中的所有数字部分?( )A.s3-1B.s311C.s4-1D.s312参考答案:D30. 关于函数,以下描述错误的是( )。A.函数能完成特定的功能,对函数的使用不需要了解函数

8、内部实现原理,只要了解函数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D31. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处

9、理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。32. Python文件的后缀名是( )。A.pyB.pdfC.pngD.pyl

10、参考答案:A33. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T34. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B35. 一元回归参数估计的参数求解方法有( )。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法参考答案:ABC36. 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或( )。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线参考答案:A37. SAN是

11、一种( )A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBA参考答案:B38. 不满足给定评价度量的关联规则是无趣的。( )A.正确B.错误参考答案:B39. 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。( )T.对F.错参考答案:T40. 在数据预处理时,无论什么情况,都可以直接将异常值删除。( )A.正确B.错误参考答案:B41. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C42. 多层感知机是由( )层神经元组成。A.二B.三C.大于等于二层D.大于等于三层参考答案:D43. 决策树内部结

12、点表示一个类,叶结点表示一个特征或属性。( )A.正确B.错误参考答案:B44. 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。( )T.对F.错参考答案:T45. 数据隐私和安全是大数据发展面临的挑战。( )T.对F.错参考答案:T46. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:

13、D47. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B48. 下面Python关键字中,不用于表示分支结构的是( )。A.elseB.ifC.elseifD.elif参考答案:C49. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C50. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5;假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含( )。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C51. 列表是一个灵活的数据结构,数字、字符串、列表、字典都可以作为其中的元素。( )A.正确B.错误参考答案:A52. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D53.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号