南开大学21春《数据科学导论》离线作业一辅导答案26

上传人:人*** 文档编号:477602463 上传时间:2023-03-09 格式:DOCX 页数:11 大小:13.83KB
返回 下载 相关 举报
南开大学21春《数据科学导论》离线作业一辅导答案26_第1页
第1页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案26_第2页
第2页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案26_第3页
第3页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案26_第4页
第4页 / 共11页
南开大学21春《数据科学导论》离线作业一辅导答案26_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》离线作业一辅导答案26》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》离线作业一辅导答案26(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论离线作业一辅导答案1. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考答案:T2. random库采用梅森旋转算法生成伪随机序列。( )A.正确B.错误参考答案:A3. 概念描述(concept description)对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。( )T.对F.错参考答案:T4. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C5. 一般而言,信息增益越大,则意味

2、着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A6. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B7. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D8. 下列不属于Google云计算平台技术架构的是( )A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2参考答案:D9. 探索性数据分析的

3、特点是研究从原始数据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A10. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B11. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B12. 对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。( )A.正确B.错误参考答案:A13. K-means聚类是发现给定数据集的K个簇的算法。( )A.正确B.错误参考答案:A14. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包

4、括了( )、( )、( )、( )。A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD15. 发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。( )T.对F.错参考答案:T16. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T17. 整数和整数之间的运算结果一定的是整数。( )A.正确B.错误参考答案:B18. 如何理解移动商务?如何理解移动商务?参考答案:移动商务是利用手机、PDA等无线终端设备并与互联网有机结合进行的电子商务活动。互联网技术、移动通信技术、短距离技术及其它技术的完善组合创造了移动商务。19. 梦幻西游

5、手游出师奖励有哪些?梦幻西游手游出师奖励有哪些?徒弟获得经验奖励、师傅获得经验和良师值奖励特别说明:1、若徒弟等级69级,出师只有少量奖励2、师傅历史收徒数量(包括解除关系的)3时,只有教学成绩达到一定条件,才有奖励。20. 信息熵越小,样本结合的纯度越低。( )A.正确B.错误参考答案:B21. 在Python3.5中,集合类型的各个元素之间存在先后顺序。( )A.正确B.错误参考答案:B22. SAN是一种( )A.存储设备B.专为数据存储而设计构建的网络C.光纤交换机D.HBA参考答案:B23. 给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。( )A.正确B.

6、错误参考答案:B24. 关于Python语言的注释,以下描述错误的是( )。A.Python语言的多行注释以(三个单引号)开头和结尾B.Python语言的单行注释以#开头C.Python语言有两种注释方式:单行注释和多行注释D.Python语言的单行注释以单引号开头参考答案:D25. 两个对象越相似,他们的相异度就越高。( )A.正确B.错误参考答案:B26. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A27. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD28. 每个类的先验概率可以通过属于该类的训练记录所占

7、的比例来估计。( )A.正确B.错误参考答案:A29. 下面变量名称命名合法的是( )。A._tempStrB.isC.2018pythonD.123Python参考答案:A30. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B31. Internet 中的IP地址是( )A.就是联网主机的网络号B.可由用户任意指定C.是由主机名和域名组成D.由32个二进制位组成参考答案:D32. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获

8、取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需

9、求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。33. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C34. 以下程序语句中,哪个是正确利用切片语句取出字符串s=“pi=3.1415926”中的所有数字部分?( )A.s3-1B.s311C.s4-1D.s312参考答案:D35. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答

10、案:A36. 手游王者荣耀三行情书征集活动到本月几日结束?三行情书征集活动到本月几日结束?3月14日结束。活动时间:3月2日3月14日活动主题:王者峡谷三行情书征集活动37. 医疗大数据的来源主要包括( )A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率D.健康管理/社交网络参考答案:ABCD38. 下列正确的是( )A.D3是数据驱动文件的缩写,是最流行的可视化库之一,它被很多其他的表格插件所使用B.D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行C.D3采用的是Selectors API的第一级标准D.基础R已经包含支撑包括协

11、同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能参考答案:ABCD39. 组合数据类型中的序列类型元素之间存在先后关系,可以通过序号访问。( )A.正确B.错误参考答案:A40. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C41. 任何程序中都必须要有分支结构或循环结构。( )A.正确B.错误参考答案:B42. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关

12、键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D43. 具有双隐层的感知机足以用于解决任何复杂的分类问题。( )具有双隐层的感知机足以用于解决任何复杂的分类问题。( )A.正确B.错误参考答案:A44. 以下选项中不是Python关键字的是( )。A.whileB.exceptC.inD.do参考答案:D45. 以下哪些不是缺失值的影响?( )A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参考答案:C46. 函数用于从控制台输入数据,print函数用于将数据输出到控制台显示。( )A.正确B.错误参考答案:A47. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于( )。A.异常值B.缺失值C.不一致的值D.重复值参考答案:C48. 阶跃函数具有不光滑、不连续的特点。( )A.正确B.错误参考答案:A49. 数据清洗(Data Cleaning)的方法有( )A.填充空缺值B.清除数据中的噪声C.识别或删除离群点并解决不一致性参考答案:ABC50. 属性或维命名的不一致也可能导致结果数据集中的数据冗余。( )T.对F.错参考答案:T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号