南开大学21秋《数据科学导论》平时作业一参考答案75

上传人:桔**** 文档编号:476835919 上传时间:2023-06-09 格式:DOCX 页数:13 大小:15.20KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》平时作业一参考答案75_第1页
第1页 / 共13页
南开大学21秋《数据科学导论》平时作业一参考答案75_第2页
第2页 / 共13页
南开大学21秋《数据科学导论》平时作业一参考答案75_第3页
第3页 / 共13页
南开大学21秋《数据科学导论》平时作业一参考答案75_第4页
第4页 / 共13页
南开大学21秋《数据科学导论》平时作业一参考答案75_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》平时作业一参考答案75》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》平时作业一参考答案75(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论平时作业一参考答案1. 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。( )T.对F.错参考答案:T2. 距离度量中的距离可以是( )。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD3. 特征的信息增益越大,则其越不重要。( )A.正确B.错误参考答案:B4. 统计图表的可视化方法主要包括( )A.散点图B.折线图C.条形图D.饼图参考答案:ABCD5. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数

2、据,这时两张表中就有了不一致的数据,这属于( )。A.异常值B.缺失值C.不一致的值D.重复值参考答案:C6. 地下城与勇士(DNF)宠物学习终结技能的等级地下城与勇士(DNF)宠物学习终结技能的等级学习技能级别根据宠物种类不同而不同,一般在2025级即可自动学习终结技能。7. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC8. 梦幻西游手游空间有什么用?梦幻西游手游空间有什么用?玩家可以在空间中上传照片、编辑个性签名,而且还可以放置礼物,让其他玩家来踩,有机会获得踩空间的奖励哦。9. Internet上的电子邮件扩充协议是( )A.FTPB.M

3、IMEC.TCP/IPD.SMTP参考答案:B10. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B11. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C12. 攻击者破换信息完整性有哪些的方式?攻击者破换信息完整性有哪些的方式?参考答案:1.篡改改变信息流的次序,更改信息的内容,如购买商品的出货地址。2.删除删除某个消息或消息的某些部分。3.插入在消息中插入

4、些信息,让收方读不懂或接收错误的信息。13. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D14. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A15. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字

5、D.估计商场客流量参考答案:ABC16. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A17. 例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:B18. 对于多层感知机,( )层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC19. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A20. 数据变换(Data Transformation)的方法有( )A.光滑B.聚集C.数据泛化D.规范化参考

6、答案:ABCD21. 数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选。( )A.正确B.错误参考答案:A22. Internet 中的IP地址是( )A.就是联网主机的网络号B.可由用户任意指定C.是由主机名和域名组成D.由32个二进制位组成参考答案:D23. 以下选项中用来捕获特定类型异常的关键字是( )。A.doB.passC.whileD.except参考答案:D24. 下列哪个R语言扩展包可以创建带有点和边的网络图( )A.ggplot2B.networkC.ggmapsD.animation参考答案:B25. K-means聚类中K值选取的方法是( )。K-mea

7、ns聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB26. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B27. 广义的Spark是指Spark生态系统,采用了四层架构。( )T.对F.错参考答案:T28. 决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。( )A.正确B.错误参考答案:A29. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取

8、值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC30. 大数据带来的挑战有哪些( )。A.会导致数据盲点B.危及个人隐私C.造成群体歧视D.产生庞大能耗参考答案:ABCD31. 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式。( )T.对F.错参考答案:T32. 大话西游手游帮派贡献怎么得?大话西游手游帮派贡献怎么得?帮派贡献是非常重要的,如果你不重视他,那么属性肯定会比其他玩家少上一大截。帮派贡献的获得方式还是比较多的。1:帮派成员通过完成帮派任务获得2:参加帮派大战获得3:参加随机刷新的限时任务帮派强盗33.

9、遍历循环for语句中,不可以遍历的结构是( )。A.字符串B.元组C.数字类型D.字典参考答案:C34. 概念描述(concept description)对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。( )T.对F.错参考答案:T35. 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。( )T.对F.错参考答案:T36. 给定关联规则AB,意味着若A发生,B也会发生。( )A.正确B.错误参考答案:B37. 用于描述相等时间间隔下连续数据随时间变化趋势的是( )A.折线图B.散点图C.条形图D.饼图参考答案:A38. Python中定义函数的关键

10、字是( )。A.defB.defineC.functionD.defunc参考答案:A39. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B40. 上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引客户C.后期可能根据物流数据展示出此拍档的物流服务能力,以吸引客户D.没有作用参考答案:ABC41. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:AB

11、CD42. 数据清洗(Data Cleaning)的方法有( )A.填充空缺值B.清除数据中的噪声C.识别或删除离群点并解决不一致性参考答案:ABC43. 下列哪一种不是Python的特性?( )A.跨平台特性B.解释型语言C.编译型语言D.面向对象参考答案:C44. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。( )A.正确B.错误参考答案:A45. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需

12、求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人

13、与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。46. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A47. 大话西游手游水陆大会怎么进场?大话西游手游水陆大会怎么进场?到皇宫找魏征48. 一拍档能帮客户买通关单。( )一拍档能帮客户买通关单。( )参考答案:49. 美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。( )T.对F.错参考答案:T50. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B51. Intranet有哪些组成部分?Intranet有哪些组成部分?参考答案:主要由物理网、防火墙、服务器(如Web服务器、邮件服务器、数据库服务器等)、客户机等几个基本部分组成。52. 考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5;假定数据集中只有5个项,采用合并

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号