南开大学21秋《数据科学导论》在线作业二答案参考32

上传人:M****1 文档编号:489594521 上传时间:2023-10-12 格式:DOCX 页数:12 大小:14.11KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》在线作业二答案参考32_第1页
第1页 / 共12页
南开大学21秋《数据科学导论》在线作业二答案参考32_第2页
第2页 / 共12页
南开大学21秋《数据科学导论》在线作业二答案参考32_第3页
第3页 / 共12页
南开大学21秋《数据科学导论》在线作业二答案参考32_第4页
第4页 / 共12页
南开大学21秋《数据科学导论》在线作业二答案参考32_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》在线作业二答案参考32》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》在线作业二答案参考32(12页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论在线作业二答案参考1. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC2. 2月28日的王者同人绘栏目中,妲己宝宝为大家带来了哪名英雄的同人作品?2月28日的王者同人绘栏目中,妲己宝宝为大家带来了哪名英雄的同人作品?答案:大乔3. 函数体现的是代码复用和模块化设计思想。( )A.正确B.错误参考答案:A4. 全局变量一定不能和局部变量同名。( )A.正确B.错误参考答案:B5. 数据规约是在尽可能保持数据原貌的前提下,最大限度地精简数据量。( )T.对F.错参考答案:T6.

2、 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或( )。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线参考答案:A7. 两个对象越相似,他们的相异度就越高。( )A.正确B.错误参考答案:B8. 21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。( )T.对F.错参考答案:T9. 商业智能(BI)可以被描述为“一组用于获取原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具”。( )T.对F.错参考答案:T10. Python内置的random库主要用于产生各种分布的真实随机数序列。

3、( )A.正确B.错误参考答案:B11. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B12. 下列选项是BFR的对象是( )。A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD13. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A14. 整数和浮点数混合运算,输出结果是浮点数。( )A.正确B.错误参考答案:A15. 关于函数,以下描述错误的是( )。A.函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函

4、数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D16. 大话西游手游好心值怎么获得?大话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上限也为200,总共每日最多获得400好心值。1

5、7. 我们需要对已生成的树( )进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左参考答案:B18. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A19. 2002年博客引进中国,建立的第一个博客网站是新浪博客。( )2002年博客引进中国,建立的第一个博客网站是新浪博客。( )答案:错误20. 在回归分析中,自变量为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量参考答案:D21. 当维度增加时,特征空间

6、的体积增加得很快,使得可用的数据变得稠密。( )A.正确B.错误参考答案:B22. 大话西游手游水陆大会怎么进场?大话西游手游水陆大会怎么进场?到皇宫找魏征23. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A24. 网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的信息B:付费的推广信息C:开放平台信息D:网盟推广信息答案:ABC25. K-means聚类是发现给定数据集的K个簇的算法。( )A.正确B.错误参考答案:A26. 常见

7、的分类方法有( )A.决策树B.贝叶斯网络C.遗传算法D.FP算法参考答案:ABC27. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )A.正确B.错误参考答案:B28. 关于网络广告付费模式,以下关于PPC解释正确的是( )A:按行动付费B:按点击付费C:按显示付费D:按关于网络广告付费模式,以下关于PPC解释正确的是( )A:按行动付费B:按点击付费C:按显示付费D:按销售付费答案:B29. 第一个提出大数据概念的公司是( )。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司参考答案:A30. 利用K近

8、邻法进行分类时,k值过小容易发生过拟合现象。( )利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )A.正确B.错误参考答案:A31. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC32. Internet Explorer不能识别的格式是( )A.cssB.scriptingC.datD.htm参考答案:C33. 地下城与勇士(DNF)宠物学习终结技能的等级地下城与勇士(DNF)宠物学习终结技能的等级学习技能级别根据宠物种类不同而不同,一

9、般在2025级即可自动学习终结技能。34. K均值(K-Means)算法是密度聚类。( )A.正确B.错误参考答案:B35. 以下哪项不是数据可视化工具的特性( )A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可参考答案:D36. 通过变量标准化计算得到的回归方程称为( )。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程参考答案:A37. 关联规则的评价度量主要有( )。A.支持度B.置信度C.准确率D.错误率参考答案:AB38. 选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对

10、近邻的点实例点非常敏感。( )A.正确B.错误参考答案:A39. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A40. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC41. 剪枝是决策树学习算法对付“过拟合”的主要手段。( )A.正确B.错误参考答案:A42. 交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。( )T.对F.错参考答案:T43. 信息熵越小,样本结合的纯度越低。( )A.正确B.错误参考答案:B44.

11、 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D45. uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同。( )A.正确B.错误参考答案:A46. 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:B47. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B48. 由于列表是动态可变的,所以它不能作为集合的元素或者字典的key。( )A.正确B.错误参考答案:A49. 给定关联规则AB,意味着:若A发生,B也会发生。(

12、 )A.正确B.错误参考答案:B50. Jaccard系数只关心个体间共同具有的特征是否一致这个问题。( )A.正确B.错误参考答案:A51. 攻击者破换信息完整性有哪些的方式?攻击者破换信息完整性有哪些的方式?参考答案:1.篡改改变信息流的次序,更改信息的内容,如购买商品的出货地址。2.删除删除某个消息或消息的某些部分。3.插入在消息中插入些信息,让收方读不懂或接收错误的信息。52. 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。( )A.正确B.错误参考答案:A53. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B54.

13、 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A55. 基于大数据的临床决策支持系统的架构包括( )A.支撑层B.大数据分析层C.网络层D.应用层参考答案:ABD56. 关于RSS与EDM的说法,正确的是( )A:RSS、EDM的送达率几乎为100%B:RSS、EDM都可以完美呈现所有图片关于RSS与EDM的说法,正确的是( )A:RSS、EDM的送达率几乎为100%B:RSS、EDM都可以完美呈现所有图片C:RSS的营销成本比EDM要低很多D:RSS相比EDM能更好的实现个性化营销答案:C57. 组合数据类型可以分为三类:序列类型、集合类型和映射类型。( )A.正确B.错误参考答案:A58. 通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。( )T.对F.错参考答案:T59. R语言是S语言的实现,是一种B编译语言。( )T.对F.错参考答案:F60. sigmoid函数属于阶跃函数,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号