南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9

上传人:s9****2 文档编号:489611710 上传时间:2022-11-16 格式:DOCX 页数:11 大小:13.85KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9_第1页
第1页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9_第2页
第2页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9_第3页
第3页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9_第4页
第4页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》复习考核试题库答案参考套卷9(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论复习考核试题库答案参考1. 时空数据是指带有地理位置与时间标签的数据。( )T.对F.错参考答案:T2. 在函数内部使用global关键字声明简单数据类型变量后,该变量作为全局变量使用。( )A.正确B.错误参考答案:A3. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A4. QQ炫舞连接下载服务器.QQ炫舞连接下载服务器.版本或者网络差异导致更新缓慢,或者优化个人网络。5. 购物篮问题是( )的典型案例A.数据变换B.关联规则挖掘C.数据分类参考答案:B6.

2、 域名是一个企业或机构在网上的永久性电子商标,它的作用如同商标在市场上的作用一样。( )域名是一个企业或机构在网上的永久性电子商标,它的作用如同商标在市场上的作用一样。( )答案:正确7. 下列不是Python对文件进行读操作的方法是( )。A.readtextB.readlinesC.readD.readline参考答案:A8. 决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布。( )决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一

3、个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布。( )A.正确B.错误参考答案:A9. 网络营销环境及企业的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销网络营销环境及企业的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销方法,这说明了网络营销发展趋势中的( )A:网络营销将从封闭式向开放式转变B:从企业自有网站为核心到多平台的综合利用C:行业内企业网络营销竞争加剧D:网络营销方法不断调整适应互联网环境发展答案:D10. 下列正确的是( )A.D3是数据驱动文件的缩写,是最流行的可视化库之一,

4、它被很多其他的表格插件所使用B.D3也可以通过一些自定义模块来根据需求增添需要的(非DOM)特性,并在WebWorker上运行C.D3采用的是Selectors API的第一级标准D.基础R已经包含支撑包括协同图(Coplot)、拼接图(Mosaic Plot)和双标图等多类图形的功能参考答案:ABCD11. Python中操作集合时,可以使用哪个函数来对集合进行增加元素的操作?( )A.appendB.putC.popD.add参考答案:D12. 随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。( )A.正确B.错误参考答案:A13. K-means聚类中K值选取的方法

5、是( )。K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB14. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C15. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )T.对F.错参考答案:T16. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C17. 例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的( )。A.简单函数变换B.规范化

6、C.属性构造D.连续属性离散化参考答案:B18. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。19. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A20. 局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用时可以继续使用。( )A.正确B.错误参考答案:B21. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考

7、答案:ABD22. 阶跃函数具有不光滑、不连续的特点。( )A.正确B.错误参考答案:A23. 以下选项中用来捕获特定类型异常的关键字是( )。A.doB.passC.whileD.except参考答案:D24. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B25. 梦幻西游手游帮派技能上限是多少?梦幻西游手游帮派技能上限是多少?1、帮派技能上限为100级,角色最高学习到自身等级+102、帮派技能20级只需消耗银币学习,20级以上需额外消耗帮贡26. 哪一项不属于规范化的方法?( )A.最小最大规范化B.零均值规范化C.小数定标规范化D.

8、中位数规范化参考答案:D27. 梦幻西游手游情缘使者在哪?梦幻西游手游情缘使者在哪?点击活动因缘际会,这样就可以自动寻路找到情缘使者了。28. 医疗大数据的来源主要包括( )A.制药企业/生命科学B.临床医疗/实验室数据C.费用报销/利用率D.健康管理/社交网络参考答案:ABCD29. 下列选项不属于函数的作用的是( )。A.复用代码B.降低编程复杂度C.提高代码的执行速度D.增强代码的可读性参考答案:C30. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )给定一个数据集,如果存在某个超平面S能够将数据集的

9、部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B31. 以下哪个不是处理缺失值的方法?( )A.删除记录B.按照一定原则补充C.不处理D.随意填写参考答案:D32. 遍历循环for语句中,不可以遍历的结构是( )。A.字符串B.元组C.数字类型D.字典参考答案:C33. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了( )、( )、( )、( )。A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD34. 多层感知机的学习能力有限,只能处理线性可分

10、的二分类问题。( )A.正确B.错误参考答案:B35. 麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。( )T.对F.错参考答案:T36. 以下选项中使Python脚本程序转变为可执行程序的第三方库的是( )。A.randomB.requestsC.pyinstallerD.pygame参考答案:C37. 全局变量一定不能和局部变量同名。( )A.正确B.错误参考答案:B38. 大话西游手游好心值怎么获得?大话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于

11、自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上限也为200,总共每日最多获得400好心值。39. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C40. 相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。( )A.正确B.错误参考答案:B41. 以下选项中是Python中文分词的第三方库

12、的是( )。A.turtleB.jiebaC.timeD.itchat参考答案:B42. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A43. 以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感性D:购买频率更低答案:D44. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A45. 集中趋势能够表明在一定条件下数据的

13、独特性质与差异。( )集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B46. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC47. 分拆方法是自底向上的方法。( )A.正确B.错误参考答案:B48. 攻击者破换信息完整性有哪些的方式?攻击者破换信息完整性有哪些的方式?参考答案:1.篡改改变信息流的次序,更改信息的内容,如购买商品的出货地址。2.删除删除某个消息或消息的某些部分。3.插入在消息中插入些信息,让收方读不懂或接收错误的信息。49. 每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。( )A.正确B.错误参考答案:A50. 常见的分类方法有( )A.决策树B.贝叶斯网络C.遗传算法D.FP算法参考答案:ABC

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号