南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26

上传人:人*** 文档编号:456691277 上传时间:2023-03-10 格式:DOCX 页数:11 大小:12.82KB
返回 下载 相关 举报
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26_第1页
第1页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26_第2页
第2页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26_第3页
第3页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26_第4页
第4页 / 共11页
南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26》由会员分享,可在线阅读,更多相关《南开大学21秋《数据科学导论》复习考核试题库答案参考套卷26(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋数据科学导论复习考核试题库答案参考1. 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A2. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B3. 贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。( )贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。( )A.正确B.错误参考答案:A4. 下列不是Python对文件进行读操作的方法是( )。A.readtextB.readlinesC.readD.read

2、line参考答案:A5. 数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。( )T.对F.错参考答案:T6. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B7. 整数和浮点数混合运算,输出结果是浮点数。( )A.正确B.错误参考答案:A8. 列表(list),集合(set),和元组(tuple)都是序列数据类型。( )A.正确B.错误参考答案:B9. 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或( )。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线参

3、考答案:A10. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C11. 以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感性D:购买频率更低答案:D12. 对于k近邻法,下列说法错误的是( )。对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采

4、用多数表决的分类决策规则参考答案:C13. 麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。( )T.对F.错参考答案:T14. 当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。( )A.正确B.错误参考答案:B15. 简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放。( )A.正确B.错误参考答案:A16. 关联规则的评价度量主要有( )。A.支持度B.置信度C.准确率D.错误率参考答案:AB17. k值增大意味着整体模型变得复杂。( )k值增大意味着整体模型变得复杂。( )A.正确B.错误

5、参考答案:B18. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C19. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD20. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A21. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D22. 数据科学具有广泛

6、的应用领域,可以应用在社交网络、职业体育、政治竞选。( )A.正确B.错误参考答案:A23. 以下哪项不是数据可视化工具的特性( )A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可参考答案:D24. 天涯明月刀是否能充值?天涯明月刀是否能充值?能充值,比例为1QB:100点券。25. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B26. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A27. 程序语句len(str(3.1415)的输出结果为( )。A.

7、4B.5C.6D.7参考答案:C28. 以下选项中不是Python关键字的是( )。A.whileB.exceptC.inD.do参考答案:D29. continue语句只结束本次循环,而不终止整个循环;break语句结束整个循环过程。( )A.正确B.错误参考答案:A30. 使用SVD方法进行图像压缩不可以保留图像的重要特征。( )A.正确B.错误参考答案:B31. random库采用梅森旋转算法生成伪随机序列。( )A.正确B.错误参考答案:A32. 在回归分析中,自变量为( ),因变量为( )。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,

8、连续型变量参考答案:D33. uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同。( )A.正确B.错误参考答案:A34. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于( )。A.异常值B.缺失值C.不一致的值D.重复值参考答案:C35. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C36. 数据科学运用科学方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。( )A.正确B.错

9、误参考答案:A37. 大数据在电信中的应用有( )A.基于用户、业务及流量分级的多维管控机制B.精准的客户分析及营销C.利用位置和轨迹信息服务社会参考答案:ABC38. 局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用时可以继续使用。( )A.正确B.错误参考答案:B39. 网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预算和组织资源B:定位网络营销形象、制定网络营销目标、评估企业外部环境、安排预算和组织资源C:评估企业外部环境、制

10、定网络营销目标、定位网络营销形象、安排预算和组织资源D:安排预算和组织资源、制定网络营销目标、评估企业外部环境、定位网络营销形象答案:C40. 下面标识符中不是Python语言的关键字的是( )。A.floatB.exceptC.continueD.global参考答案:A41. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B42. Python中的注释是为了让计算机更能理解程序表达的意思。( )A.正确B.错误参考答案:B43. 以下哪一项不是特征选择常见的方法?( )A.过滤

11、式B.封装式C.嵌入式D.开放式参考答案:D44. 用一个函数拟合数据来光滑数据称为回归。( )T.对F.错参考答案:T45. 事件是Flume的基本数据单位。( )T.对F.错参考答案:T46. 以下哪一项不是特征工程的子问题?( )A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D47. 拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )参考答案:48. FP是一种最有影响的挖掘布尔关联规则频繁项集的算法。( )T.对F.错参考答案:F49. 交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。( )T.对F.错参考答案:T50. 任何元组都可以作为集合的元素也可以作为字典的键。( )A.正确B.错误参考答案:B

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号