南开大学22春《数据科学导论》补考试题库答案参考100

上传人:博****1 文档编号:511692564 上传时间:2024-01-16 格式:DOCX 页数:11 大小:13.62KB
返回 下载 相关 举报
南开大学22春《数据科学导论》补考试题库答案参考100_第1页
第1页 / 共11页
南开大学22春《数据科学导论》补考试题库答案参考100_第2页
第2页 / 共11页
南开大学22春《数据科学导论》补考试题库答案参考100_第3页
第3页 / 共11页
南开大学22春《数据科学导论》补考试题库答案参考100_第4页
第4页 / 共11页
南开大学22春《数据科学导论》补考试题库答案参考100_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学22春《数据科学导论》补考试题库答案参考100》由会员分享,可在线阅读,更多相关《南开大学22春《数据科学导论》补考试题库答案参考100(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春数据科学导论补考试题库答案参考1. 特征的信息增益越大,则其越不重要。( )A.正确B.错误参考答案:B2. 属性或维命名的不一致也可能导致结果数据集中的数据冗余。( )T.对F.错参考答案:T3. 广播变量在广播后可以修改。( )T.对F.错参考答案:F4. 距离度量中的距离可以是( )。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD5. 函数可以看作是一段具有名字的子程序,在需要的地方调用执行,不需要在每个执行地方重复编写这些语句。( )A.正确B.错误参考答案:A6. 决策树分类时将该结点的实例强行分到条件概率大的那一类去。( )A.正确

2、B.错误参考答案:A7. 域名是一个企业或机构在网上的永久性电子商标,它的作用如同商标在市场上的作用一样。( )域名是一个企业或机构在网上的永久性电子商标,它的作用如同商标在市场上的作用一样。( )答案:正确8. 随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。( )A.正确B.错误参考答案:A9. 编写HTML文件不能在哪个软件中编写?( )A.EditB.WordC.WPSD.Windows的画笔参考答案:D10. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A11. 利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。(

3、 )A.正确B.错误参考答案:B12. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B13. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A14. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )A.正确B.错误参考答案:B15. 如何理解移动商务?如何理解移动商务?参考答案:移动商务是利用手机、PDA等无线终端设备并与互联网有机结合进行的电子商务活动。互联网技术、移动通信技术、短距离技术及其它技术的完善组合创造了移动商务。16. 根据映射关系的不同可以分为线性回归和( )。A.对数回归B.

4、非线性回归C.逻辑回归D.多元回归参考答案:B17. 基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益。( )T.对F.错参考答案:T18. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A19. 2002年博客引进中国,建立的第一个博客网站是新浪博客。( )2002年博客引进中国,建立的第一个博客网站是新浪博客。( )答案:错误20. 以下属于关联分析的是( )。A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模参考答案:B21. BFR聚类簇的坐标可以与空间的坐标保持一致。( )A.正

5、确B.错误参考答案:B22. 医疗大数据特点:除了包含了大数据4个“V”的特点之外还有( )A.多态性B.时效性C.不完整性D.冗余性参考答案:ABCD23. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B24. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A25. 下面不能用来作为变量名称的是( )。A.listB._1abC.notD.a1b2参考答案:C26. 为了解决任何复杂的分类问题,使用的感知机结构应至少包含(

6、 )个隐含层。A.1B.2C.3D.4参考答案:B27. 以下不是数据仓库基本特征的是( )A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的参考答案:B28. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC29. 结构化数据是用excel结构表现的数据。( )T.对F.错参考答案:F30. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B31. 可信度是对关联规则的准确度的衡量。( )可信度是对关联规则的准确度的衡量。( )A.正确B.错误参考

7、答案:A32. 内存分析数据量比BI分析数据量大。( )T.对F.错参考答案:F33. 多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面。( )T.对F.错参考答案:T34. 决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。( )A.正确B.错误参考答案:A35. 地下城与勇士(DNF)使用加百利后,队长怎么无法进行再次挑战等操作?地下城与勇士(DNF)使用加百利后,队长怎么无法进行再次挑战等操作?1、组队后,如果有用户使用加百利秘密商店或者

8、点击出现了加百利商店的交易界面,那么队长无法选择再次挑战、选择其他地下城、返回城镇等菜单;2、加百利只出现三分钟,三分钟后秘密商店自动关闭,届时队长即可进行再次挑战、选择其他地下城及返回城镇等操作。36. Internet 中的IP地址是( )A.就是联网主机的网络号B.可由用户任意指定C.是由主机名和域名组成D.由32个二进制位组成参考答案:D37. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明( )。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单

9、位平均增加100元参考答案:C38. 以下选项对Python文件操作描述错误的是( )。A.当文件以文本方式打开时,读写会按照字节流方式进行B.Python能以文本和二进制两种方式处理文件C.文件使用结束后要用close方法关闭,释放文件的使用授权D.Python能通过内置的open函数打开一个文件进行操作参考答案:A39. 在多分支结构中,Python是通过( )来判断语句是否属于一个分支结构中。A.花括号B.冒号C.括号D.缩进参考答案:D40. 置信度(confidence)是衡量兴趣度度量( )的指标。A.简洁性B.确定性C.实用性D.新颖性参考答案:B41. 地下城与勇士(DNF)T

10、S 警告码(x,1008, x)是什么意思?地下城与勇士(DNF)TS 警告码(x,1008, x)是什么意思?游戏驱动异常,您的机器存在游戏多开情况或已启动过不支持win8系统的游戏,请重启机器后再试。42. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数

11、据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。43. 增加神经元的个数,无法提高神经网络的训练精度。( )A.正确

12、B.错误参考答案:B44. 大话西游手游浣彩露有什么用?大话西游手游浣彩露有什么用?浣彩露是人物染色最主要的材料,仙人们浣形易色的必备品,据传为云霞仙子把流动的彩虹吸入琉璃瓶中而成的奇珍妙露。45. 单层感知机模型属于( )模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型参考答案:A46. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T47. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B48. 网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的信息B:付费的推广信息C:开放平台信息D:网盟推广信息答案:ABC49. 不满足给定评价度量的关联规则是无趣的。( )不满足给定评价度量的关联规则是无趣的。( )A.正确B.错误参考答案:B50. 多层感知机的学习能力有限,只能处理线性可分的二分类问题。( )A.正确B.错误参考答案:B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号