南开大学21春《数据科学导论》在线作业二满分答案_56

上传人:壹****1 文档编号:466529446 上传时间:2022-08-26 格式:DOCX 页数:13 大小:15.13KB
返回 下载 相关 举报
南开大学21春《数据科学导论》在线作业二满分答案_56_第1页
第1页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_56_第2页
第2页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_56_第3页
第3页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_56_第4页
第4页 / 共13页
南开大学21春《数据科学导论》在线作业二满分答案_56_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《数据科学导论》在线作业二满分答案_56》由会员分享,可在线阅读,更多相关《南开大学21春《数据科学导论》在线作业二满分答案_56(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春数据科学导论在线作业二满分答案1. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A2. 如何测试自己家中的宽带速率?宽带速率如何快速检测?如何测试自己家中的宽带速率?宽带速率如何快速检测?答案:1.停止其它设备的上网行为,只留一台电脑通过网线与光纤猫或路由器连接;2.打开电脑的浏览器,输入“”,进入网站(pc端,手机版需要下载)3.等待网页加载完成后点击“begin”,开始测试。4.测试结果很会显示在网页的正中央,出用户的延迟,下载速率和上传速率都会详细显示。3. 多层感知机的学习过程包含( )。多层感知机的学习

2、过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD4. 常见的非结构化数据有( )A.web网页B.即时消息C.富文本文档D.实时多媒体数据参考答案:ABCD5. 一元回归参数估计的参数求解方法有( )。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法参考答案:ABC6. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A7. 在k近邻法中,选择较小的k值时,学习的“近似误差”会( ),“估计误差”会( )。A.减小,减小B.减小,增大C.增大,减小D.增

3、大,增大参考答案:B8. 某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。参考答案:数据集市9. 以下哪一种数据类型元素之间是无序的,相同元素在集合中唯一存在?( )A.元组B.字符串C.列表D.集合参考答案:D10. 朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能。( )A.正确B.错误参考答案:A11. 购物篮问题是( )的典型案例A.数据变换B.关联规则挖掘C.数据分类参考答案:B12. 常见的分类方法有( )A.决策树B.贝叶斯网络C.遗传算法D.FP算法参考答案:ABC

4、13. 地下城与勇士(DNF)公会技能可以清除后重新点不?地下城与勇士(DNF)公会技能可以清除后重新点不?当前版本中,公会的技能在学习后,无法进行清除和重新学习,还请了解,谢谢!14. 下列不是Python对文件进行读操作的方法是( )。A.readtextB.readlinesC.readD.readline参考答案:A15. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC16. 单层感知机模型属于( )模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的

5、非线性分类模型参考答案:A17. 贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。( )贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。( )A.正确B.错误参考答案:A18. 实体识别的常见形式:( )A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D19. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C20. 利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )A.正确

6、B.错误参考答案:A21. 借助于大数据提供的( )和( ),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果参考答案:AB22. 基于大数据的临床决策支持系统的架构包括( )A.支撑层B.大数据分析层C.网络层D.应用层参考答案:ABD23. 多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面。( )T.对F.错参考答案:T24. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B25. 下面变量名称命名合法的是( )。A._tempStrB

7、.isC.2018pythonD.123Python参考答案:A26. 下列两个变量之间的关系中,哪个是函数关系?( )A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度参考答案:C27. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。( )A.正确B.错误参考答案:B28. 给定关联规则AB,意味着:若A发生,B也会发生。( )A.正确B.错误参考答案:B29. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步

8、骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,

9、通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。30. 以下不是数据仓库基本特征的是( )A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的参考答案:B31. BFR聚类簇的坐标可以与空间的坐标保持一致。( )A.正确B.错误参考答案:B32. 怪物猎人OL游戏中的武器防具都是哪里来的?打怪掉落吗?怪物猎人OL游戏中的武器防具都是哪里来的?打怪掉落吗?在怪物猎人OL中,大部分武器和防具都只

10、能通过收集相应的素材,在铁匠处进行制作,怪物不会掉落任何武器或者防具。33. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T34. 以下选项中不是Python关键字的是( )。A.whileB.exceptC.inD.do参考答案:D35. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )T.对F.错参考答案:T36. 选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。( )A.正确B.错误参考答案:A37. BFR聚类用于在( )欧氏空间中

11、对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A38. 对于k近邻法,下列说法错误的是( )。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C39. 决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。( )A.正确B.错误参考答案:A40. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC41. Extranet有哪些功能?Extranet有哪些功能

12、?参考答案:1.信息资源共享:与外部企业共享信息资源2.业务协作处理:建立业务协同处理链接,优化业务流程3.共同开发新业务:形成虚拟联合企业42. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B43. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B44. 结构化数据是用excel结构表现的数据。( )T.对F.错参考答案:F45. 事件是Flume的基本数据单位。( )T.对F.错参考答案:T

13、46. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC47. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A48. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B49. Python中的注释是为了让计算机更能理解程序表达的意思。( )A.正确B.错误参考答案:B50. 整数和整数之间的运算结果一定的是整数。( )A.正确B.错误参考答案:B51. 逗号分隔数值的存储格式叫做csv格式,csv格式一般用来表示二维数据。( )A.正确B.错误参考答案:A52. Internet Explorer不能识别的格式是( )A.cssB.scriptingC.datD.htm参考答案:C53. 特征的信息增益越大,则其越不重要。( )A.正确B.错误参考答案

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号