[南开大学]20春学期《数据科学导论》在线作业-2(答案100分)

上传人:j****u 文档编号:135285025 上传时间:2020-06-14 格式:DOC 页数:9 大小:46.50KB
返回 下载 相关 举报
[南开大学]20春学期《数据科学导论》在线作业-2(答案100分)_第1页
第1页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《[南开大学]20春学期《数据科学导论》在线作业-2(答案100分)》由会员分享,可在线阅读,更多相关《[南开大学]20春学期《数据科学导论》在线作业-2(答案100分)(9页珍藏版)》请在金锄头文库上搜索。

1、 谋学网【奥鹏】-南开大学20春学期(1709、1803、1809、1903、1909、2003)数据科学导论在线作业试卷总分:100 得分:100第1题,单层感知机是由()层神经元组成。A、一B、二C、三D、四正确答案:B第2题,多层感知机是由()层神经元组成。A、二B、三C、大于等于二层D、大于等于三层正确答案:D第3题,在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A、减小,减小B、减小,增大C、增大,减小D、增大,增大正确答案:B第4题,通过变量标准化计算得到的回归方程称为()。A、标准化回归方程B、标准化偏回归方程C、标准化自回归方程D、标准化多回归方

2、程正确答案:A第5题,设X=1,2,3是频繁项集,则可由X产生()个关联规则。A、4B、5C、6D、7正确答案:C第6题,维克托迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )A、K-meansB、Bayes NetworkC、C4.5D、Apriori正确答案:D第7题,置信度(confidence)是衡量兴趣度度量( )的指标。A、简洁性B、确定性C、实用性D、新颖性正确答案:B第8题,以下

3、哪一项不属于数据变换()A、简单函数变换B、规范化C、属性合并D、连续属性离散化正确答案:C第9题,某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A、关联规则发现B、聚类C、分类D、自然语言处理正确答案:A第10题,实体识别属于以下哪个过程()A、数据清洗B、数据集成C、数据规约D、数据变换正确答案:B第11题,Apriori算法的加速过程依赖于以下哪个策略( )A、抽样B、剪枝C、缓冲D、并行正确答案:B第12题,手肘法的核心指标是()。A、SESB、SSEC、RMSED、MSE正确答案:B第13题,考虑下面的频繁3-项集的集合:1,2,3,1

4、,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5正确答案:C第14题,层次聚类对给定的数据进行()的分解。A、聚合B、层次C、分拆D、复制正确答案:B第15题,层次聚类适合规模较()的数据集A、大B、中C、小D、所有正确答案:C第16题,通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A、简单函数变换B、规范化C、属性构造D、连续属性离散化正确答

5、案:C第17题,BFR聚类是用于处理数据集()的k-means变体。A、大B、中C、小D、所有正确答案:A第18题,为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。A、1B、2C、3D、4正确答案:B第19题,对于k近邻法,下列说法错误的是()。A、不具有显式的学习过程B、适用于多分类任务C、k值越大,分类效果越好D、通常采用多数表决的分类决策规则正确答案:C第20题,在回归分析中,自变量为(),因变量为()。A、离散型变量,离散型变量B、连续型变量,离散型变量C、离散型变量,连续型变量D、连续型变量,连续型变量正确答案:D第21题,数据科学具有哪些性质()A、有效性B、可

6、用性C、未预料D、可理解正确答案:A,B,C,D第22题,下列选项是BFR的对象是()A、废弃集B、临时集C、压缩集D、留存集正确答案:A,C,D第23题,多层感知机的学习过程包含()。A、信号的正向传播B、信号的反向传播C、误差的正向传播D、误差的反向传播正确答案:A,D第24题,Apriori算法的计算复杂度受()影响。A、支持度阈值B、项数C、事务数D、事务平均宽度正确答案:A,B,C,D第25题,距离度量中的距离可以是()A、欧式距离B、曼哈顿距离C、Lp距离D、Minkowski距离正确答案:A,B,C,D第26题,什么情况下结点不用划分()A、当前结点所包含的样本全属于同一类别B、

7、当前属性集为空,或是所有样本在所有属性上取值相同C、当前结点包含的样本集为空D、还有子集不能被基本正确分类正确答案:A,B,C第27题,K-means聚类中K值选取的方法是()。A、密度分类法B、手肘法C、大腿法D、随机选取正确答案:A,B第28题,对于多层感知机,()层拥有激活函数的功能神经元。A、输入层B、隐含层C、输出层正确答案:B,C第29题,相关性的分类,按照相关的方向可以分为()。A、正相关B、负相关C、左相关D、右相关正确答案:A,B第30题,聚类的主要方法有()。A、划分聚类B、层次聚类C、密度聚类D、距离聚类正确答案:A,B,C第31题,利用K近邻法进行分类时,k值过小容易发

8、生过拟合现象。T、对F、错正确答案:T第32题,Apriori算法是一种典型的关联规则挖掘算法。T、对F、错正确答案:T第33题,贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布 有关。T、对F、错正确答案:第34题,可信度是对关联规则的准确度的衡量。T、对F、错正确答案:第35题,利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。T、对F、错正确答案:F第36题,k值增大意味着整体模型变得复杂。T、对F、错正确答案:第37题,获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。T、对F、错正确答案:F第38题,决策树还可以表示给定特征

9、条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布T、对F、错正确答案:T第39题,探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。T、对F、错正确答案:第40题,当特征为离散型时,可以使用信息增益作为评价统计量。T、对F、错正确答案:T第41题,信息熵越大,数据信息的不确定性越小。T、对F、错正确答案:F第42题,决策树内部结点表示一个类,叶结点表示一个特征或属性T、对F、错正确答案:F第43题,给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确

10、的划分到超平面的两侧,则称该数据集是线性可分数据集。T、对F、错正确答案:F第44题,不满足给定评价度量的关联规则是无趣的。T、对F、错正确答案:F第45题,集中趋势能够表明在一定条件下数据的独特性质与差异T、对F、错正确答案:第46题,随着特征维数的增加,样本间区分度提高。T、对F、错正确答案:F第47题,多元线性回归模型中,标准化偏回归系数没有单位。T、对F、错正确答案:T第48题,交叉表被广泛用于调查研究,商业智能,工程和科学研究T、对F、错正确答案:第49题,具有双隐层的感知机足以用于解决任何复杂的分类问题。T、对F、错正确答案:第50题,标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。T、对F、错正确答案:F

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号