奥鹏南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业

上传人:A11****业论文 文档编号:120274596 上传时间:2020-02-06 格式:DOC 页数:9 大小:47KB
返回 下载 相关 举报
奥鹏南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业_第1页
第1页 / 共9页
奥鹏南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业_第2页
第2页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《奥鹏南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业》由会员分享,可在线阅读,更多相关《奥鹏南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业(9页珍藏版)》请在金锄头文库上搜索。

1、19秋学期(1709、1803、1809、1903、1909)数据科学导论在线作业为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。A.1B.2C.3D.4正确答案:B某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.聚类C.分类D.自然语言处理正确答案:A只有非零值才重要的二元属性被称作:(),其中购物篮数据就属于这种属性。A.计数属性B.离散属性C.非对称的二元属性#对称属性正确答案:C变量之间的关系一般可以分为确定性关系与()。A.非确定性关系B.线性关系C.函数关系D.相关关系正确答案:ABFR聚类是用于

2、处理数据集()的k-means变体。A.大B.中C.小D.所有正确答案:A例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化正确答案:B数据质量检验的主要任务就是检查原始数据中是否存在“脏数据”,概括性来说,脏数据不包括以下()A.普通值B.异常值C.不一致的值D.重复值正确答案:A层次聚类适合规模较()的数据集A.大B.中C.小D.所有正确答案:C某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元

3、C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元正确答案:C设X=1,2,3是频繁项集,则可由X产生()个关联规则。A.4B.5C.6D.7正确答案:C根据映射关系的不同可以分为线性回归和()。A.对数回归B.非线性回归C.逻辑回归D.多元回归正确答案:B多层感知机是由()层神经元组成。A.二B.三C.大于等于二层D.大于等于三层正确答案:D通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化正确答案:C单层感知机是由()层神经元组成。A

4、.一B.二C.三D.四正确答案:B比如一张表,从业务上讲,一个用户应该只会有一条记录,那么如果某个用户出现了超过一条的记录,这就产生了()A.异常值B.不一致的值C.重复值D.缺失值正确答案:C我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左正确答案:B一元线性回归中,真实值与预测值的差称为样本的()。A.误差B.方差C.测差D.残差正确答案:D以下哪一项不是特征工程的子问题()A.特征创建B.特征提取C.特征选择D.特征识别正确答案:D对于k近邻法,下列说法错误的是()。A.不具有显式的学习过程B.适用于多分类任务C

5、.k值越大,分类效果越好D.通常采用多数表决的分类决策规则正确答案:C聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类正确答案:A多层感知机的学习过程包含()。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播正确答案:ADApriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度正确答案:ABCD什么情况下结点不用划分()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类正确答案:ABC聚类的主要方法有()。A.

6、划分聚类B.层次聚类C.密度聚类D.距离聚类正确答案:ABC下列选项是BFR的对象是()A.废弃集B.临时集C.压缩集D.留存集正确答案:ACD关联规则的评价度量主要有:()。A.支持度B.置信度C.准确率D.错误率正确答案:AB数据科学具有哪些性质()A.有效性B.可用性C.未预料D.可理解正确答案:ABCD系统日志收集的基本特征有()A.高可用性B.高可靠性C.可扩展性D.高效率正确答案:ABC相关性的分类,按照相关的方向可以分为()。A.正相关B.负相关C.左相关D.右相关正确答案:AB距离度量中的距离可以是()A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离正确答案:A

7、BCD多层感知机的学习能力有限,只能处理线性可分的二分类问题。T.对F.错正确答案:B阶跃函数具有不光滑、不连续的特点。T.对F.错正确答案:A标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。T.对F.错正确答案:B剪枝是决策树学习算法对付“过拟合”的主要手段T.对F.错正确答案:A为了尽可能正确分类训练样本,结点划分过程将不断重复,有时会造成决策树分支过少,以致于把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合T.对F.错正确答案:B当训练集较大的时候,标准BP算法通常会更快的获得更好的解。T.对F.错正确答案:A方差过小的特征对数据的区分能力强T.对F.错正确答案

8、:B利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。T.对F.错正确答案:B两个对象越相似,他们的相异度就越高。T.对F.错正确答案:B给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。T.对F.错正确答案:B一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。T.对F.错正确答案:A决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间

9、的划分,也对应着决策树的构建T.对F.错正确答案:AK-means聚类是发现给定数据集的K个簇的算法。T.对F.错正确答案:A增加神经元的个数,无法提高神经网络的训练精度。T.对F.错正确答案:B神经网络中误差精度的提高可以通过增加隐含层中的神经元数目来实现。T.对F.错正确答案:A茎叶图失去原始数据的信息,而直方图保留原始数据的信息。T.对F.错正确答案:B当特征为离散型时,可以使用信息增益作为评价统计量。T.对F.错正确答案:AK-means算法采用贪心策略,通过迭代优化来近似求解。T.对F.错正确答案:A对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。T.对F.错正确答案:A啤酒与尿布的故事是聚类分析的典型实例。T.对F.错正确答案:B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号