南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业

上传人:不吃****猫 文档编号:99226596 上传时间:2019-09-18 格式:DOC 页数:8 大小:42KB
返回 下载 相关 举报
南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业_第1页
第1页 / 共8页
南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业_第2页
第2页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业》由会员分享,可在线阅读,更多相关《南开19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业(8页珍藏版)》请在金锄头文库上搜索。

1、 谋学网【奥鹏】南开大学19秋学期(1709、1803、1809、1903、1909)数据科学导论在线作业试卷总分:100 得分:100第1题,在回归分析中,自变量为(),因变量为()。A、离散型变量,离散型变量B、连续型变量,离散型变量C、离散型变量,连续型变量D、连续型变量,连续型变量正确答案:D第2题,Apriori算法的加速过程依赖于以下哪个策略( )A、抽样B、剪枝C、缓冲D、并行正确答案:B第3题,通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A、简单函数变换B、规范化C、属性构造D、连续属性离散化正确答案:

2、C第4题,单层感知机模型属于()模型。A、二分类的线性分类模型B、二分类的非线性分类模型C、多分类的线性分类模型D、多分类的非线性分类模型正确答案:A第5题,聚类是一种()。A、有监督学习B、无监督学习C、强化学习D、半监督学习正确答案:B第6题,以下属于关联分析的是( )A、CPU性能预测B、购物篮分析C、自动判断鸢尾花类别D、股票趋势建模正确答案:B第7题,在一元线性回归模型中,残差项服从()分布。A、泊松B、正态C、线性D、非线性正确答案:B第8题,变量之间的关系一般可以分为确定性关系与()。A、非确定性关系B、线性关系C、函数关系D、相关关系正确答案:A第9题,具有偏差和至少()个S型

3、隐含层加上一个()输出层的网络能够逼近任何有理数。A、1,线性B、2,线性C、1,非线性D、2,非线性正确答案:A第10题,我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A、自上而下B、自下而上C、自左而右D、自右而左正确答案:B第11题,比如一张表,从业务上讲,一个用户应该只会有一条记录, 那么如果某个用户出现了超过一条的记录,这就产生了()A、异常值B、不一致的值C、重复值D、缺失值正确答案:C第12题,实体识别的常见形式()A、同名异义B、异名同义C、单位不统一D、属性不同正确答案:D第13题,单层感知机拥有()层功能神经元。A、一B、二C、三D、四正确答案

4、:A第14题,多层感知机是由()层神经元组成。A、二B、三C、大于等于二层D、大于等于三层正确答案:D第15题,下列两个变量之间的关系中,哪个是函数关系()。A、人的性别和他的身高B、人的工资与年龄C、正方形的面积和边长D、温度与湿度正确答案:C第16题,单层感知机是由()层神经元组成。A、一B、二C、三D、四正确答案:B第17题,维克托迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )A、K-m

5、eansB、Bayes NetworkC、C4.5D、Apriori正确答案:D第18题,哪一项不属于规范化的方法()A、最小-最大规范化B、零-均值规范化C、小数定标规范化D、中位数规范化正确答案:D第19题,K-means聚类适用的数据类型是()。A、数值型数据B、字符型数据C、语音数据D、所有数据正确答案:A第20题,为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。A、1B、2C、3D、4正确答案:B第21题,距离度量中的距离可以是()A、欧式距离B、曼哈顿距离C、Lp距离D、Minkowski距离正确答案:A,B,C,D第22题,Apriori算法的计算复杂度受()

6、影响。A、支持度阈值B、项数C、事务数D、事务平均宽度正确答案:A,B,C,D第23题,什么情况下结点不用划分()A、当前结点所包含的样本全属于同一类别B、当前属性集为空,或是所有样本在所有属性上取值相同C、当前结点包含的样本集为空D、还有子集不能被基本正确分类正确答案:A,B,C第24题,下面例子属于分类的是()A、检测图像中是否有人脸出现B、对客户按照贷款风险大小进行分类C、识别手写的数字D、估计商场客流量正确答案:A,B,C第25题,关联规则的评价度量主要有:()。A、支持度B、置信度C、准确率D、错误率正确答案:A,B第26题,多层感知机的学习过程包含()。A、信号的正向传播B、信号的

7、反向传播C、误差的正向传播D、误差的反向传播正确答案:A,D第27题,k近邻法的基本要素包括()。A、距离度量B、k值的选择C、样本大小D、分类决策规则正确答案:A,B,D第28题,K-means聚类中K值选取的方法是()。A、密度分类法B、手肘法C、大腿法D、随机选取正确答案:A,B第29题,层次聚类的方法是()A、聚合方法B、分拆方法C、组合方法D、比较方法正确答案:A,B第30题,相关性的分类,按照相关的方向可以分为()。A、正相关B、负相关C、左相关D、右相关正确答案:A,B第31题,啤酒与尿布的故事是聚类分析的典型实例。T、对F、错正确答案:F第32题,利用K近邻法进行分类时,使用不

8、同的距离度量所确定的最近邻点都是相同的。T、对F、错正确答案:F第33题,数据分析师的任务:用模型来回答具体问题,了解数据,其来源和结构T、对F、错正确答案:F第34题,平均减少的不纯度越大,则特征重要度越高。T、对F、错正确答案:T第35题,多元线性回归模型中,标准化偏回归系数没有单位。T、对F、错正确答案:T第36题,相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。T、对F、错正确答案:F第37题,随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。T、对F、错正确答案:T第38题,获取数据为数据分析提供了素材和依据,这里的数据只

9、包括直接获取的数据。T、对F、错正确答案:F第39题,利用K近邻法进行分类时,k值过小容易发生过拟合现象。T、对F、错正确答案:T第40题,Apriori算法是一种典型的关联规则挖掘算法。T、对F、错正确答案:T第41题,两个对象越相似,他们的相异度就越高。T、对F、错正确答案:F第42题,选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。T、对F、错正确答案:T第43题,K均值(K-Means)算法是密度聚类。T、对F、错正确答案:F第44题,EDA可以最大化数据分析者对数据集和数据集底层结构的洞察力,并

10、且为分析者提供数据集中包含的各类信息。T、对F、错正确答案:T第45题,一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。T、对F、错正确答案:T第46题,使用SVD方法进行图像压缩不可以保留图像的重要特征。T、对F、错正确答案:F第47题,随着特征维数的增加,样本间区分度提高。T、对F、错正确答案:F第48题,特征的信息增益越大,则其越不重要。T、对F、错正确答案:F第49题,当训练集较大的时候,标准BP算法通常会更快的获得更好的解。T、对F、错正确答案:T第50题,sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。T、对F、错正确答案:F

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号