南开21春学期(2103)《数据科学导论》在线作业_2

上传人:A11****业论文 文档编号:183064812 上传时间:2021-05-28 格式:DOC 页数:9 大小:15.67KB
返回 下载 相关 举报
南开21春学期(2103)《数据科学导论》在线作业_2_第1页
第1页 / 共9页
南开21春学期(2103)《数据科学导论》在线作业_2_第2页
第2页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开21春学期(2103)《数据科学导论》在线作业_2》由会员分享,可在线阅读,更多相关《南开21春学期(2103)《数据科学导论》在线作业_2(9页珍藏版)》请在金锄头文库上搜索。

1、1.BFR聚类是用于处理数据集()的k-means变体。A.大B.中C.小D.所有【参考答案】: A2.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5【参考答案】: C3.以下哪一项不是特征选择常见的方法()A.过滤式B.封装式C.嵌入式D.开放式【参考答案】: D4.例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()A.简单函数变换B.规范化C.属性构造

2、D.连续属性离散化【参考答案】: B5.对于k近邻法,下列说法错误的是()。A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则【参考答案】: C6.手肘法的核心指标是()。A.SESB.SSEC.RMSED.MSE【参考答案】: B7.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A.减小,减小B.减小,增大C.增大,减小D.增大,增大【参考答案】: B8.变量之间的关系一般可以分为确定性关系与()。A.非确定性关系B.线性关系C.函数关系D.相关关系【参考答案】: A9.某商品的产量(X,件)与单位成本(Y

3、,元/件)之间的回归方程为Y=100-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元【参考答案】: C10.层次聚类对给定的数据进行()的分解。A.聚合B.层次C.分拆D.复制【参考答案】: B11.下列两个变量之间的关系中,哪个是函数关系()。A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度【参考答案】: C12.通过变量标准化计算得到的回归方程称为()。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回

4、归方程【参考答案】: A13.以下属于关联分析的是( )A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模【参考答案】: B14.单层感知机模型属于()模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型【参考答案】: A15.以下哪一项不属于数据变换()A.简单函数变换B.规范化C.属性合并D.连续属性离散化【参考答案】: C16.层次聚类适合规模较()的数据集A.大B.中C.小D.所有【参考答案】: C17.维克托?迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我

5、们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )A.K-meansB.Bayes NetworkC.C4.5D.Apriori【参考答案】: D18.根据映射关系的不同可以分为线性回归和()。A.对数回归B.非线性回归C.逻辑回归D.多元回归【参考答案】: B19.数据质量检验的主要任务就是检查原始数据中是否存在“脏数据”,概括性来说,脏数据不包括以下()A.普通值B.异常值C.不一致的值D.重复值【参考答案】: A20.在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。A.最优回归

6、线B.最优分布线C.最优预测线D.最佳分布线【参考答案】: A21.层次聚类的方法是()A.聚合方法B.分拆方法C.组合方法D.比较方法【参考答案】: AB22.k近邻法的基本要素包括()。A.距离度量B.k值的选择C.样本大小D.分类决策规则【参考答案】: ABD23.对于多层感知机,()层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层【参考答案】: BC24.Apriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度【参考答案】: ABCD25.系统日志收集的基本特征有()A.高可用性B.高可靠性C.可扩展性D.高效率【参考答案】: ABC26.K

7、-means聚类中K值选取的方法是()。A.密度分类法B.手肘法C.大腿法D.随机选取【参考答案】: AB27.多层感知机的学习过程包含()。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播【参考答案】: AD28.什么情况下结点不用划分()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类【参考答案】: ABC29.下面例子属于分类的是()A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量【参考答案】: ABC30.距离度量

8、中的距离可以是()A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离【参考答案】: ABCD31.增加神经元的个数,无法提高神经网络的训练精度。T.对F.错【参考答案】: F32.一个人的身高与体重之间具有函数关系。T.对F.错【参考答案】: F33.可信度是对关联规则的准确度的衡量。T.对F.错【参考答案】: T34.给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。T.对F.错【参考答案】: F35.K均值(K-Means)算法是密度聚类。T.对F.错【参考答案】: F36.具有双隐层的感知机足以用于解决任何复杂的分类问题。T.对F.错【参考答案】:

9、T37.当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。T.对F.错【参考答案】: F38.集中趋势能够表明在一定条件下数据的独特性质与差异T.对F.错【参考答案】: F39.给定关联规则AB,意味着:若A发生,B也会发生。T.对F.错【参考答案】: F40.数据科学运用科学方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。T.对F.错【参考答案】: T41.BFR聚类簇的坐标可以与空间的坐标保持一致。T.对F.错【参考答案】: F42.剪枝是决策树学习算法对付“过拟合”的主要手段T.对F.错【参考答案】: T43.决策树还可以表示给定特征条件下类

10、的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布T.对F.错【参考答案】: T44.K-means聚类是发现给定数据集的K个簇的算法。T.对F.错【参考答案】: T45.数据分析师的任务:用模型来回答具体问题,了解数据,其来源和结构T.对F.错【参考答案】: F46.特征的信息增益越大,则其越不重要。T.对F.错【参考答案】: F47.贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布 有关。T.对F.错【参考答案】: T48.给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。T.对F.错【参考答案】: F49.对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。T.对F.错【参考答案】: T50.利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。T.对F.错【参考答案】: F

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号