21春南开大学《数据科学导论》在线作业参考答案

上传人:住在山****ck 文档编号:203396351 上传时间:2021-10-21 格式:DOCX 页数:9 大小:18.77KB
返回 下载 相关 举报
21春南开大学《数据科学导论》在线作业参考答案_第1页
第1页 / 共9页
21春南开大学《数据科学导论》在线作业参考答案_第2页
第2页 / 共9页
21春南开大学《数据科学导论》在线作业参考答案_第3页
第3页 / 共9页
21春南开大学《数据科学导论》在线作业参考答案_第4页
第4页 / 共9页
21春南开大学《数据科学导论》在线作业参考答案_第5页
第5页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《21春南开大学《数据科学导论》在线作业参考答案》由会员分享,可在线阅读,更多相关《21春南开大学《数据科学导论》在线作业参考答案(9页珍藏版)》请在金锄头文库上搜索。

1、21春南开大学数据科学导论在线作业参考答案通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类在回归分析中,自变量为(),因变量为()。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量以下哪一项不是特征工程的子问题?()A.特征创建B.特征提取C.特征选择D.特征识别对于k近邻法,下列说法错误的是()。A.不具有显式的学习过程B.适用于多分

2、类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则通过变量标准化计算得到的回归方程称为()。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A.减小,减小B.减小,增大C.增大,减小D.增大,增大Apriori算法的加速过程依赖于以下哪个策略?()A.抽样B.剪枝C.缓冲D.并行下列两个变量之间的关系中,哪个是函数关系?()A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,

3、4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化下面不是分类的常用方法的有()。A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场根据映射关系的不同可以分为线性回归和()。A.对数回归B.非线性回归C.逻辑回归D.多元回归实体识别的常见形式:()A.同名异义B.异名同义C.单位不统一D.属性不同BFR聚类用于在()欧氏空间中

4、对数据进行聚类。A.高维B.中维C.低维D.中高维在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。A.越小B.越大C.无关D.不确定层次聚类对给定的数据进行()的分解。A.聚合B.层次C.分拆D.复制某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元单层感知机模型属于()模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型

5、D.多分类的非线性分类模型层次聚类适合规模较()的数据集。A.大B.中C.小D.所有数据科学具有哪些性质?()A.有效性B.可用性C.未预料D.可理解下列选项是BFR的对象是()。A.废弃集B.临时集C.压缩集D.留存集关联规则的评价度量主要有()。A.支持度B.置信度C.准确率D.错误率Apriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度k近邻法的基本要素包括()。A.距离度量B.k值的选择C.样本大小D.分类决策规则聚类的主要方法有()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类K-means聚类中K值选取的方法是()。A.密度分类法B.手肘法C

6、.大腿法D.随机选取多层感知机的学习过程包含()。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播系统日志收集的基本特征有()。A.高可用性B.高可靠性C.可扩展性D.高效率什么情况下结点不用划分?()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类Jaccard系数只关心个体间共同具有的特征是否一致这个问题。()A.正确B.错误关联规则可以用枚举的方法产生。()A.正确B.错误给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。()A.正确B.错误

7、利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。()A.正确B.错误多层感知机的学习能力有限,只能处理线性可分的二分类问题。()A.正确B.错误决策树分类时将该结点的实例强行分到条件概率大的那一类去。()A.正确B.错误特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。()A.正确B.错误当特征为离散型时,可以使用信息增益作为评价统计量。()A.正确B.错误K-means算法采用贪心策略,通过迭代优化来近似求解。()A.正确B.错误当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。()A.正确B.错误信息熵越小,样本结合的纯度越低。()A

8、.正确B.错误随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。()A.正确B.错误k值增大意味着整体模型变得复杂。()A.正确B.错误当训练集较大的时候,标准BP算法通常会更快的获得更好的解。()A.正确B.错误平均减少的不纯度越大,则特征重要度越高。()A.正确B.错误不满足给定评价度量的关联规则是无趣的。()A.正确B.错误uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同。()A.正确B.错误K-means聚类是发现给定数据集的K个簇的算法。()A.正确B.错误对于项集来说,置信度没有意义。()A.正确B.错误每个类的先验概率可以通过属于该类的训练记录所占的比

9、例来估计。()A.正确B.错误 参考答案:C参考答案:A参考答案:D参考答案:D参考答案:C参考答案:A参考答案:B参考答案:B参考答案:C参考答案:C参考答案:B参考答案:D参考答案:B参考答案:D参考答案:A参考答案:B参考答案:B参考答案:C参考答案:A参考答案:C参考答案:ABCD参考答案:ACD参考答案:AB参考答案:ABCD参考答案:ABD参考答案:ABC参考答案:AB参考答案:AD参考答案:ABC参考答案:ABC参考答案:A参考答案:A参考答案:B参考答案:B参考答案:B参考答案:A参考答案:A参考答案:A参考答案:A参考答案:B参考答案:B参考答案:A参考答案:B参考答案:A参考答案:A参考答案:B参考答案:A参考答案:A参考答案:A参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号