CPDA考试真题与答案1,推荐文档

上传人:高**** 文档编号:228559577 上传时间:2021-12-23 格式:PDF 页数:13 大小:138.01KB
返回 下载 相关 举报
CPDA考试真题与答案1,推荐文档_第1页
第1页 / 共13页
CPDA考试真题与答案1,推荐文档_第2页
第2页 / 共13页
CPDA考试真题与答案1,推荐文档_第3页
第3页 / 共13页
CPDA考试真题与答案1,推荐文档_第4页
第4页 / 共13页
CPDA考试真题与答案1,推荐文档_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《CPDA考试真题与答案1,推荐文档》由会员分享,可在线阅读,更多相关《CPDA考试真题与答案1,推荐文档(13页珍藏版)》请在金锄头文库上搜索。

1、-WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - 一、单选题1.“大数据”是指规模超过 1000TB 的数据集。正确答案:2. 概率为 0 的事件是不可能事件,概率为1 的事件是必然事件。正确答案:3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。正确答案:4.统计图中的散点图主要用来观察变量之间的相关关系。正确答案:5.抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。正确答案:6.Datahoop1.2 版中 K-means 聚类分析要求输入的数据必须是数值型数据。正确答案:7.如果事件 A,B 互斥,且 P(A)

2、0,P(B)0, 则 A , B 独立。正确答案:8.SQL 中删除表的命令是“ DELETE TABLE ”。正确答案:9.聚类分析中,各变量的取值在数量级上不能有过大的差异。正确答案:10.如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师归纳 - - - - - - - - - -第 1 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - 正确答案:11. 需求定

3、价法的核心思想是力求在需求高涨时收取较低价格,价格。而当需求低落时则收取较高正确答案:12. 使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。正确答案:13. 线性回归模型的拟合优度可采用可决系数进行评判。可决系数越小,模型拟合效果越差。可决系数越高,模型拟合效果越好;正确答案:14. 一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。正确答案:15. 决策树中包含根结点、叶结点、内部结点和外部结点。正确答案:二、单选题1. 检查异常值常用的统计图形是()A 、柱状图B、箱线图C、帕累托图D、气泡图正确答案:B2. 什么是

4、KDD ?()A 、数据挖掘与知识发现B、领域知识发现精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师归纳 - - - - - - - - - -第 2 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - C、文档知识发现D、动态知识发现正确答案:A3. 东北人养了一只鸡和一头猪。一天鸡问猪:主人呢?猪说:出去买蘑菇了。鸡听了撒丫子就跑。猪说:你跑什么?鸡叫道:“有本事主人买粉条的时候你小子别跑!以上对话体现了数据分析方法中的()A 、

5、关联B、聚类C、分类D、自然语言处理正确答案:A4. 假设检验中显著性水平是()A 、推断时犯取伪错误的概率B、推断时取伪弃真的概率C、正确推断的概率D、是推断的可信度正确答案:B5. 矩估计的基本原理是()A 、用样本矩估计总体矩B、使得似然函数达到最大C、使得似然函数达到最小D、小概率事件在一次试验中是不可能发生的正确答案:A6. SQL 查询语句中HAVING子句的作用是()A 、指出分组查询的范围B、指出分组查询的值C、指出分组查询的条件D、指出分组查询的内容正确答案:C精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师

6、归纳 - - - - - - - - - -第 3 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - 7. 以下哪项关于决策树的说法是错误的()A 、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感D、寻找最佳决策树是NP 完全问题正确答案:C8. 以下哪种方法不属于于监督学习模型()A 、决策树B、线性回归C、关联分析D、判别分析正确答案:C9 考虑下面的频繁 3- 项集的集合: 1 ,2,3 , 1 ,2,4 ,1 ,3, 4 , 1 ,

7、3, 5 ,2 ,3 ,4 ,2 , 3,5 , 3 ,4, 5 假定数据集中只有5 个项,若采用合并策略,则由候选产生过程得到 4- 项集不包含()A 、1 , 2 , 3 , 4B、 1 , 2 , 3, 5C、 1 , 2 , 4 , 5D、 1 , 3 , 4 , 5正确答案:C10. 下列不属于原始数据来源的是()A 、行政记录B、统计调查C、统计年鉴D、实验正确答案:C11. 下列不属于分类算法的是()A 、C4.5 算法B、逻辑回归精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师归纳 - - - - - - -

8、- - -第 4 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - C、 KNN 算法D、 TF-TDF 算法正确答案:D12. 相关分析与回归分析的一个重要区别是()A 、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系正确答案:A13. 数据仓库是随着时间变化的,下面的描述不正确的是()A 、数据仓库随时间的变化不断增加新的数据内容B、捕捉到的新数据会覆

9、盖原来的快照C、数据仓库随时间变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合正确答案:C14. 资金的时间价值是()A 、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额正确答案:B15. 描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是()A 、极差B、标准差C、均值D、变异系数正确答案:B16. 下列有关Apriori算法的说法中不正确的是()精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - -

10、 - - - -欢迎下载 名师归纳 - - - - - - - - - -第 5 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - A 、Apriori算法是关联分析中最常用的算法之一。B、应用 Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值。C、应用 Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据。D、 Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量。正确答案:C17. 当置信水平一定时,置信区间的宽度()A 、随着样本量的增大而减小B、随着样

11、本量的增大而增大C、与样本量的大小无关D、先随着样本量的增大而减小,到一定程度后会随着样本量的增大而增大。正确答案:A18. 一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为()A 、需求价格弹性B、供给价格弹性C、需求交叉弹性D、供给交叉弹性正确答案:C19. 分类器效果检验中的准确率是指()A 、预测正确的数据在总数据中的比例B、预测为正的数据在总数据中的比例C、预测为正的数据中实际为正的数据所占比例D、实际为正的数据中被预测为正的数据所占比例正确答案:C20.给出下列结论:(1 )在回归分析中,可用指数系数R 方的值判断模型的拟合效果,R 方越大,模型的拟合效果越好;(2

12、)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3 )在回归分析中,可用相关系数 r 的值判断模型的拟合效果, r 越小,模型的拟合效果越好;精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师归纳 - - - - - - - - - -第 6 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - (4 )在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比

13、较合适带状区域的宽度越宽,说明模型的拟合精度越高以上结论中,正确的有()个A 、1 B、 2 C、 3 D、 4 正确答案:A21. 维度规约是在以下哪个步骤的任务?()A 、频繁模式挖掘B、降维C、数据预处理D、数据流挖掘正确答案:C22.假设属性 income 的最大最小值分别是 12000 元和 98000 元。利用最大 - 最小规范化的方法将属性的值映射到0 至 1 的范围内。对属性income的 73600元将被转化为()A 、 0.751 B、 0.163 C、 0.457 D、 0.716 正确答案:D23.假定用于分析的数据包含属性age 。数据元组中 age 的值如下(按递增

14、序): 13 , 15 ,16 ,16 ,19 ,20 ,20 ,21 ,22 ,22 ,25 ,25 ,25 ,30 ,33 ,33 ,35 ,35 ,36 ,40 ,45 ,46 ,52 ,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为()A 、 15.7 B、 18.3 C、 19.7 D、以上都不对正确答案:B精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师归纳 - - - - - - - - - -第 7 页,共 13 页 - - - - - - - - - - -WORD 格式

15、 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - 24. EXCEL 中,求标准差的函数是()A 、AVERAGE B、 MEDIAN C、 MODE D、 STDEV 正确答案:D25. 人们购买制冷用空调主要是为了在夏天获得凉爽空气,这属于空调产品整体概念中的( )A 、有形产品B、直接产品C、核心产品D、主要产品正确答案:C26. 贝叶斯决策是根据()进行决策的一种方法。A 、极大似然概率B、先验概率C、边际概率D、后验概率正确答案:D27.某人欲为子女筹措 250000 元的留学经费,预计在 8 年内的每年年初在银行存入一笔款项,如银行存款年利率为8 ,每年应存入金

16、额为()A 、23502.87 B、 23505.20 C、 12698.6 D、 21762.67 正确答案:D28. 指数平滑法可以用以下哪种指标来反映对时间序列资料的修正程度()A 、平滑常数B、指数平滑数初始值C、跨越期精品p d f 资料 - - - 欢迎下载 - - - - - - - - - - - - - - -欢迎下载 名师归纳 - - - - - - - - - -第 8 页,共 13 页 - - - - - - - - - - -WORD 格式 - 可编辑 - -WORD 格式 - 可编辑 - 精品资料分享 - D、季节指数正确答案:A29. 某牙膏厂原来生产两面针药物牙膏,现在又增加牙刷生产,这属于()A 、同心多元化B、水平多元化C、集团多元化D、相关多元化正确答案:B30. 净现值、内部收益率、获利指数指标之间的数量关系是()A 、当 NPV0时, IRRi , PI0时, IRRi , PI1C、当 NPVi , PI1D、当 NPVi , PI1正确答案:B三、多选题1. 以下关于皮尔森相关分析叙述正确的是()A 、两变量独立,两者的皮尔森相关系数必然等

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 高中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号