大数据分析师认证样题0814v0.2

上传人:橙** 文档编号:333372503 上传时间:2022-09-01 格式:PDF 页数:4 大小:83.58KB
返回 下载 相关 举报
大数据分析师认证样题0814v0.2_第1页
第1页 / 共4页
大数据分析师认证样题0814v0.2_第2页
第2页 / 共4页
大数据分析师认证样题0814v0.2_第3页
第3页 / 共4页
大数据分析师认证样题0814v0.2_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《大数据分析师认证样题0814v0.2》由会员分享,可在线阅读,更多相关《大数据分析师认证样题0814v0.2(4页珍藏版)》请在金锄头文库上搜索。

1、阿里云大学认证阿里云大数据行业认证(ACP)考试样题1 大数据分析师认证(ACP 级)考试样题一、单选题1、MySQL 数据库中有“product”的数据表。“product”数据表存储的是产品的基本信息,它包含如下字段:产品编号“id”,价格“price”以及产品描述“description”,其中产品编号“id”是主键。如果分析师希望通过SQL 语句从“product”表中选取三件价格最贵的产品的编号以及产品描述,可以通过_ 命令实现。a)select id,description from product order by price asc limit 3;b)select id,de

2、scription from product where max(price)3;c)select id,description from product order by price desc limit 3;d)select id,description,max(price)from product order by price;2、某高校的教授在第一天上课时发现,他授课的班级中女性学生的出勤比例明显大于男性学生,但是点名册却显示该班级的男女比例实际上为1 比 1。该教授推测,可能是因为男性学生比女性学生更容易翘课。为了检验他的假设,该教授记录了这个班级在一个学期的16 次课程中的男女学生

3、出勤情况,并使用双样本T-test的假设检验方法来检查男女学生的出勤率有无明显差异。男性学生与女性学生的平均出勤率分别用 P(M)与 P(F)表示。以下假设条件中,_ 符合该教授的分析要求。a)原假设应该设为,H0:P(M)=P(F),并使用双侧检验b)原假设应该设为,H0:P(M)=P(F),并使用左侧检验c)原假设应该设为,H0:P(M)P(F),并使用左侧检验d)原假设应该设为,H0:P(M)P(F),并使用双侧检验3、与 RDBMS 相比,Apache Hadoop的一个不同之处在于_。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 4 页 -阿里云大学认证阿里云大数据行

4、业认证(ACP)考试样题2 a)RDBMS 只能将数据存储在同一磁盘上统一管理,而 Hadoop可以在不同磁盘上存储数据块,因此Hadoop可实现分布读写数据b)RDBMS 只能将数据存储在同一磁盘上统一管理,而 Hadoop可以在不同磁盘上存储数据块,因此Hadoop的可扩展性较强c)RDBMS 和 Hadoop都可以在多个磁盘上存储数据,但Hadoop不需要遵循ACID 特性,因此Hadoop可存储非结构化数据d)RDBMS 和 Hadoop都可以在多个磁盘上存储数据,但Hadoop可以利用低端硬件设备横向扩展,因此Hadoop的扩展成本较低4、2017 年,“新一线城市研究所”发布了最新

5、的中国城市等级划分。在进行划分时,使用了城市的经济实力、城市枢纽性与城市生活多样性等5 项指标作为评判标准,利用算法对全国各主要城市进行了重新划分。划分结果完全由各个城市在几个指标上的差异决定,这打破了传统的一、二、三线城市的划分规则,出现了一类“新一线”城市。这种划分算法属于_。a)聚类,可根据各城市之间的差异自动确定城市类别b)聚类,使用部分已划分好的城市作为训练集有监督学习c)分类,需要过往的城市等级划分作为标签无监督学习d)分类,可以使用K-means法进行划分5、ABC 电商公司非常关心用户从浏览到下单到支付的转化率,他们想分析不同性别的人在该流程中的转化率的差异,以下图表中_ 更适

6、合该场景。a)旋风漏斗图b)漏斗图c)矩阵树图名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 4 页 -阿里云大学认证阿里云大数据行业认证(ACP)考试样题3 d)瀑布图二、多选题1、数据管理技术在其发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。与文件系统阶段相比,数据库系统阶段对数据的管理方式有了许多方面的改进。这种改进体现在_。(正确答案个数:2 个)a)数据库系统提供了结构化查询语言,降低了数据管理、查询等操作的难度b)数据库系统在某种程度上保证了数据的一致性c)文件系统管理的数据量较少,而数据库系统可以管理庞大的数据量d)数据库系统比较复杂,而文件系统比较

7、简单e)文件系统可以更好的保存非格式化的数据,比如音频、视频等2、业务部门需要关闭一些销售情况不佳的门店,数据分析师小张按KPI 设计要求计算了各个门店上一季度的相关KPI,建议将KPI 指标最差的门店关闭。但业务部门认为无法凭借一个季度的KPI 决定哪家店需要关,而是需要前两年每个季度KPI 的同比结果来判断各个门店的业绩是上升的还是下降,才能决定关店。该分析方案设计有缺陷,小张很可能在实施项目前没有理解项目的_。(正确答案个数:2 个)a)目的b)范围c)风险d)绩效3、设计师小王参与了多个使用可视化工具制作可视化大屏的项目,他根据自己的经验总结了一些可视化大屏的基本设计原则,其中正确的有

8、_。(正确答案的数量:3 个)名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 4 页 -阿里云大学认证阿里云大数据行业认证(ACP)考试样题4 a)将大屏合理的拆解成多个板块,层次结构分明b)重点 KPI 放在突出位置,最好能辅以细节解释数据c)优先级越高的信息,越要放在中间和上方d)大屏中心是视觉核心区,必须放一个地图(平面或者3D 均可)提升视觉效果e)制作大屏时要遵循从上到下,从左到右的顺序f)尽可能在同一个大屏上增加更多的信息点,为受众提供更多的信息三、判断题1、MapReduce是一种编程模型,用于大规模数据的并行运算。它提供了一种简便的并行程序设计方法,用Map(映射

9、)和Reduce(归约)两个函数编程实现基本的并行计算任务。2、在决策树算法中,如果由于设置的决策树的分枝较少,或者训练集的样本量较小而导致模型的预测精度不足,可能是因为模型出现了过拟合的现象。3、MySQL数据库中有“customer”和“orders”两张表,两张表中有共同的字段“customer_id”。分析师小张在执行:select a.customer_id,a.gender,b.amount from customer as a full join orders as b on a.customer_id=b.customer_id查询后,发现部分输出数据的“customer_id”缺失,另外还有部分数据有重复记录。原因可能是部分“customer_id”在“customer”表中存在,但在“orders”表中不存在,并且“orders”表有重复“customer_id”。名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 4 页 -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号