03-Spark测试试卷

上传人:简****9 文档编号:111785553 上传时间:2019-11-03 格式:DOC 页数:4 大小:81.50KB
返回 下载 相关 举报
03-Spark测试试卷_第1页
第1页 / 共4页
03-Spark测试试卷_第2页
第2页 / 共4页
03-Spark测试试卷_第3页
第3页 / 共4页
03-Spark测试试卷_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《03-Spark测试试卷》由会员分享,可在线阅读,更多相关《03-Spark测试试卷(4页珍藏版)》请在金锄头文库上搜索。

1、Spark培训试卷模块1:不定项选题 (100分,每题5分)1.关于数据及软件架构的CAP理论不包括下面哪些( D )A.可用性B.一致性C.分区容忍性D.分布性2下列关于spark中的RDD描述正确的有 ( ABCD )A.RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象B.Resilient:表示弹性的,弹性表示C.Destributed:分布式,可以并行在集群计算D.Dataset:就是一个集合,用于存放数据的3. 下列哪些是面向对象技术的特征( ABC )A封装B继承C多态D分布性4. 下列描述正确的是( ABD

2、)A进程(Process)是程序的一次执行过程B线程(Thread) 是比进程更小的执行单位C 线程不可共享相同的内存单元D在同一个应用程序中可以有多个线程同时执行5. 下面哪些是spark比Mapreduce计算快的原因( ABC )A.基于内存的计算B.基于DAG的调度框架C.基于Lineage的容错机制D.基于分布式计算的框架6.下面哪个操作是窄依赖?( B )A.join B.filter C.group D.sort 7.下面哪个操作肯定是宽依赖 ( C )A. map B. flatMap C. reduceByKey D. sample8.最早是Cloudera提供的日志收集系统

3、,目前是Apache下的一个孵化项目,支持在日志系统中定制各类数据发送方,用于收集数据的工具是( A )A.FlumeB.ZookeeperC.StormD.Sparkstreaming9.一个分布式应用程序协调服务,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等的工具有 ( B )A.FlumeB.ZookeeperC.StormD.Sparkstreaming10.作为分布式消息队列,既有非常优秀的吞吐量,又有较高的可靠性和扩展性,同时接受Spark Streaming的请求,将流量日志按序发送给Spark Streaming集群是 ( C )A.FlumeB.Zookeepe

4、rC.KafkaD.Sparkstreaming11. Hadoop框架的缺陷有( ABC )AMR编程框架的限制B过多的磁盘操作,缺乏对分布式内存的支持C无法高效低支持迭代式计算D海量的数据存储12. Hadoop组件的核心功能包括( AD )A、分布式数据存储 B、分析 C、挖掘 D、分布式计算 13. DataFrame 和 RDD 最大的区别 ( B )A.科学统计支持B.多了 schema C.存储方式不一样 D.外部数据源支持14. spark中默认的存储级别 ( A )A. MEMORY_ONLY B. MEMORY_ONLY_SERC. MEMORY_AND_DISK D. M

5、EMORY_AND_DISK_SER15. Spark组成部件包括( BC )A.Resource ManagerB.ExecutorC.DriverD.RDD16. Spark RDD的依赖机制包括( AD )A. 宽依赖B. 深度依赖C.广度依赖D.窄依赖17.RDD有哪些缺陷? ADA.不支持细粒度的写和更新操作(如网络爬虫)B.基于内存的计算C.拥有schema信息D.不支持增量迭代计算18.Spark应用的计算逻辑会被解析成DAG,这个解析操作由以下哪个功能模块完成( CD )A.ClientB.ApplicationMasterC.ExecutorD.Driver 19.spark

6、的部署模式有? ABCDA.本地模式B.standalone 模式C.spark on yarn 模式D.mesos模式20.下面不是Spark 的四大组件的有( BD )A. Spark Streaming B. pyspark 为了用Spark支持Python,Apache Spark社区发布了一个工具PySparkC. Graphx D. Spark RSparkR是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用ApacheSparkSpark 的四大组件有:SparkSQL、SparkStreaming、MLlib、GraphX-选择题答案1 D2 ABCD3 ABC4 ABD5 ABC6 B7 C8A9B10C11ABC12AD13B14A15BC16AD17AD18CD19ABCD20BD4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号