19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业答卷

上传人:哼**** 文档编号:119658752 上传时间:2020-01-22 格式:DOC 页数:8 大小:30.50KB
返回 下载 相关 举报
19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业答卷_第1页
第1页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业答卷》由会员分享,可在线阅读,更多相关《19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业答卷(8页珍藏版)》请在金锄头文库上搜索。

1、19秋学期(1709、1803、1809、1903、1909)大数据开发技术(一)在线作业-0001试卷总分:100 得分:100一、单选题 (共 30 道试题,共 60 分)1.优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是()A.键值数据库B.文档数据库C.图数据库D.列族数据库答案:B2.以下哪种属于图数据库()A.RedisB.Neo4jC.MongoDBD.Hbase答案:B3.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.GlobalGrou

2、pingC.FiedlsGroupingD.AllGrouping答案:D4.以下哪个是HDFS的局限性()。A.数据集B.延迟C.吞吐率D.兼容性答案:B5.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.GlobalGroupingC.FiedlsGroupingD.AllGrouping答案:A6.以下说法不正确的是()。A.Zookeeper提供分布式锁之类的基本服务B.Sqoop主要被用于数据交互操作C.Mahout提供了分布式存储服务D

3、.Flume提供了日志管理服务答案:C7.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。A.N-1B.NC.M-1D.M答案:D8.Hbase中Zookeeper文件记录了()的位置A.RegionB.-ROOT-表C.MasterD.META.表答案:B9.Amazon SimpleDB属于()A.键值数据库B.数据仓库C.关系数据库D.NoSQL数据库答案:A10.UMP系统的哪个功能实现了负载均衡()A.资源隔离B.资源调度C.读写分离D.可扩展答案:C11.在Storm的工作流程中,对于Supervisor说法错误的是

4、()。A.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的NimbusB.Supervisor会通知自己的Worker进程进行Task的处理C.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会去Zookeeper集群上认领自己的Task答案:A12.HDFS中FSDataInputStream封装了()A.HDFSInputStreamB.FSInputStreamC.DataInputStreamD.DFSInputStream答案:D13.Storm中如果要保证相同字段的Tuple分配到同一个

5、Task中,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.GlobalGroupingC.FiedlsGroupingD.AllGrouping答案:C14.关于Hadoop集群网络拓扑,以下说法错误的是()。A.普通的Hadoop集群结构由一个两阶网络构成B.在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和C.一般来说机架内部网络环境比机架间网络环境好D.Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器答案:B15.列式数据库采用()存储模型A.NSMB.MySQLC.

6、HbaseD.DSM答案:D16.以下亚马逊的产品中哪个是NoSQL数据库A.SimpleDBB.RedshiftC.RDSD.DynamoDB答案:D17.UMP系统中面对分库分表用户如何进行资源调度()A.随机分配MySQL实例B.每个用户独占一个MySQL实例C.可以共享同一个MySQL实例D.会占用多个独立的MySQL实例答案:D18.Hbase中Zookeeper可以帮助选举出一个()作为集群的总管A.客户端B.SlaverC.RegionD.Master答案:D19.Amazon RDS属于()A.键值数据库B.数据仓库C.关系数据库D.NoSQL数据库答案:C20.Hadoop启

7、动所有进程的命令为()。A.start-all.shB.start-all.exeC.all-start.shD.all-start.exe答案:A21.信息技术发展史上的第三次信息化浪潮解决的问题是什么()。A.信息爆炸B.信息处理C.信息增长D.信息传输答案:A22.以下亚马逊的产品中哪个是键值数据库A.SimpleDBB.RedshiftC.RDSD.DynamoDB答案:A23.以下属于Hadoop2.0的特性是()。A.YARNB.SPARKC.MapReduceD.HDFS答案:A24.Xtimeline是哪种可视化工具()A.时间线工具B.地图工具C.分析工具D.信息图表答案:A

8、25.很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.静态B.实时C.存量D.动态答案:A26.MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。A.投影B.并C.差D.交答案:C27.以下哪种属于键值数据库()A.RedisB.Neo4jC.MongoDBD.Hbase答案:A28.UMP系统借助于()来实现高效和可靠的协同工作A.ZookeeperB.RabbitMQC.MnesiaD.LVS答案:A29.Storm中如果要让所有的Tuple都

9、发送到同一个Task中,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.GlobalGroupingC.FiedlsGroupingD.AllGrouping答案:B30.关于Hadoop集群,以下说法错误的是()。A.SecondaryNameNode可以和NameNode共用一台机器B.SecondaryNameNode可以和DataNode共用一台机器C.NameNode可以和JobTracker共用一台机器D.JobTracker指派的任务由TaskTracker执行答案:B二、多选题 (共 10 道试题,共 20 分)31.以下哪个是HDFS的

10、局限性()。A.用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加B.拥有复杂的数据模型C.延迟高D.只允许对文件执行追加操作,不能执行随机写操作答案:ACD32.以下哪种数据库属于NoSQL数据库()A.SimpleDBB.MongoDBC.GraphDBD.BigTable答案:ABCD33.以下哪个不是云数据库的特点A.高可用性B.高可扩展性C.本地存储D.支持资源有效分发答案:C34.Hbase的Region服务器中用户数据首先被写入到()A.客户端B.StoreFileC.MemStoreD.Hlog答案:CD35.以下亚马逊的产品中哪个属于存储部分

11、A.S3B.ELBC.EC2D.EBS答案:AD36.HDFS中NameNode保存的核心数据结构是()A.FsImageB.EditLogC.DataNodeD.Block答案:AB37.以下哪些是数据可视化信息图表工具()A.大数据魔镜B.Google Fusion TablesC.Google Chart APID.D3答案:ACD38.NoSQL数据库与关系数据库相比有哪些优势()A.支持事务ACID四性B.可以支持超大规模数据存储C.具有强大的横向扩展能力D.以完善的关系代数理论作为基础答案:BC39.MapReduce与传统并行计算框架的对比中,说法正确的是()。A.传统并行计算框

12、架适用于实时、细粒度计算B.传统并行计算框架比MapReduce硬件更加便宜C.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型D.MapReduce属于共享式集群架构,容错性好答案:AC40.HDFS的命名空间包含()A.节点B.目录C.文件D.块答案:BCD三、判断题 (共 10 道试题,共 20 分)41.NoSQL数据库可以完全取代关系数据库答案:错误42.HDFS中的NameNode的操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作答案:正确43.MapReduce和Spark都属于大数据批处理计算的产品。答案:正确注意:答案的顺序有可能和

13、你的题不一样 注意核对答案与选项售后或需要更多联系QQ1192235545 微信同步 44.大数据开发的两大核心技术是Hadoop和MapReduce答案:错误45.Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件答案:正确46.HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。答案:错误47.大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟答案:正确48.亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层答案:正确49.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记答案:正确50.感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。答案:正确答题时注意答案顺序

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 成考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号