奥鹏南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业

上传人:A11****业论文 文档编号:120276117 上传时间:2020-02-06 格式:DOC 页数:10 大小:51KB
返回 下载 相关 举报
奥鹏南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业_第1页
第1页 / 共10页
奥鹏南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业_第2页
第2页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《奥鹏南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业》由会员分享,可在线阅读,更多相关《奥鹏南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业(10页珍藏版)》请在金锄头文库上搜索。

1、19秋学期(1709、1803、1809、1903、1909)大数据开发技术(一)在线作业优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活提供嵌入式文档功能的数据库是()A.列族数据库B.键值数据库C.图数据库D.文档数据库正确答案:D以下哪种属于图数据库()A.MongoDBB.RedisC.HbaseD.Neo4j正确答案:DStorm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种StreamGroupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping正确答案:B以下哪个是HDF

2、S的局限性()。A.吞吐率B.数据集C.兼容性D.延迟正确答案:DStorm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种StreamGroupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping正确答案:A以下说法不正确的是()。A.Zookeeper提供分布式锁之类的基本服务B.Mahout提供了分布式存储服务C.Flume提供了日志管理服务D.Sqoop主要被用于数据交互操作正确答案:BMapReduce将输入文件切分成M个分片,Maste

3、r将其中()个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1正确答案:AHbase中Zookeeper文件记录了()的位置A.META.表B.-ROOT-表C.RegionD.Master正确答案:BAmazonSimpleDB属于()A.关系数据库B.键值数据库C.NoSQL数据库D.数据仓库正确答案:BUMP系统的哪个功能实现了负载均衡()A.读写分离B.资源隔离C.资源调度D.可扩展正确答案:A在Storm的工作流程中,对于Supervisor说法错误的是()。A.Supervisor会去Zookeeper集群上认领自己的TaskB.Supervisor节

4、点首先将提交的Topology进行分片,分成一个个Task,分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Worker进程进行Task的处理正确答案:BHDFS中FSDataInputStream封装了()A.HDFSInputStreamB.DFSInputStreamC.DataInputStreamD.FSInputStream正确答案:BStorm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种StreamGroupings()。A.ShuffleGroupingB.AllG

5、roupingC.GlobalGroupingD.FiedlsGrouping正确答案:D关于Hadoop集群网络拓扑,以下说法错误的是()。A.普通的Hadoop集群结构由一个两阶网络构成B.Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器C.在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和D.一般来说机架内部网络环境比机架间网络环境好正确答案:C列式数据库采用()存储模型A.NSMB.DSMC.HbaseD.MySQL正确答案:B以下亚马逊的产品中哪个是NoSQL数据库A.RDSB.SimpleDBC.Dyn

6、amoDBD.Redshift正确答案:CUMP系统中面对分库分表用户如何进行资源调度()A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例正确答案:CHbase中Zookeeper可以帮助选举出一个()作为集群的总管A.MasterB.SlaverC.RegionD.客户端正确答案:AAmazonRDS属于()A.关系数据库B.键值数据库C.NoSQL数据库D.数据仓库正确答案:AHadoop启动所有进程的命令为()。A.all-start.shB.all-start.exeC.start-all.shD.start

7、-all.exe正确答案:C信息技术发展史上的第三次信息化浪潮解决的问题是什么()。A.信息处理B.信息增长C.信息爆炸D.信息传输正确答案:C以下亚马逊的产品中哪个是键值数据库A.RDSB.SimpleDBC.DynamoDBD.Redshift正确答案:B以下属于Hadoop2.0的特性是()。A.MapReduceB.HDFSC.YARND.SPARK正确答案:CXtimeline是哪种可视化工具()A.信息图表B.地图工具C.时间线工具D.分析工具正确答案:C很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静

8、态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态正确答案:DMapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。A.投影B.差C.交D.并正确答案:B以下哪种属于键值数据库()A.MongoDBB.RedisC.HbaseD.Neo4j正确答案:BUMP系统借助于()来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper正确答案:DStorm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种StreamGroupings()。A.ShuffleGroupingB.AllGroupingC.Glo

9、balGroupingD.FiedlsGrouping正确答案:C关于Hadoop集群,以下说法错误的是()。A.SecondaryNameNode可以和NameNode共用一台机器B.JobTracker指派的任务由TaskTracker执行C.SecondaryNameNode可以和DataNode共用一台机器D.NameNode可以和JobTracker共用一台机器正确答案:C以下哪个是HDFS的局限性()。A.延迟高B.只允许对文件执行追加操作,不能执行随机写操作C.用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加D.拥有复杂的数据模型正确答案:AB

10、C以下哪种数据库属于NoSQL数据库()A.SimpleDBB.BigTableC.MongoDBD.GraphDB正确答案:ABCD以下哪个不是云数据库的特点A.高可扩展性B.高可用性C.支持资源有效分发D.本地存储正确答案:DHbase的Region服务器中用户数据首先被写入到()A.MemStoreB.HlogC.StoreFileD.客户端正确答案:AB以下亚马逊的产品中哪个属于存储部分A.EC2B.EBSC.S3D.ELB正确答案:BCHDFS中NameNode保存的核心数据结构是()A.FsImageB.DataNodeC.BlockD.EditLog正确答案:AD以下哪些是数据可

11、视化信息图表工具()A.大数据魔镜B.D3C.GoogleChartAPID.GoogleFusionTables正确答案:ABCNoSQL数据库与关系数据库相比有哪些优势()A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力正确答案:BDMapReduce与传统并行计算框架的对比中,说法正确的是()。A.MapReduce属于共享式集群架构,容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型正确答案:CDHDF

12、S的命名空间包含()A.节点B.目录C.文件D.块正确答案:BCDNoSQL数据库可以完全取代关系数据库T.对F.错正确答案:BHDFS中的NameNode的操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作T.对F.错正确答案:AMapReduce和Spark都属于大数据批处理计算的产品。T.对F.错正确答案:A大数据开发的两大核心技术是Hadoop和MapReduceT.对F.错正确答案:BHbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件T.对F.错正确答案:AHDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。T.对F.错正确答案:B大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟T.对F.错正确答案:A亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层T.对F.错正确答案:AHbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记T.对F.错正确答案:A感知式系统的广泛使用人类社会数据量第三次大的飞跃最终导致了大数据的产生。T.对F.错正确答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号