南开21春学期《大数据开发技术(一)》在线作业 2

上传人:奥鹏****师 文档编号:182906871 上传时间:2021-05-25 格式:DOC 页数:8 大小:30.50KB
返回 下载 相关 举报
南开21春学期《大数据开发技术(一)》在线作业 2_第1页
第1页 / 共8页
南开21春学期《大数据开发技术(一)》在线作业 2_第2页
第2页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开21春学期《大数据开发技术(一)》在线作业 2》由会员分享,可在线阅读,更多相关《南开21春学期《大数据开发技术(一)》在线作业 2(8页珍藏版)》请在金锄头文库上搜索。

1、21春学期(1709、1803、1809、1903、1909、2003、2009、2103)大数据开发技术(一)在线作业试卷总分:100 得分:100一、单选题 (共 30 道试题,共 60 分)1.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1答案:A2.SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层A.Client LayerB.Services LayerC.Platform LayerD.Infrastructure Layer答案:B3.MapReduce中

2、最优的Reduce任务个数取决于集群中可用的()的数目。A.SplitB.SlotC.MapD.Shuffle答案:B4.对于不同顶点之间的信息交换,Pregel采用了()A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息答案:C5.优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是()A.列族数据库B.键值数据库C.图数据库D.文档数据库答案:D6.优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()A.列族数据库B.键值数据库C.图数据库D.文档数据库答案:C7.UMP系统借助于()来实现高效和可靠的协同工作A.Mnesia

3、B.LVSC.RabbitMQD.Zookeeper答案:D8.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping答案:B9.UMP系统中面对分库分表用户如何进行资源调度()A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例答案:C10.以下不属于物联网关键技术的是()。A.RFIDB.传感器C.交换机D.矩阵式二维码答案:C11.关于S

4、torm中Topology说法错误的是()。A.Topology可视为流转换图B.Topology可以被提交到Storm集群执行C.在Topology里面可以指定每个组件的并行度, Storm会在集群里面分配那么多的线程来同时计算D.Topology里面的每一个组件都是串行运行的答案:D12.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping答案:A13.Hbase

5、中Zookeeper文件记录了()的位置A.META.表B.-ROOT-表C.RegionD.Master答案:B14.BigTable采用()作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统答案:B15.MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据并行答案:B16.Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD

6、.FiedlsGrouping答案:D17.Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()A.MasterB.RegionC.ZookeeperD.Chubby答案:A18.应用于分布式数据存储与管理 数据在地理上分布于多个数据中心的应用程序的数据库是哪种()A.列族数据库B.键值数据库C.图数据库D.文档数据库答案:A19.针对流数据,“量子恒道”开发了海量数据实时流计算框架()。A.Time TunnelB.SparkC.Super MarioD.Storm答案:C20.UMP系通过()来实现实现数据路由的基本功能A.Controller服务器B.Procy服务

7、器C.愚公系统D.Agent服务器答案:B21.()可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block答案:B22.以下哪种数据库适合于批量数据处理和即席查询()A.MySQLB.OracleC.HbaseD.NosSQL答案:C23.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby答案:C24.以下亚马逊的产品中哪

8、个是关系数据库A.RDSB.SimpleDBC.DynamoDBD.Redshift答案:A25.1秒定律体现了大数据的哪个特征()。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快答案:B26.HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量()冗余因子A.大于B.小于C.等于D.大于等于答案:B27.很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态答案:D28.MapReduce中()会周期性地通过“心跳”将本节点上资源的使用

9、情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker答案:D29.HDFS读数据过程中()具体实现了FileSystemA.DistributedFileSystemB.GFSSystemC.FileSystemD.HDFSSystem答案:A30.关于分布式并行编程,以下说法错误的是()。A.“摩尔定律”,CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上,可以并行

10、执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce答案:A二、多选题 (共 10 道试题,共 20 分)31.Hadoop配置文件中说法错误的是()。A.core-site.xml中hadoop.tmp.dir表示存放临时数据的目录,仅为NameNode的数据B.core-site.xml中fs.defaultFS表示HDFS路径的逻辑名称C.hdfs-site.xml中dfs.namenode.name.dir表示存储fsimage文件的地方D.hdfs-site.xml中dfs.replication表示副本的数量,伪分布式要设置为0E

11、.hdfs-site.xml中dfs.datanode.data.dir表示HDFS数据存放block的地方答案:AC32.MapReduce可以解决哪些计算问题()。A.矩阵乘法B.关系代数运算C.聚合运算D.关系投影运算答案:ABCD33.流计算系统的需求有()。A.实时性B.廉价C.高性能D.高带宽E.分布式答案:ACE34.以下亚马逊的产品中哪个属于存储部分A.EC2B.EBSC.S3D.ELB答案:BC35.MapReduce的main函数中设置输出类型的方法有()。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.s

12、etKeyValueClass答案:AC36.哪些属于数据可视化的重要作用()A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据答案:ACD37.大数据的特征是()。A.数据体量大B.数据产生速度快C.数据种类多D.数据计算快E.数据价值高答案:ABCE38.已得到广泛应用的分布式文件系统主要包括()。A.GFSB.MapReduceC.HbaseD.HDFS答案:AD39.HDFS中客户端在读取到数据后,会采用()对数据块进行校验,已确定正确性A.md5B.哈希桶C.sha1D.奇偶校验答案:AC40.以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎A.Giraph

13、B.PregelC.HamaD.DEX答案:ABC三、判断题 (共 10 道试题,共 20 分)41.文件块的大小和副本个数只能由系统指定。答案:错误42.Hbase和传统数据库一样都是列式数据库答案:错误43.数据产生方式的运营式系统阶段的数据产生方式是主动的。答案:错误44.亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层答案:正确45.Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储答案:错误46.云数据库不可以满足大企业的海量数据存储需求答案:错误47.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记答案:正确48.在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在答案:错误49.传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。答案:正确50.Storm框架是实时计算系统,所以不能使用数据库。答案:错误

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号