南开大学21秋《大数据开发技术》在线作业三答案参考65

上传人:博****1 文档编号:470110612 上传时间:2023-05-29 格式:DOCX 页数:13 大小:13.89KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业三答案参考65_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考65_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考65_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考65_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考65_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业三答案参考65》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业三答案参考65(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业三答案参考1. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B2. SQL Azure体系结构层中哪层是硬件和操作系统( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:D3. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案:C4. RDD中zip操作要求两个RDD的partition数量以及元素数量都

2、相同。( )T.对F.错参考答案:T5. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B6. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案:B7. TF-IDF中TF指的是( )A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率参考答案:AB8. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T9. Scala类通过子类化和基于灵活的混合类来进行扩展,作为( )的一个可靠性解决方案

3、A.多态B.虚函数C.派生D.多重继承参考答案:D10. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )A.对B.错参考答案:A11. Spark的RDD持久化操作有( )方式A.cacheB.presistC.storageD.long参考答案:AB12. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B13. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B14. Spark中Da

4、taFrame的( )方法是进行排序查询A.order byB.group byC.select byD.sort by参考答案:A15. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.RegionD.Master参考答案:B16. Scala列表方法中将函数应用到列表的所有元素的方法是( )A.filterB.foreachC.mapD.mkString参考答案:B17. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参

5、考答案:A18. Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:D19. 已得到广泛应用的分布式文件系统主要包括( )。A.GFSB.MapReduceC.HbaseD.HDFS参考答案:AD20. Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。( )A.正确B.错误参考答案:A21. 优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是( )A.列族数据库B.键值数据库C.图数据库D.文

6、档数据库参考答案:D22. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD23. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。( )A.正确B.错误参考答案:A24. 请问RDD的( )操作用于将相同键的数据聚合A.joinB.zipC.combineByKeyD.collect参考答案:C25. 以下不可以使用分治法求解的是( )。A.棋

7、盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案:D26. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端参考答案:C27. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B28. Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F29. Spark DataFrame中( )方法可以返回一个ListA.collectB.takeC.takeAsListD.collectAsList

8、参考答案:CD30. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B31. 矩阵连乘问题的算法可由动态规划设计实现。( )A.错误B.正确参考答案:B32. Scala列表方法中丢弃前n个元素,并返回新列表的方法是( )A.dropB.headC.filterD.init参考答案:A33. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )T.对F.错参考答案:F34. Spark持久化RDD后,在再一次需要计算该RDD时将需要重新计算。( )A.正确B.错误参考答案:B35. 关于分布式并

9、行编程,以下说法错误的是( )。A.“摩尔定律”,CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce参考答案:A36. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A37. 广度优先是什么的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A38. Dstream窗口操作中( )方

10、法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:C39. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B40. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:A41. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD42. Scala函数

11、组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F43. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B44. 请问RDD的( )操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect参考答案:A45. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platfo

12、rm. LayerD.Infrastructure Layer参考答案:A46. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B47. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD48. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD49. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A

13、.对B.错参考答案:A50. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B51. 下列属于传统统计学展示方法的是( )。A.柱状图B.饼状图C.曲线图D.网络图参考答案:ABC52. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A53. RDD是一个( )的数据结构A.可读写B.只读的C.容错的D.可进行并行操作的参考答案:BCD54. HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。( )A.正确B.错误参考答案:A55. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB56. Scala中合并两个数组的方法是( )A.lineB.addC.appendD.concat参考答案:D

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号