南开大学21秋《大数据开发技术》平时作业二参考答案85

资源描述

《南开大学21秋《大数据开发技术》平时作业二参考答案85》由会员分享，可在线阅读，更多相关《南开大学21秋《大数据开发技术》平时作业二参考答案85（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术平时作业二参考答案1. 对于不同顶点之间的信息交换，Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案：C2. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案：B3. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案：ABC4. 在图结构中，每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案：B5. Scala中高阶函数可以产生新的函数，并将新的函数作为返回值。( )T.对F.错参考答案：T6. 以下不可以使

2、用分治法求解的是( )。A.棋盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案：D7. Scala函数组合器可以对集合中的元素进行分组操作，结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案：C8. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案：C9. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案：A10. Hbase中( )是最核心的模块

3、，负责维护分配给自己的Region，并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端参考答案：C11. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案：D12. Hbase中缓存刷新，每次刷写都生成一个新的StoreFile文件，因此，每个Store包含多个StoreFile文件。( )A.正确B.错误参考答案：A13. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案：A14. Scala源代

4、码被编译成( )字节码，所以它可以运行于JVM之上A.SparkB.ScalaC.JavaD.JDK参考答案：C15. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案：A16. 键值对RDD由一组组的键值对组成，这些RDD被称为PairRDD。( )A.正确B.错误参考答案：A17. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案：B18. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案：ABCD19. 分布式离线分析可以实现秒级别的实时分析响应。( )A.正

5、确B.错误参考答案：B20. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案：B21. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序，故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案：B22. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案：ABCD23. 贪心选择性质是贪心算法可行的第一个基本要素，也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案：B24. 以下哪种方法可以让Spark不自定义

6、分区也能对任何类型RDD 简单重分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案：BD25. Scala函数组合器可以通过一个函数重新计算列表中所有元素，并且返回一个相同数目元素的新列表的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案：A26. MLlib中Normalizer是一个转换器，它可以将多行向量输入转化为统一的形式。( )T.对F.错参考答案：T27. HDFS中当一些数据节点不可用时，会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案：B28

7、. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案：ABC29. 0-1背包问题的回溯算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案：A30. 程序是算法用某种程序设计语言的具体实现。( )A.错误B.正确参考答案：B31. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案：B32. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案：A33. Scala列表中last返回列表最后一个元素。( )A.正确B.错误参考答案：A34. 以下哪个方法可以创建

8、RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案：ABC35. Spark Streaming中时间片也可称为批处理时间间隔(batch interval)，时间片是人为地对数据进行定量的标准，作为拆分数据的依据，一个时间片的数据对应一个RDD实例。( )A.正确B.错误参考答案：A36. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答案：ABCD37. Python是一种面向对象的解释型计算机程序设计语言。( )A.对B.错参考答案：A38. Scala函数组合器可以接收一个可以处理嵌

9、套列表的函数，然后把返回结果连接起来的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案：D39. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案：BCD40. 传统数据处理流程，用户需要主动发起查询或者定时查询;流处理流程中，可以实时查询。( )A.正确B.错误参考答案：A41. 下列算法中通常以自底向上的方式求解最优解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案：B42. 大数据智能感知层：主要包括( )及软硬件资源接入系统。A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系参考答案：ABCD43.

10、DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案：A44. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案：A45. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案：D46. 数据集成(Data Integration)是将多个数据源中的数据合并存放

11、到一个一致的数据存储中，数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案：A47. Scala是一种纯面向对象的语言，每个值都是对象。( )T.对F.错参考答案：T48. ( )和( )，它们把原数据变换或投影到较小的空间。A.小波变换B.中心化变换C.主成分分析D.对数变换参考答案：AC49. Spark中DataFrame的( )方法是进行排序查询A.order byB.group byC.select byD.sort by参考答案：A50. Mllib中metrics.fMeasureByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲

12、线参考答案：C51. GraphX中( )方法可以查询度数A.degreesB.degreeC.verticesD.edges参考答案：A52. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案：B53. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案：F54. 请问RDD的( )操作用于将相同键的数据聚合A.joinB.zipC.combineByKeyD.collect参考答案：C55. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案：C56. Gra

13、phX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案：C57. RDD中join操作最后只返回两个RDD都存在的键的连接结果。( )A.正确B.错误参考答案：A58. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案：A59. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案：BCD60. PairRDD中mapValues是针对键值对(Key，Value)类型的数据中的key和Value进行Map操作。( )T.对F.错参考

展开阅读全文