南开大学21秋《大数据开发技术》在线作业一答案参考79

资源描述

《南开大学21秋《大数据开发技术》在线作业一答案参考79》由会员分享，可在线阅读，更多相关《南开大学21秋《大数据开发技术》在线作业一答案参考79（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业一答案参考1. 聚类分析(Cluster analysis)简称聚类(Clustering)，是把数据对象划分成子集(类)的过程，每个子集称为一个簇(Cluster)。( )A.对B.错参考答案：A2. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案：B3. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案：ACD4. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案：B5. Spark SQL读取的数据源支持( )

2、A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案：ABCD6. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案：D7. UMP系统的哪个功能实现了负载均衡( )A.读写分离B.资源隔离C.资源调度D.可扩展参考答案：A8. Google Chart API是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案：A9. PairRDD可以通过( )获得仅包含键的RDDA.keyB.keysC.valueD.valu

3、es参考答案：B10. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案：C11. Dstream窗口操作中( )方法基于滑动窗口对(K，V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作，得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案：D12. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。

4、( )A.正确B.错误参考答案：A13. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答案：ABCD14. 针对流数据，“量子恒道”可处理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案：A15. Hbase中( )是最核心的模块，负责维护分配给自己的Region，并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端参考答案：C16. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案：B17. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正

5、确B.错误参考答案：B18. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案：AC19. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案：B20. RDD中join操作最后只返回两个RDD都存在的键的连接结果。( )A.正确B.错误参考答案：A21. 大数据技术也能帮助政府进行支出管理，透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案：A22. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执

6、行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色，Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案：C23. Scala函数组合器中foreach和map类似，有返回值。( )A.正确B.错误参考答案：B24. 批处理系统关注( )，流处理系统关注( )。A.吞吐率，延时B.延时，吞吐率C.延时，速度D.速度，吞吐率参考答案：A25. Python是一种面向对象的解释型计算机程序设计语言。( )A.对B.错参考答案：A26. HDFS的命名空间包含( )A.节点B.目录C

7、.文件D.块参考答案：BCD27. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案：T28. 关系数据库的关键特性包括完善的事务机制和高效的查询机制。( )A.正确B.错误参考答案：A29. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案：A30. 交通数据的来源包括车辆GPS数据，人类移动的GPS位置信息或者单位站点记录，和监视设备的视频图像技术记录。( )A.对B.错参考答案：A31. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案：A32. Spark的RDD持久化操作有(

8、)方式A.cacheB.presistC.storageD.long参考答案：AB33. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案：B34. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案：A35. Spark GraphX中类Graph的reverse方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性D.合并边相同的属性参考答案：A36. HBase的客户端并不依赖Master，而是通过( )来获得

9、Region位置信息，大多数客户端甚至从来不和Master通信，这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案：C37. 大数据的特征是( )。A.数据体量大B.数据产生速度快C.数据种类多D.数据计算快E.数据价值高参考答案：ABCE38. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.RegionD.Master参考答案：B39. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案：C

10、40. 关联分析又称为关联规则学习。( )A.对B.错参考答案：A41. 在HBase中，更新操作会用最新的当前值去替换记录中原来的旧值，旧值被覆盖后就不会存在。( )A.正确B.错误参考答案：B42. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性D.合并边相同的属性参考答案：C43. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案：A44. 采用贪心算法的最优装载问

11、题的主要计算量在于将集装箱依其重量从小到大排序，故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案：B45. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案：D46. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案：A47. Spark中DataFrame的查询操作也是一个懒操作，仅仅生成一个查询计划，只有触发Action操作才会进行计算并返回查询结果。( )A.正确B.错误参考答案：A48. Scala列表方法中将函数应用到列表的所有元素的方法是( )A.fi

12、lterB.foreachC.mapD.mkString参考答案：B49. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案：T50. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案：B51. 关于Map端Shuffle过程中的合并与归并，说法正确的是( )。A.两个键值对和，如果合并，会得到B.合并不会改变最终结果C.两个键值对和，如果归并，会得到D.两个键值对和，如果归并，会得到参考答案：ABD52. RDD中的collect 函数是

13、一个行动操作，把RDD 所有元素转换成数组并返回到Driver 端，适用于大数据处理后的返回。( )T.对F.错参考答案：F53. 大数据计算处理方法主要分为两种方法，即批处理方法和流处理方法。( )A.正确B.错误参考答案：A54. Scala列表方法中输出符号指定条件的所有元素的方法是( )A.dropB.headC.filterD.init参考答案：C55. ( )是Spark的核心，提供底层框架及核心支持A.Spark CoreB.Spark SQLC.Spark StreamingD.Mllib参考答案：A56. Storm中如果要保证相同字段的Tuple分配到同一个Task中，应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案：D57. 以下哪个方法可以创

展开阅读全文

南开大学21秋《大数据开发技术》在线作业一答案参考79

最新文档