南开大学21秋《大数据开发技术》在线作业一答案参考79

上传人:大米 文档编号:497242108 上传时间:2022-08-17 格式:DOCX 页数:13 大小:13.71KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业一答案参考79_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考79_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考79_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考79_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考79_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业一答案参考79》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业一答案参考79(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业一答案参考1. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。( )A.对B.错参考答案:A2. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B3. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD4. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案:B5. Spark SQL读取的数据源支持( )

2、A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD6. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D7. UMP系统的哪个功能实现了负载均衡( )A.读写分离B.资源隔离C.资源调度D.可扩展参考答案:A8. Google Chart API是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A9. PairRDD可以通过( )获得仅包含键的RDDA.keyB.keysC.valueD.valu

3、es参考答案:B10. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C11. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:D12. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。

4、( )A.正确B.错误参考答案:A13. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答案:ABCD14. 针对流数据,“量子恒道”可处理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案:A15. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端参考答案:C16. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B17. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正

5、确B.错误参考答案:B18. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC19. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B20. RDD中join操作最后只返回两个RDD都存在的键的连接结果。( )A.正确B.错误参考答案:A21. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A22. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执

6、行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C23. Scala函数组合器中foreach和map类似,有返回值。( )A.正确B.错误参考答案:B24. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A25. Python是一种面向对象的解释型计算机程序设计语言。( )A.对B.错参考答案:A26. HDFS的命名空间包含( )A.节点B.目录C

7、.文件D.块参考答案:BCD27. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案:T28. 关系数据库的关键特性包括完善的事务机制和高效的查询机制。( )A.正确B.错误参考答案:A29. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案:A30. 交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。( )A.对B.错参考答案:A31. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A32. Spark的RDD持久化操作有(

8、)方式A.cacheB.presistC.storageD.long参考答案:AB33. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案:B34. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A35. Spark GraphX中类Graph的reverse方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:A36. HBase的客户端并不依赖Master,而是通过( )来获得

9、Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案:C37. 大数据的特征是( )。A.数据体量大B.数据产生速度快C.数据种类多D.数据计算快E.数据价值高参考答案:ABCE38. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.RegionD.Master参考答案:B39. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案:C

10、40. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A41. 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。( )A.正确B.错误参考答案:B42. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C43. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A44. 采用贪心算法的最优装载问

11、题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B45. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D46. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A47. Spark中DataFrame的查询操作也是一个懒操作,仅仅生成一个查询计划,只有触发Action操作才会进行计算并返回查询结果。( )A.正确B.错误参考答案:A48. Scala列表方法中将函数应用到列表的所有元素的方法是( )A.fi

12、lterB.foreachC.mapD.mkString参考答案:B49. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T50. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B51. 关于Map端Shuffle过程中的合并与归并,说法正确的是( )。A.两个键值对和,如果合并,会得到B.合并不会改变最终结果C.两个键值对和,如果归并,会得到D.两个键值对和,如果归并,会得到参考答案:ABD52. RDD中的collect 函数是

13、一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。( )T.对F.错参考答案:F53. 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A54. Scala列表方法中输出符号指定条件的所有元素的方法是( )A.dropB.headC.filterD.init参考答案:C55. ( )是Spark的核心,提供底层框架及核心支持A.Spark CoreB.Spark SQLC.Spark StreamingD.Mllib参考答案:A56. Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D57. 以下哪个方法可以创

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号