南开大学21春《大数据开发技术》在线作业二满分答案87

上传人:s9****2 文档编号:493716009 上传时间:2023-07-22 格式:DOCX 页数:13 大小:14.33KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业二满分答案87_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案87_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案87_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案87_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案87_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业二满分答案87》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业二满分答案87(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业二满分答案1. MLBase包括( )A.MllibB.MLIC.SparkRD.GraphX参考答案:AB2. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案:B3. Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A4. 图的结构通常表示为:G(V,E),其中,G表示( )A.图B.子图C.顶点D.边参考答案:A5. Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是( )A

2、.filterB.flattenC.groubyD.flatmap参考答案:A6. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A7. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C8. 动态规划算法的基本思想是将待求解问题分解成若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解。( )A.错误B.正确参考答案:B9. Scala函数组合器中groupBy是对集合

3、中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A10. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端参考答案:C11. Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来。( )A.正确B.错误参考答案:A12. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.

4、Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C13. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B14. Spark的RDD持久化操作有( )方式A.cacheB.presistC.storageD.long参考答案:AB15. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )A.对B.错参考答案:A16. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C

5、17. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:D18. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD19. 请问RDD的( )操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect参考答案:A20. 以下亚马逊的产品中哪个

6、属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案:BC21. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案:B22. UMP系统的哪个功能实现了负载均衡( )A.读写分离B.资源隔离C.资源调度D.可扩展参考答案:A23. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A24. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B25. ( )是Spar

7、k的核心,提供底层框架及核心支持A.Spark CoreB.Spark SQLC.Spark StreamingD.Mllib参考答案:A26. Spark Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C27. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB28. 数据产生方式变革中数据产生方式是被动的主要是来

8、自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A29. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD30. 一个问题可用动态规划算法或贪心算法求解的关键特征是问题的( )。A.重叠子问题B.最优子结构性质C.贪心选择性质D.定义最优解参考答案:B31. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B32. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduc

9、eByKey参考答案:BC33. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A34. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟。( )A.正确B.错误参考答案:A35. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B36. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C37. 下列算法中不能解决0/1背包问题的是( )。A

10、.贪心法B.动态规划C.回溯法D.分支限界法参考答案:A38. RDD是一个( )的数据结构A.可读写B.只读的C.容错的D.可进行并行操作的参考答案:BCD39. spark-submit配置项中( )表示executor内存大小A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:B40. SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD。( )A.正确B.错误参考答案:B41. Spark Streming中( )函数可以

11、合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案:D42. 关系数据库与NoSQL数据库相比有哪些优势( )A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力参考答案:AC43. Graph类中如果根据边数据创建图,数据需要转换成RDDEdgeED类型,应该用( )方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue

12、)C.Graph.fromEdgeTuples(rawEdges: RDD(VertexId, VertexId), defaultValueD.GraphLoader.edgeListFile(sc,filename)参考答案:B44. 下面哪种函数是回溯法中为避免无效搜索采取的策略?( )A.递归函数B.剪枝函数C.随机数函数D.搜索函数参考答案:B45. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:C46. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇

13、报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D47. Spark只有键值对类型的RDD才能设置分区方式。( )A.正确B.错误参考答案:A48. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B49. Spark Streming中( )函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W)键值对的一个新 DStream。A.unionB.reduceC.joinD.cogroup参考答案:D50. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案:D51. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A52. Spark Streming中( )函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号