南开大学21秋《大数据开发技术》在线作业三答案参考88

上传人:工**** 文档编号:454835775 上传时间:2023-11-12 格式:DOCX 页数:13 大小:13.94KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业三答案参考88_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考88_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考88_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考88_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考88_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业三答案参考88》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业三答案参考88(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业三答案参考1. 实现大整数的乘法是利用( )的算法。A.贪心法B.动态规划法C.分治策略D.回溯法参考答案:C2. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B3. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B4. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A5. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特

2、卡罗算法。( )A.错误B.正确参考答案:B6. BigTable采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B7. 大数据的特征是( )。A.数据体量大B.数据产生速度快C.数据种类多D.数据计算快E.数据价值高参考答案:ABCE8. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B9. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T10. 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是

3、( )A.0,numPartitionsB.0,numPartitions-1C.1,numPartitions-1D.1,numPartitions参考答案:B11. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A12. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B13. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loa

4、dFile参考答案:ABC14. Spark Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C15. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B16. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案:A17. 早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计

5、算框架。( )A.正确B.错误参考答案:A18. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B19. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D20. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A21. 分支限界法是一种只带有系统性的搜索算法。( )A.错误B.正确参

6、考答案:A22. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B23. 关于Map端Shuffle过程中的合并与归并,说法正确的是( )。A.两个键值对和,如果合并,会得到B.合并不会改变最终结果C.两个键值对和,如果归并,会得到D.两个键值对和,如果归并,会得到参考答案:ABD24. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案:B25. 按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。( )A.对B.错参考答案:A

7、26. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A27. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A28. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B29. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案:B30. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD31. Scala源代码被编译成( )字节码,所以它可以运行于JVM之上A.SparkB.ScalaC.JavaD.JDK参考答案:C32

8、. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A33. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B34. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply参考答案:ABCD35. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案:A36. MLlib 中可以调用mllib.tree.DecisionTr

9、ee 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参考答案:B37. 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。( )A.正确B.错误参考答案:B38. 流计算系统的需求有( )。A.实时性B.廉价C.高性能D.高带宽E.分布式参考答案:ACE39. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案:D40. Google C

10、hart API是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A41. 广度优先是什么的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A42. RDD的mapPartitions操作会导致Partitions数量的变化。( )A.正确B.错误参考答案:B43. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A44. UMP系通过( )来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.

11、Proxy服务器C.愚公系统D.Agent服务器参考答案:A45. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案:T46. Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。( )A.正确B.错误参考答案:A47. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB48. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A49. Map

12、Reduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D50. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F51. Spark可以从( )分布式文件系统中读取数据A.HDFSB.HbaseC.HiveD.Tachyon参考答案:ABCD52. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A53.

13、Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F54. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B55. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:A56. spark-submit配置项中( )表示executor内存大小A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:B57. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号