南开大学22春《大数据开发技术》离线作业一及答案参考56

资源描述

《南开大学22春《大数据开发技术》离线作业一及答案参考56》由会员分享，可在线阅读，更多相关《南开大学22春《大数据开发技术》离线作业一及答案参考56（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术离线作业一及答案参考1. 流计算系统的需求有( )。A.实时性B.廉价C.高性能D.高带宽E.分布式参考答案：ACE2. Scala在子类中重写超类的抽象方法时，需要使用override关键字。( )T.对F.错参考答案：F3. Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案：B4. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案：A5. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F

2、.错参考答案：T6. 很多企业为了支持决策分析而构建的数据仓库系统，其中存放的大量历史数据就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案：D7. Scala中高阶函数可以产生新的函数，并将新的函数作为返回值。( )T.对F.错参考答案：T8. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案：D9. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案：B10.

3、 Scala通过( )来定义变量A.valB.valC.defineD.def参考答案：A11. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案：A12. 分治法与动态规划法的不同点是：适合于用动态规划法求解的问题，经分解得到的子问题往往不是互相独立的。而用分治法求解的问题，经分解得到的子问题往往是互相独立的。( )A.错误B.正确参考答案：B13. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.u

4、nion参考答案：A14. Spark Streming中( )函数可以合并两个DStream，生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案：D15. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案：ACD16. 以下亚马逊的产品中哪个属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案：BC17. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案：F18. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参

5、考答案：T19. 批处理系统关注( )，流处理系统关注( )。A.吞吐率，延时B.延时，吞吐率C.延时，速度D.速度，吞吐率参考答案：A20. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案：ABCD21. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树参考答案：A22. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD，但是转换操作是懒操作，不会立刻执行计算。( )A.正确B.错误参考答案：B23. Scala函数组合器中filter过滤移除使得传入的函数的

6、返回值为true的元素。( )A.正确B.错误参考答案：B24. 大数据智能感知层：主要包括( )及软硬件资源接入系统。A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系参考答案：ABCD25. MspReduce中的Map和Reduce函数使用( )进行输入输出。A.key/value对B.随机数值C.其他计算结果参考答案：A26. Spark只有键值对类型的RDD才能设置分区方式。( )A.正确B.错误参考答案：A27. 解决0/1背包问题可以使用动态规划、回溯法和分支限界法，其中不需要排序的是动态规划，需要排序的是回溯法，分支限界法。( )A.错误B.正确参考答案：B28.

7、 RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案：T29. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案：ABCD30. MLBase包括( )A.MllibB.MLIC.SparkRD.GraphX参考答案：AB31. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案：B32. 优点是性能好(高并发)，灵活性高，复杂性低，数据结构灵活提供嵌入式文档功能的数据库是( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案：D33. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法

8、是( )A.filterB.foreachC.mapD.mkString参考答案：D34. 图结构中如果任意两个顶点之间都存在边，那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案：A35. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案：B36. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案：B37. Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。( )A.正确

9、B.错误参考答案：B38. 已得到广泛应用的分布式文件系统主要包括( )。A.GFSB.MapReduceC.HbaseD.HDFS参考答案：AD39. 在HBase中，更新操作会用最新的当前值去替换记录中原来的旧值，旧值被覆盖后就不会存在。( )A.正确B.错误参考答案：B40. RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD。( )A.正确B.错误参考答案：A41. HDFS中当一些数据节点不可用时，会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案：B42. 大数据计算处理方法主要分为两种方法，即批处理方法和流处理方法。( )A.正

10、确B.错误参考答案：A43. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案：T44. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中，数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案：A45. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案：B46. RDD的sortBy排序默认是升序。( )T.对F.错参考答案：T47. Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值。( )A.正确B.错误参考答案：B48. Spark可以从( )分布式文件系统中

11、读取数据A.HDFSB.HbaseC.HiveD.Tachyon参考答案：ABCD49. Mllib中metrics.recallByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案：B50. 使用回溯法进行状态空间树裁剪分支时一般有两个标准：约束条件和目标函数的界，N皇后问题和0/1背包问题正好是两种不同的类型，其中同时使用约束条件和目标函数的界进行裁剪的是0/1背包问题，只使用约束条件进行裁剪的是N皇后问题。( )A.错误B.正确参考答案：B51. NoSQL数据库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数

12、据分析参考答案：CD52. RDD是一个可读写的数据结构。( )T.对F.错参考答案：F53. 以下哪个函数可以对RDD进行去重( )A.sortByB.filterC.distinctD.intersection参考答案：C54. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply参考答案：ABCD55. Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。( )T.对F.错参考答案：F56. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D

13、.12参考答案：B57. 如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是( )A.0，numPartitionsB.0，numPartitions-1C.1，numPartitions-1D.1，numPartitions参考答案：B58. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案：A59. 以下属于Hadoop的安装方式的有( )。A.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式参考答案：ACE60. PairRDD的( )方法，可以把两个RDD中键相同的元素组合在一起，合并为一个RDD。A.joinB.unionC.substractD.intersection

展开阅读全文