南开大学22春《大数据开发技术》离线作业二及答案参考3

资源描述

《南开大学22春《大数据开发技术》离线作业二及答案参考3》由会员分享，可在线阅读，更多相关《南开大学22春《大数据开发技术》离线作业二及答案参考3（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术离线作业二及答案参考1. Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。( )T.对F.错参考答案：F2. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper参考答案：D3. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案：A4. var a=10; do a+=1;

2、 while(a20) 共循环了( )次A.9B.10C.11D.12参考答案：B5. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker，同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案：D6. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案：

3、A7. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案：B8. 大数据智能感知层：主要包括( )及软硬件资源接入系统。A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系参考答案：ABCD9. 关联分析又称为关联规则学习。( )A.对B.错参考答案：A10. Spark Streming中DStream可以通过外部数据源(Kafka，Flume，Twitter等)来获取，也可以通过现有DStream的高级操作(Transformation操作)获得。( )A.正确B.错误参考答案：A11. 数据仓

4、库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案：B12. Spark Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算，如果func函数返回结果为true，则保留该元素，否则丢弃该元素，返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案：C13. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案：C14. Scala中如果函数无返回值，则函数返回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案：

5、D15. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案：B16. Scala函数组合器中groupBy是对集合中的元素进行分组操作，结果得到的是一个Map。( )A.正确B.错误参考答案：A17. MongoDB将数据存储为一个( )A.关系B.属性C.字段D.文档参考答案：D18. 数据采集，又称数据获取，是大数据生命周期的第一个环节，通过RFID.射频识别技术，传感器，交互型社交网络，移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案：A19. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度

6、快C.数据存储快D.数据计算快参考答案：B20. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案：A21. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案：T22. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案：ABCD23. 非结构化数据是指非纯文本类数据，没有标准格式，无法直接解析出相应的值。( )A.对B.错参考答案：A24. SparkContext类中makeRDD方法

7、不可将单机数据创建为分布式RDD。( )A.正确B.错误参考答案：B25. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树参考答案：A26. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案：A27. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案：C28. 实现棋盘覆盖算法利用的算法是( )。A.

8、分治法B.动态规划法C.贪心法D.回溯法参考答案：A29. RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。( )A.正确B.错误参考答案：A30. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案：A31. Scala中如果函数中的每个参数在函数中最多只出现一次，则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案：B32. Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑，还要解决实时数据获取、传输、存储。( )A.正确B.错误参考答案：B33. 以下属于Hadoop的安装方式的有( )。A

9、.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式参考答案：ACE34. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案：T35. 图结构中如果任意两个顶点之间都存在边，那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案：A36. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案：F37. 传统数据处理流程，用户需要主动发起查询或者定时查询;流处理流程中，可以实时查询。( )A.正确B.错误参考答案：A38. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操

10、作数据库等任何操作B.Bolt是一个被动的角色，Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案：C39. 贪心选择性质是贪心算法可行的第一个基本要素，但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案：A40. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案：B41. Spark创建DataFrame对象方式有( )A.结构化数据文件B.外部数据库C.RDDD.Hive中的表参考答案：ABCD42. 交通数据的来源包括车辆G

11、PS数据，人类移动的GPS位置信息或者单位站点记录，和监视设备的视频图像技术记录。( )A.对B.错参考答案：A43. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案：AC44. 关于Map端Shuffle过程中的合并与归并，说法正确的是( )。A.两个键值对和，如果合并，会得到B.合并不会改变最终结果C.两个键值对和，如果归并，会得到D.两个键值对和，如果归并，会得到参考答案：ABD45. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中，也可以

12、运行在云计算环境中B.Hadoop自带有一套脚本，用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazon EC2为Hadoop提供了存储服务参考答案：D46. HBase的客户端并不依赖Master，而是通过( )来获得Region位置信息，大多数客户端甚至从来不和Master通信，这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案：C47. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案：C48. 以深度优先方式系统搜索问题

13、解的算法称为回溯法。( )A.错误B.正确参考答案：B49. ( )可以解决图计算问题A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案：C50. 流计算是针对流数据的实时计算，可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案：ABCD51. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案：B52. 关系数据库的关键特性包括完善的事务机制和高效的查询机制。( )A.正确B.错误参考答案：A53. Scala列表方法中将函数应用到列表的所有元素的方法是( )A.filterB.foreachC.mapD.mkString参考答案：B54. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案：T55. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案：A56. 使用回溯

展开阅读全文