南开大学22春《大数据开发技术》离线作业二及答案参考3

上传人:cl****1 文档编号:490289441 上传时间:2023-01-08 格式:DOCX 页数:13 大小:14.26KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》离线作业二及答案参考3_第1页
第1页 / 共13页
南开大学22春《大数据开发技术》离线作业二及答案参考3_第2页
第2页 / 共13页
南开大学22春《大数据开发技术》离线作业二及答案参考3_第3页
第3页 / 共13页
南开大学22春《大数据开发技术》离线作业二及答案参考3_第4页
第4页 / 共13页
南开大学22春《大数据开发技术》离线作业二及答案参考3_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》离线作业二及答案参考3》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》离线作业二及答案参考3(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术离线作业二及答案参考1. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )T.对F.错参考答案:F2. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper参考答案:D3. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A4. var a=10; do a+=1;

2、 while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B5. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D6. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:

3、A7. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B8. 大数据智能感知层:主要包括( )及软硬件资源接入系统。A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系参考答案:ABCD9. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A10. Spark Streming中DStream可以通过外部数据源(Kafka,Flume,Twitter等)来获取,也可以通过现有DStream的高级操作(Transformation操作)获得。( )A.正确B.错误参考答案:A11. 数据仓

4、库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B12. Spark Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C13. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C14. Scala中如果函数无返回值,则函数返回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案:

5、D15. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B16. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A17. MongoDB将数据存储为一个( )A.关系B.属性C.字段D.文档参考答案:D18. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案:A19. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度

6、快C.数据存储快D.数据计算快参考答案:B20. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案:A21. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案:T22. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD23. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )A.对B.错参考答案:A24. SparkContext类中makeRDD方法

7、不可将单机数据创建为分布式RDD。( )A.正确B.错误参考答案:B25. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树参考答案:A26. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A27. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C28. 实现棋盘覆盖算法利用的算法是( )。A.

8、分治法B.动态规划法C.贪心法D.回溯法参考答案:A29. RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。( )A.正确B.错误参考答案:A30. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A31. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B32. Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储。( )A.正确B.错误参考答案:B33. 以下属于Hadoop的安装方式的有( )。A

9、.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式参考答案:ACE34. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T35. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A36. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F37. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( )A.正确B.错误参考答案:A38. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操

10、作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C39. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A40. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B41. Spark创建DataFrame对象方式有( )A.结构化数据文件B.外部数据库C.RDDD.Hive中的表参考答案:ABCD42. 交通数据的来源包括车辆G

11、PS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。( )A.对B.错参考答案:A43. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC44. 关于Map端Shuffle过程中的合并与归并,说法正确的是( )。A.两个键值对和,如果合并,会得到B.合并不会改变最终结果C.两个键值对和,如果归并,会得到D.两个键值对和,如果归并,会得到参考答案:ABD45. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中,也可以

12、运行在云计算环境中B.Hadoop自带有一套脚本,用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazon EC2为Hadoop提供了存储服务参考答案:D46. HBase的客户端并不依赖Master,而是通过( )来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案:C47. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C48. 以深度优先方式系统搜索问题

13、解的算法称为回溯法。( )A.错误B.正确参考答案:B49. ( )可以解决图计算问题A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:C50. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD51. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:B52. 关系数据库的关键特性包括完善的事务机制和高效的查询机制。( )A.正确B.错误参考答案:A53. Scala列表方法中将函数应用到列表的所有元素的方法是( )A.filterB.foreachC.mapD.mkString参考答案:B54. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T55. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案:A56. 使用回溯

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号