南开大学22春《大数据开发技术》综合作业一答案参考16

资源描述

《南开大学22春《大数据开发技术》综合作业一答案参考16》由会员分享，可在线阅读，更多相关《南开大学22春《大数据开发技术》综合作业一答案参考16（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术综合作业一答案参考1. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案：A2. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案：AD3. HBase的客户端并不依赖Master，而是通过( )来获得Region位置信息，大多数客户端甚至从来不和Master通信，这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案：C4. Storm中Bolt可以执行过滤、

2、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案：A5. RDD的cartesian函数是笛卡尔积，也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案：A6. SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD。( )A.正确B.错误参考答案：B7. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案：ABC8. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案：D9. 大数据时代预

3、测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案：ABCD10. RDD是一个可读写的数据结构。( )A.正确B.错误参考答案：B11. Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案：B12. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案：D13. 以下不可以使用分治法求解的是( )。A.棋盘覆盖问题B

4、.选择问题C.归并排序D.0/1背包问题参考答案：D14. Spark GraphX中类Graph的joinVertices方法可以( )A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中参考答案：D15. Spark可以通过哪些外部存储创建RDD( )A.文本文件B.目录C.压缩文件D.通配符匹配的文件参考答案：ABCD16. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案：B17. 下列算法中通常以深度优先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案：D18.

5、Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案：F19. PairRDD中groupBy(func)func返回key，传入的RDD的各个元素根据这个key进行分组。( )A.正确B.错误参考答案：A20. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案：C21. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案：B22. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案：ACD23. Spa

6、rk中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案：B24. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案：A25. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案：A26. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案：C27. 按照数据量的大小，可将数据分析分为内存级数据分析、Bl级数据分析和海量级数

7、据分析。( )A.对B.错参考答案：A28. 分布式离线分析可以实现秒级别的实时分析响应。( )A.正确B.错误参考答案：B29. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案：D30. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案：B31. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案：A32. 下列算法中不能解决0/1背包问题的是( )。A.贪心法B.动态规划C.回溯法D.分支限界法参考答案：A33. 对于

8、不同顶点之间的信息交换，Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案：C34. Python是一种面向对象的解释型计算机程序设计语言。( )A.对B.错参考答案：A35. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQLB.OracleC.HbaseD.NosSQL参考答案：C36. 阿里云RDS中一个实例可以创建多个数据库，在实例内数据库命名唯一，所有数据库都会共享该实例下的资源，如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案：A37. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B

9、.正确参考答案：B38. Scala列表方法中丢弃前n个元素，并返回新列表的方法是( )A.dropB.headC.filterD.init参考答案：A39. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案：T40. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案：A41. 算法是由若干条指令组成的有穷序列，且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案：B42. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案：B43. Hadoop启动所有进程的命令为( )。A.al

10、l-start.shB.all-start.exeC.start-all.shD.start-all.exe参考答案：C44. Scala中( )方法返回一个列表，包含除了最后一个元素之外的其他元素A.headB.initC.tailD.last参考答案：B45. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案：B46. 居民通过健康云平台中的数据，了解健康情况，防患于未然; 医疗机构通过对远程监控系统中的数据分析，缩短住院时间，提高家庭护理比例和门诊医生预约量。( )A.对

11、B.错参考答案：A47. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案：A48. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案：C49. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案：C50. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案：A51. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案：A52. 解决0/1背包

12、问题可以使用动态规划、回溯法和分支限界法，其中不需要排序的是动态规划，需要排序的是回溯法，分支限界法。( )A.错误B.正确参考答案：B53. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案：T54. 在HBase中，更新操作会用最新的当前值去替换记录中原来的旧值，旧值被覆盖后就不会存在。( )A.正确B.错误参考答案：B55. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性D.合并边相同的属性参考答案：C56. 回溯法搜索解空间树时，

13、常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案：B57. Storm中如果要让所有的Tuple都发送到同一个Task中，应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案：C58. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案：B59. SQL Azure体系结构层中哪层相当于网关，相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案：B60. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容

展开阅读全文