南开大学21秋《大数据开发技术》平时作业2-001答案参考5

上传人:大米 文档编号:473256998 上传时间:2024-01-10 格式:DOCX 页数:11 大小:12.47KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》平时作业2-001答案参考5_第1页
第1页 / 共11页
南开大学21秋《大数据开发技术》平时作业2-001答案参考5_第2页
第2页 / 共11页
南开大学21秋《大数据开发技术》平时作业2-001答案参考5_第3页
第3页 / 共11页
南开大学21秋《大数据开发技术》平时作业2-001答案参考5_第4页
第4页 / 共11页
南开大学21秋《大数据开发技术》平时作业2-001答案参考5_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》平时作业2-001答案参考5》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》平时作业2-001答案参考5(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术平时作业2-001答案参考1. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:B2. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A3. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B4. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素

2、。( )A.正确B.错误参考答案:B5. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B6. Pentaho是最流行的开源商业智能软件之一。( )A.对B.错参考答案:A7. 键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。( )A.正确B.错误参考答案:A8. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD9. RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案:A10. Hbase采用( )作为底层数据存储

3、A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A11. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B12. 0-1背包问题的回溯算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:A13. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A14. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( )A.正确B.错误参考答案:A15. Spark可以从( )分布式文件系统中读取数据A.HDFSB.HbaseC.HiveD.Tach

4、yon参考答案:ABCD16. Spark中DataFrame的( )方法是进行排序查询A.order byB.group byC.select byD.sort by参考答案:A17. Scala中使用( )方法来查看两个集合的交集元素A.Set.concatB.Set.&C.Set.&D.Set.intersect参考答案:BD18. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F19. 关于分布式并行编程,以下说法错误的是( )。A.“摩尔定律”,CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模

5、计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce参考答案:A20. RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。( )A.正确B.错误参考答案:A21. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.RegionD.Master参考答案:B22. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D23. Scala中可以用( )方法来连接两

6、个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD24. NoSQL数据库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:CD25. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B26. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A27. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB.Sla

7、verC.Region服务器D.客户端参考答案:C28. 一个问题可用动态规划算法或贪心算法求解的关键特征是问题的( )。A.重叠子问题B.最优子结构性质C.贪心选择性质D.定义最优解参考答案:B29. 以下哪个函数可以对RDD进行去重( )A.sortByB.filterC.distinctD.intersection参考答案:C30. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD31. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.inte

8、rsection参考答案:A32. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B33. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B34. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B35. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B36. 下列算法中通常以自底向上的方式求解最优解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法

9、参考答案:B37. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A38. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T39. 对于不同顶点之间的信息交换,Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案:C40. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案:A41. Scala中高阶函数经常将只需要执行多次的函数定义为

10、匿名函数作为参数。( )T.对F.错参考答案:F42. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A43. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A44. RDD的mapPartitions操作会导致Partitions数量的变化。( )A.正确B.错误参考答案:B45. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A46. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B47. 从分治法的一般设计模式可以看出,用它设计出的程序一般是递归算法。( )A.错误B.正确参考答案:B48. 问题的最优子结构性质是该问题不可用动态规划算法或贪心算法求解的关键特征。( )A.错误B.正确参考答案:A49. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案:A50. RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD。( )A.正确B.错误参考答案:A

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号