南开大学21春《大数据开发技术》在线作业二满分答案12

上传人:re****.1 文档编号:487566167 上传时间:2023-07-10 格式:DOCX 页数:13 大小:13.79KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业二满分答案12_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案12_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案12_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案12_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案12_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业二满分答案12》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业二满分答案12(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业二满分答案1. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB2. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A3. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD4. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C5. UMP系通过( )来实现实现数据

2、路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B6. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端参考答案:C7. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D8. Scala中如果函数无返回值,则函数返

3、回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案:D9. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D10. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案:A11. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D12. 算法的

4、复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A13. RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。( )A.正确B.错误参考答案:A14. Mllib中metrics.fMeasureByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:C15. Google Chart API是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A16. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案

5、:B17. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B18. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B19. 分支限界法解旅行售货员问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:A20. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D21. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LV

6、SC.RabbitMQD.Zookeeper参考答案:D22. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。( )A.对B.错参考答案:A23. Scala列表方法中丢弃前n个元素,并返回新列表的方法是( )A.dropB.headC.filterD.init参考答案:A24. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案:C25. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树

7、参考答案:A26. 下面哪种函数是回溯法中为避免无效搜索采取的策略?( )A.递归函数B.剪枝函数C.随机数函数D.搜索函数参考答案:B27. Spark Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C28. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A29. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC30. R

8、DD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F31. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.RegionD.Master参考答案:B32. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD33. Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A34. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并

9、D.原问题和子问题使用相同的方法解参考答案:A35. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD36. 回溯法是一种既带有系统性又带有跳跃性的搜索算法。( )A.错误B.正确参考答案:B37. Scala在子类中重写超类的抽象方法时,需要使用override关键字。( )T.对F.错参考答案:F38. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案:B39. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A40. Storm中如果要保证相

10、同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D41. Dstream窗口操作中( )方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:C42. 以下亚马逊的产品中哪个属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案:BC43. Hbas

11、e采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A44. RDD的map操作不会改变RDD的分区数目。( )A.正确B.错误参考答案:A45. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B46. PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。( )A.正确B.错误参考答案:A47. RDD中join操作最后只返回两个RDD都存在的键的连接结果。( )A.正确B.错误参考答案:A48. HDFS的命名空间包含( )A.节点B

12、.目录C.文件D.块参考答案:BCD49. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟。( )A.正确B.错误参考答案:A50. 交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。( )A.对B.错参考答案:A51. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A52. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD53. Spark的RDD持久化操作有( )方式A.ca

13、cheB.presistC.storageD.long参考答案:AB54. 0-1背包问题的回溯算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:A55. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A56. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A57. Python是一种面向对象的解释型计算机程序设计语言。( )A.对B.错参考答案:A58. RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T59. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号