南开大学22春《大数据开发技术》综合作业一答案参考42

上传人:工**** 文档编号:467106709 上传时间:2023-09-05 格式:DOCX 页数:13 大小:13.36KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》综合作业一答案参考42_第1页
第1页 / 共13页
南开大学22春《大数据开发技术》综合作业一答案参考42_第2页
第2页 / 共13页
南开大学22春《大数据开发技术》综合作业一答案参考42_第3页
第3页 / 共13页
南开大学22春《大数据开发技术》综合作业一答案参考42_第4页
第4页 / 共13页
南开大学22春《大数据开发技术》综合作业一答案参考42_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》综合作业一答案参考42》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》综合作业一答案参考42(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术综合作业一答案参考1. RDD是一个可读写的数据结构。( )A.正确B.错误参考答案:B2. GraphX中( )方法可以查询度数A.degreesB.degreeC.verticesD.edges参考答案:A3. RDD的map操作不会改变RDD的分区数目。( )A.正确B.错误参考答案:A4. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC5. 交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。( )A.对B.错

2、参考答案:A6. GraphX中( )方法可以查询边信息A.numVerticesB.numEdgesC.verticesD.edges参考答案:D7. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B8. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。( )A.对B.错参考答案:A9. 图(Graph)是一种复杂的非线性结构。( )T.对F.错参考答案:T10. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B11. 亚

3、马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层。( )A.正确B.错误参考答案:A12. Mllib中metrics.fMeasureByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:C13. Spark可以从( )分布式文件系统中读取数据A.HDFSB.HbaseC.HiveD.Tachyon参考答案:ABCD14. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B15. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案

4、:B16. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案:B17. Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D18. 广度优先是什么的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A19. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A20. 下列算法中

5、通常以自底向上的方式求解最优解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:B21. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB22. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:B23. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B24. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获

6、得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案:A25. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:D26. HDFS中SecondaryNameNode可减少( )重启的时间A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:A27. 任何可用计算机求解的问题所需的时间都与其规模无关。( )A.错误B.正确参考答案:A28. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )T.对

7、F.错参考答案:F29. var a=10; for(aA.10B.11C.20D.19参考答案:D30. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C31. Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。( )T.对F.错参考答案:F32. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树参考答案:A33. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.

8、networkC.ggmapsD.animation参考答案:D34. 以下不可以使用分治法求解的是( )。A.棋盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案:D35. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案:B36. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T37. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F38. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F39. MapReduce中最优的Reduce任务个数取决于集群中可用的( )的数目。A.SplitB

9、.SlotC.MapD.Shuffle参考答案:B40. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper参考答案:D41. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD42. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A43. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A

10、.错误B.正确参考答案:A44. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B45. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案:B46. 请问RDD的( )操作用于将相同键的数据聚合A.joinB.zipC.combineByKeyD.collect参考答案:C47. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B48. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟。( )A.正确

11、B.错误参考答案:A49. PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。( )A.正确B.错误参考答案:A50. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A51. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案:A52. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.

12、正确参考答案:B53. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B54. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案:T55. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A56. 以下亚马逊的产品中哪个属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案:BC57. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )T.对F.错参考答案:F58. 0-1背包问题的回溯算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:A59. SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:C60. 关系数据库与NoSQL数据库相比有哪些优势( )A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力参考答案:AC

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号