南开大学21秋《大数据开发技术》在线作业二满分答案64

上传人:汽*** 文档编号:504313847 上传时间:2022-09-02 格式:DOCX 页数:13 大小:13.67KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业二满分答案64_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业二满分答案64_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业二满分答案64_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业二满分答案64_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业二满分答案64_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业二满分答案64》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业二满分答案64(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业二满分答案1. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C2. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply参考答案:ABCD3. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD4. RDD的mapPartitions操作会导致Partitions数量的变化。( )A.正确B.错误参考答案:B5. NAS是一种采

2、用直接与网络介质相连的特殊设备实现数据存储的模式。( )A.对B.错参考答案:A6. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B7. 下列算法中不能解决0/1背包问题的是( )。A.贪心法B.动态规划C.回溯法D.分支限界法参考答案:A8. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:A9. 流计算系统的需求有( )。A.实时性

3、B.廉价C.高性能D.高带宽E.分布式参考答案:ACE10. Scala通过( )来定义变量A.valB.valC.defineD.def参考答案:A11. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T12. 以下不可以使用分治法求解的是( )。A.棋盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案:D13. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A14. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC15.

4、计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。( )A.错误B.正确参考答案:B16. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.RegionD.Master参考答案:B17. SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:C18. Scala列表中last返回列表最后一个元素。( )A.正确B.错误参考答案:A19. SQL Azure体

5、系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:B20. ( )是Microsoft Office的核心组件。A.SQLB.WORDC.PPTD.EXCEL参考答案:D21. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案:B22. 回溯法是一种既带有系统性又带有跳跃性的搜索算法。( )A.错误B.正确参考答案:B23. 图结构中如果无重复的边或者顶点到自身的边,那么称之为( )A

6、.完全图B.有向完全图C.无向图D.简单图参考答案:D24. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B25. 使用回溯法进行状态空间树裁剪分支时一般有两个标准:约束条件和目标函数的界,N皇后问题和0/1背包问题正好是两种不同的类型,其中同时使用约束条件和目标函数的界进行裁剪的是0/1背包问题,只使用约束条件进行裁剪的是N皇后问题。( )A.错误B.正确参考答案:B26. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F27. Mllib中线性会馆算法中的参数reParam表示( )A

7、.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D28. 关于Map端Shuffle过程中的合并与归并,说法正确的是( )。A.两个键值对和,如果合并,会得到B.合并不会改变最终结果C.两个键值对和,如果归并,会得到D.两个键值对和,如果归并,会得到参考答案:ABD29. RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。( )A.正确B.错误参考答案:A30. 早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架。( )A.正确B.错误参考答案:A31. S

8、park Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C32. 在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据。( )A.对B.错参考答案:A33. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。( )A.对B

9、.错参考答案:A34. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C35. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A36. 图的结构通常表示为:G(V,E),其中,E是图G中( )A.顶点B.顶点的集合C.边D.边的集合参考答案:D37. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD38. Scala列表方法中输出符号指定条件的所有元素的方法是( )A.dropB.headC.filterD.init参考答案:C39. Spark Dat

10、aFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB40. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A41. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参

11、考答案:B42. MongoDB将数据存储为一个( )A.关系B.属性C.字段D.文档参考答案:D43. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A44. MapReduce的main函数中设置输出类型的方法有( )。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClass参考答案:AC45. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A46. Python是一种面向对象的解释型计算机程序设计语言。(

12、 )A.对B.错参考答案:A47. 已得到广泛应用的分布式文件系统主要包括( )。A.GFSB.MapReduceC.HbaseD.HDFS参考答案:AD48. RDD是一个可读写的数据结构。( )A.正确B.错误参考答案:B49. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息,构造最优解。( )A.错误B.正确参考答案:A50. 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案:BD51. 以下哪个方法可以创建RDD( )A.paralleli

13、zeB.makeRDDC.textFileD.loadFile参考答案:ABC52. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:C53. 下面哪种函数是回溯法中为避免无效搜索采取的策略?( )A.递归函数B.剪枝函数C.随机数函数D.搜索函数参考答案:B54. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A55. 回溯法搜索状态空间树是按照什么的顺序?( )A.中序遍历B.广度优先遍历C.深度优先遍历D.层次优先遍历参考答案:C56. 感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。( )A.正确B.错误参考答案:A57. 以下是机器学习的常用算法的是( )A.回归算

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号