南开大学22春《大数据开发技术》补考试题库答案参考5

上传人:博****1 文档编号:488199208 上传时间:2023-06-20 格式:DOCX 页数:11 大小:12.76KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》补考试题库答案参考5_第1页
第1页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考5_第2页
第2页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考5_第3页
第3页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考5_第4页
第4页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考5_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》补考试题库答案参考5》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》补考试题库答案参考5(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术补考试题库答案参考1. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B2. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A3. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD4. HDFS读数据过程中( )具体实现了FileSystemA.DistributedFileSystemB.GFSSystemC.FileSystemD.HDFSSystem参考答案:A5. S

2、cala 集合分为可变的和不可变的集合。( )A.正确B.错误参考答案:A6. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:C7. Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:B8. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给

3、数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D9. Spark SQL可以通过( )方法加载json文件为DataFrameA.formatB.jsonC.getD.read参考答案:AB10. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案:A11. Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B12. 分支限界法解旅行售货员问题时,活结点表的组织形式是( )。A.最小堆B

4、.最大堆C.栈D.数组参考答案:A13. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD14. 交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录,和监视设备的视频图像技术记录。( )A.对B.错参考答案:A15. PairRDD中( )函数可以合并具有相同键的值A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:A16. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( )A.正确B.错误参考答案:A17. Scala 集合分为可变的

5、和不可变的集合。( )T.对F.错参考答案:T18. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T19. MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。( )T.对F.错参考答案:T20. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB21. Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A22. Scala函数组合器可

6、以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F23. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B24. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D25. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进

7、行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。( )A.正确B.错误参考答案:A26. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD27. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD28. Hadoop启动所有进程的命令为( )。A.all-start.shB.all-start.exeC.start-all.shD.start-all.exe参考答案:C29. Mllib实现了一些常见的机器学习算法和应用程序,包括( )A.分类B.聚类C.降维D

8、.回归参考答案:ABCD30. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T31. Spark创建DataFrame对象方式有( )A.结构化数据文件B.外部数据库C.RDDD.Hive中的表参考答案:ABCD32. 任何可用计算机求解的问题所需的时间都与其规模无关。( )A.错误B.正确参考答案:A33. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F34. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配

9、MySQL实例参考答案:C35. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B36. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B37. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A38. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B39. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B40. MLBase包括( )A.MllibB.MLIC.

10、SparkRD.GraphX参考答案:AB41. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案:A42. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。( )T.对F.错参考答案:F43. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A44. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )

11、A.对B.错参考答案:A45. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A46. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟。( )A.正确B.错误参考答案:A47. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD48. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC49. Gr

12、aph类中如果根据边数据创建图,数据需要转换成RDDEdgeED类型,应该用( )方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue)C.Graph.fromEdgeTuples(rawEdges: RDD(VertexId, VertexId), defaultValueD.GraphLoader.edgeListFile(sc,filename)参考答案:B50. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号