南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20

上传人:re****.1 文档编号:458593945 上传时间:2022-08-30 格式:DOCX 页数:11 大小:12.97KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20_第1页
第1页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20_第2页
第2页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20_第3页
第3页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20_第4页
第4页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷20(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术复习考核试题库答案参考1. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D2. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:B3. Scala列表中last返回列表最后一个元素。( )A.正确B.错误参考答案:A4. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B5. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A6. 下列哪个R语言扩展包可

2、以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D7. ( )和( ),它们把原数据变换或投影到较小的空间。A.小波变换B.中心化变换C.主成分分析D.对数变换参考答案:AC8. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T9. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC10. Scala 集合分为可变的和不可变的集合。( )A.正确B.错误参考答案:A11. TF-IDF中TF指的是( )A.词频B.词在文档中出

3、现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率参考答案:AB12. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A13. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F14. Mllib中metrics.fMeasureByThreshold表示( )指标A

4、.准确度B.召回率C.F值D.ROC曲线参考答案:C15. Spark中DataFrame的( )方法是进行排序查询A.order byB.group byC.select byD.sort by参考答案:A16. 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。( )A.正确B.错误参考答案:B17. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD18. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A19

5、. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C20. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案:T21. 下列算法中不能解决0/1背包问题的是( )。A.贪心法B.动态规划C.回溯法D.分支限界法参考答案:A22. Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数。( )T.对F.错参考答案:F23. UMP系通过( )来实现实现数据路由的基本功能A.C

6、ontroller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B24. BigTable采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B25. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案:D26. NoSQL数据库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:CD27. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答

7、案:ABCD28. Pentaho是最流行的开源商业智能软件之一。( )A.对B.错参考答案:A29. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:A30. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C31. RDD的mapPartitions操作会导致Partitions数量的变化。( )A.正确B.错误参考答案:B32. Sc

8、ala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T33. 已得到广泛应用的分布式文件系统主要包括( )。A.GFSB.MapReduceC.HbaseD.HDFS参考答案:AD34. Spark Streming中DStream可以通过外部数据源(Kafka,Flume,Twitter等)来获取,也可以通过现有DStream的高级操作(Transformation操作)获得。( )A.正确B.错误参考答案:A35. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文

9、件。( )A.对B.错参考答案:A36. Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A37. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A38. 以下哪些是数据可视化时间线工具( )A.EchartsB.TimetoastC.XtimelineD.R参考答案:BC39. 在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化

10、数据。( )A.对B.错参考答案:A40. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A41. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:D42. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案:B43. Gra

11、ph类中如果根据边数据创建图,数据需要转换成RDDEdgeED类型,应该用( )方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue)C.Graph.fromEdgeTuples(rawEdges: RDD(VertexId, VertexId), defaultValueD.GraphLoader.edgeListFile(sc,filename)参考答案:B44. SQL Azure体系结构层中哪层是硬件和操作系统( )A.Client LayerB.Services La

12、yerC.Platform. LayerD.Infrastructure Layer参考答案:D45. MapReduce的main函数中设置输出类型的方法有( )。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClass参考答案:AC46. 早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架。( )A.正确B.错误参考答案:A47. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案:A48. Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。( )T.对F.错参考答案:F49. Spark可以通过哪些外部存储创建RDD( )A.文本文件B.目录C.压缩文件D.通配符匹配的文件参考答案:ABCD50. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案:B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号