南开大学21春《大数据开发技术》在线作业三满分答案83

资源描述

《南开大学21春《大数据开发技术》在线作业三满分答案83》由会员分享，可在线阅读，更多相关《南开大学21春《大数据开发技术》在线作业三满分答案83（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业三满分答案1. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案：F2. Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案：F3. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案：B4. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.substractC.intersectionD.cartesi

2、an参考答案：D5. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案：B6. Scala中高阶函数可以产生新的函数，并将新的函数作为返回值。( )T.对F.错参考答案：T7. 很多企业为了支持决策分析而构建的数据仓库系统，其中存放的大量历史数据就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案：D8. 流计算是针对流数据的实时计算，可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案：ABCD

3、9. Scala中如果函数中的每个参数在函数中最多只出现一次，则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案：B10. SQL Azure体系结构层中哪层是存储节点集群，相当于普通Web系统的数据库层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案：C11. Scala函数组合器中groupBy是对集合中的元素进行分组操作，结果得到的是一个Map。( )A.正确B.错误参考答案：A12. 大数据决策逐渐成为一种新的决策方式，大数据应用有力促进了信息技术与各行业的深

4、度融合，大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案：A13. HDFS中当一些数据节点不可用时，会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案：B14. RDD的flatMap操作是将函数应用于RDD之中的每一个元素，将返回的迭代器(数组、列表等)中的所有元素构成新的RDD。( )A.正确B.错误参考答案：A15. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案：B16. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByK

5、ey参考答案：BC17. Scala中如果函数无返回值，则函数返回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案：D18. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案：ABCD19. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案：ABC20. var a=10; for(aA.10B.11C.20D.19参考答案：D21. 亚马逊的云服务提供了多达几十种服务，涵盖了IaaS、PaaS、SaaS这三层。( )A.正确B.错误参考答案：A22.

6、大数据计算处理方法主要分为两种方法，即批处理方法和流处理方法。( )A.正确B.错误参考答案：A23. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案：B24. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案：ABCD25. 关联分析又称为关联规则学习。( )A.对B.错参考答案：A26. HBase的客户端并不依赖Master，而是通过( )来获得Region位置信息，大多数客户端甚至从来不和Master通信，这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案

7、：C27. 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案：BD28. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案：A29. 聚类分析(Cluster analysis)简称聚类(Clustering)，是把数据对象划分成子集(类)的过程，每个子集称为一个簇(Cluste

8、r)。( )A.对B.错参考答案：A30. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案：C31. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案：A32. SQL Azure体系结构层中哪层相当于网关，相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案：B33. 图的结构通常表示为：G(V，E)，其中，E是图G中( )A.

9、顶点B.顶点的集合C.边D.边的集合参考答案：D34. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案：D35. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案：A36. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker，同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案：D37. Storm中如果要保证相同字段的Tuple分配到同一个Task中，应该

10、采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案：D38. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案：A39. 利用概率的性质计算近似值的随机算法是数值概率算法，运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案：B40. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案：A41. 下列随机

11、算法中运行时有时候成功有时候失败的是( )。A.数值概率算法B.舍伍德算法C.拉斯维加斯算法D.蒙特卡罗算法参考答案：C42. RDD的cartesian函数是笛卡尔积，也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案：A43. 默认情况下，Scala 使用的是可变集合。( )T.对F.错参考答案：F44. ( )和( )，它们把原数据变换或投影到较小的空间。A.小波变换B.中心化变换C.主成分分析D.对数变换参考答案：AC45. Spark Streming中( )函数可以使用func将源DStream中的每个元素进行聚合操作，返回一个内部所包含的RDD只有一个元素的新D

12、StreamA.unionB.reduceC.joinD.cogroup参考答案：B46. 以下哪个函数可以对RDD进行去重( )A.sortByB.filterC.distinctD.intersection参考答案：C47. 用户可以在Hadoop YARN上运行Spark。( )A.正确B.错误参考答案：A48. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案：A49. 计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。( )A.错误B.正确参考答案：B50. 大数据技术也能帮助政府进行支出管理，透明合理的财政支出将有利于提高公信

13、力和监督财政支出。( )A.对B.错参考答案：A51. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案：B52. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案：B53. 算法是由若干条指令组成的有穷序列，且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案：B54. Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值。( )T.对F.错参考答案：F55. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案：C56. Spark Streaming中时间片也可称为批处理时间间隔(batch interval)，时间片是人为地对数据进行定量的标准，作为拆分数据的依据，一个时间片的数据对应一个RDD实例。

展开阅读全文