南开大学21春《大数据开发技术》在线作业三满分答案83

上传人:hs****ma 文档编号:487350332 上传时间:2022-09-20 格式:DOCX 页数:13 大小:13.93KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业三满分答案83_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案83_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案83_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案83_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案83_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业三满分答案83》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业三满分答案83(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业三满分答案1. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F2. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F3. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:B4. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.substractC.intersectionD.cartesi

2、an参考答案:D5. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B6. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T7. 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案:D8. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD

3、9. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B10. SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:C11. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A12. 大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深

4、度融合,大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案:A13. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B14. RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD。( )A.正确B.错误参考答案:A15. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案:B16. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByK

5、ey参考答案:BC17. Scala中如果函数无返回值,则函数返回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案:D18. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD19. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC20. var a=10; for(aA.10B.11C.20D.19参考答案:D21. 亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层。( )A.正确B.错误参考答案:A22.

6、 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A23. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B24. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD25. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A26. HBase的客户端并不依赖Master,而是通过( )来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案

7、:C27. 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案:BD28. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:A29. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluste

8、r)。( )A.对B.错参考答案:A30. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案:C31. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案:A32. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:B33. 图的结构通常表示为:G(V,E),其中,E是图G中( )A.

9、顶点B.顶点的集合C.边D.边的集合参考答案:D34. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D35. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A36. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D37. Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该

10、采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D38. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A39. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案:B40. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A41. 下列随机

11、算法中运行时有时候成功有时候失败的是( )。A.数值概率算法B.舍伍德算法C.拉斯维加斯算法D.蒙特卡罗算法参考答案:C42. RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案:A43. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F44. ( )和( ),它们把原数据变换或投影到较小的空间。A.小波变换B.中心化变换C.主成分分析D.对数变换参考答案:AC45. Spark Streming中( )函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新D

12、StreamA.unionB.reduceC.joinD.cogroup参考答案:B46. 以下哪个函数可以对RDD进行去重( )A.sortByB.filterC.distinctD.intersection参考答案:C47. 用户可以在Hadoop YARN上运行Spark。( )A.正确B.错误参考答案:A48. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A49. 计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。( )A.错误B.正确参考答案:B50. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信

13、力和监督财政支出。( )A.对B.错参考答案:A51. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B52. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案:B53. 算法是由若干条指令组成的有穷序列,且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案:B54. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F55. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C56. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号