南开大学21春《大数据开发技术》离线作业一辅导答案19

上传人:hs****ma 文档编号:470416332 上传时间:2022-07-26 格式:DOCX 页数:11 大小:13.02KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业一辅导答案19_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案19_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案19_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案19_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案19_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业一辅导答案19》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业一辅导答案19(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业一辅导答案1. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案:B2. 分支限界法是一种只带有系统性的搜索算法。( )A.错误B.正确参考答案:A3. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。( )A.正确B.错误参考答案:A4. Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过1

2、00TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B5. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A6. RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。( )A.正确B.错误参考答案:A7. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByK

3、eyAndWindow参考答案:D8. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案:B9. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B10. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C11. 分支限界法解旅行售货员问题时,活结点表的组

4、织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:A12. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A13. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B14. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C15. spark-submit配置项中( )表示executor内存大小A.-num-execut

5、ors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:B16. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B17. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B18. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案:A19. 问题的最优子结构性质是该问题不可用动

6、态规划算法或贪心算法求解的关键特征。( )A.错误B.正确参考答案:A20. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B21. 在Storm的工作流程中,对于Supervisor说法错误的是( )。A.Supervisor会去Zookeeper集群上认领自己的TaskB.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Worker进程进行Task的处理参考答案:B22. 以下哪个方法可

7、以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC23. ( )可以解决图计算问题A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:C24. Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用( )方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue)C.Graph.fromEdgeTuples(rawEdges: RDD(VertexId

8、, VertexId), defaultValue,)D.GraphLoader.edgeListFile(sc,filename)参考答案:C25. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B26. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A27. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Inf

9、rastructure Layer参考答案:A28. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B29. 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案:BD30. 矩阵连乘问题的算法可由动态规划设计实现。( )A.错误B.正确参考答案:B31. SparkContext类中makeRDD方法不可将单机数据创建

10、为分布式RDD。( )A.正确B.错误参考答案:B32. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A33. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D34. Scala源代码被编译成( )字节码,所以它可以运行于JVM之上A.SparkB.ScalaC.JavaD.JDK参考答案:C35. Mllib中metrics.fMeasureByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:C36. 以下哪个是Scala的数据类型( )A.Any

11、B.NULLC.NothingD.AnyRef参考答案:ABCD37. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD38. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案:B39. 下列算法中不能解决0/1背包问题的是( )。A.贪心法B.动态规划C.回溯法D.分支限界法参考答案:A40. Pentaho是最流行的开源商业智能软件之一。( )A.对B.错参考答案:A41. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考

12、答案:C42. Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。( )A.正确B.错误参考答案:B43. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案:B44. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C45. 以下属于Hadoop的安装方式的有( )。A.单机模式B.多机模式C

13、.分布式模式D.并行模式E.伪分布式模式参考答案:ACE46. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F47. Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。( )A.正确B.错误参考答案:A48. 下列Scala代码应输出( ):var a=0;var b=0var sum=0;for(a-1 until 3; b-1 until 3) sum+=a+b;println(sum);A.36B.35C.11D.12参考答案:D49. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:D50. Scala中元组是是一种可迭代的键值对(key/value)结构。( )A.正确B.错误参考答案:B

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号