南开大学21春《大数据开发技术》离线作业一辅导答案58

上传人:大米 文档编号:498955346 上传时间:2023-08-26 格式:DOCX 页数:11 大小:12.88KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业一辅导答案58_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案58_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案58_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案58_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业一辅导答案58_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业一辅导答案58》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业一辅导答案58(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业一辅导答案1. Spark中DataFrame的( )方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A2. HBase的客户端并不依赖Master,而是通过( )来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案:C3. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B4. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数

2、据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A5. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B6. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A7. spark-submit配置项中( )表示executor内存大小A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-exec

3、utor-coures NUM参考答案:B8. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC9. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC10. Spark Streming中( )函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案:D11. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B12. Scala列表方法中使用分隔

4、符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案:D13. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C14. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A15. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A16. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案:C17. RDD

5、的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B18. 每个变量的最大值和最小值之差称为极差。( )A.对B.错参考答案:A19. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.substractC.intersectionD.cartesian参考答案:D20. 下列属于传统统计学展示方法的是( )。A.柱状图B.饼状图C.曲线图D.网络图参考答案:ABC21. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B22. Hbase中Zookeeper文件记录了( )的位置A.META.表B.-ROOT-表C.

6、RegionD.Master参考答案:B23. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD24. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案:B25. MapReduce将输入文件切分成M个分片,Master将其中( )个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1参考答案:A26. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B27. 默认情况下,Scala 使用的是可变集合。( )T

7、.对F.错参考答案:F28. 请问RDD的( )操作用于将相同键的数据聚合A.joinB.zipC.combineByKeyD.collect参考答案:C29. Spark Streming中( )函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W)键值对的一个新 DStream。A.unionB.reduceC.joinD.cogroup参考答案:D30. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C31.

8、 Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F32. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F33. RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T34. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案:ACD35. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A36. 感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。( )A

9、.正确B.错误参考答案:A37. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B38. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B39. ( )是Spark的核心,提供底层框架及核心支持A.Spark CoreB.Spark SQLC.Spark StreamingD.Mllib参考答案:A40. 关于分布式并行编程,以下说法错误的是( )。A.“摩尔定律”,CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上,可

10、以并行执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce参考答案:A41. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B42. 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区( )A.resetpartitionB.repartitonC.PartitionD.coalesce参考答案:BD43. SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层( )A.

11、Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:C44. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B45. 我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。( )A.对B.错参考答案:A46. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参考答案:A47. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案:B48. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D49. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB50. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号