南开大学21春《大数据开发技术》在线作业三满分答案96

上传人:壹****1 文档编号:484626312 上传时间:2023-11-07 格式:DOCX 页数:13 大小:14.09KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业三满分答案96_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案96_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案96_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案96_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案96_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业三满分答案96》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业三满分答案96(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业三满分答案1. Spark中DataFrame的( )方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A2. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:A3. Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D4. 算

2、法是由若干条指令组成的有穷序列,且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案:B5. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A6. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B7. MapReduce将输入文件切分成M个分片,Master将其中( )个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1参考答案:A8. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC9. 针对流数据,“量子恒道”可处理每天( )级的实时流数据A

3、.TBB.PBC.GBD.MB参考答案:A10. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A11. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD12. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D13. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A14. 分支限界法主要

4、有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案:B15. Scala中元组是是一种可迭代的键值对(key/value)结构。( )A.正确B.错误参考答案:B16. 以下亚马逊的产品中哪个属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案:BC17. Scala列表方法中丢弃前n个元素,并返回新列表的方法是( )A.dropB.headC.filterD.init参考答案:A18. 图的结构通常表示为:G(V,E),其中,G表示( )A.图B.子图C.顶点D.边参考答案:A19. 关系数据库的关键特性包括完善的事务机制和高效的查询机制。( )

5、A.正确B.错误参考答案:A20. Mllib中线性会馆算法中的参数numIterations表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A21. 关于分布式并行编程,以下说法错误的是( )。A.“摩尔定律”,CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce参考答案:A22. Dstream输出操作中(

6、)方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C23. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A24. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C25. 以深度优先方式系统搜索问题解的算法称为回溯

7、法。( )A.错误B.正确参考答案:B26. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案:B27. 大数据的特征是( )。A.数据体量大B.数据产生速度快C.数据种类多D.数据计算快E.数据价值高参考答案:ABCE28. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A29. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A30. 广度优先是什么的一种搜

8、索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A31. 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是( )A.0,numPartitionsB.0,numPartitions-1C.1,numPartitions-1D.1,numPartitions参考答案:B32. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B33. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.

9、斜杠D.逗号参考答案:B34. Spark的RDD持久化操作有( )方式A.cacheB.presistC.storageD.long参考答案:AB35. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B36. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A37. HDFS中客户端在读取到数据后,会采用( )对数据块进行校验,以确定正确性A.md5B.哈希桶C.sha1D.奇偶校验参考答案:AC38. Scala函数组合器可以通过一个函数重新计算

10、列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B39. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案:T40. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD41. Spark中DataFrame的查询操作也是一个懒操作,仅仅生成一个查询计划,只有触发Action操作才会进行计算并返回查询结果。( )A.正确B.错误参考答案:A42. 下列算法中通常以深度优先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:D43. GraphX中( )方法可以释放边缓存A.cacheB.p

11、resistC.unpersistVerticesD.edges.unpersist参考答案:D44. Scala中如果函数无返回值,则函数返回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案:D45. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.substractC.intersectionD.cartesian参考答案:D46. 在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据。( )A.对B.错参考答案:A47. Spark取代Hadoop仅仅是取代MapReduce这

12、种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F48. 我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。( )A.对B.错参考答案:A49. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T50. 一个问题可用动态规划算法或贪心算法求解的关键特征是问题的( )。A.重叠子问题B.最优子结构性质C.贪心选择性质D.定义最优解参考答案:B51. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B52. DataFrame是一个分布式的Row对象的数据集合。( )

13、A.正确B.错误参考答案:A53. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参考答案:A54. Mllib中metrics.recallByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:B55. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A56. Spark Streming中( )函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案:D57. 大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号