南开大学22春《大数据开发技术》补考试题库答案参考16

上传人:cl****1 文档编号:490317730 上传时间:2022-09-10 格式:DOCX 页数:11 大小:13.02KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》补考试题库答案参考16_第1页
第1页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考16_第2页
第2页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考16_第3页
第3页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考16_第4页
第4页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考16_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》补考试题库答案参考16》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》补考试题库答案参考16(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术补考试题库答案参考1. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参考答案:B2. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A3. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快参考答案:B4. RDD的subtract用于用于将前一个RD

2、D中在后一个RDD出现的元素删除。( )A.正确B.错误参考答案:A5. Spark Streming中( )函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案:D6. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案:A7. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD8. 针对流数据,“量子恒道”可处

3、理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案:A9. Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D10. TF-IDF中TF指的是( )A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率参考答案:AB11. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中

4、,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参考答案:A12. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C13. 图的结构通常表示为:G(V,E),其中,E是图G中( )A.顶点B.顶点的集合C.边D.边的集合参考答案:D14. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B15. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参

5、考答案:ABCD16. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:D17. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C18. BigTable采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B19. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使

6、用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B20. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B21. 请问RDD的( )操作用于将相同键的数据聚合A.joinB.zipC.combineByKeyD.collect参考答案:C22. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B23. Mllib中metrics.fMeasureByThreshold表示( )指标A.准确度B.召回率C.F值D.RO

7、C曲线参考答案:C24. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:C25. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F26. MspReduce中的Map和Reduce函数使用( )进行输入输出。A.key/value对B.随机数值C.其他计算结果参考答案:A27. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独

8、立的MySQL实例D.随机分配MySQL实例参考答案:A28. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:B29. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中B.Hadoop自带有一套脚本,用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazon EC2为Hadoop提供了存储服务参考答案:D30. MapReduce设计的一个理念就是( ),因为移动数据需要大量的网络

9、传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据并行参考答案:B31. UMP系统的哪个功能实现了负载均衡( )A.读写分离B.资源隔离C.资源调度D.可扩展参考答案:A32. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F33. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D34. 矩阵连乘问题的算法可由动态规划设计实现。( )A.错误B.正确参考答案:B35. RDD是一个( )的数据结构A.可读写B.只读的C.容错的D.可进行并行操作的参考答案

10、:BCD36. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD37. UMP系通过( )来实现实现数据路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B38. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B39. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T40. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )

11、A.对B.错参考答案:A41. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案:B42. 分支限界法解旅行售货员问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:A43. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。( )A.对B.错参考答案:A44. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD45. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业

12、的数据分析参考答案:AB46. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC47. Scala在子类中重写超类的抽象方法时,需要使用override关键字。( )T.对F.错参考答案:F48. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A49. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F50. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号