南开大学22春《大数据开发技术》补考试题库答案参考32

上传人:夏** 文档编号:496173186 上传时间:2022-12-18 格式:DOCX 页数:11 大小:13.10KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》补考试题库答案参考32_第1页
第1页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考32_第2页
第2页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考32_第3页
第3页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考32_第4页
第4页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考32_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》补考试题库答案参考32》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》补考试题库答案参考32(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术补考试题库答案参考1. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D2. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B3. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A4. 分布式离线分析可

2、以实现秒级别的实时分析响应。( )A.正确B.错误参考答案:B5. 分支限界法解旅行售货员问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:A6. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A7. NoSQL数据库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:CD8. Scala中创建一个

3、方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F9. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B10. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD11. UMP系通过( )来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:A12. RDD的mapPartitions操作会导致Partitions数量的变化。( )A.正确B.错误参考答

4、案:B13. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD14. 以下哪个函数可以对RDD进行去重( )A.sortByB.filterC.distinctD.intersection参考答案:C15. 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。( )A.对B.错参考答案:A16. RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。( )A.正确B.错误参考答案:A17. Scala是Scalable Language的简写,是一门多范式的编程语言,

5、设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案:B18. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD19. MapReduce中最优的Reduce任务个数取决于集群中可用的( )的数目。A.SplitB.SlotC.MapD.Shuffle参考答案:B20. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中B.Hadoop自带有一套脚本,用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一

6、些工作流D.Amazon EC2为Hadoop提供了存储服务参考答案:D21. 关系数据库与NoSQL数据库相比有哪些优势( )A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力参考答案:AC22. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A23. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C24. UMP系通过( )

7、来实现实现数据路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B25. Hadoop启动所有进程的命令为( )。A.all-start.shB.all-start.exeC.start-all.shD.start-all.exe参考答案:C26. 已得到广泛应用的分布式文件系统主要包括( )。A.GFSB.MapReduceC.HbaseD.HDFS参考答案:AD27. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD28. Spark中DataFrame的( )方法是进行排序查询A.order byB.gro

8、up byC.select byD.sort by参考答案:A29. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A30. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案:C31. 回溯法是一种既带有系统性又带有跳跃性的搜索算法。( )A.错误B.正确参考答案:B32. Scala函数组合器中foreach和map类似,有返回值。( )A.正确B.错误参考答案:B33. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇

9、(Cluster)。( )A.对B.错参考答案:A34. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案:B35. var a=10; for(aA.10B.11C.20D.19参考答案:D36. 图结构中如果无重复的边或者顶点到自身的边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:D37. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC38. 0-1背包问题的回溯算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O

10、(2n)D.O(n)参考答案:A39. 分支限界法解最大团问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:B40. HDFS中SecondaryNameNode可减少( )重启的时间A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:A41. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC42. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A43. Gartner研究机构给出的大数据定义是大数据一般会涉及两种

11、或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B44. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A45. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD46. Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:D47. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:C48. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C49. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD50. MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。( )T.对F.错参考答案:T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号