南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84

上传人:cl****1 文档编号:474540005 上传时间:2022-11-06 格式:DOCX 页数:11 大小:13.09KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84_第1页
第1页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84_第2页
第2页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84_第3页
第3页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84_第4页
第4页 / 共11页
南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》复习考核试题库答案参考套卷84(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术复习考核试题库答案参考1. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B2. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B3. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A4. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。( )A.正确B.错误

2、参考答案:A5. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD6. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:D7. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A8. Strassen矩阵乘法是利用什么实现的算法?( )A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A9. MapReduce设计的一个理念就

3、是( ),因为移动数据需要大量的网络传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据并行参考答案:B10. PairRDD可以通过( )获得仅包含键的RDDA.keyB.keysC.valueD.values参考答案:B11. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B12. 内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。( )A.对B.错参考答案:A13. RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所

4、有元素构成新的RDD。( )A.正确B.错误参考答案:A14. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( )A.正确B.错误参考答案:A15. 对于不同顶点之间的信息交换,Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案:C16. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A17. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block

5、参考答案:B18. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B19. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案:T20. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B21. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C22. GraphX中( )方法可以查询度数A.degreesB.degreeC.vertice

6、sD.edges参考答案:A23. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T24. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B25. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC26. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案:B27. Mllib中metrics.recallByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC

7、曲线参考答案:B28. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD29. UMP系通过( )来实现实现数据路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B30. 问题的最优子结构性质是该问题不可用动态规划算法或贪心算法求解的关键特征。( )A.错误B.正确参考答案:A31. Mllib实现了一些常见的机器学习算法和应用程序,包括( )A.分类B.聚类C.降维D.回归参考答案:ABCD32. 流计算是针对流数据的实时计算

8、,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD33. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B34. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A35. 以下哪些是数据可视化时间线工具( )A.EchartsB.TimetoastC.XtimelineD.R参考答案:BC36. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD37. 大数据决策逐渐

9、成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案:A38. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C39. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C40. 图结构中如果任

10、意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A41. Scala类通过子类化和基于灵活的混合类来进行扩展,作为( )的一个可靠性解决方案A.多态B.虚函数C.派生D.多重继承参考答案:D42. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A43. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A44. 在Storm的工作流程中,对于Supervisor说法错误的是( )。A.Supervisor会去Zookeeper集群上认领自己的TaskB.Supervisor节点首先将提交的Topo

11、logy进行分片,分成一个个Task,分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Worker进程进行Task的处理参考答案:B45. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A46. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A47. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB48. Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B49. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A50. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号