南开大学21春《大数据开发技术》离线作业2参考答案7

上传人:壹****1 文档编号:468334368 上传时间:2023-12-21 格式:DOCX 页数:11 大小:12.95KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业2参考答案7_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案7_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案7_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案7_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案7_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业2参考答案7》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业2参考答案7(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业2参考答案1. Hadoop在配置伪分布式时需要修改哪几个配置文件( )。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml参考答案:BC2. 一个问题可用动态规划算法或贪心算法求解的关键特征是问题的( )。A.重叠子问题B.最优子结构性质C.贪心选择性质D.定义最优解参考答案:B3. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A4. Scala列表中last返回一个列表,包含除了

2、第一个元素之外的其他元素。( )T.对F.错参考答案:F5. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B6. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A7. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D8. Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗。(

3、)T.对F.错参考答案:F9. 居民通过健康云平台中的数据,了解健康情况,防患于未然; 医疗机构通过对远程监控系统中的数据分析,缩短住院时间,提高家庭护理比例和门诊医生预约量。( )A.对B.错参考答案:A10. 早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架。( )A.正确B.错误参考答案:A11. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B12. 优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是( )A.列族数据库B.

4、键值数据库C.图数据库D.文档数据库参考答案:D13. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A14. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案:A15. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )A.对B.错参考答案:A16. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A17. RDD的(

5、 )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C18. Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:D19. 解决0/1背包问题可以使用动态规划、回溯法和分支限界法,其中不需要排序的是动态规划,需要排序的是回溯法,分支限界法。( )A.错误B.正确参考答案:B20. Spark Streming中( )函数可以对源DStre

6、am的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A21. Pentaho是最流行的开源商业智能软件之一。( )A.对B.错参考答案:A22. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A23. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B24. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL

7、实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:C25. Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:D26. PairRDD中( )函数可以合并具有相同键的值A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:A27. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD28. 图结构中如果任意两个顶点之间都存在有向边,

8、那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B29. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A30. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T31. Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。( )A.正确B.错误参考答案:B32. HDFS

9、在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。( )A.正确B.错误参考答案:A33. Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:C34. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B35. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参

10、考答案:A36. 用分支限界法设计算法的第二步是( )。A.针对所给问题,定义问题的解空间(对解进行编码)B.确定易于搜索的解空间结构(按树或图组织解)C.以广度优先或以最小耗费(最大收益)优先的方式搜索解空间D.在搜索过程中用剪枝函数避免无效搜索参考答案:B37. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C38. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C39. Scala中重写一个非抽象方法必须使

11、用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B40. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C41. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:D42. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T

12、.对F.错参考答案:T43. Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储。( )A.正确B.错误参考答案:B44. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:D45. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD46. 可视化工具包括( )。A.ExcelB.Google ChartC.GephiD.ppt参考答案:ABC47. RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案:A48. Scala是一种纯面向对象的语言,每个值都是对象。( )T.对F.错参考答案:T49. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A50. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号