南开大学21秋《大数据开发技术》在线作业三满分答案98

上传人:cn****1 文档编号:514006629 上传时间:2023-04-06 格式:DOCX 页数:13 大小:13.66KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业三满分答案98_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业三满分答案98_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业三满分答案98_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业三满分答案98_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业三满分答案98_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业三满分答案98》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业三满分答案98(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业三满分答案1. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A2. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B3. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC4. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案:B5. 可使用( ),( ),( )进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值参考答案:BCD6. SQL Azure体系结构层中哪层是硬件和操作系统( )A.Clien

2、t LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:D7. 下列属于传统统计学展示方法的是( )。A.柱状图B.饼状图C.曲线图D.网络图参考答案:ABC8. Spark只有键值对类型的RDD才能设置分区方式。( )A.正确B.错误参考答案:A9. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:D10. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于

3、大数据处理后的返回。( )T.对F.错参考答案:F11. RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案:A12. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:C13. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B14. var a=10; for(aA.10B.11C.20D.19参考答案:D15. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实

4、例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:C16. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B17. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C18. Scala类通过子类化和基于灵活的混合类来进行扩展,作为( )的一个可靠性解决方案A.多态B.虚函数C.派生D.多重继承参考

5、答案:D19. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB20. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A21. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C22. Scala列表方法中丢弃前n个元素,并返回新列表的方法是( )A.dropB.headC.filterD.init参考答案:A23. Google Chart AP

6、I是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A24. 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A25. 关系数据库的关键特性包括完善的事务机制和高效的查询机制。( )A.正确B.错误参考答案:A26. Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:D27. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Servi

7、ces LayerC.Platform. LayerD.Infrastructure Layer参考答案:A28. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD29. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD30. Mllib中metrics.recallByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:B31. Hbase中Zookeeper提供了( )A.分布式同步B.组服务C.域名服务D.配置维护参考答案:A

8、BCD32. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C33. RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T34. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T35. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A36. MLBase包括( )A.MllibB.MLIC.SparkRD.Gr

9、aphX参考答案:AB37. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC38. 下列算法中通常以深度优先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:D39. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A40. Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储。(

10、)A.正确B.错误参考答案:B41. 关系数据库与NoSQL数据库相比有哪些优势( )A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力参考答案:AC42. MapReduce中最优的Reduce任务个数取决于集群中可用的( )的数目。A.SplitB.SlotC.MapD.Shuffle参考答案:B43. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B44. Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来。(

11、)A.正确B.错误参考答案:A45. Spark Streming中Dstream是一种抽象的离散流。( )T.对F.错参考答案:T46. Scala中元组是是一种可迭代的键值对(key/value)结构。( )A.正确B.错误参考答案:B47. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A48. TF-IDF中TF指的是( )A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率参考答案:AB49. Spark中DataFrame的( )方法是查询指定字段的数据信息A.sel

12、ectB.selectExprC.colD.apply参考答案:ABCD50. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快参考答案:B51. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F52. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案:B53. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A54. Storm中Bolt可以执行过滤

13、、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A55. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:A56. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟。( )A.正确B.错误参考答案:A57. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:B58. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B59. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-t

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号