南开大学21秋《大数据开发技术》在线作业三满分答案12

资源描述

《南开大学21秋《大数据开发技术》在线作业三满分答案12》由会员分享，可在线阅读，更多相关《南开大学21秋《大数据开发技术》在线作业三满分答案12（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业三满分答案1. 任何可用计算机求解的问题所需的时间都与其规模无关。( )A.错误B.正确参考答案：A2. Spark SQL可以通过( )方法加载json文件为DataFrameA.formatB.jsonC.getD.read参考答案：AB3. 实现大整数的乘法是利用( )的算法。A.贪心法B.动态规划法C.分治策略D.回溯法参考答案：C4. 分治法与动态规划法的不同点是：适合于用动态规划法求解的问题，经分解得到的子问题往往不是互相独立的。而用分治法求解的问题，经分解得到的子问题往往是互相独立的。( )A.错误B.正确参考答案：B5. UMP系统中面对多个

2、小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案：A6. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案：AB7. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案：A8. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案：B9. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题

3、不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案：A10. 下列算法中通常以深度优先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案：D11. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案：A12. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题，这些子问题互相独立且与原问题相同。递归地解这些子问题，然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案：B13. 贪心算法的基本要素是贪心选择质和最优子结构性

4、质。( )A.错误B.正确参考答案：B14. HDFS中客户端在读取到数据后，会采用( )对数据块进行校验，以确定正确性A.md5B.哈希桶C.sha1D.奇偶校验参考答案：AC15. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树参考答案：A16. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案：T17. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案：A18. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExpr

5、C.colD.apply参考答案：ABCD19. 流计算系统的需求有( )。A.实时性B.廉价C.高性能D.高带宽E.分布式参考答案：ACE20. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案：C21. 大数据决策逐渐成为一种新的决策方式，大数据应用有力促进了信息技术与各行业的深度融合，大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案：A22. 居民通过健康云平台中的数据，了解健康情况，防

6、患于未然; 医疗机构通过对远程监控系统中的数据分析，缩短住院时间，提高家庭护理比例和门诊医生预约量。( )A.对B.错参考答案：A23. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案：B24. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper参考答案：D25. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案：D

7、26. 大数据的特征是( )。A.数据体量大B.数据产生速度快C.数据种类多D.数据计算快E.数据价值高参考答案：ABCE27. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案：C28. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案：B29. Scala通过( )来定义变量A.valB.valC.defineD.def参考答案：A30. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序，故算法的时间复杂度为( )。A.O(n2

8、n)B.O(nlogn)C.O(2n)D.O(n)参考答案：B31. 以下算法中属于监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案：ABC32. 数据采集，又称数据获取，是大数据生命周期的第一个环节，通过RFID.射频识别技术，传感器，交互型社交网络，移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案：A33. 大数据计算处理方法主要分为两种方法，即批处理方法和流处理方法。( )A.正确B.错误参考答案：A34. 在Storm的工作流程中，对于Supervisor说法错误的是( )。A.Supervisor会去

9、Zookeeper集群上认领自己的TaskB.Supervisor节点首先将提交的Topology进行分片，分成一个个Task，分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Worker进程进行Task的处理参考答案：B35. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQLB.OracleC.HbaseD.NosSQL参考答案：C36. Mllib中metrics.roc表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案：D37. 算法是由若干条指令组成的有穷序列，且要满足

10、输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案：B38. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案：B39. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案：B40. 传统数据处理流程，用户需要主动发起查询或者定时查询;流处理流程中，可以实时查询。( )A.正确B.错误参考答案：A41. HDFS中SecondaryNameNode可减少( )重启的时间A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考

11、答案：A42. Spark只有键值对类型的RDD才能设置分区方式。( )A.正确B.错误参考答案：A43. MspReduce中的Map和Reduce函数使用( )进行输入输出。A.key/value对B.随机数值C.其他计算结果参考答案：A44. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案：B45. 1秒定律体现了大数据的哪个特征( )。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快参考答案：B46. TF-IDF中TF指的是( )A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现

12、的概率参考答案：AB47. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性D.合并边相同的属性参考答案：C48. Storm框架是实时计算系统，所以不能使用数据库。( )A.正确B.错误参考答案：B49. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案：D50. MLlib中用于线性回归算法的包主要有( )A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD

13、.LeftRegression参考答案：ABC51. 在图结构中，每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案：B52. 图结构中如果无重复的边或者顶点到自身的边，那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案：D53. Dstream窗口操作中( )方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案：C54. 从分治法的一般设计模式可以看出，用它设计出的程序一般是递归算法。( )A.错误B.正确参考答案：B55. Spark创建DataFrame对象方式有( )A.结构化数据文件B.外部数据库C.RDDD.Hive中的表参考答案：ABCD56. Scala中元组是是一种可迭代的键值对(key/value)结构。( )A

展开阅读全文