南开大学21秋《大数据开发技术》在线作业三答案参考19

上传人:枫** 文档编号:488214330 上传时间:2023-11-10 格式:DOCX 页数:13 大小:13.99KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业三答案参考19_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考19_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考19_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考19_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考19_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业三答案参考19》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业三答案参考19(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业三答案参考1. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( )A.正确B.错误参考答案:A2. Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。( )A.正确B.错误参考答案:B3. Spark创建DataFrame对象方式有( )A.结构化数据文件B.外部数据库C.RDDD.Hive中的表参考答案:ABCD4. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC5. RDD的map操作不会改变RDD的分

2、区数目。( )T.对F.错参考答案:T6. 分支限界法解最大团问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:B7. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A8. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参考答案:B9. Sca

3、la列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案:B10. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B11. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )T.对F.错参考答案:F12. Scala是一种纯面向对象的语言,每个值都是对象。( )T.对F.错参考答案:T13. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD

4、.MinMaxScaler参考答案:ACD14. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C15. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC16. 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。( )A.正确B.错误参考答案:B17. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.substractC.intersecti

5、onD.cartesian参考答案:D18. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案:B19. RDD是一个( )的数据结构A.可读写B.只读的C.容错的D.可进行并行操作的参考答案:BCD20. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案:B21. 分治法与动态规划法的不同点是:适合于用动态规划法求解的问题,经分解得到的子问题往往不是互相独立的。而用分治法求解的问题,经分解得到的子问题往往是互相独立的。( )A.错误B.正确参考答案:B22. MspReduce中的Map和Reduce函数使用( )进行输入输出。A.

6、key/value对B.随机数值C.其他计算结果参考答案:A23. spark-submit配置项中( )表示executor内存大小A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:B24. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B25. Scala源代码被编译成( )字节码,所以它可以运行于JVM之上A.SparkB.ScalaC.JavaD.JDK参考答案:C26. Spar

7、k支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD27. 请问RDD的( )操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect参考答案:A28. 一个问题可用动态规划算法或贪心算法求解的关键特征是问题的( )。A.重叠子问题B.最优子结构性质C.贪心选择性质D.定义最优解参考答案:B29. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A30. 任何可用计算机求解的问题所需的时间都与其规模无关。( )A.错误B.正确参考答案:A31. 分支限界法解旅行售货员问题时,活结点表的组织

8、形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:A32. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD33. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A34. Spark持久化RDD后,在再一次需要计算该RDD时将需要重新计算。( )A.正确B.错误参考答案:B35. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D36. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A37. 流计算的采集阶段需要保证( )。A.

9、实时性B.大量C.低延迟D.稳定可靠参考答案:ACD38. 键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。( )A.正确B.错误参考答案:A39. MapReduce设计的一个理念就是( ),因为移动数据需要大量的网络传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据并行参考答案:B40. Scala中使用( )方法来查看两个集合的交集元素A.Set.concatB.Set.&C.Set.&D.Set.intersect参考答案:BD41. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB

10、.SlaverC.Region服务器D.客户端参考答案:C42. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:C43. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID.射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )A.对B.错参考答案:A44. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随

11、机分配MySQL实例参考答案:C45. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B46. 感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。( )A.正确B.错误参考答案:A47. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:D48. UMP系统借助于(

12、 )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper参考答案:D49. 下列算法中通常以自底向上的方式求解最优解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:B50. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB51. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T52. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参

13、考答案:A53. Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案:A54. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B55. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。( )T.对F.错参考答案:F56. Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F57. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和r

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号