南开大学21春《大数据开发技术》在线作业二满分答案_29

上传人:hs****ma 文档编号:470086775 上传时间:2023-02-04 格式:DOCX 页数:13 大小:13.79KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业二满分答案_29_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案_29_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案_29_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案_29_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案_29_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业二满分答案_29》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业二满分答案_29(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业二满分答案1. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A2. UMP系通过( )来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:A3. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案:C4. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享

2、同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:C5. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案:B6. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD7. 文件块的大小和副本个数只能由系统指定。( )A.正确B.错误参考答案:B8. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D

3、.O(n)参考答案:B9. 任何可用计算机求解的问题所需的时间都与其规模无关。( )A.错误B.正确参考答案:A10. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T11. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A12. 广度优先是什么的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A13. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC14. HDFS中SecondaryName

4、Node可减少( )重启的时间A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:A15. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T16. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B17. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B18. MLlib中用于线性回归算法的包主要有( )A.Linea

5、rRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression参考答案:ABC19. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A20. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A21. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A22. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪

6、心法D.回溯法参考答案:A23. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案:B24. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A25. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )T.对F.错参考答案:F26. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A27. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共

7、顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C28. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:D29. RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。( )A.正确B.错误参考答案:A30. 图结构中如果无重复的边或者顶点到自身的边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:D31. MongoDB将

8、数据存储为一个( )A.关系B.属性C.字段D.文档参考答案:D32. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T33. Dstream窗口操作中( )方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:C34. Mllib中线性会馆算法中的参数numIterations表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A35.

9、PairRDD可以通过( )获得仅包含键的RDDA.keyB.keysC.valueD.values参考答案:B36. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A37. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息,构造最优解。( )A.错误B.正确参考答案:A38. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F39. 从分治法的一般设计模式可以看出,用它设计出的程序一般是递归算法。( )A.错误B.正确参考答案:B40. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据

10、D.关系数据库参考答案:ABCD41. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。( )A.对B.错参考答案:A42. GraphX中( )方法可以查询度数A.degreesB.degreeC.verticesD.edges参考答案:A43. 以深度优先方式系统搜索问题解的算法称为回溯法。( )A.错误B.正确参考答案:B44. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B45. Spark GraphX中类Graph的reverse方法可以( )A.反转图中所有边的方向B.按

11、照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:A46. 每个变量的最大值和最小值之差称为极差。( )A.对B.错参考答案:A47. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A48. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B49. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中B.Ha

12、doop自带有一套脚本,用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazon EC2为Hadoop提供了存储服务参考答案:D50. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B51. MapReduce的main函数中设置输出类型的方法有( )。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClass参考答案:AC52. Scala是Scalable Language的简写,是一门多范式的编程语言,设

13、计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F53. RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T54. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T55. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD56. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A57. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:B58. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号