南开大学21春《大数据开发技术》离线作业2参考答案54

上传人:cn****1 文档编号:512894956 上传时间:2023-07-29 格式:DOCX 页数:11 大小:12.93KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业2参考答案54_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案54_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案54_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案54_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案54_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业2参考答案54》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业2参考答案54(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业2参考答案1. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A2. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案:B3. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C4. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD5. R

2、DD的map操作不会改变RDD的分区数目。( )A.正确B.错误参考答案:A6. 一个问题可用动态规划算法或贪心算法求解的关键特征是问题的( )。A.重叠子问题B.最优子结构性质C.贪心选择性质D.定义最优解参考答案:B7. 回溯法是一种既带有系统性又带有跳跃性的搜索算法。( )A.错误B.正确参考答案:B8. 请问RDD的( )操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect参考答案:A9. MapReduce设计的一个理念就是( ),因为移动数据需要大量的网络传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据

3、并行参考答案:B10. 图结构中如果无重复的边或者顶点到自身的边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:D11. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B12. 分布式离线分析可以实现秒级别的实时分析响应。( )A.正确B.错误参考答案:B13. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD14. Scala中( )方法返回一个列表,包含除了最后一个元素之外的其他元素A.headB.initC.tailD.last参考答案:B15. 优点是

4、性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:D16. PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。( )A.正确B.错误参考答案:A17. 大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案:A18. Mllib中线性会馆算法中的参数numIterations表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数

5、据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A19. 下列属于传统统计学展示方法的是( )。A.柱状图B.饼状图C.曲线图D.网络图参考答案:ABC20. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:A21. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C22. 大数据的特征是( )。A.数据体量大B.

6、数据产生速度快C.数据种类多D.数据计算快E.数据价值高参考答案:ABCE23. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案:A24. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A25. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A26. Scala中如果函数无返回值,则函数返回类型为( )A.NULLB.VoidC.NothingD.Unit参考答案:D27. 传统的数据

7、处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC28. Mllib中metrics.fMeasureByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:C29. 回溯法搜索状态空间树是按照什么的顺序?( )A.中序遍历B.广度优先遍历C.深度优先遍历D.层次优先遍历参考答案:C30. RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。( )T.对

8、F.错参考答案:T31. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T32. 内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。( )A.对B.错参考答案:A33. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案:B34. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A35. UMP系通过( )来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Co

9、ntroller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:A36. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQLB.OracleC.HbaseD.NosSQL参考答案:C37. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B38. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B39. HDFS中SecondaryNameNode可减少( )重启的时间A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:A40. PairRDD的( )方法,可以把

10、两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection参考答案:A41. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D42. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A43. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案:B44. 递归函数意味着函数可以调用它( )A.其

11、他函数B.主函数C.子函数D.自身参考答案:D45. Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来。( )A.正确B.错误参考答案:A46. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F47. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案:B48. Google Chart API是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A49. Spark的RDD持久化操作有( )方式A.cacheB.presistC.storageD.long参考答案:AB50. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号