南开大学21春《大数据开发技术》离线作业2参考答案10

上传人:夏** 文档编号:488051565 上传时间:2023-01-10 格式:DOCX 页数:11 大小:12.57KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业2参考答案10_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案10_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案10_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案10_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业2参考答案10_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业2参考答案10》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业2参考答案10(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业2参考答案1. 图(Graph)是一种复杂的非线性结构。( )T.对F.错参考答案:T2. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A3. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C4. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T5. Mllib实现了一些常见的机器学习算法和应用程序,包括( )A.分类B.聚

2、类C.降维D.回归参考答案:ABCD6. HDFS中客户端在读取到数据后,会采用( )对数据块进行校验,以确定正确性A.md5B.哈希桶C.sha1D.奇偶校验参考答案:AC7. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply参考答案:ABCD8. MapReduce将输入文件切分成M个分片,Master将其中( )个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1参考答案:A9. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Z

3、ookeeper参考答案:D10. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A11. 下列Scala代码应输出( ):var a=0;var b=0var sum=0;for(a-1 until 3; b-1 until 3) sum+=a+b;println(sum);A.36B.35C.11D.12参考答案:D12. ( )可以解决图计算问题A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:C13. Spark Streming中( )函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K

4、,(V,W)键值对的一个新 DStream。A.unionB.reduceC.joinD.cogroup参考答案:D14. 早期对于流计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架。( )A.正确B.错误参考答案:A15. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A16. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B17. 最长公共子序列算法利

5、用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B18. 可视化工具包括( )。A.ExcelB.Google ChartC.GephiD.ppt参考答案:ABC19. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD20. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB21. 算法是由若干条指令组成的有穷序列,且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案:B22. Spark中DataFrame的( )

6、方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B23. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T24. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A25. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A26. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案:A27. 分治法与动态规划法的不同点是:适合于用动态规划法求解的问题,经分解得到的子问题往往不是互相独立的。而用分治法求解的问题,经分解得到的

7、子问题往往是互相独立的。( )A.错误B.正确参考答案:B28. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C29. GraphX中( )方法可以查询边信息A.numVerticesB.numEdgesC.verticesD.edges参考答案:D30. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A31. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B

8、.错误参考答案:A32. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:ABCD33. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:C34. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案:B35. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )A.对B.错参考答案:A36. 分支限界法解旅行售货员问题时,活结点表的组织形式是( )。A

9、.最小堆B.最大堆C.栈D.数组参考答案:A37. 实现棋盘覆盖算法利用的算法是( )。A.分治法B.动态规划法C.贪心法D.回溯法参考答案:A38. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C39. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案:T40. Scala函数组合器中foreach和map类似,有返回值。( )A.正确B.错误参考答案:B41. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B42. spark-submit配置项中(

10、 )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A43. Dstream输出操作中( )方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案:C44. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services

11、 LayerC.Platform. LayerD.Infrastructure Layer参考答案:B45. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A46. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F47. var a=10; for(aA.10B.11C.20D.19参考答案:D48. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A49. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B50. 亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层。( )A.正确B.错误参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号