南开大学21春《大数据开发技术》在线作业二满分答案73

上传人:工**** 文档编号:463927054 上传时间:2023-10-04 格式:DOCX 页数:13 大小:13.86KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业二满分答案73_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案73_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案73_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案73_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业二满分答案73_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业二满分答案73》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业二满分答案73(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业二满分答案1. 图的结构通常表示为:G(V,E),其中,G表示( )A.图B.子图C.顶点D.边参考答案:A2. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:C3. Mllib中线性会馆算法中的参数numIterations表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A4. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电

2、信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB5. Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件。( )A.正确B.错误参考答案:A6. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQLB.OracleC.HbaseD.NosSQL参考答案:C7. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F8. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union

3、参考答案:A9. var a=10; for(aA.10B.11C.20D.19参考答案:D10. Spark Streming中( )函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案:D11. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A12. UMP系通过( )来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答

4、案:A13. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A14. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B15. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B16. RDD的map操作不会改变RDD的分区数目。( )A.正确B.错误参考答案:A17. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD18. 关联分析又称为关

5、联规则学习。( )A.对B.错参考答案:A19. Scala是一种纯面向对象的语言,每个值都是对象。( )T.对F.错参考答案:T20. 算法的复杂性没有时间复杂性和空间复杂性之分。( )A.错误B.正确参考答案:A21. RDD是一个( )的数据结构A.可读写B.只读的C.容错的D.可进行并行操作的参考答案:BCD22. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答案:ABCD23. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案:ACD24. 居民通过健康云平台中的数据,了解健康情况,防患于未然; 医疗

6、机构通过对远程监控系统中的数据分析,缩短住院时间,提高家庭护理比例和门诊医生预约量。( )A.对B.错参考答案:A25. spark-submit配置项中( )表示executor内存大小A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:B26. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure L

7、ayer参考答案:B27. 矩阵连乘问题的算法可由动态规划设计实现。( )A.错误B.正确参考答案:B28. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B29. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A30. MongoDB将数据存储为一个( )A.关系B.属性C.字段D.文档参考答案:D31. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegresso

8、rC.LogisticRegressionModelD.LabeledPoint参考答案:B32. GraphX中( )方法可以查询度数A.degreesB.degreeC.verticesD.edges参考答案:A33. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案:B34. Scala类通过子类化和基于灵活的混合类来进行扩展,作为( )的一个可靠性解决方案A.多态B.虚函数C.派生D.多重继承参考答案:D35. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案:T36. 非结构化数据是指非纯文本类数据,

9、没有标准格式,无法直接解析出相应的值。( )A.对B.错参考答案:A37. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B38. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C39. 以下不可以使用分治法求解的是( )。A.棋盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案:D40. GraphX中( )方法可以查询边信息A.numVerticesB.numEdgesC.verticesD.edges参考答案:D41. 关系数据库与

10、NoSQL数据库相比有哪些优势( )A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力参考答案:AC42. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B43. 算法是由若干条指令组成的有穷序列,且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案:B44. MapReduce将输入文件切分成M个分片,Master将其中( )个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1参考答案:A45. 以下哪个函数可以对两个RDD进行合并( )A.

11、unionB.substractC.intersectionD.cartesian参考答案:A46. NoSQL数据库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:CD47. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A48. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC49. 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是( )A.0,numPartitionsB.

12、0,numPartitions-1C.1,numPartitions-1D.1,numPartitions参考答案:B50. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B51. 以下哪个函数可以求两个RDD差集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:B52. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A53. Scala函数组合器中flatmap结合了map和flatten的功能,接收一

13、个可以处理嵌套列表的函数,然后把返回结果连接起来。( )A.正确B.错误参考答案:A54. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B55. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A56. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案:D57. ( )可以解决图计算问题A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:C58. DataFrame是一个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号