南开大学21秋《大数据开发技术》在线作业一答案参考86

上传人:s9****2 文档编号:485315043 上传时间:2022-10-09 格式:DOCX 页数:13 大小:13.85KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业一答案参考86_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考86_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考86_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考86_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业一答案参考86_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业一答案参考86》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业一答案参考86(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业一答案参考1. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A2. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息,构造最优解。( )A.错误B.正确参考答案:A3. Scala中使用( )方法来查看两个集合的交集元素A.Set.concatB.Set.&C.Set.&D.Set.intersect参考答案:BD4. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考答案:T5. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB

2、.substractC.intersectionD.cartesian参考答案:D6. 用户可以在Apache Mesos上运行Spark。( )T.对F.错参考答案:T7. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参考答案:B8. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD9. 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨

3、在确保源系统中的函数依赖和参照约束与目标系统中的匹配。( )A.对B.错参考答案:A10. 实现大整数的乘法是利用( )的算法。A.贪心法B.动态规划法C.分治策略D.回溯法参考答案:C11. MapReduce的main函数中设置输出类型的方法有( )。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClass参考答案:AC12. 按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。( )A.对B.错参考答案:A13. Spark取代Hadoop仅仅是取代MapReduce

4、这种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F14. 回溯法搜索状态空间树是按照什么的顺序?( )A.中序遍历B.广度优先遍历C.深度优先遍历D.层次优先遍历参考答案:C15. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。( )A.正确B.错误参考答案:A16. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:A17. 我们既要通过政府主导,又要发挥社

5、会的力量,来共同推进医疗大数据的应用。( )A.对B.错参考答案:A18. 对于不同顶点之间的信息交换,Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案:C19. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C20. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D2

6、1. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC22. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。( )A.对B.错参考答案:A23. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A24. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B25. Scala是Scalable Language的简写,是一门多范式的编程语

7、言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F26. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB27. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:C28. 计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。( )A.错误B.正确参考答案:B29. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作

8、是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B30. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F31. HBase的客户端并不依赖Master,而是通过( )来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby参考答案:C32. Scala在子类中重写超类的抽象方法时,需要使用override关键字。( )T.对F.错参考答案:F33. 以下哪个函数可以求两个RDD差集 ( )A.unionB.s

9、ubstractC.intersectionD.cartesian参考答案:B34. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B35. HDFS读数据过程中( )具体实现了FileSystemA.DistributedFileSystemB.GFSSystemC.FileSystemD.HDFSSystem参考答案:A36. Spark中DataFrame的( )方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A37. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F38. S

10、park持久化RDD后,在再一次需要计算该RDD时将需要重新计算。( )A.正确B.错误参考答案:B39. SQL Azure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:B40. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A41. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersectio

11、n参考答案:A42. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案:B43. Hadoop在配置伪分布式时需要修改哪几个配置文件( )。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml参考答案:BC44. 分支限界法解最大团问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:B45. TF-IDF中TF指的是( )A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概

12、率参考答案:AB46. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案:A47. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD48. Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:A49. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端

13、定位于通讯记录D.社会网络签到数据参考答案:ABCD50. 每个变量的最大值和最小值之差称为极差。( )A.对B.错参考答案:A51. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B52. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参考答案:T53. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案:B54. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB55. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B56. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C57. 批处理系统关注( ),流处理系统关注( )。A.吞吐率

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号