南开大学21春《大数据开发技术》在线作业三满分答案63

上传人:pu****.1 文档编号:511410319 上传时间:2023-10-29 格式:DOCX 页数:13 大小:13.99KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》在线作业三满分答案63_第1页
第1页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案63_第2页
第2页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案63_第3页
第3页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案63_第4页
第4页 / 共13页
南开大学21春《大数据开发技术》在线作业三满分答案63_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》在线作业三满分答案63》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》在线作业三满分答案63(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术在线作业三满分答案1. var a=10; do a+=1;while(aA.9B.10C.11D.12参考答案:B2. 在Storm的工作流程中,对于Supervisor说法错误的是( )。A.Supervisor会去Zookeeper集群上认领自己的TaskB.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Worker进程进行Task的处理参考答案:B3. 流计算系统的需求有( )。A.实时

2、性B.廉价C.高性能D.高带宽E.分布式参考答案:ACE4. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B5. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC6. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:C7. Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是( )A.mapB.for

3、eachC.flattenD.flatmap参考答案:D8. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD9. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A10. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD11. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A12. 大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应

4、用的不断涌现。( )A.正确B.错误参考答案:A13. Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数。( )T.对F.错参考答案:F14. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A15. 分支限界法解最大团问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:B16. MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。( )T.对F.错参考答案:T17. 下列算法中通常以深度优

5、先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:D18. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B19. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案:B20. Scala在子类中重写超类的抽象方法时,需要使用override关键字。( )T.对F.错参考答案:F21. 舍伍德算法总能求得问题的一个解。( )A.错误B.正确参考答案:B22. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答

6、案:ACD23. 从分治法的一般设计模式可以看出,用它设计出的程序一般是递归算法。( )A.错误B.正确参考答案:B24. SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:C25. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC26. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法

7、参考答案:ABCD27. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。( )A.正确B.错误参考答案:A28. 按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。( )A.对B.错参考答案:A29. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A30. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案:ACD31. MLBase包括( )A.MllibB.MLIC.

8、SparkRD.GraphX参考答案:AB32. 在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据。( )A.对B.错参考答案:A33. 用分支限界法设计算法的第二步是( )。A.针对所给问题,定义问题的解空间(对解进行编码)B.确定易于搜索的解空间结构(按树或图组织解)C.以广度优先或以最小耗费(最大收益)优先的方式搜索解空间D.在搜索过程中用剪枝函数避免无效搜索参考答案:B34. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A35.

9、Spark可以通过哪些外部存储创建RDD( )A.文本文件B.目录C.压缩文件D.通配符匹配的文件参考答案:ABCD36. RDD的filter过滤会将返回值为true的过滤掉。( )T.对F.错参考答案:F37. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案:A38. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。( )A.对B.错参考答案:A39. Scala源代码被编译成( )字节码,所以它可以运行于JVM之上A.SparkB.ScalaC.Jav

10、aD.JDK参考答案:C40. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A41. Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储。( )A.正确B.错误参考答案:B42. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B43. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B44. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B45. 程序是算法用某种程序设计语言

11、的具体实现。( )A.错误B.正确参考答案:B46. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B47. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:D48. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD49. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD50. PairRDD中( )函数可以合并具有相同键的值A.mapValuesB.g

12、roupByC.groupByKeyD.reduceByKey参考答案:A51. Spark的RDD持久化操作有( )方式A.cacheB.presistC.storageD.long参考答案:AB52. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参考答案:A53. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A54. 居民通过健康云平台中的数据,了解健康情况,防患于未然; 医疗机构通过对远

13、程监控系统中的数据分析,缩短住院时间,提高家庭护理比例和门诊医生预约量。( )A.对B.错参考答案:A55. 图的结构通常表示为:G(V,E),其中,E是图G中( )A.顶点B.顶点的集合C.边D.边的集合参考答案:D56. 可视化工具包括( )。A.ExcelB.Google ChartC.GephiD.ppt参考答案:ABC57. Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。( )T.对F.错参考答案:F58. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD59. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息,构造最优解。( )A.错误B.正确参考答案:A60. MongoDB将数据存储为一个( )A.关系B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号