南开大学21秋《大数据开发技术》在线作业一答案参考93

资源描述

《南开大学21秋《大数据开发技术》在线作业一答案参考93》由会员分享，可在线阅读，更多相关《南开大学21秋《大数据开发技术》在线作业一答案参考93（13页珍藏版）》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业一答案参考1. 流计算系统的需求有( )。A.实时性B.廉价C.高性能D.高带宽E.分布式参考答案：ACE2. Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。( )A.正确B.错误参考答案：B3. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息，构造最优解。( )A.错误B.正确参考答案：A4. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案：AC5. Spark取代Hadoop仅仅是取代MapReduce这种计算框架，Sp

2、ark可以取代HDFS吗。( )T.对F.错参考答案：F6. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案：A7. RDD的mapPartitions操作会导致Partitions数量的变化。( )A.正确B.错误参考答案：B8. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案：A9. 以下哪个函数可

3、以求两个RDD的笛卡尔积( )A.unionB.substractC.intersectionD.cartesian参考答案：D10. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案：ABCD11. Scala函数组合器中foreach和map类似，有返回值。( )A.正确B.错误参考答案：B12. Mllib中线性会馆算法中的参数numIterations表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案：A13. RDD的行动操作是用于触发转

4、换操作的操作，这个时候才会真正开始进行计算。( )A.正确B.错误参考答案：A14. Dstream输出操作中( )方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles参考答案：D15. 图结构中如果无重复的边或者顶点到自身的边，那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案：D16. Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值。( )T.对F.错参考答案：F17. Spark GraphX中类

5、Graph的reverse方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性D.合并边相同的属性参考答案：A18. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案：ABCD19. 程序是算法用某种程序设计语言的具体实现。( )A.错误B.正确参考答案：B20. SQL Azure体系结构层中哪层是硬件和操作系统( )A.Client LayerB.Services LayerC.Platform. LayerD.In

6、frastructure Layer参考答案：D21. 使用Amazon云环境部署Hadoop的说法中错误的是( )。A.Hadoop不仅可以运行在企业内部的集群中，也可以运行在云计算环境中B.Hadoop自带有一套脚本，用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazon EC2为Hadoop提供了存储服务参考答案：D22. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案：B23. 下列Scala代码应输出( )：var a=0;var b=0var sum=0;for(a-1 until 3; b-1 until 3) s

7、um+=a+b;println(sum);A.36B.35C.11D.12参考答案：D24. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案：ACD25. Scala列表中last返回一个列表，包含除了第一个元素之外的其他元素。( )T.对F.错参考答案：F26. 以深度优先方式系统搜索问题解的算法称为回溯法。( )A.错误B.正确参考答案：B27. 对于不同顶点之间的信息交换，Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案：C28. Google Chart API是哪种可视化工具( )A.信息图表B.地图工具C.

8、时间线工具D.分析工具参考答案：A29. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案：B30. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案：ABC31. Spark SQL可被视为一个分布式的SQL查询引擎，并且提供了一个叫做DataFrame的可编程抽象数据模型。( )A.正确B.错误参考答案：A32. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案：BCD33. Scala函数组合器可以通

9、过一个函数重新计算列表中所有元素，没有返回值。( )A.正确B.错误参考答案：B34. 分支限界法解最大团问题时，活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案：B35. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案：A36. 回溯法搜索解空间树时，常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案：B37. 用户可以在Hadoop YARN上运行Spark。( )A.正确B.错误参考答案：A38. RDD的( )操作通常用来划分单词A.filterB.unionC.

10、flatmapD.mapPartitions参考答案：C39. 针对流数据，“量子恒道”可处理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案：A40. 关于分布式并行编程，以下说法错误的是( )。A.“摩尔定律”，CPU性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后，人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上，可以并行执行大规模数据处理任务，从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce参考答案：A41. MspReduce中的Map和Reduce函数使用( )进行输入输出。A.key/value对

11、B.随机数值C.其他计算结果参考答案：A42. Scala通过( )来定义变量A.valB.valC.defineD.def参考答案：A43. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案：A44. HDFS中SecondaryNameNode可减少( )重启的时间A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案：A45. 以下算法中属于无监督学习算法的是( )A.KNN算法B.逻辑回归C.随机森林D.

12、Kmeans参考答案：D46. Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案：A47. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案：B48. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案：A49. 很多企业为了支持决策分析而构建的数据仓库系统，其中存放的大量历史数据就是( )数据。技术人员可以利用数据挖掘

13、和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案：D50. 解决0/1背包问题可以使用动态规划、回溯法和分支限界法，其中不需要排序的是动态规划，需要排序的是回溯法，分支限界法。( )A.错误B.正确参考答案：B51. Hbase中缓存刷新，每次刷写都生成一个新的StoreFile文件，因此，每个Store包含多个StoreFile文件。( )A.正确B.错误参考答案：A52. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案：A53. Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案：F54. Spark中DataFrame的( )方法是进行条件查询A.where

展开阅读全文