南开大学22春《大数据开发技术》离线作业一及答案参考56

上传人:m**** 文档编号:464663705 上传时间:2023-04-27 格式:DOCX 页数:13 大小:13.54KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》离线作业一及答案参考56_第1页
第1页 / 共13页
南开大学22春《大数据开发技术》离线作业一及答案参考56_第2页
第2页 / 共13页
南开大学22春《大数据开发技术》离线作业一及答案参考56_第3页
第3页 / 共13页
南开大学22春《大数据开发技术》离线作业一及答案参考56_第4页
第4页 / 共13页
南开大学22春《大数据开发技术》离线作业一及答案参考56_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》离线作业一及答案参考56》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》离线作业一及答案参考56(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术离线作业一及答案参考1. 流计算系统的需求有( )。A.实时性B.廉价C.高性能D.高带宽E.分布式参考答案:ACE2. Scala在子类中重写超类的抽象方法时,需要使用override关键字。( )T.对F.错参考答案:F3. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )A.正确B.错误参考答案:B4. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A5. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F

2、.错参考答案:T6. 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案:D7. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T8. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D9. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:B10.

3、 Scala通过( )来定义变量A.valB.valC.defineD.def参考答案:A11. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A12. 分治法与动态规划法的不同点是:适合于用动态规划法求解的问题,经分解得到的子问题往往不是互相独立的。而用分治法求解的问题,经分解得到的子问题往往是互相独立的。( )A.错误B.正确参考答案:B13. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.u

4、nion参考答案:A14. Spark Streming中( )函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象A.mapB.flatMapC.filterD.union参考答案:D15. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案:ACD16. 以下亚马逊的产品中哪个属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案:BC17. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F18. 用户可以在Hadoop YARN上运行Spark。( )T.对F.错参

5、考答案:T19. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A20. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD21. 回溯法解旅行售货员问题时的解空间树是( )。A.子集树B.排列树C.深度优先生成树D.广度优先生成树参考答案:A22. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B23. Scala函数组合器中filter过滤移除使得传入的函数的

6、返回值为true的元素。( )A.正确B.错误参考答案:B24. 大数据智能感知层:主要包括( )及软硬件资源接入系统。A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系参考答案:ABCD25. MspReduce中的Map和Reduce函数使用( )进行输入输出。A.key/value对B.随机数值C.其他计算结果参考答案:A26. Spark只有键值对类型的RDD才能设置分区方式。( )A.正确B.错误参考答案:A27. 解决0/1背包问题可以使用动态规划、回溯法和分支限界法,其中不需要排序的是动态规划,需要排序的是回溯法,分支限界法。( )A.错误B.正确参考答案:B28.

7、 RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T29. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD30. MLBase包括( )A.MllibB.MLIC.SparkRD.GraphX参考答案:AB31. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B32. 优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:D33. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法

8、是( )A.filterB.foreachC.mapD.mkString参考答案:D34. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A35. MapReduce中Client会跟踪任务的执行进度、资源使用量等信息。( )A.正确B.错误参考答案:B36. Scala中重写一个非抽象方法必须使用( )修饰符。A.extendsB.overrideC.extendD.overrides参考答案:B37. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )A.正确

9、B.错误参考答案:B38. 已得到广泛应用的分布式文件系统主要包括( )。A.GFSB.MapReduceC.HbaseD.HDFS参考答案:AD39. 在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。( )A.正确B.错误参考答案:B40. RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD。( )A.正确B.错误参考答案:A41. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B42. 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。( )A.正

10、确B.错误参考答案:A43. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T44. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A45. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B46. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T47. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B48. Spark可以从( )分布式文件系统中

11、读取数据A.HDFSB.HbaseC.HiveD.Tachyon参考答案:ABCD49. Mllib中metrics.recallByThreshold表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:B50. 使用回溯法进行状态空间树裁剪分支时一般有两个标准:约束条件和目标函数的界,N皇后问题和0/1背包问题正好是两种不同的类型,其中同时使用约束条件和目标函数的界进行裁剪的是0/1背包问题,只使用约束条件进行裁剪的是N皇后问题。( )A.错误B.正确参考答案:B51. NoSQL数据库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数

12、据分析参考答案:CD52. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F53. 以下哪个函数可以对RDD进行去重( )A.sortByB.filterC.distinctD.intersection参考答案:C54. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply参考答案:ABCD55. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )T.对F.错参考答案:F56. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D

13、.12参考答案:B57. 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是( )A.0,numPartitionsB.0,numPartitions-1C.1,numPartitions-1D.1,numPartitions参考答案:B58. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A59. 以下属于Hadoop的安装方式的有( )。A.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式参考答案:ACE60. PairRDD的( )方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号