南开大学21秋《大数据开发技术》在线作业三答案参考72

上传人:人*** 文档编号:487333737 上传时间:2023-11-30 格式:DOCX 页数:13 大小:13.96KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》在线作业三答案参考72_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考72_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考72_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考72_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》在线作业三答案参考72_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》在线作业三答案参考72》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》在线作业三答案参考72(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术在线作业三答案参考1. RDD的intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A2. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC3. Spark中DataFrame的( )方法是进行排序查询A.order byB.group byC.select byD.sort by参考答案:A4. 在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据。( )A.对B.错参考答案:A5. Scala函数组合

2、器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B6. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F7. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A8. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A9. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B10. 早期对于流

3、计算的研究多数是基于对传统数据库处理的流式化,即实时数据库,很少研究流计算框架。( )A.正确B.错误参考答案:A11. 动态规划算法的基本思想是将待求解问题分解成若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解。( )A.错误B.正确参考答案:B12. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案:B13. Scala是一种纯面向对象的语言,每个值都是对象。( )T.对F.错参考答案:T14. Spark可以通过哪些外部存储创建RDD( )A.文本文件B.目录C.压缩文件D.通配符匹配的文件参考答案:ABCD15. Spark Streming中(

4、)函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStreamA.unionB.reduceC.joinD.cogroup参考答案:B16. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T17. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A18. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D19. M

5、Llib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD20. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案:B21. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( )A.filterB.foreachC.mapD.mkString参考答案:D22. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A23. 计算一个算法时间复杂度通常可以计算循环次数、基本操

6、作的频率或计算步。( )A.错误B.正确参考答案:B24. RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T25. 请问RDD的( )操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect参考答案:A26. Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:B27. MLlib 中可以调用mllib.tree.DecisionT

7、ree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参考答案:B28. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参考答案:A29. Hbase和传统数据库一样都是列式数据库。( )A.正确B.错误参考答案:B30. 数据归约(Data Reduction)主要有( )。A.维度规约B.样本规约C.数据聚集D.离散化概念分层参考答案:

8、ABCD31. Hbase中Zookeeper提供了( )A.分布式同步B.组服务C.域名服务D.配置维护参考答案:ABCD32. 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。( )A.对B.错参考答案:A33. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案:C34. Spark支持使用( )语言编写应用A.ScalaB.PythonC.JavaD.R参考答案:ABCD35. Map Task和Re

9、duce Task均由( )启动。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D36. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A37. 对于不同顶点之间的信息交换,Pregel采用了( )A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息参考答案:C38. 备忘录方法是哪种算法的变形?( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:B39. 图的结构通常表示为:G(V,E),其中,E是图G中( )A.顶点B.顶点的集合C.边D.边的集合参考答案:D40. Hadoop启动所有

10、进程的命令为( )。A.all-start.shB.all-start.exeC.start-all.shD.start-all.exe参考答案:C41. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow参考答案:D42. 程序是算法用某种程序设计语言的具体实现。( )A.错误B.正确参考答案:B43. MapReduce中最优的Reduce任务个数取决于集群中可用的(

11、 )的数目。A.SplitB.SlotC.MapD.Shuffle参考答案:B44. 以下不可以使用分治法求解的是( )。A.棋盘覆盖问题B.选择问题C.归并排序D.0/1背包问题参考答案:D45. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A46. Spark Streming中( )函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W)键值对的一个新 DStream。A.unionB.reduceC.joinD.cogroup参考答案:D47. Hadoop在配置伪分布式时需要修改哪几个配置文件(

12、 )。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml参考答案:BC48. HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。( )A.正确B.错误参考答案:B49. MLlib中用于线性回归算法的包主要有( )A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression参考答案:ABC50. 以下哪个函数可以对RDD进行排序( )A.sortB

13、yB.filterC.distinctD.intersection参考答案:A51. Scala 使用( )关键字来继承一个类A.extendsB.overrideC.extendD.overrides参考答案:A52. spark-submit配置项中( )表示启动的executor数量A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A53. 矩阵连乘问题的算法可由动态规划设计实现。( )A.错误B.正确参考答案:B54. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C55. Spark DataFrame中

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号