南开大学21春《大数据开发技术》离线作业1辅导答案17

上传人:工**** 文档编号:489628678 上传时间:2023-02-18 格式:DOCX 页数:11 大小:13.10KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业1辅导答案17_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案17_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案17_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案17_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案17_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业1辅导答案17》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业1辅导答案17(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业1辅导答案1. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )A.正确B.错误参考答案:B2. 在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据。( )A.对B.错参考答案:A3. 按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海量级数据分析。( )A.对B.错参考答案:A4. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位

2、于通讯记录D.社会网络签到数据参考答案:ABCD5. spark-submit配置项中( )表示Driver程序使用的内存大小A.-driver-memory MEMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM参考答案:A6. Dstream窗口操作中( )方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindo

3、w参考答案:D7. Spark GraphX中类Graph的reverse方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:A8. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B9. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:D10. SQL Azure体系结构层中哪层是存储节点集群,相当于普通

4、Web系统的数据库层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:C11. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A12. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD13. Spark Streming中( )函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W)键值对的一个新 DStream。A.unionB.

5、reduceC.joinD.cogroup参考答案:D14. Hive提供了大数据批处理计算功能。( )A.正确B.错误参考答案:B15. MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。( )T.对F.错参考答案:T16. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答案:ABCD17. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案:C18. RDD的map操作不会改变RDD的分区数目。( )T.对F.错参考答案:T19. Scala 集合分为可变

6、的和不可变的集合。( )T.对F.错参考答案:T20. 针对流数据,“量子恒道”可处理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案:A21. Spark DataFrame中( )方法可以返回一个ListA.collectB.takeC.takeAsListD.collectAsList参考答案:CD22. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC23. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B24. 程序是算法用某种程序设计语

7、言的具体实现。( )A.错误B.正确参考答案:B25. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )T.对F.错参考答案:F26. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A27. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A28. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案:B29. UMP系通过( )来实现实现集群成员管理、元数

8、据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:A30. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T31. 以下哪个函数可以对两个RDD进行合并( )A.unionB.substractC.intersectionD.cartesian参考答案:A32. 分支限界法解最大团问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答案:B33. 以下属于Hadoop的安装方式的有( )。A.单机模式B.多机模式C.分布式模式D

9、.并行模式E.伪分布式模式参考答案:ACE34. Spark GraphX中类Graph的mask方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:C35. 回溯法搜索状态空间树是按照什么的顺序?( )A.中序遍历B.广度优先遍历C.深度优先遍历D.层次优先遍历参考答案:C36. Scala中合并两个数组的方法是( )A.lineB.addC.appendD.concat参考答案:D37. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B3

10、8. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。( )A.错误B.正确参考答案:B39. PairRDD中( )函数可以合并具有相同键的值A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:A40. Graph类中如果根据边数据创建图,数据需要转换成RDDEdgeED类型,应该用( )方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue)C.Graph.fromEdgeTuples(rawEdges: RDD(

11、VertexId, VertexId), defaultValueD.GraphLoader.edgeListFile(sc,filename)参考答案:B41. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。( )A.对B.错参考答案:A42. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A43. 分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解合并得到原问题的解。( )A.错误B.正确参考答案:B44. NoSQL数据

12、库与关系数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:CD45. 关于Map端Shuffle过程中的合并与归并,说法正确的是( )。A.两个键值对和,如果合并,会得到B.合并不会改变最终结果C.两个键值对和,如果归并,会得到D.两个键值对和,如果归并,会得到参考答案:ABD46. Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F47. Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:C48. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD49. UMP系通过( )来实现实现数据路由的基本功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:B50. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号