南开大学21春《大数据开发技术》离线作业1辅导答案55

上传人:M****1 文档编号:487334002 上传时间:2023-02-05 格式:DOCX 页数:11 大小:12.90KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业1辅导答案55_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案55_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案55_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案55_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案55_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业1辅导答案55》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业1辅导答案55(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业1辅导答案1. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B2. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。( )A.对B.错参考答案:A3. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A4. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B5. MspReduce中的Map和Reduce函数使用(

2、)进行输入输出。A.key/value对B.随机数值C.其他计算结果参考答案:A6. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B7. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答案:A8. 计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。( )A.错误B.正确参考答案:B9. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB10. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和V

3、alue进行Map操作。( )T.对F.错参考答案:F11. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.LogisticRegressionModelD.LabeledPoint参考答案:B12. 流计算的采集阶段需要保证( )。A.实时性B.大量C.低延迟D.稳定可靠参考答案:ACD13. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案:B14. RDD的filter函数返回一个

4、存储符合过滤条件的所有元素的新RDD。( )A.正确B.错误参考答案:A15. Scala列表中last返回列表最后一个元素。( )A.正确B.错误参考答案:A16. HDFS中客户端在读取到数据后,会采用( )对数据块进行校验,以确定正确性A.md5B.哈希桶C.sha1D.奇偶校验参考答案:AC17. Scala类通过子类化和基于灵活的混合类来进行扩展,作为( )的一个可靠性解决方案A.多态B.虚函数C.派生D.多重继承参考答案:D18. Mllib中线性会馆算法中的参数reParam表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和rid

5、ge的正规化参数参考答案:D19. 用户可以在Hadoop YARN上运行Spark。( )A.正确B.错误参考答案:A20. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC21. Scala函数组合器中foreach和map类似,有返回值。( )A.正确B.错误参考答案:B22. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD23. Scala中如果函数中的每个参数在函数中最多只出现一

6、次,则可以使用占位符( )代替参数。A.井号B.下划线C.斜杠D.逗号参考答案:B24. Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数。( )T.对F.错参考答案:F25. 递归函数意味着函数可以调用它( )A.其他函数B.主函数C.子函数D.自身参考答案:D26. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F27. 哪些属于数据可视化的重要作用( )A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据参考答案:ACD28. Spark Streming中( )函数可以对源DStream的每个元素通过函数fu

7、nc返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A29. 关于Strom中Bolt说法错误的是( )。A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tuple还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义参考答案:C30. Spark DataFrame中( )方法可以返回一个ListA.collectB.takeC.takeAsListD.collectAsList参考答案:CD31. 大数据计算处理方法主要分为两

8、种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A32. RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。( )A.正确B.错误参考答案:A33. GraphX中( )方法可以查询边信息A.numVerticesB.numEdgesC.verticesD.edges参考答案:D34. 请问RDD的( )操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect参考答案:A35. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B36. 默认情况

9、下,Scala 使用的是可变集合。( )T.对F.错参考答案:F37. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D38. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案:A39. Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:C40. 下列哪

10、一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C41. Spark中DataFrame的( )方法是进行连接查询A.whereB.joinC.limitD.apply参考答案:B42. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A43. Spark持久化RDD后,在再一次需要计算该RDD时将需要重新计算。( )A.正确B.错误参考答案:B44. Mllib中线性会馆算法中的参数numItera

11、tions表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A45. Graph类中如果根据边数据创建图,数据需要转换成RDDEdgeED类型,应该用( )方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue)C.Graph.fromEdgeTuples(rawEdges: RDD(VertexId, VertexId), defaultValueD.GraphLoader.edgeListFil

12、e(sc,filename)参考答案:B46. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( )A.filterB.flattenC.groubyD.flatmap参考答案:C47. Pig是Hadoop项目中一种数据仓库工具。( )A.正确B.错误参考答案:B48. 使用分治法求解不需要满足的条件是( )。A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A49. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B50. Spark可以通过哪些外部存储创建RDD( )A.文本文件B.目录C.压缩文件D.通配符匹配的文件参考答案:ABCD

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号