南开大学22春《大数据开发技术》综合作业二答案参考86

上传人:汽*** 文档编号:469140845 上传时间:2023-08-13 格式:DOCX 页数:13 大小:13.31KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》综合作业二答案参考86_第1页
第1页 / 共13页
南开大学22春《大数据开发技术》综合作业二答案参考86_第2页
第2页 / 共13页
南开大学22春《大数据开发技术》综合作业二答案参考86_第3页
第3页 / 共13页
南开大学22春《大数据开发技术》综合作业二答案参考86_第4页
第4页 / 共13页
南开大学22春《大数据开发技术》综合作业二答案参考86_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》综合作业二答案参考86》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》综合作业二答案参考86(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术综合作业二答案参考1. 以下哪个是Scala的数据类型( )A.AnyB.NULLC.NothingD.AnyRef参考答案:ABCD2. 以深度优先方式系统搜索问题解的算法称为回溯法。( )A.错误B.正确参考答案:B3. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C4. GraphX中( )方法可以查询边信息A.numVerticesB.numEdgesC.verticesD.edges参考答案:D5. 贪心选择性质是贪心算

2、法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:A6. Spark中DataFrame的( )方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A7. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A8. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )T.对F.错参考答案:F9. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges

3、参考答案:A10. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( )A.正确B.错误参考答案:A11. GraphX中( )是存放着Edg对象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD参考答案:A12. 下列属于传统统计学展示方法的是( )。A.柱状图B.饼状图C.曲线图D.网络图参考答案:ABC13. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )A.正确B.错误参考答案:B14. 下列算法中通常以自底向上的方式求解

4、最优解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:B15. 图(Graph)是一种复杂的非线性结构。( )T.对F.错参考答案:T16. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD17. 图的结构通常表示为:G(V,E),其中,G表示( )A.图B.子图C.顶点D.边参考答案:A18. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配My

5、SQL实例参考答案:A19. Map Task和Reduce Task均由( )启动。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D20. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQLB.OracleC.HbaseD.NosSQL参考答案:C21. HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。( )A.正确B.错误参考答案:A22. Hadoop启动所有进程的命令为( )。A.all-start.shB.all-start.exeC.start-all.shD.start-all.exe参考答案:C23

6、. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )T.对F.错参考答案:F24. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD25. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B26. 哈弗曼编码的贪心算法所需的计算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B27. 分支限界法解旅行售货员问题时,活结点表的组织形式是( )。A.最小堆B.最大堆C.栈D.数组参考答

7、案:A28. Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B29. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B30. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B31. Spark Streming中( )函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DSt

8、ream对象A.mapB.flatMapC.filterD.union参考答案:D32. Hbase采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:A33. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block参考答案:B34. 分治法与动态规划法的不同点是:适合于用动态规划法求解的问题,经分解得到的子问题往往不是互相独立的。而用分治法求解的问题,经分解得到的子问题往往是互相独立的。( )A.错误B.正确参考答案:B35. PairRDD中mapVa

9、lues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作。( )A.正确B.错误参考答案:B36. 解决0/1背包问题可以使用动态规划、回溯法和分支限界法,其中不需要排序的是动态规划,需要排序的是回溯法,分支限界法。( )A.错误B.正确参考答案:B37. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:C38. 关联分析又称为关联规则学习。( )A.对B.错参考答案:A39. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值。( )A.对B.错参考答案:

10、A40. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D41. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B42. var a=10; do a+=1; while(a20) 共循环了( )次A.9B.10C.11D.12参考答案:B43. Spark中DataFrame的( )方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply参考答案:ABCD44. Pentaho是最流行的开源商业智能软件之一。( )A.对B.错参考答案:A45. RDD的

11、intersection方法用于求出两个RDD的共同元素。( )A.正确B.错误参考答案:A46. Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗。( )T.对F.错参考答案:F47. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B48. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A49. HDFS读数据过程中( )具体实现了FileSystemA.Distribut

12、edFileSystemB.GFSSystemC.FileSystemD.HDFSSystem参考答案:A50. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B51. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.substractC.intersectionD.cartesian参考答案:D52. 云数据库不可以满足大企业的海量数据存储需求。( )A.正确B.错误参考答案:B53. 分支限界法主要有队列式(FIFO)分支限界法和优先队列式分支限界法。( )A.错误B.正确参考答案:B54. RDD的sortB

13、y排序默认是升序。( )T.对F.错参考答案:T55. 默认情况下,Scala 使用的是可变集合。( )T.对F.错参考答案:F56. GraphX中( )方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:C57. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( )T.对F.错参考答案:T58. 数据产生方式的运营式系统阶段的数据产生方式是主动的。( )A.正确B.错误参考答案:B59. Spark Streming中( )函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.mapB.flatMapC.filterD.union参考答案:C60.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号