南开大学21春《大数据开发技术》离线作业1辅导答案85

上传人:s9****2 文档编号:484572939 上传时间:2024-02-10 格式:DOCX 页数:11 大小:12.58KB
返回 下载 相关 举报
南开大学21春《大数据开发技术》离线作业1辅导答案85_第1页
第1页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案85_第2页
第2页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案85_第3页
第3页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案85_第4页
第4页 / 共11页
南开大学21春《大数据开发技术》离线作业1辅导答案85_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学21春《大数据开发技术》离线作业1辅导答案85》由会员分享,可在线阅读,更多相关《南开大学21春《大数据开发技术》离线作业1辅导答案85(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学21春大数据开发技术离线作业1辅导答案1. HDFS读数据过程中( )具体实现了FileSystemA.DistributedFileSystemB.GFSSystemC.FileSystemD.HDFSSystem参考答案:A2. Spark中DataFrame的( )方法是进行分组查询A.order byB.group byC.select byD.sort by参考答案:B3. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A4. ( )可以解决图计算问题A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:

2、C5. RDD是一个可读写的数据结构。( )T.对F.错参考答案:F6. 下列算法中不能解决0/1背包问题的是( )。A.贪心法B.动态规划C.回溯法D.分支限界法参考答案:A7. 感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。( )A.正确B.错误参考答案:A8. BigTable采用( )作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统参考答案:B9. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B10. 以下哪种数据库适合于批量数据处理和即席查询( )A.MySQLB.OracleC.

3、HbaseD.NosSQL参考答案:C11. Scala 集合分为可变的和不可变的集合。( )T.对F.错参考答案:T12. 下列算法中通常以深度优先方式系统搜索问题解的是( )。A.备忘录法B.动态规划法C.贪心法D.回溯法参考答案:D13. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD14. MapReduce将输入文件切分成M个分片,Master将其中( )个分片分给处于空闲状态的N个Worker来处理。A.MB.NC.M-1D.N-1参考答案:A15. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C

4、.感知式系统阶段参考答案:A16. 下列属于传统统计学展示方法的是( )。A.柱状图B.饼状图C.曲线图D.网络图参考答案:ABC17. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案:C18. 回溯法是一种既带有系统性又带有跳跃性的搜索算法。( )A.错误B.正确参考答案:B19. 大数据技术也能帮助政府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A20. 以下亚马逊的产品中哪个属于存储部分( )A.EC2B.EBSC.S3D.ELB参考答案:BC21. SQL Azure体系结构层中哪

5、层相当于网关,相当于普通Web系统的逻辑层( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:B22. 分布式离线分析可以实现秒级别的实时分析响应。( )A.正确B.错误参考答案:B23. 使用回溯法进行状态空间树裁剪分支时一般有两个标准:约束条件和目标函数的界,N皇后问题和0/1背包问题正好是两种不同的类型,其中同时使用约束条件和目标函数的界进行裁剪的是0/1背包问题,只使用约束条件进行裁剪的是N皇后问题。( )A.错误B.正确参考答案:B24. Spark Streming中对DStrea

6、m的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A25. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。( )T.对F.错参考答案:F26. Scala在子类中重写超类的抽象方法时,需要使用override关键字。( )T.对F.错参考答案:F27. GraphX中( )方法可以查询度数A.degreesB.degreeC.verticesD.edges参考答案:A28. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A29. Mllib中线性会馆算法中的参数numIterati

7、ons表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:A30. Spark Streming中( )函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStreamA.unionB.reduceC.joinD.cogroup参考答案:B31. 回溯法搜索状态空间树是按照什么的顺序?( )A.中序遍历B.广度优先遍历C.深度优先遍历D.层次优先遍历参考答案:C32. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD33. 大数据决策逐渐

8、成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。( )A.正确B.错误参考答案:A34. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B35. Spark DataFrame中( )方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList参考答案:AB36. Scala源代码被编译成( )字节码,所以它可以运行于JVM之上A.SparkB.ScalaC.JavaD.JDK参考答案:C37. 哈弗曼编码的贪心算法所需的计

9、算时间为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B38. 图(Graph)是一种复杂的非线性结构。( )T.对F.错参考答案:T39. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D40. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A41. MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法( )训练回归树A.trainClassifierB.trainRegressorC.Logi

10、sticRegressionModelD.LabeledPoint参考答案:B42. 以下算法中属于分类算法的是( )A.KNN算法B.逻辑回归C.随机森林D.Kmeans参考答案:ABC43. 快速排序算法的性能取决于划分的对称性。( )A.错误B.正确参考答案:B44. Google Chart API是哪种可视化工具( )A.信息图表B.地图工具C.时间线工具D.分析工具参考答案:A45. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B46. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A47. Hadoop启动所有进程的命令为( )。A.all-start.shB.all-start.exeC.start-all.shD.start-all.exe参考答案:C48. Scala中数组的第一个元素索引为1。( )A.正确B.错误参考答案:B49. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F50. var a=10; for(aA.10B.11C.20D.19参考答案:D

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号