南开大学21秋《大数据开发技术》平时作业二参考答案79

上传人:大米 文档编号:504175460 上传时间:2023-06-25 格式:DOCX 页数:13 大小:14.04KB
返回 下载 相关 举报
南开大学21秋《大数据开发技术》平时作业二参考答案79_第1页
第1页 / 共13页
南开大学21秋《大数据开发技术》平时作业二参考答案79_第2页
第2页 / 共13页
南开大学21秋《大数据开发技术》平时作业二参考答案79_第3页
第3页 / 共13页
南开大学21秋《大数据开发技术》平时作业二参考答案79_第4页
第4页 / 共13页
南开大学21秋《大数据开发技术》平时作业二参考答案79_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《南开大学21秋《大数据开发技术》平时作业二参考答案79》由会员分享,可在线阅读,更多相关《南开大学21秋《大数据开发技术》平时作业二参考答案79(13页珍藏版)》请在金锄头文库上搜索。

1、南开大学21秋大数据开发技术平时作业二参考答案1. Mllib实现了一些常见的机器学习算法和应用程序,包括( )A.分类B.聚类C.降维D.回归参考答案:ABCD2. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD3. 数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段?( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:A4. 贪心选择性质是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。( )A.错误B.正确参考答案:B5. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时

2、间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B6. Spark GraphX中类Graph的reverse方法可以( )A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性参考答案:A7. 程序是算法用某种程序设计语言的具体实现。( )A.错误B.正确参考答案:B8. RDD的( )操作通常用来划分单词A.filterB.unionC.flatmapD.mapPartitions参考答案:C9. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息,构造最优解。(

3、 )A.错误B.正确参考答案:A10. 算法是由若干条指令组成的有穷序列,且要满足输入、输出、确定性和有限性四条性质。( )A.错误B.正确参考答案:B11. GraphX中( )方法可以查询顶点个数A.numVerticesB.numEdgesC.verticesD.edges参考答案:A12. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C13. 拉斯维加斯算法找到的解不一定是正确解。( )A.错误B.正确参考答案:A14. UMP系统中面对多个小规模用

4、户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A15. 在图结构中,每个元素都可以有( )前驱A.至少一个B.零个或多个C.一个D.零个参考答案:B16. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB17. 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。( )A.正确B.错误参考答案:A18. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driv

5、er 端,适用于大数据处理后的返回。( )T.对F.错参考答案:F19. Scala中创建一个方法时经常用void表示该方法无返回值。( )T.对F.错参考答案:F20. 感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。( )A.正确B.错误参考答案:A21. Scala中集合连接时如果元素有重复的就会移除重复的元素。( )A.正确B.错误参考答案:A22. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B23. 传统的数据处理流程的前提是( )。A.存储的数据是旧的B.存储的数据

6、是实时的C.需要用户主动发出查询D.不需要用户主动发出查询参考答案:AC24. HDFS中当一些数据节点不可用时,会导致一些数据块的副本数量( )冗余因子A.大于B.小于C.等于D.大于等于参考答案:B25. 批处理系统关注( ),流处理系统关注( )。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率参考答案:A26. 设计动态规划算法的主要步骤有5步。( )A.错误B.正确参考答案:A27. 亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层。( )A.正确B.错误参考答案:A28. 以下哪个函数可以求两个RDD的笛卡尔积( )A.unionB.sub

7、stractC.intersectionD.cartesian参考答案:D29. 流计算是针对流数据的实时计算,可以应用在( )场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统参考答案:ABCD30. Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B31. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D3

8、2. Hadoop在配置伪分布式时需要修改哪几个配置文件( )。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml参考答案:BC33. ( )是Spark的数据挖掘算法库A.Spark CoreB.BlinkDBC.GraphXD.Mllib参考答案:D34. MapReduce中( )会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.T

9、ask Tracker参考答案:D35. 在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注意数据的结构。这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。( )A.对B.错参考答案:A36. Mllib中metrics.roc表示( )指标A.准确度B.召回率C.F值D.ROC曲线参考答案:D37. 传感器工作模式类别包括( )。A.基于位置B.基于活动C.基于设备参考答案:ABC38. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A39

10、. UMP系统借助于( )来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper参考答案:D40. 下列Scala代码应输出( ):var a=0;var b=0var sum=0;for(a-1 until 3; b-1 until 3) sum+=a+b;println(sum);A.36B.35C.11D.12参考答案:D41. 图结构中如果任意两个顶点之间都存在边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:A42. UMP系通过( )来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Pro

11、xy服务器C.愚公系统D.Agent服务器参考答案:C43. Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings( )。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping参考答案:B44. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B45. RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD。( )A.正确B.错误参考答案:A46. MLlib中进行数据标准化的方式有( )A.Norma

12、lizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD47. 任何可用计算机求解的问题所需的时间都与其规模无关。( )A.错误B.正确参考答案:A48. HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。( )A.正确B.错误参考答案:A49. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD50. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F51. 分支限界法与回溯法的求解目标相同。( )A.错误B.正确参考答

13、案:A52. 最长公共子序列算法利用的算法是( )。A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:B53. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )A.对B.错参考答案:A54. var a=10; for(aA.10B.11C.20D.19参考答案:D55. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD56. Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。( )A.正确B.错误参考答案:A57. 实现合并排序利用的算法是( )。A.分治策略B.动态规划法C.贪心法D.回溯法参考答案:A58. Hadoop启动所有进程的命令为( )。A.all-start.shB.all-start.exeC.start

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号