南开大学22春《大数据开发技术》补考试题库答案参考19

上传人:M****1 文档编号:474024386 上传时间:2023-10-23 格式:DOCX 页数:11 大小:13.17KB
返回 下载 相关 举报
南开大学22春《大数据开发技术》补考试题库答案参考19_第1页
第1页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考19_第2页
第2页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考19_第3页
第3页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考19_第4页
第4页 / 共11页
南开大学22春《大数据开发技术》补考试题库答案参考19_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《南开大学22春《大数据开发技术》补考试题库答案参考19》由会员分享,可在线阅读,更多相关《南开大学22春《大数据开发技术》补考试题库答案参考19(11页珍藏版)》请在金锄头文库上搜索。

1、南开大学22春大数据开发技术补考试题库答案参考1. 数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件。( )A.对B.错参考答案:A2. Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map。( )A.正确B.错误参考答案:A3. 应用于分布式数据存储与管理数据在地理上分布于多个数据中心的应用程序的数据库是哪种( )A.列族数据库B.键值数据库C.图数据库D.文档数据库参考答案:A4. Scala源代码被编译成( )字节码,所以它可以运行于JVM之上A.Spark

2、B.ScalaC.JavaD.JDK参考答案:C5. DataFrame是一个分布式的Row对象的数据集合。( )A.正确B.错误参考答案:A6. 大数据智能感知层:主要包括( )及软硬件资源接入系统。A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系参考答案:ABCD7. 针对流数据,“量子恒道”可处理每天( )级的实时流数据A.TBB.PBC.GBD.MB参考答案:A8. Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD实例。( )A.正确B.错

3、误参考答案:A9. Map Task和Reduce Task均由( )启动。A.ClientB.Job TrackerC.TaskD.Task Tracker参考答案:D10. 每个变量的最大值和最小值之差称为极差。( )A.对B.错参考答案:A11. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。( )T.对F.错参考答案:F12. GraphX中( )方法可以释放边缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist参考答案:D13. 大数据技术也能帮助政

4、府进行支出管理,透明合理的财政支出将有利于提高公信力和监督财政支出。( )A.对B.错参考答案:A14. UMP系统中面对多个小规模用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:A15. SQL Azure体系结构层中哪层是硬件和操作系统( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:D16. ( )是Spark的核心,提供底层框架及核心支持A.Spark CoreB.Spa

5、rk SQLC.Spark StreamingD.Mllib参考答案:A17. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B18. 大数据时代预测人类移动行为的数据来源有( )。A.志愿者定位数据B.装有导航设备的出租车轨迹数据C.手机终端定位于通讯记录D.社会网络签到数据参考答案:ABCD19. 以下哪个函数可以对RDD进行排序( )A.sortByB.filterC.distinctD.intersection参考答案:A20. Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存

6、储级别。( )A.正确B.错误参考答案:A21. Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )A.正确B.错误参考答案:A22. 动态规划算法的基本思想是将待求解问题分解成若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解。( )A.错误B.正确参考答案:B23. 下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画?( )A.ggplot2B.networkC.ggmapsD.animation参考答案:D24. HDFS的命名空间包含( )A.节点B.目

7、录C.文件D.块参考答案:BCD25. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( )A.对B.错参考答案:A26. MLlib中用于线性回归算法的包主要有( )A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression参考答案:ABC27. Mllib中线性会馆算法中的参数intercept表示( )A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数参考答案:C28. Spark GraphX中类Graph的joinV

8、ertices方法可以( )A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中参考答案:D29. 静态数据采取( )计算模式A.批量B.实时C.大数据D.动态参考答案:A30. RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。( )A.正确B.错误参考答案:B31. RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。( )A.正确B.错误参考答案:A32. 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静

9、态数据中找到对企业有价值的信息。A.动态B.存量C.实时D.静态参考答案:D33. Spark Streming中( )函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStreamA.unionB.reduceC.joinD.cogroup参考答案:B34. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( )T.对F.错参考答案:T35. 亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层。( )A.正确B.错误参考答案:A36. 文件块的大小和副本个数只能由系统指定。( )A

10、.正确B.错误参考答案:B37. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B38. Scala中可以用( )方法来连接两个或多个列表A.:B.#:C.List.:( )D.List.concat( )参考答案:BCD39. Spark中DataFrame的( )方法是进行条件查询A.whereB.joinC.limitD.apply参考答案:A40. 关系数据库与NoSQL数据库相比适用于哪些领域( )A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析参考答案:AB41. 以下哪个函数可以求两个RDD交集 ( )A.unionB.subst

11、ractC.intersectionD.cartesian参考答案:C42. 贪心算法的基本要素是贪心选择质和最优子结构性质。( )A.错误B.正确参考答案:B43. 以下属于Hadoop的安装方式的有( )。A.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式参考答案:ACE44. UMP系统中面对分库分表用户如何进行资源调度( )A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例参考答案:C45. RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除。( )T.对F.错参考

12、答案:T46. 图是一种数据元素间为( )关系的数据结构A.多对多B.一对一C.一对多D.多对一参考答案:A47. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( )T.对F.错参考答案:F48. Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B49. MLlib中进行数据标准化的方式有( )A.NormalizerB.StandardC.StandardScaleerD.MinMaxScaler参考答案:ACD50. 决策树是( )的常用算法A.分类B.聚类C.降维D.回归参考答案:AD

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号