南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(二)》在线作业参考答案

上传人:学*** 文档编号:136006777 上传时间:2020-06-22 格式:DOCX 页数:16 大小:22.97KB
返回 下载 相关 举报
南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(二)》在线作业参考答案_第1页
第1页 / 共16页
亲,该文档总共16页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(二)》在线作业参考答案》由会员分享,可在线阅读,更多相关《南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(二)》在线作业参考答案(16页珍藏版)》请在金锄头文库上搜索。

1、南开20春学期(1709、1803、1809、1903、1909、2003)大数据开发技术(二)在线作业试卷总分:100 得分:100一、单选题 (共 25 道试题,共 50 分)1.Spark中DataFrame的()方法是进行条件查询A.whereB.joinC.limitD.apply答案:A2.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。A.第一个B.所有C.前10个D.前100个答案:C3.Scala元组的值是通过将单个的值包含在()中构成的A.小括号B.中括号C.大括号D.尖括号答案:A4.当需要将一个普通的RDD转化为一个PairR

2、DD时可以使用()函数来进行操作A.transferB.changeC.mapD.build答案:C5.以下哪个函数可以求两个RDD交集 ()A.unionB.substractC.intersectionD.cartesian答案:C6.以下哪个函数可以求两个RDD差集 ()A.unionB.substractC.intersectionD.cartesian答案:B7.spark-submit配置项中()表示executor使用的总核数A.-num-executors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-execut

3、or-coures NUM答案:C8.GraphX中()方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist答案:C9.以下哪个方法可以从外部存储中创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile答案:C10.Scala可以使用()关键字实现单例模式A.objectB.staticC.privateD.public答案:A11.以下哪个不是Scala的数据类型()A.IntB.Short IntC.LongD.Any答案:B12.Mllib中metrics.precisio

4、nByThreshold表示()指标A.准确度B.召回率C.F值D.ROC曲线答案:A13.图的结构通常表示为:G(V,E),其中,E是图G中()A.顶点B.顶点的集合C.边D.边的集合答案:D14.请问RDD的()操作用于将相同键的数据聚合A.joinB.zipC.combineByKeyD.collect答案:C15.Mllib中metrics.recallByThreshold 表示()指标A.准确度B.召回率C.F值D.ROC曲线答案:B16.GraphX中EdgeRDD继承自()A.EdgeRDDB.RDDEdgeC.VertexRDDVDD.RDD(VertexId,VD)答案:B

5、17.Dstream输出操作中()方法将DStream中的内容以文本的形式保存为文本文件A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles答案:B18.GraphX中()方法可以查询顶点信息A.numVerticesB.numEdgesC.verticesD.edges答案:C19.Scala通过()来定义变量A.valB.valC.defineD.def答案:A20.Mllib中线性会馆算法中的参数reParam表示()A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso 和ridg

6、e 的正规化参数答案:D21.Scala中()方法返回Map所有的valueA.keyB.keysC.valueD.values答案:D22.Scala列表方法中返回所有元素,除了最后一个的方法是()A.dropB.headC.filterD.init答案:D23.Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStreamA.unionB.reduceC.joinD.cogroup答案:B24.PairRDD可以通过()获得仅包含键的RDDA.keyB.keysC.valueD.values答案:B

7、25.Scala中()方法返回Map所有的keyA.keyB.keysC.valueD.values答案:B二、多选题 (共 10 道试题,共 20 分)26.以下哪个是Scala的数据类型()A.AnyB.NULLC.NothingD.AnyRef答案:ABCD27.以下算法中属于分类算法的是()A.KNN算法B.逻辑回归C.随机森林D.Kmeans答案:ABC28.Spark的RDD持久化操作有()方式A.cacheB.presistC.storageD.long答案:AB29.Spark Streaming的特点有()A.单极性B.可伸缩C.高吞吐量D.容错能力强答案:BCD30.Spa

8、rk Streaming能够和()无缝集成A.HadoopB.Spark SQLC.MllibD.GraphX答案:BCD31.Scala系统支持()作为对象成员A.通用类B.内部类C.抽象类D.复合类答案:ABCD32.Scala中可以用()方法来连接两个或多个列表A.:B.#:C.List.:()D.List.concat()答案:BCD33.Spark DataFrame中()方法可以返回一个ListA.collectB.takeC.takeAsListD.collectAsList答案:CD34.Spark DataFrame中()方法可以返回一个Array对象A.collectB.t

9、akeC.takeAsListD.collectAsList答案:AB35.Spark可以通过哪些外部存储创建RDD()A.文本文件B.目录C.压缩文件D.通配符匹配的文件答案:ABCD三、判断题 (共 15 道试题,共 30 分)36.Spark只有键值对类型的RDD才能设置分区方式答案:正确37.Scala中列表是可变的答案:错误38.RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。答案:错误39.Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗答案:错误40.Spark在同一个应用中不能同时使用Spark SQL和M

10、llib答案:错误41.val如同Java里面的非final变量,可以在它的声明周期中被多次赋值。答案:错误42.Scala 配备了一种表现型的系统,它以静态的方式进行抽象,以安全和连贯的方式进行使用。答案:正确43.RDD的mapPartitions操作会导致Partitions数量的变化答案:错误44.RDD的flatMap操作是将函数应用于RDD 之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD 。答案:正确45.RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除答案:正确46.MLlib中StandardScaler处理的对象是每

11、一列,也就是每一维特征,将特征标准化为单位标准差或是0均值,或是0均值单位标准差。答案:正确47.RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD答案:正确48.用户可以在Apache Mesos上运行Spark答案:正确49.RDD中join操作根据键对两个RDD进行内连接,将两个RDD 中键相同的数据的值相加。答案:错误50.PairRDD中groupByKey是对具有相同键的值进行分组答案:正确以下内容不需要的请自行删除 德国企业是欧洲企业的代表 1.企业培训。德国企业培训的突出特点是注重能力的培养,解决实际存在的问题。通过探讨和实验寻求解决问题的最佳途径和方法,给每

12、个员工充分的自由发挥的空间,极大地调动了他们的积极性,也大大地提高了参训学员的素质和解决问题的能力。德国企业培训工作还有一个十分重要的任务,就是让员工认同企业的价值观。 2.牢固的质量意识。德国企业对产品质量一向是最重视的。他们认为没有物美价廉的产品,只有精品和次品。他们的许多产品都是以精取胜,成为世界知名的品牌。德国企业精益求精的价值观已深入人心,成为员工的一种自觉行为。德国企业员工追求技术完美和注重质星的强烈意识,技术不断进步,保持良好的质量,制造一流产品,是德国企业具有较强竟争力的重要原因。 3.注重独创性研究开发。德国研究经费占国民生产总值2.9%,居世界前列。德国人相信研究与开发决定

13、企业未来,因而不论经济如何不景气,也不削减开发费用,并在研究中重视独创性和高度专业性,最大限度发挥个人创造潜力,这是德国研究与开发体制的长处。附件2个人所得税预扣率表一(居民个人工资、薪金所得预扣预缴适用)级数累计预扣预缴应纳税所得额预扣率(%)速算扣除数1不超过36000元的部分302超过36000元至144000元的部分1025203超过144000元至300000元的部分20169204超过300000元至420000元的部分25319205超过420000元至660000元的部分30529206超过660000元至960000元的部分35859207超过960000元的部分451819

14、20个人所得税预扣率表二(居民个人劳务报酬所得预扣预缴适用)级数预扣预缴应纳税所得额预扣率(%)速算扣除数1不超过20000元的2002超过20000元至50000元的部分3020003超过50000元的部分407000个人所得税税率表三(非居民个人工资、薪金所得,劳务报酬所得,稿酬所得,特许权使用费所得适用)级数应纳税所得额税率(%)速算扣除数1不超过3000元的302超过3000元至12000元的部分102103超过12000元至25000元的部分2014104超过25000元至35000元的部分2526605超过35000元至55000元的部分3044106超过55000元至80000元的部分3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号