智慧树知到《大数据算法》章节测试答案

上传人:巩鑫 文档编号:157496994 上传时间:2020-12-24 格式:PDF 页数:21 大小:343.18KB
返回 下载 相关 举报
智慧树知到《大数据算法》章节测试答案_第1页
第1页 / 共21页
智慧树知到《大数据算法》章节测试答案_第2页
第2页 / 共21页
智慧树知到《大数据算法》章节测试答案_第3页
第3页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《智慧树知到《大数据算法》章节测试答案》由会员分享,可在线阅读,更多相关《智慧树知到《大数据算法》章节测试答案(21页珍藏版)》请在金锄头文库上搜索。

1、智慧树知到大数据算法章节测试答案 1.1 1.以下关于大数据的特点,叙述错误的是()。答案:速度慢 A、速度慢 B、多元、异构 C、数据规模大 D、基于高度分析的新价值 2.在法华经中,“那由他”描写的“大”的数量级是()。答案:1028 A、107 B、1014 C、1028 D、1056 3.以下选项中,大数据涉及的领域中包括()。答案:社交网络计算机艺术医疗数据 A、社交网络 B、医疗数据 C、计算机艺术 D、医疗数据 4.大数据的应用包括()。答案:推荐科学研究预测商业情报分析 A、预测 B、推荐 C、商业情报分析 D、科学研究 5.目前,关于大数据已有公认的确定定义。 6.大数据种类

2、繁多,在编码方式、数据格式、应用特征等方面都存在差异。() 1.2 1. 大数据求解计算问题过程的第三步一般是()。答案:算法设计与分析 A、判断可计算否 B、判断能行可计算否 C、算法设计与分析 D、用计算机语言实现算法 2.在大数据求解计算问题中,判断是否为能行可计算的因素包括()。答案:资源约 束数据量时间约束 A、数据量 B、资源约束 C、速度约束 D、时间约束 3.大数据求解计算问题过程的第一步是确定该问题是否可计算。 4.大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。 1.3 1.资源约束包括()。答案:网络带宽外存 CPU 内存 A、CPU B、网络带宽 C、内存

3、 D、外存 2.大数据算法可以不是()。答案:精确算法串行算法内存算法 A、云计算 B、精确算法 C、内存算法 D、串行算法 3.大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生 成满足给定约束结果的算法。 4.MapReduce 是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。 5.大数据算法是仅在电子计算机上运行的算法。 1.4 1. 众包算法是用来解决()。答案:计算机计算能力不足或知识不足,需要人来帮忙 A、访问全部数据时间过长 B、数据难于放入内存计算 C、单个计算机难以保存全部数据,计算需要整体数据 D、计算机计算能力不足或知识不足,需要人来帮忙

4、2.大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案 是()。答案:读取部分数据 A、将数据存储到磁盘上 B、仅基于少量数据进行计算 C、读取部分数据 D、并行处理 3.大数据算法的()特点,使其与大数据算法密切相关的。答案:速度快数据量大 A、数据量大 B、基于高度分析的新价值 C、速度快 D、多样性、复杂性 4.为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技 术会涉及到时间亚线性算法。 1.5 1.大数据算法涉及到外存的时候,通常要分析()。答案:IO 复杂性 A、时间空间复杂性 B、IO 复杂性 C、结果质量 D、通讯复杂性 2.下列选项中,

5、属于智能仿生算法的是()。答案:遗传算法模拟退火算法 A、遗传算法 B、近似算法 C、模拟退火算法 D、数据流算法 3.在线算法/数据流算法是面向大数据速度快的特点提出的。() 4.对于数据流算法或在线算法,经常要分析结果的近似比。() 5.随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。 () 2.1 1.计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下, 进行精确计算最少需要访问()个顶点。答案:n-1 A、n B、n+1 C、2n D、n-1 2.亚线性是指()等的消耗是输入规模 o。()答案:空间通讯时间 IO A、时间 B、空间 C、IO D

6、、通讯 3.性质检测算法属于亚线性空间算法的一类。() 2.2 1. 在经典的水库抽样中,要求空间复杂性为 O(k),是指与抽样大小有关,而与整个数 据的数据量无关。 2.水库抽样算法的采样是均匀的。 2.3 1. 以下()不是衡量分析近似解代价与优化解代价差距的方法。答案:绝对误差 A、RatioBound B、相对误差 C、绝对误差 D、(1-)-近似 2.利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。 答案:二分之一 A、二分之一 B、三分之一 C、四分之一 D、十分之一 3.采用平面图的直径近似算法的动机是无法在要求的时间内得到()。答案:精确 解 A、相似解

7、 B、完整解 C、精确解 D、近似解 4.在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在 i、j、k 三个点中,i 到 j 的距离加上 j 到 k 的距离小于 i 到 k 的距离。 5.近似算法能给出一个优化问题的优化解。 6.RatioBound 越大,则近似解越坏。() 2.4 1. 在判定问题的近似中,对于近似解需要区分的是()。答案:差得很远是 A、是 B、否 C、差不离 D、差得很远 2.全 0 数组判定的近似算法的证据引理是:如果一次测试以大于等于 p 的概率获 得一个证据,那么 s=2/p 轮测试得到证据的概率大于等于 1/2。 3.判定问题的近似解是指:输入满足

8、某种性质或近似满足某种性质。 3.1 1. Zipf 原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。() 2.在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等, 且处理这些函数时通常使用单个寄存器 s。() 3.数据流模型中,数据流是指来自某个域中的元素序列。() 4.在数据流模型中,内存远远大于数据的规模。() 3.2 1. 频繁元素计算算法又称为()算法。答案:MG A、MM B、MG C、GM D、MP 2.频繁元素计算算法有效的原因是源于()。答案:Zipf 原则 A、取近似解 B、证据引理 C、错误界限和 k 成反比 D、Zipf 原则 3.在频繁元素计

9、算算法中,计数器 x 减少的次数依赖于有几个减少计数器的步骤。 () 4.在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差 的最多值时,可以得到频繁项一个好的估计。 3.3 1. 时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。 答 案:权重 A、近似值 B、精确值 C、权重 D、界限 2.求最小生成树是一个贪心法,可以用()算法来解决。答案:Prime A、Prime B、并行 C、MG D、内存 3.对联通分量个数的估计可以利用随机化方法。 3.4 1. 对于输入 n 个数的数组(x1,x2,x3,xn),输出:这个数组是否有序。远离意味 着必须

10、删除大于()个元素才能保证剩下的元素有序。答案:n A、-n B、n C、/n D、n/ 2.如果一次测试以大于等于 p 的概率获得一个证据,那么 s=2/p 轮测试得到证据 的概率大于等于 3/4。 3.关于证明如果输入远离有序,则存在大于 n 个“坏索引”的问题,可以采用证明 其逆否命题的方法。 4.1 1. 下列选项中叙述正确的是()。D A、磁盘的访问可以随机读、随机取 B、磁盘系统传输大规模连续的数据块的范围是 18-32k C、磁盘访问比主存访问的速度快 D、大多数程序在 RAM 模型上运行 2.对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储 所有的内存。(

11、) 3.当内存不够或者算法设计不好时,如果数据量达到一定规模以上,运行时间会急 剧增加。 4.现代计算机有复杂的存储层次,存储单元的访问是以块为单位的数据移动。 () 4.2.1 1. 外存归并排序,以()为单位进行调度。答案:块 A、比特 B、兆 C、块 D、层 2.排序分为内部排序和外部排序,外部排序是因排序的数据很大,一次不能容纳全 部的排序内容,在排序过程中需要访问外存。() 4.2.2 1.在外排序的快速排序中,分割元素的选择非常重要。答案:正确 A、正确 B、错误 4.3 1. 在内存中的二分搜索树中,通常使用()来维护树的平衡。()答案:旋转 A、置换 B、分裂 C、旋转 D、合

12、并 2.二叉搜索树是在 n 个元素之间搜索的标准方法,一般把元素保存在根处。() 3.为更快地保存外部搜索树,可采取按 BFS 的顺序将其分割。() 5.1 1.如果 T 是一个(a,b)-树(a2 且 b2a-1),其根结点的度在()之间。答案:2 到 b A、2 到 a B、2 到 b C、a 到 b D、2 到 4 2.在(a,b)-树中,a 和 b 表示的是每个节点当中键值的上限和下限。() 3.B-树中右边的指针指向的是键值小于最右键值的子数。() 5.2 1. 元素都在叶子中的 B-树有时被称为()。答案:B+-树 A、B+树 B、B-+树 C、B+-树 D、B+-数 2.关于(a

13、,b)树的删除操作,删除操作出现问题的情形是:从叶子 v 删除元素 后,v 的儿子小于 a-1 个。() 3.关于(a,b)-树的插入,插入涉及到的结点最多到树高+1。() 5.3 1. KD 树在()层使用水平线。A A、偶数层 B、奇数层 C、最底层 D、最高层 2.KdB-树的插入可以使用()的方法。C A、近似 B、置换 C、对数 D、重构 3.构建 KDB-树时,完成网格建立之后,计算每个网格中点的个数,并且存储在()中。 A A、外存 B、数据库 C、寄存器 D、内存 4.基于位置的查找实际上是一种三维空间的查找。()X 5.KD 树可以看成是两个二叉树的交叠。()正确 6.1 1

14、.为数 T 的每个结点标上子树大小的 I/O 复杂度为()。B A、IO(sort(N) B、O(sort(N) C、IO(scan(N) D、O(scan(N) 2.前序计数的 I/O 复杂度为()。B A、IO(sort(N) B、O(sort(N) C、IO(scan(N) D、O(scan(N) 3.对给定顶点邻接链表 T,其一个欧拉回路可以以()IO 复杂性求得。C A、O(sort(N) B、O(scan(N) C、O(scan(N)IO D、IO(scan(N) 4.外存算法最坏情况的 I/O 数位(N)。()X 5.图中的独立集是指图当中点的集合,其任意两点之间不存在边。()正

15、确 6.2 1.查找规模为 N 的表 L 中,每个独立集(MIS)的大小至少为()。D A、n+1 B、2n C、n/2 D、n/3 2.时间前向的处理方法是按照()来访问边。C A、欧拉回路 B、表排序 C、拓扑序 D、结点序 3.求最大独立集的基本思想是使用贪心法。()正确 6.3 1.图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()。C A、自举 B、缩图法 C、时间前向处理 D、连通分量 2.半外存算法是假设()。B A、边放在内存中,顶点在外面 B、顶点放在内存中,边在外面 C、顶点和边都放在内存当中 D、顶点和边都不在内存当中 3.图的连通性算法可扩增为求图 G 最小生成树(MST)的算法。()正确 4.在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最 大值。()X 7.1 1.MapReduce 是由()开发的分布式编程模型。B A、Microsoft B、Google C、Tencent D、AlibabaGroup 2.在实现 MapReduce 程序时,需要注意的事项不包括()

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号