第二部分 第5章 vsphere分布式资源调度 drs计算推荐

上传人:第*** 文档编号:33525276 上传时间:2018-02-15 格式:DOCX 页数:10 大小:319.07KB
返回 下载 相关 举报
第二部分 第5章 vsphere分布式资源调度 drs计算推荐_第1页
第1页 / 共10页
第二部分 第5章 vsphere分布式资源调度 drs计算推荐_第2页
第2页 / 共10页
第二部分 第5章 vsphere分布式资源调度 drs计算推荐_第3页
第3页 / 共10页
第二部分 第5章 vsphere分布式资源调度 drs计算推荐_第4页
第4页 / 共10页
第二部分 第5章 vsphere分布式资源调度 drs计算推荐_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《第二部分 第5章 vsphere分布式资源调度 drs计算推荐》由会员分享,可在线阅读,更多相关《第二部分 第5章 vsphere分布式资源调度 drs计算推荐(10页珍藏版)》请在金锄头文库上搜索。

1、第五章 DRS 计算推荐群集负载平衡,DRS 建议考虑几个指标来计算迁移:当前虚拟机的资源需求,主机资源的高可用性和高级别资源策略,接下来的探讨 DRS 如何用这些指标来创建一个比当前虚拟机更新的,更好的虚拟机,当一直满足所有的需求和限制。什么时候 DRS 被调用?DRS 默认每 300 秒调用一次,当调用间隔时间过后,DRS 将计算和生成虚拟机迁移的建议,每个建议在下一次调用 DRS 期间不被接收将被“ 退休”,如果资源还是不平衡,DRS 可能会再次产生精准的建议。当 DRS 算法被调用期间可以通过 vpxd.cfg 的下列选项来进行控制:vpxd 配置文件300 默认的频率是 300 秒,

2、但是可以在 60 秒3600 秒的范围内设置,强烈不建议修改此值,不频繁的时间间隔可能会降低 vMotion 的数量,虽然节约了开销但是离开一段较长的时间群集会有不平衡的危险。而缩短时间可能会产生额外的开销,尽管提供额外的一些好处。如果群集检测资源池树的改变,操作和事件,如资源供应变化或者资源设置修改也会触发 DRS 的不平衡计算。表 18:DRS 计算调用事件计算建议为了生成迁移建议 DRS 执行多个计算过程,DRS 定义群集不平衡和选择合适虚拟机迁移来解决不平衡。约束校验确定负载不平衡之前,DRS 检测是否违反约束,约束校验决定是否 DRS 必须要: 由于用户请求进入维护模式或者待机模式,

3、撤出主机 强制纠正主机和虚拟机之间关联性/反关联性规则冲突 纠正虚拟机和虚拟机之间的反关联性规则冲突 纠正虚拟机和虚拟机之间的关联性规则冲突 纠正主机资源过量(稀有,因为 DRS 资源控制)在负载平衡期间,这种约束被遵从,理解约束可能引起负载平衡,但是不尊重约束就可以解决的,如果被认定无法修复不平衡,群集摘要页面的信息会通知管理员。不平衡计算要建立一个不平衡的群集,DRS 会将当前主机负载标准偏差值(CHLSD)和目标主机负载标准偏差值(THLSD)进行比较,如果 CHLSD 超过 THLSD,群集被认为不平衡。当前主机负载标准偏差DRS 通过群集中所有活动的主机计算平均值和正常配额标准偏差决

4、定了当前主机负载标准偏差(CHLSD).正常的配额是衡量可用容量的利用率,DRS 收到每个虚拟机的资源利用率和需求来计算动态配额,主机上所有虚拟机的配额之和,通过主机的容量进行划分,主机的可用容量是剩下资源数量,也就是减去虚拟层的资源需求后的容量。Normalized entitlement= (VM entitlements)/(Capacity of host)因为虚拟机配置包括需求指标,如 CPU 的准备百分比和内存的空闲百分比,在没有资源争用的情况下,正常的标准差同群集的状态非常类似。目标主机负载标准偏差目标主机保证偏差(THLSD)是来自 DRS 的迁移阈值,它定义了群集不平衡的容忍

5、等级。DRS 迁移等级迁移阈值决定了保持负载不均衡最大值,DRS 迁移阈值提供五个等级,范围从保守到激进。图 83:迁移阈值每个阈值级别设置了不平衡的容忍边界,激进的阈值设置了一个收紧的边界以允许一点点不平衡,而保守的阈值容忍比较大的不平衡,大多数保守阈值不会计算THLSD,只会建议强制性约束冲突,阈值更多的信息,可以在后面的章节发现。期望高频繁的迁移可以选择激进的迁移阈值,DRS 会请求保持 CHLSD 低于THLSD。在 vCenter 度量当前主机负载标准偏差(CHLSD ),CHLSD 经常被称为 DRS 的负载不平衡标准,负载不平衡标准和 CHLSD 互换。图 84:DRS 迁移建议

6、工作流当前主机负载标准偏差超过了目标主机负载标准偏差,DRS 将发起GetBestMove(最佳迁移)DRS 程序步骤while (load imbalance metric threshold) move = getbestmove(); if no good migration is found: stop; else: add move to the list of recommendations; update representation of cluster to the state after the move is added; 与流行的看法相反,在允许 vCenter 或者用

7、户执行建立清单之前算法将所有的建议列入清单。GetBestMove(最佳移动)GetBestMove 过程旨在找到虚拟机并移动,最大程度的改善群集资源的广泛的不平衡,GetBestMove 过程如下:GetBestMove GetBestMove() for each virtual machine v: for each host h that is not source host: if h is lightly loaded compared to source host: if cost-benefit and risk analysis accepted simulate move

8、v to h measure new cluster-wide load imbalance metric as g return move v that gives least cluster-wide imbalance g. 这个过程决定了迁移的最大进步,DRS 周期性的通过每个开启 DRS 的虚拟机和主机,该主机并非源主机,源主机是 ESXi 主机当前运行着虚拟机的主机,DRS 将会对比源主机和目标主机的正常配额,主机配额较低的被选为下一步的模拟主机。GetBestMove 完成后,结果是理想的,DRS 会从主机以前正常配额的部分选择和模拟迁移,DRS 计算在模拟迁移后计算两台主机的

9、CHLSD 值,如果它们仍然超过DRS 迁 移阈值,DRS 重复该过程,但选择不同的目标主机,这个过程为每个虚拟机和主机的组合重复,列出迁移建议清单,这样最大化的减少负载不平衡。基本设计原则当设计 vCenter 时需要考虑群集和主机的数量,DRS 为大量虚拟机迁移计算会影响vCenter 的性能。成本效益和风险分析标准成本效益和风险分析的目的是过滤掉高成本和不稳定的迁移。术语“不稳定” 表示群集负载平衡受影响的迁移和检查虚拟机工作负载的稳定性。请注意,这并不意味着vMotion 本身不稳定。DRS 调用成本效益风险分析来节省迁移流量,避免 vMotion 不断的产生流量,当执行 vMotio

10、n 时源主机和目标主机都会产生开销,不断的初始化 vMotion 会抵消虚拟机迁移的益处。成本效益和风险分析产生的建议也可以阻止高负载,如果虚拟机的工作负载改变为直接方式(直接接受建议,不手工操作),建议将变得无用,会产生虚拟机重复选择的情景,像“ 乒乓” 一样来回迁移。成本如 果使用 1GB 的网络 vMotion 过程中将需要预留 30%的 CPU,如果使用 10GB 网络的 vMotion 端口组,将需要预留 100%的 CPU,此预留在 本地主机的资源池中设置,在源主机和目的主机上创建,如果多个 vMotion 正在运行,在 vMotion 任务之间预留资源被分享,在 vMotion

11、过程中 目的主机上一个影子虚拟机将被创建,影子虚拟机的内存消耗也是成本需要考虑的因素之一。益处通过移动虚拟机,源主机上的资源被释放,这些资源可以为其它虚拟机提供使用,由于新的主机上低标准的配额,迁移过去的虚拟机也同样受益,DRS 定义迁移的工作负载导致群集负载更加平衡。如果在特定的资源上任何主机被使用过量,DRS 将对所有的迁移资源给出高权重,例如,如果 CPU 发生资源争用,DRS 将使用一个更高权重的 CPU 来解决争用,DRS 在每次调用期间重新检查特定资源的过量情况。风险风险账户为可能的不规则负载建立,不规则负载表示不一致的高需求的负载结合成本效益风险DRS 为重新平衡提供迁移建议,如

12、果他们的估计成本低于他们的当前潜在的收益,最近的 VM 需求和主机的相对失衡,DRS 结合成本效益和风险来计算虚拟机新的位置,以满足所有的约束和改善负载平衡。成 本效益和风险分析确定了资源迁移收益,无论是正面还是负面的,要确定迁移是否有一个正面积极的结果,虚拟机最后 5 分钟的工作负载特征被分析,这被称为“稳 定”时间,并表示虚拟机已经使用资源多次时间,类似活动工作负载值,保守的估计是调用期间的剩余时间)调用周期持续时间-稳定时间),DRS 假定虚拟机在 最坏的负载下运行,从最后 60 分钟使用的最高值。DRS 包括迁移成本,并考虑源主机和目的主机的资源收益,如果成本收益和风险分析产生了积极的

13、结果,DRS 将只会建议迁移。你可以想象,什么影响调整下,调用间隔将会有这样的分析,因为每个周期净资源收益被计算,通过周期长度增加权重,我们不建议改变这个区间,除非你完全了解这种变化的影响。MinGoodness除了成本效益分析,DRS 将计算每一个动作的 goodness 值,此值表示群集在负载平衡移动时是正面或负面的影响,对于这两种成本效益和 Goodness 值,DRS 使用相同的评级系统。表 19:评级系统每 个移动获得 Goodness 评级,关系到当前的负载平衡和最小迁移阈值,如果移动将会伤害负载平衡,移动将会收到-2 的评级,一个移动稍微降低负载平衡会 得到-1 的评级,一个提供

14、负载平衡,但是提高不能满足最小阈值会收到 Neutral 评级,一个移动稍微提高(0.1)了负载平衡会得到+1 评级,显著改善 负载平衡的获得+2评级。正如之前提到的,受益于移动 DRS 使用相同的值进行成本加权,这些评级应用如下:减少 10%可用资源的移动得到 -2 评级,稍微减少可用资源的移动得到-1 评级,如果对资源来说移动是是中性,不会帮助也不会伤害资源,将得到 0 评级,如果提高了可用资源的移动得到+1 评级,当增加 10%的可用资源的移动得到+2 评级。在提出建议之前,Goodness 评级被用来对比成本收益评级,由于成本收益计算比Goodness 计算更保守,这就是非常难看到 D

15、RS 提出中性评级移动和低 Goodness移动的建议,因此,DRS 通常给出的建议是正面的成本收益移动和 Goodness 评级移动当 群集严重失衡,通过 Goodness(MinGoodnessFiltering)和成本收益(CostBenefitFiltering)过滤移动能阻 止 DRS 给出的移动建议,当任何主机的负载同目标主机的负载偏差 0.2 时,群集被视为严重失衡,如果你发现 DRS 在你的环境中不建议任何负载平衡移动,这 可能是每个移动对群集不平衡影响太小,这可能是没有移动能明显提高群集平衡(MinGoodnessFiltering 控制),或者改善群集失衡的成本太 高(Co

16、stBenefitFilter 控制)为解决这种情形,vSphere 5.1 在 DRS 负载均衡算法上配备了三个额外的步骤,这些步骤是RelaxMinGoodness, RelaxCostBenfitFiltering and DropCostBenefitFiltering,它们是怎样工作呢?表 20:DRS 调用步骤在 正常操作期间,中性移动或者负面的 Goodness 评级将会被拒绝;但是,如果群集严重失衡,它们可以被重新考虑和接受。如果在 DRS 负载平衡步骤后群集 仍然严重失衡,如果负载平衡操作并不被迁移限制(MaxMovesPerHost)所限制,负载平衡将重新运行激活 (RelaxMinGoodness (RMG)标志,这意味着, DRS 认为之前移动中性 Goodness 和成本收益评级,将通过 MinGoodNessFiltering 放弃。如果分析显示群集仍然严重失衡,即使在考虑移动之

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号