第31课、可预测的性能

上传人:小** 文档编号:57140745 上传时间:2018-10-19 格式:DOCX 页数:11 大小:386.67KB
返回 下载 相关 举报
第31课、可预测的性能_第1页
第1页 / 共11页
第31课、可预测的性能_第2页
第2页 / 共11页
第31课、可预测的性能_第3页
第3页 / 共11页
第31课、可预测的性能_第4页
第4页 / 共11页
第31课、可预测的性能_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《第31课、可预测的性能》由会员分享,可在线阅读,更多相关《第31课、可预测的性能(11页珍藏版)》请在金锄头文库上搜索。

1、第 31 课、可预测的性能 1、共享资源干扰2、需要可预测的性能 可预测的性能的需要当多个应用程序共享资源特别是如果有些应用需要性能保证例 1:在虚拟化系统不同用户的工作整合到同一个服务器需要满足关键作业性能要求例 2:在移动通信系统互动应用与非交互式应用程序的运行需要保证的交互式应用程序的性能3、重要观察 第一个观察:对于内存绑定的应用程序,性能和内存请求服务率第二个观察:请求服务价格独自(RSRAlone)的一个应用程序可以通过给该应 用程序优先级最高的存储器控制器来估计 最高优先级 干扰小(如果应用程序是单独运行几乎一样)由于内存绑定应用程序,存储干扰引起的减速估计(MISE)模型第三个

2、观察:内存限制的应用程序由于非内存绑定应用程序,存储干扰引起的减速估计(MISE)模型SharedAlone RSRRSR) - (1 Slowdown 4、在内存带宽干扰的情况下可预见性 估计减速主要意见执行MISE 型号:全部放在一起评估模型 控制减速提供了软件保障放缓5、间隔化运作6、Estimating Request Service Rate Alone (RSRAlone) 将每个间隔成较短的时期 在每个周期的开始随机选择一个应用程序作为最高优先级的应用 在一个间隔的结束,对于每一个应用程序进行估计7、不准确估计 RSRAlone 当应用程序具有最高的优先级还是经历了一些干扰8、方

3、法论 我们的模拟系统的配置4 芯1 路,8 家 bank/通道DDR3 DRAM1066512 KB 私有缓存/核心 工作量SPEC CPU2006300 多编程工作量 9、定量比较10、MISE- QoS:提供了“软件” 减速担保 目标 1.确保 QoS 关键的应用满足规定的放缓约束 2. 对于其他应用程序最大限度地提高系统性能 基本思路 分配刚足够带宽 QoS 关键的应用 分配剩余带宽给其他应用程序 11、考虑共享 cache 干扰挑战:12、辅助变量存储辅助标记存储跟踪此类争失误 13、缓存容量分区目标:分区中的应用,以减轻竞争共享缓存以前的方式分区方案优化计数未命中 问题:不知道性能和

4、怠工14、总结:在可预测的共享缓存干扰的情况下 主要观点:高速缓存访问率性能代理辅助标签存储和高优先级可以被组合以估计减速 主要结果:减速估计误差 - 10 一些应用程序:减速感知缓存分区减速感知内存带宽分配还有更多的可能第 32 课、异构系统 1、异质性(不对称) 1.1、异质性(不对称)专业化 想法:与其具有相同的“资源”是相同的(即,均匀的或对称的)多个实 例,设计一些实例是不同的(即,异构或不对称) 不同实例可以进行优化,以在执行不同类型的工作负荷或满足不同的要求/ 目标的更有效的 异质性使得专业化/自定义 1.2、不对称启用自定义对称:均码能源和次优的性能为不同的“工作量”行为 不对

5、称:允许自定义和适应 处理要求横跨不同的工作负载(应用程序和相位) 1.3、在未来系统的三个关键问题 存储系统应用也越来越密集数据 数据存储和移动限制了性能与效率效率(性能和能源) 可扩展性启用可扩展的系统 新的应用实现了更好的用户体验 新的使用模式 可预测性和稳健性资源共享和不可靠的硬件导致 QoS 问题可预测的性能和 QoS 都是一流的限制2、多核设计“Large” vs. “Small” Cores3、非对称多核心 3.1、非对称多处理器芯片(ACMP)提供一个大的核心和许多小芯 +加快使用大核心系列的一部分 +因为高通量,执行小核和大核芯上的平行部分 3.2、加快串行瓶颈序列化或不平衡

6、执行在平行部也可以从大芯受益 例如:那些主张的关键部分这需要更长的时间比其他人来执行并行阶段思路:动态确定这些代码部分导致系列化和执行它们在一个大的核心第 33 课、互联网 1、互联网络基础 拓扑 指定开关的接线方式 影响路径,可靠性,吞吐量,延时,构建容易 路由(算法) 如何做一个获取信息从源到目的地 静态或自适应 缓冲和流量控制 什么是我们在网络中存储? 整个数据包,数据包的一部分,等等? 超额认购期间我们如何节流? 紧密结合路径策略 1.1、 总线 连接到单个链路的所有节点+简单+性价比高的少数节点+易于实施的一致性(窥探和系列化)- 不扩展到大量节点(有限带宽,电负荷降频)- 高争快速

7、饱和1.2、点对点 每个节点直接/隔离链接连到每个其他的 +最低竞争 +潜在最低的延迟 +理想的,如果成本没有问题 - 最高性价比 O(N)的连接/端口 O(N2)链接的每个节点 - 没有可扩展性1.3、交叉开关 连接到每一个其他与共享链路的每个目的地的每个节点 启用并发转移到非冲突目的地 可能是具有成本效益的少数节点+低延迟和高吞吐量 - 昂贵 - 不可扩展O(N2)成本 - 很难仲裁作为 N 增加01234567012345671.4、多级对数网络 理念:间接与网络交换机的终端/节点之间的多层次 开销:O(NlogN) ,延迟:O(LOGN) 许多变化(欧米茄,蝴蝶,贝奈斯,榕树,.) 欧米茄网络:1.5、Ring 每个节点连接到正好两个其它节点。节点形成一个连续的途径,以便数据包可 以到达任何节点。+特价:O(N)的成本 - 高延迟:O(N) - 不易结垢- 二分带宽保持不变单向环形双向环形 多方向的途径,或多个环 +减少延迟 +提高可扩展性 - 稍微更复杂的输入政策 分层环网孔 花托 Trees 超立方体 加州理工学院宇宙魔方 2、无缓冲偏射路径 主要思路:数据包从未在网络中缓冲。当两个数据包争用同一链路,一个是偏 转3、片上网络 连接内核,缓存,存储器控制器等 总线和交叉开关都不能扩展 分组交换 2D 网:最常用的拓扑结构 主要服务于高速缓存未命中和内存要求

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号