第31课、可预测的性能

资源描述

《第31课、可预测的性能》由会员分享，可在线阅读，更多相关《第31课、可预测的性能（11页珍藏版）》请在金锄头文库上搜索。

1、第 31 课、可预测的性能 1、共享资源干扰2、需要可预测的性能可预测的性能的需要当多个应用程序共享资源特别是如果有些应用需要性能保证例 1：在虚拟化系统不同用户的工作整合到同一个服务器需要满足关键作业性能要求例 2：在移动通信系统互动应用与非交互式应用程序的运行需要保证的交互式应用程序的性能3、重要观察第一个观察：对于内存绑定的应用程序，性能和内存请求服务率第二个观察：请求服务价格独自（RSRAlone）的一个应用程序可以通过给该应用程序优先级最高的存储器控制器来估计最高优先级干扰小（如果应用程序是单独运行几乎一样）由于内存绑定应用程序，存储干扰引起的减速估计（MISE）模型第三个

2、观察：内存限制的应用程序由于非内存绑定应用程序，存储干扰引起的减速估计（MISE）模型SharedAlone RSRRSR) - (1 Slowdown 4、在内存带宽干扰的情况下可预见性估计减速主要意见执行MISE 型号：全部放在一起评估模型控制减速提供了软件保障放缓5、间隔化运作6、Estimating Request Service Rate Alone (RSRAlone) 将每个间隔成较短的时期在每个周期的开始随机选择一个应用程序作为最高优先级的应用在一个间隔的结束，对于每一个应用程序进行估计7、不准确估计 RSRAlone 当应用程序具有最高的优先级还是经历了一些干扰8、方

3、法论我们的模拟系统的配置4 芯1 路，8 家 bank/通道DDR3 DRAM1066512 KB 私有缓存/核心工作量SPEC CPU2006300 多编程工作量 9、定量比较10、MISE- QoS：提供了“软件” 减速担保目标 1.确保 QoS 关键的应用满足规定的放缓约束 2. 对于其他应用程序最大限度地提高系统性能基本思路分配刚足够带宽 QoS 关键的应用分配剩余带宽给其他应用程序 11、考虑共享 cache 干扰挑战：12、辅助变量存储辅助标记存储跟踪此类争失误 13、缓存容量分区目标：分区中的应用，以减轻竞争共享缓存以前的方式分区方案优化计数未命中问题：不知道性能和

4、怠工14、总结：在可预测的共享缓存干扰的情况下主要观点：高速缓存访问率性能代理辅助标签存储和高优先级可以被组合以估计减速主要结果：减速估计误差 - 10 一些应用程序：减速感知缓存分区减速感知内存带宽分配还有更多的可能第 32 课、异构系统 1、异质性（不对称） 1.1、异质性（不对称）专业化想法：与其具有相同的“资源”是相同的（即，均匀的或对称的）多个实例，设计一些实例是不同的（即，异构或不对称）不同实例可以进行优化，以在执行不同类型的工作负荷或满足不同的要求/ 目标的更有效的异质性使得专业化/自定义 1.2、不对称启用自定义对称：均码能源和次优的性能为不同的“工作量”行为不对

5、称：允许自定义和适应处理要求横跨不同的工作负载（应用程序和相位） 1.3、在未来系统的三个关键问题存储系统应用也越来越密集数据数据存储和移动限制了性能与效率效率（性能和能源）可扩展性启用可扩展的系统新的应用实现了更好的用户体验新的使用模式可预测性和稳健性资源共享和不可靠的硬件导致 QoS 问题可预测的性能和 QoS 都是一流的限制2、多核设计“Large” vs. “Small” Cores3、非对称多核心 3.1、非对称多处理器芯片（ACMP）提供一个大的核心和许多小芯 +加快使用大核心系列的一部分 +因为高通量，执行小核和大核芯上的平行部分 3.2、加快串行瓶颈序列化或不平衡

6、执行在平行部也可以从大芯受益例如：那些主张的关键部分这需要更长的时间比其他人来执行并行阶段思路：动态确定这些代码部分导致系列化和执行它们在一个大的核心第 33 课、互联网 1、互联网络基础拓扑指定开关的接线方式影响路径，可靠性，吞吐量，延时，构建容易路由（算法）如何做一个获取信息从源到目的地静态或自适应缓冲和流量控制什么是我们在网络中存储？整个数据包，数据包的一部分，等等？超额认购期间我们如何节流？紧密结合路径策略 1.1、总线连接到单个链路的所有节点+简单+性价比高的少数节点+易于实施的一致性（窥探和系列化）- 不扩展到大量节点（有限带宽，电负荷降频）- 高争快速

7、饱和1.2、点对点每个节点直接/隔离链接连到每个其他的 +最低竞争 +潜在最低的延迟 +理想的，如果成本没有问题 - 最高性价比 O（N）的连接/端口 O（N2）链接的每个节点 - 没有可扩展性1.3、交叉开关连接到每一个其他与共享链路的每个目的地的每个节点启用并发转移到非冲突目的地可能是具有成本效益的少数节点+低延迟和高吞吐量 - 昂贵 - 不可扩展O（N2）成本 - 很难仲裁作为 N 增加01234567012345671.4、多级对数网络理念：间接与网络交换机的终端/节点之间的多层次开销：O（NlogN），延迟：O（LOGN）许多变化（欧米茄，蝴蝶，贝奈斯，榕树，.）欧米茄网络：1.5、Ring 每个节点连接到正好两个其它节点。节点形成一个连续的途径，以便数据包可以到达任何节点。+特价：O（N）的成本 - 高延迟：O（N） - 不易结垢- 二分带宽保持不变单向环形双向环形多方向的途径，或多个环 +减少延迟 +提高可扩展性 - 稍微更复杂的输入政策分层环网孔花托 Trees 超立方体加州理工学院宇宙魔方 2、无缓冲偏射路径主要思路：数据包从未在网络中缓冲。当两个数据包争用同一链路，一个是偏转3、片上网络连接内核，缓存，存储器控制器等总线和交叉开关都不能扩展分组交换 2D 网：最常用的拓扑结构主要服务于高速缓存未命中和内存要求

展开阅读全文

第31课、可预测的性能

最新文档