英特尔14纳米微架构处理器(Broadwell)

上传人:飞****9 文档编号:131942017 上传时间:2020-05-11 格式:PDF 页数:50 大小:2.53MB
返回 下载 相关 举报
英特尔14纳米微架构处理器(Broadwell)_第1页
第1页 / 共50页
英特尔14纳米微架构处理器(Broadwell)_第2页
第2页 / 共50页
英特尔14纳米微架构处理器(Broadwell)_第3页
第3页 / 共50页
英特尔14纳米微架构处理器(Broadwell)_第4页
第4页 / 共50页
英特尔14纳米微架构处理器(Broadwell)_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《英特尔14纳米微架构处理器(Broadwell)》由会员分享,可在线阅读,更多相关《英特尔14纳米微架构处理器(Broadwell)(50页珍藏版)》请在金锄头文库上搜索。

1、芯动芯动 行动行动 共创未来共创未来 英特尔英特尔 14 纳米微架构处理器纳米微架构处理器 Broadwell Srinivas Chennupaty 英特尔公司高级首席工程师兼 CPU 首席架构师 江宏博士 英特尔院士兼英特尔公司首席媒体架构师 ARCS001 议程议程 简介 功耗管理 CPU 微架构 芯片组 显卡和异构处理创新 媒体和显示创新 2 议程议程 简介 功耗管理 CPU 微架构 芯片组 显卡和异构处理创新 媒体和显示创新 3 Tick Tock 开发模式开发模式 全新英特尔微架构全新英特尔微架构 全新英特尔全新英特尔 微架构微架构 Haswell 英特尔微架构英特尔微架构 14

2、纳米制程技术纳米制程技术32 纳米制程技术纳米制程技术22 纳米制程技术纳米制程技术 TICKTOCKTICK TICK 英特尔英特尔 微架构微架构 英特尔微架构英特尔微架构 TOCK 全新英特尔微架构 14 纳米制程技术 为客户端和服务器处理器为客户端和服务器处理器 推出行业领先的推出行业领先的14 纳米制程技术纳米制程技术 4 14 纳米微架构纳米微架构 即将广泛的应用于各种优势产品中即将广泛的应用于各种优势产品中 5 采用无风扇结构设计带来出色的 英特尔 酷睿 处理器体验 英特尔英特尔 酷睿酷睿 M 处理器处理器 14 纳米第二代三栅极晶体管 更低的 TDP 支持不超过 9 毫米的无风扇

3、设计 经过系统优化的动态功耗和散热管理 降低系统芯片 SoC 闲置功耗 扩大动态工作范围 第二代 FIVR 和 3DL 技术 下一代显卡 媒体 显示 芯片组 更低的功耗 语音用途 更快的存储 6 英特尔的下一代英特尔的下一代 14 纳米微架构纳米微架构 OpenCL 2 0 API SVM DirectX 11 2 DirectX 12 Ready OpenGL 4 3 14 纳米制程纳米制程 高能效高能效 IPC 更快的浮点和矢量运算更快的浮点和矢量运算 速度速度 精细化精细化 PCH 功耗管理功耗管理 第二代第二代 FIVR 和和 3DL 技术技术 有针对性的加密速度有针对性的加密速度 提

4、升提升 PCI Express 存储存储 音频音频 DSP 升级升级 闲置功耗降低闲置功耗降低 60 工作工作功耗降低功耗降低 30 x16 PCIe eDRAM 双通道双通道 内存内存 面向嵌入式面向嵌入式 控制器的控制器的 PECI 接口接口 笔记本电脑笔记本电脑 DisplayPort 显卡 内核LLC 内核LLC 内核LLC 内核LLC 系统代理 显示 DMI OPIPCI Express IMC PCH 7 英特尔的下一代英特尔的下一代 14 纳米微架构纳米微架构 OpenCL 2 0 API SVM DirectX 11 2 DirectX 12 Ready OpenGL 4 3

5、14 纳米制程纳米制程 高能效高能效 IPC 更快的浮点和矢量运算更快的浮点和矢量运算 速度速度 精细化精细化 PCH 功耗管理功耗管理 第二代第二代 FIVR 和和 3DL 技术技术 有针对性的加密速度有针对性的加密速度 提升提升 PCI Express 存储存储 音频音频 DSP 升级升级 闲置功耗降低闲置功耗降低 60 工作工作功耗降低功耗降低 30 x16 PCIe eDRAM 双通道双通道 内存内存 面向嵌入式面向嵌入式 控制器的控制器的 PECI 接口接口 笔记本电脑笔记本电脑 DisplayPort 显卡 内核LLC 内核LLC 内核LLC 内核LLC 系统代理 显示 DMI O

6、PIPCI Express IMC PCH 经过系统优化的动态散热和功耗管理经过系统优化的动态散热和功耗管理 7 14 纳米设计纳米设计 制程制程 将功耗优化至传统的将功耗优化至传统的1 2 在性能检测过程中涉及的软件及其性能只有在英特尔微处理器的架构下方能得到优化 诸如 SYSmark 和 MobileMark 等测试均系基于特定计算机系统 硬件 软件 操作系统及功能 上述任何要素的变动都有可能 导致测试结果的变化 请参考其它信息及性能测试 包括结合其它产品使用时的运行性能 以对目标产品进行全面评估 更多信息敬请登陆 传统传统14 纳米英特尔纳米英特尔 酷睿酷睿 M 处理器制程优势处理器制程

7、优势 系统芯片影响系统芯片影响 电容量0 75 倍0 65 倍功耗降低 25 通过缩小和优化晶体管 互连实现 更低的最小工作电压相同降低 10 功耗降低 20 通过更小的偏差和设计优化实现 低电压晶体管性能通常针对高电压工作 状态进行优化 晶体管性能提升 10 15 14 纳米制程针对低电压性能进行了优化 漏电量0 8 倍通过优化将漏电量 降低 1 2 功耗降低约 10 14 纳米制程专门针对英特尔酷睿 M 处 理器进行了优化 面积规模 Area scaling 0 51 倍 功能不变 通过14纳米设计规范和版图优化实现 9 议程议程 简介 功耗管理 CPU 微架构 芯片组 显卡和异构处理创新

8、 媒体和显示创新 10 增强的睿频加速技术 在保持系统可靠性的同时增强的睿频加速技术 在保持系统可靠性的同时 最大限度地 最大限度地 进行加速进行加速 时间 PL1 功耗 PL1 长期系统限制 PL3 电池保护 PL2 PL3 PL2 突发限制 确保电池不会频繁出现电流尖峰 英特尔 睿频加速技术 11 增强的增强的 FIVR 效率管理效率管理 可提升 FIVR 效率的新启发法 监控峰值需求 调整 Vccin 输入电压 最大限度地提升 FIVR 效率 将供电传输损耗控制在 6W 以下 在保持低功耗的同时提升性能 非线性电压跌落 droop 控制 改善电压跌落 droop 50 速度提升超过 5

9、功耗节省 10 随着峰值负载的下降 Vccin 电压会下降 从而最大限度地减少供电损耗 负载 效率 12 最大最大 睿频睿频 最低最低 功耗功耗 IA 频率 GT 频率 芯片组控制T1T2T3 占空比控制 打开 关闭模块 管理偏移管理偏移 13 芯片组芯片组占占空比控空比控制制 Duty Cycling CPU 监控总体系统芯片功耗 要求PCH基于功耗余量进行控制 PCH 响应 SATA 当指令发出后进行调节 使链路有机会进入 低功耗状态 部分运行 睡眠 PCI Express 强制 Tx 和 Rx 进入 L0s 状态 USB 推迟向终端设备安排事务 使链路有机会进入 U1 U2 等低功耗状态

10、No ThrottlingWith Throttling PCH 控制图示 ScoreSATA power Bandwidth 功耗降低 50 14 扩大有效工作范围扩大有效工作范围 低功耗极限要求在 Vmin 频率下进行工作 但在该点以下漏电量不可进行扩展 通过占空比控制降低功耗 在 500MHz 时实现 80 而非在 400MHz 实现 100 相同的频率 更 少的漏电量 DCC 占空比控制 借助硬件和显卡驱动程序之间的协作来实施 Anandtech 蛮力与智慧并用 显卡性能显卡性能 系统芯片功耗极限 瓦 系统芯片功耗极限 瓦 No Duty Cycling Duty Cycle Cont

11、rol 以更高功耗极限智能 解除 DCC DCC 可扩大系统芯 片的工作范围 DCC 可显著提升 ISO 能效 无工作循环时的最小工作点 15 占空比控制图示占空比控制图示 最高效率频率 最高效率频率 可编程偏移 可实现的显卡频率 显卡引擎开始在高效电 压 频率范围内运行 高效频率可能随温度 而变化 可实现的频率 高效频率 偏移 CPU 发送中断信号至显卡驱动程序 以重启工作 显卡频率可能降至有 效点以下 此时 CPU 会请求显卡进入闲置 状态 显卡进入闲置状态 系统芯 片功耗下降 16 C 状态状态增强特性可降低平均功耗增强特性可降低平均功耗 增强的 PkgC7 C7 状态可进一步降低平均功

12、耗 在 C7 中打开 LVR 线性电压源 最大限度地减少 FIVR 静态损耗 将 Vccin 从 1 6V 降到 1 3V 以进一步减少损耗 在该优化的低功耗状态下支持内存路径 唤醒刷新显示缓冲区时 不会导致电压上升 Intel 4th Gen MicroarchitectureIntel Core M 60 20 35 Windows 空闲高清播放Web 浏览 17 英特尔英特尔 动态平台和散热框架动态平台和散热框架 Intel Dynamic Platform and Thermal Framework 系统优化散热管理 系统优化散热管理 用于实现最佳性能的平台功耗共享用于实现最佳性能的平

13、台功耗共享 处理器 温度 功耗控制 P T 状态 处理器显卡 温度 功耗控制 RP 状态 EU PCH 温度 功耗控制 内存 温度 功耗控制 WLAN WWAN 温度 功耗控制 电池充电器 充电率控制 表层热传感器 Skin Thermal Sensor 温度 显示 亮度控制 系统风扇 精细化风扇控制 18 英特尔英特尔 DPTF 积极积极表层温度管理表层温度管理 监控平台限制 调节系统和系统芯片参数 确保在限制内运行 例如 监控表层温度 动态调节 PL1 PL2 在冷系统上性能提升 50 Iteration 1 iteration 3 Iteration 5 Iteration 7 Iter

14、ation 8 19 随时间变化的性能 超过超过 30 英特尔 动态平台和散热框架 英特尔 DPTF 19 议程议程 简介 功耗管理 CPU 微架构 芯片组 显卡和异构处理创新 媒体和显示创新 20 在频率相同的情况下 性能高于先前的微架构在频率相同的情况下 性能高于先前的微架构 更大的乱序调度程序 60 64 个条目 更大的 4K 2M L2 TLB 1K 1 5K 个条目 全新的 1G L2 TLB 16 个条目 用于并行页面查询的第二个页面未命中处理程序 更准确的分支和返回地址预测 浮点和矢量改进 下一页 能效能效 性能特性设计为大约 2 1 的性能功耗比 功耗门控 Power Gati

15、ng 和设计优化可提升每个工作 点的能效 出色能效性能出色能效性能 单线程 每周期执行的指令数 IPC 广泛的混合工作负载 21 矢量性能矢量性能 除法延迟 周期 除法延迟 周期 除法吞吐量除法吞吐量 开始下次除法所需的周期数 开始下次除法所需的周期数 1024 Radix 除法器 更低延迟 可单独调度的标量除法器 更高吞吐量 每 2 5 个周期 平均 完成一个单精度除法 每 4 个周 期完成一个双精度除法 FP 乘法延迟缩短至 3 个时钟周期 提升的 Gather 相比上代处理器 微运算次数降低约 60 针对 Gather 密集型工作负载实现了延迟和吞吐量改进 0 10 20 30 40 5

16、0 20062014 SS 128 PS SD 128 PD 256 PS 256 PD 0 10 20 30 40 50 20062014 SS SD 128 PS 128 PD 256 PS 256 PD 22 加密和安全保护加密和安全保护 ADCX ADOX 新指令 更快速的 ADC SBB GNU 多精度库 如 Mathematica RSA 公钥加密 更快速的打包无进位乘法 Carryless Multiply PCLMULQDQ 基本 CRC 片 散列 完整性检验等 RDSEED 新指令 非确定性随机数 ANSI X9 82 第 2 和第 4 部分 管理模式访问保护 SMAP 类似于管理模式执行保护 SMEP 防止管理模式观察用户页面上的数据 20092014 ECDH p256 RSA 2048 AES 128 GCM AES 128 GCM PCLMULQDQ RSA 2048 ADCX ADOX ECDH p256 ADCX ADOX 23 监控监控 英特尔 处理器跟踪 英特尔 CPU 上用于软件调试的主要新架 构功能 支持在内存中执行低开销指令工作负载 跟踪 该功能

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号