异构、多核、可重构

上传人:简****9 文档编号:106892229 上传时间:2019-10-16 格式:PDF 页数:33 大小:1.10MB
返回 下载 相关 举报
异构、多核、可重构_第1页
第1页 / 共33页
异构、多核、可重构_第2页
第2页 / 共33页
异构、多核、可重构_第3页
第3页 / 共33页
异构、多核、可重构_第4页
第4页 / 共33页
异构、多核、可重构_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《异构、多核、可重构》由会员分享,可在线阅读,更多相关《异构、多核、可重构(33页珍藏版)》请在金锄头文库上搜索。

1、多核、异构、可重构多核、异构、可重构 新一代计算机体系结构 张惠臻 新一代计算机体系结构 张惠臻 20142014年年4 4月月 2/33 主要内容主要内容 1.从单核到多核从单核到多核 2.多核多核从同构到异构从同构到异构 3.异构多核异构多核 + 可重构计算可重构计算 3/33 1. 1.从单核到多核从单核到多核 4/33 Intel处理器的发展历程处理器的发展历程 由由一个经验定律一个经验定律引发的引发的三个物理限制三个物理限制 5/33 一个经验定律一个经验定律 1. 芯片上晶体管的集成度,每芯片上晶体管的集成度,每18个月翻一番个月翻一番 3. 相同性能产品的价格,每相同性能产品的价

2、格,每18个月下降一半个月下降一半 2. 微处理器的性能,每微处理器的性能,每18个月提高一倍个月提高一倍 摩尔定律摩尔定律 6/33 晶体管集成度发展趋势图晶体管集成度发展趋势图 7/33 CPU的性能与频率的性能与频率 性能性能 = 频率频率 IPC IPC:Instructions per Cycle 频率:频率:1/Cycle 受受CPU频率和频率和CPU架构两方面的综合决定架构两方面的综合决定 CPU架构改变,提高架构改变,提高IPC,带来性能质的飞跃,带来性能质的飞跃 CPU频率增长,带来性能量的提升 对于同一代架构,改良架构来提高IPC的幅度是非常有限的 所以, 频率增长,带来性

3、能量的提升 对于同一代架构,改良架构来提高IPC的幅度是非常有限的 所以,提高提高CPUCPU主频成为单核时代提升性能唯一有效手段主频成为单核时代提升性能唯一有效手段 8/33 Intel CPU时钟频率与晶体管集成度演变时钟频率与晶体管集成度演变 Sorry, Bill. The free lunch is over ! Hello,Andy 9/33 三个物理限制(三个物理限制(1) 功耗限制功耗限制 功耗计算公式功耗计算公式 晶体管集成度 消耗能量 (功耗) 发热 (温度) 晶体管集成度 消耗能量 (功耗) 发热 (温度) 晶体管翻转 (频率) 晶体管翻转 (频率) 芯片密度散热能力芯片

4、密度散热能力 P = CP = CV V2 2f f C:芯片总的栅电容 V:工作电压, f f:工作频率 C:芯片总的栅电容 V:工作电压, f f:工作频率 P fP f3 3 10/33 三个物理限制(三个物理限制(2) 互连延迟限制互连延迟限制 传输延迟与频率的相对关系传输延迟与频率的相对关系 增加流水线级数的失效代价增加流水线级数的失效代价 设计复杂度限制设计复杂度限制 设计空间问题设计空间问题 芯片验证问题芯片验证问题 11/33 新的提升处理器性能的方法新的提升处理器性能的方法 功耗限制 频率不变, 增加片上处 理器的数量 互连延迟限制 分成多个相对 独立的区域, 减少通信联系

5、设计复杂度限制 采用多个简单 重复的处理器 功耗限制 频率不变, 增加片上处 理器的数量 互连延迟限制 分成多个相对 独立的区域, 减少通信联系 设计复杂度限制 采用多个简单 重复的处理器 多核多核 12/33 Intel 80核处理器核处理器 13/33 2.2.多核多核 从同构到异构从同构到异构 14/33 多核架构多核架构 斯坦福的斯坦福的Hydra处理器处理器(1996)同构片上多核同构片上多核 15/33 总线或交叉开关架构总线或交叉开关架构 特点特点 可视作传统板上多处理器的片上集成可视作传统板上多处理器的片上集成 处理核数相对较少,结构相似处理核数相对较少,结构相似 单核功能较全

6、面,类似传统单核处理器单核功能较全面,类似传统单核处理器 传统应用程序无需修改即可运行,获得一定加速传统应用程序无需修改即可运行,获得一定加速 共享存储,各核访存方式一致共享存储,各核访存方式一致 缺点缺点 总线或者交换开关成为系统瓶颈总线或者交换开关成为系统瓶颈 限制了核的数目,难以扩展限制了核的数目,难以扩展 16/33 流处理器和流处理器和GPU架构架构 新的应用特征新的应用特征 大规模的数据并行计算大规模的数据并行计算 图像和视频处理、动画合成等图像和视频处理、动画合成等 三类并行三类并行 线程并行线程并行Hydra 数据并行数据并行 SIMD(Single Instruction M

7、ultiple Data) 单核时代单核时代DSP 指令并行指令并行 VLIW(Very Long Instruction Word) 17/33 Imagine流处理器流处理器 斯坦福的斯坦福的Imagine (2000) 8个个ALU单元被同一 个控制器所控制,同 时对大量的并行数据 进行同样的操作 单元被同一 个控制器所控制,同 时对大量的并行数据 进行同样的操作 一个大型一个大型SIMD单元单元 18/33 GPU架构架构Nvidea Fermi 19/33 多核设计的问题多核设计的问题 少数强大的核还是很多简单的核?少数强大的核还是很多简单的核? 前者前者总指令吞吐率与其功耗或面积成

8、本呈亚 线性关系,投入产出效率较低 总指令吞吐率与其功耗或面积成本呈亚 线性关系,投入产出效率较低 后者后者单线程的性能很低,而每个程序总有一 部分没法并行化,这将最终决定整个程序的性能 单线程的性能很低,而每个程序总有一 部分没法并行化,这将最终决定整个程序的性能 取决于程序的可并行性取决于程序的可并行性Amdahl定律定律 20/33 Amdahl定律定律 Speedup Defined as sequential execution time over parallel execution time in parallel processing. f The portion of the

9、 workload that can be parallelized m The number of processors 21/33 异构多核架构异构多核架构 异构多核异构多核 一个强大的单核一个强大的单核执行程序串行部分执行程序串行部分 众多简单的单核众多简单的单核执行程序并行部分执行程序并行部分 另一个角度看异构多核另一个角度看异构多核 一个核心控制核一个核心控制核 负责系统的控制、调度与协调负责系统的控制、调度与协调 多个计算核多个计算核 负责具体应用程序的功能计算负责具体应用程序的功能计算 计算核可以不相同计算核可以不相同 22/33 典型的异构多核架构典型的异构多核架构Cell I

10、BM的的Cell处理器处理器 23/33 多核的关键问题多核的关键问题 多核处理器本身的设计不是问题多核处理器本身的设计不是问题 最关键的问题最关键的问题编程模型编程模型 并行化编程并行化编程 编译器等软件工具的支持编译器等软件工具的支持 其他关键问题其他关键问题 互连结构互连结构 系统的可扩展性系统的可扩展性片上网络片上网络 多核操作系统多核操作系统 24/33 3.3.异构多核+可重构计算异构多核+可重构计算 25/33 实现功能的三种计算模式实现功能的三种计算模式 CBxAxy 2 26/33 可重构计算可重构计算 简化描述简化描述 在软件的控制下,利用系统中的可重用资源(如在软件的控制

11、下,利用系统中的可重用资源(如FPGA等 可重构逻辑器件),根据应用的需要重新构造一个新的 用于执行应用程序的硬件平台 等 可重构逻辑器件),根据应用的需要重新构造一个新的 用于执行应用程序的硬件平台 一类计算机组织结构一类计算机组织结构 在硬件芯片制造后针对计算任务的定制能力;在硬件芯片制造后针对计算任务的定制能力; 为计算任务提供大量可定制执行空间的实现能力为计算任务提供大量可定制执行空间的实现能力 带来了系统硬件的可变性 能够像安装软件那样 带来了系统硬件的可变性 能够像安装软件那样“安装安装”硬件硬件 27/33 可重构方式可重构方式 静态可重构静态可重构编译时重构 动态可重构 编译时

12、重构 动态可重构运行时重构运行时重构 28/33 可重构计算系统可重构计算系统 29/33 从高性能到高效能从高性能到高效能 性能性能 机械或是其他工业制品对设计要求的满足程度机械或是其他工业制品对设计要求的满足程度 计算机性能计算机性能速度速度为先!为先! 效能效能 综合了综合了“效率效率”、“效益效益”、“性能性能”等多个词的意等多个词的意 计算机效能计算机效能性能、功耗、容错性、适应性、 安全性等等 性能、功耗、容错性、适应性、 安全性等等 可重构计算为系统的高效能实现提供了条件可重构计算为系统的高效能实现提供了条件 30/33 异构多核异构多核+可重构计算可重构计算 31/33 一些用

13、于扩展的关键词一些用于扩展的关键词 并行计算并行计算 Parallel ComputingParallel Computing 片上系统片上系统SoC Systems on Chip SoC Systems on Chip 片上网络片上网络NoC Networks on Chip NoC Networks on Chip 众核处理器众核处理器 Manycore ProcessorsManycore Processors 高性能计算高性能计算 High Performance ComputingHigh Performance Computing 高效能计算高效能计算 High Efficien

14、cy ComputingHigh Efficiency Computing 演化硬件演化硬件 Evolvable Hardware Evolvable Hardware 超标量超标量 SuperscalarSuperscalar 超长指令字 VLIW超长指令字 VLIW Very Long Instruction WordVery Long Instruction Word 现场可编程门阵列FPGA Field Programmable Gate Arrays 现场可编程门阵列FPGA Field Programmable Gate Arrays 32/33 【号外】介绍几本书【号外】介绍几本

15、书 1.深入理解计算机系统深入理解计算机系统(第第2版版),美美 Randal E.Bryant / David R.OHallaron著,龚奕利著,龚奕利/雷迎春译,机械工业出 版社, 雷迎春译,机械工业出 版社,2011年年 2.浪潮之巅浪潮之巅,吴军,电子工业出版社,吴军,电子工业出版社,2011年年 数学之美数学之美,吴军,人民邮电出版社,吴军,人民邮电出版社,2012年年 3.程序员的自我修养:链接、装载与库程序员的自我修养:链接、装载与库,俞甲子等,电 子工业出版社, ,俞甲子等,电 子工业出版社,2009年年 4.链接器和加载器链接器和加载器,美美 John R.Levine著,李勇译, 北京航空航天大学出版社, 著,李勇译, 北京航空航天大学出版社,2009年年 33/33

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号