体系结构课件chapter0章节

上传人:E**** 文档编号:90648883 上传时间:2019-06-14 格式:PPT 页数:68 大小:8.14MB
返回 下载 相关 举报
体系结构课件chapter0章节_第1页
第1页 / 共68页
体系结构课件chapter0章节_第2页
第2页 / 共68页
体系结构课件chapter0章节_第3页
第3页 / 共68页
体系结构课件chapter0章节_第4页
第4页 / 共68页
体系结构课件chapter0章节_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《体系结构课件chapter0章节》由会员分享,可在线阅读,更多相关《体系结构课件chapter0章节(68页珍藏版)》请在金锄头文库上搜索。

1、计算机系统结构 -课程介绍,陈竹敏 2011,2,课程目标,本课程是计算机科学与技术专业的一门的基础课程。 通过本课程的学习 使学生理解计算机系统的基本工作原理 硬件、软件界面划分的权衡策略 建立完整的、系统的计算机软、硬件的整体概念,3,课程主要内容,计算机系统结构概论 数据表示、寻址方式与指令系统 存储、中断、总线与I/O系统 存储体系 流水和指令级高速并行的超级机 阵列处理机 多处理机 数据流机和规约机*,4,课程学习的重点,本科专业的重要课程 综合知识,牵扯到多门课程 宏观上看计算机系统,不只是硬件课程,而是涉及软、硬件的课程 从整体上掌握计算机系统的工作原理,以基本概念和基本原理为主

2、 不是完整介绍各种系统结构,即不是以具体的机器为实例进行教学 让同学们明白计算机技术发展的趋势及影响,激发学习热情、钻研和创新精神 了解新技术、新概念,扩大知识面 如:RISC、RAID、SMP、Cluster等 如:网格计算(Grid Computing),P2P,云计算(Cloud Computing), 物联网(The Internet of things), GFS(Google File System) 如:多核技术(Multicore),众核(Manycore),5,计算机学科的组织构成,计算机系统结构 计算机软件与理论 计算机应用,理科 工科 农 医 管理,计算机科学与技术专业,

3、说明: 一级学科 二级学科,6,计算机技术的发展,自1946年以来,计算机在70年中有了惊人的发展 性能 (加法)速度提高了5个数量级 计算机性能大约以35%/年的速度提高 价格 今天$1,000的机器相当于60年代中$1,000,000的机器 相同性能计算机的价格比,改善了个数量级。 从发展过程中体会本课程的含义。,7,指数增长的世界,网络 vs. 计算机性能 处理器速度 每18个月翻一番 存储密度 每12个月翻一番 网络速度 每9个月翻一番 1986 to 2000 (数量) 计算机: x 500 网络: x 340,000 2001 to 2010 计算机: x 60 网络: x 400

4、0,处理器速度持续提高(广度),从1971年第一颗微处理器Intel 4004问世以来,处理器频率从不到1MHz发展到今天最高接近5GHz,处理器的性能提高了数十万倍。,千条指令/秒, KIPS Kilo Instructions Per Second 百万条指令/秒,MIPS Million Instructions Per Second,Intel 酷睿i7 980X(至尊版),9,10,1965 年Gordon Moore (Founder of Intel)观察到在一个芯片上集成的晶体管数每1年增长1倍,到现在一直是这样。 40年间处理器芯片集成的晶体管数目从二千三百个发展到今天的数十

5、亿个。,晶体管数/芯片 持续增长,1亿,30年间计算机系统的速度提高了6个数量级,对计算能力的需求持续增长,每秒千万亿次(Petaflops,即每秒1015运算),13,摩尔定律(1979年),假设芯片价格保持不变,则微处理器芯片上的晶体管数,每隔18-24个月便翻一番 假设微处理器价格保持不变,则微处理器速度每隔18-24个月便翻一番 假设微处理器速度或芯片内存储器容量不变,则微处理器芯片价格每18-24个月将降低约48%,14,摩尔定律即将终结,Intel公司负责内部芯片设计的首席技术官盖尔欣格认为:以地球文明所拥有的材料环境,如果芯片的耗能和散热问题不解决,则: 2005年芯片上集成2亿

6、个晶体管,热的像核反应堆 到摩尔定律截至年,2010年,就会达到火箭发射时高温气体喷嘴的水平 2015年,芯片表面就会与太阳的表面一样热,15,Memory Capacity (and Cost) have changed dramatically in the last 20 years.,year size(Mb) cyc time 1980 0.0625 250 ns 1983 0.25 220 ns 1986 1 190 ns 1989 4 165 ns 1992 16 145 ns 1996 64 120 ns 2000 256 100 ns 2011 4096 1.25ns,存储容

7、量,16,芝奇4GB DDR3 1600,17,在速度方面,CPU增长的非常快,但内存和磁盘却增长的很慢。 这导致了在系统结构,操作系统和编程方面的巨大改变。,Capacity Speed (latency) Logic 2x in 3 years 2x in 3 years DRAM 4x in 3 years 2x in 10 years Disk 4x in 3 years 2x in 10 years,18,Scaling to 0.1m,Semiconductor Industry Association, 1992 Technology Workshop Projected fut

8、ure technology based on past trends,1992 1995 1998 2001 2004 2007 Feature size(m): 0.5 0.35 0.25 0.18 0.12 0.10 Industry is slightly ahead of projection DRAM capacity: 16M 64M 256M 1G 4G 16G Doubles every 1.5 years Prediction on track Chip area (cm2): 2.5 4.0 6.0 8.0 10.0 12.5 Way off! Chips staying

9、 small,芯片制造工艺在1992年以后,从0.5微米、0.35微米、0.25微米、0.18微米、0.15微米、0.13微米、90纳米、65纳米一直发展到目前最新的45、32纳米,而32纳米的制造工艺将是下一代CPU的发展目标。,19,20,CPU与Memroy的性能呈现剪刀差,Performance,21,ENIAC (艾尼亚克) 背景,最早的计算机 Electronic Numerical Integrator And Computer (电子数字积分计算机) Eckert (总工程师,年仅24岁) and Mauchly 1943开始,1946完成,1955年终止 宾夕法尼亚大学 二战

10、期间,军方要求为陆军炮弹部队提供6张火力表以便对导弹的研制进行技术鉴定 如果雇用200多名计算员加班加点工作大约需要二个多月的时间才能算完一张火力表,22,ENIAC,23,ENIAC-技术细节,长30.48米,宽1米,占地面积170平方米,30个操作台,重达30吨 耗电量150千瓦 据说,每当它开机时,费城西区的电灯黯然失色(功率过大) 造价48万美元 17468真空管;7200水晶二极管;1500中转;70000电阻器;10000电容器;1500继电器;6000多个开关 每秒执行5000次加法或400次乘法,是当时继电器计算机的1000倍、手工计算的20万倍,24,Commercial C

11、omputers商业计算机,1947年 - Eckert-Mauchly 公司 UNIVAC I (Universal Automatic Computer) 1950年- UNIVAC II 更快 更大的存储容量,25,IBM 360系列,1964年 最早计划的“家族式”系列电脑,不同型号之间互相兼容 相似或一致的指令集 相似或一致的OS 越来越快的速度 越来越多的 I/O端口 (更多的终端) 越来越多的存储容量 越来越多的费用 1964年的360系列 速度: 0.034 1.700 MIPS 主存: 8 KB 8 MB Million Instructions Per Second(每秒百

12、万条指令),26,DEC PDP-8,Digital Equipment Corporation (DEC) 1964 第一台小型机 占用很少的空间(电冰箱大小) diode-transistor logic (二极管-晶体管) BUS STRUCTURE-Unibus(单总线),27,目前最快的计算机(2010年11月),Top500 in World 世界最快的500台计算机系统 2010年11月 www.top500.org No1: 天河一号 (天津超级计算中心) 2566万亿次/秒 No2: Cray XT5-Jaguar(美洲虎) 1759万亿次/秒 No3: 星云1号 1271万

13、亿次/秒,每秒千万亿次(Petaflops,即每秒1015运算) 2.566Pflops,目前最快的计算机(2008年11月),世界最快的500台计算机系统 2008年11月 www.top500.org No1: IBM Roadrunner走鹃 1450万亿次/秒 No2: Cray XT5 QC 2.3 GHz 1381万亿次/秒 No4: IBM BlueGene/L 596万亿次/秒 No10: 曙光(上海超算中心) 233万亿次/秒 中国最快的100台计算机系统 2008年11月 No1:上海超级计算中心 曙光 233万亿次/秒 No300+:山东省高性能计算中心 浪潮 0.749

14、万亿次/秒,29,目前最快的计算机(2009年11月),30,目前最快的计算机(2010年11月),31,国际超级计算机500强排名(TOP500),是美国田纳西大学、伯克利NERSC实验室和德国曼海姆大学一些专家为评价世界超级计算机性能而搞的民间学术活动,每年2次排出世界上实际运行速度最快的前500台计算机。(6月、11月) 排名的依据是线性代数软件包Linpack的实际测试数据,而峰值浮点运算速度作为参考值列出。 Linpack基准测试程序 是一个可以分解和解答线性方程和线性最小平方问题的Fortran子程序集. 于20世纪70年代到80年代初为超级计算机而设计 测试出的最高性能指标作为衡

15、量机器性能的标准,32,33,34,35,36,37,38,39,40,PFlops 千万亿次浮点指令 TFlops 万亿次浮点指令,80 times,41,No 1:天河-1A,国防科技大学,这是超过美国橡树岭国家实验室产品高达40的系统。达到每秒4700万亿次的峰值性能和每秒2507万亿次的实测性能,位居榜首。 14,336颗英特尔六核至强X5670 2.93GHz CPU、7168颗Nvidia Tesla M2050 GPU,以及2048颗自主研发的八核飞腾FT-1000处理器 天河一号A将大规模并行GPU与多核CPU相结合,在性能、尺寸以及功耗等方面均取得了巨大进步,是当代异构计算(

16、CPU GPU)的典型代表。如果单纯只使用CPU的话,要实现同等性能则需要50,000颗以上的CPU以及两倍的占地面积。 更重要的是,如果完全采用CPU打造,可实现2.507 Petaflops(千万亿次)性能的系统将消耗1200万瓦特的电力。多亏在异构计算环境中运用了GPU,天河一号A仅消耗404万瓦特的电力,节能效果高达3倍。二者之间的功耗之差足够满足5000多户居民一年的电力所需。,三大突破,“天河一号”除了使用了英特尔处理器,还首次在超级计算机中使用了2048个我国自主设计的处理器。这款名为“飞腾-1000”的64位CPU。它利用65纳米技术设计生产,共有8个核心。 中国首创了CPU和GPU融合并行的体系结构。关注电脑的人都知道,中央处理器CPU和图形处理器GPU的生产厂商近期先是互相

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号