ARM体系结构清华第一章

上传人:飞*** 文档编号:7517387 上传时间:2017-08-10 格式:PPT 页数:84 大小:2.95MB
返回 下载 相关 举报
ARM体系结构清华第一章_第1页
第1页 / 共84页
ARM体系结构清华第一章_第2页
第2页 / 共84页
ARM体系结构清华第一章_第3页
第3页 / 共84页
ARM体系结构清华第一章_第4页
第4页 / 共84页
ARM体系结构清华第一章_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《ARM体系结构清华第一章》由会员分享,可在线阅读,更多相关《ARM体系结构清华第一章(84页珍藏版)》请在金锄头文库上搜索。

1、2,第1章 ARM概述及其基本编程模型,目前,基于ARM技术的处理器已经占据了32位RISC芯片75%的市场份额。可以说,ARM技术几乎无处不在。1990年11月ARM公司在英国剑桥的一个谷仓里成立,最初只有12人。经过11年多的发展,ARM公司已经拥有700多名员工,其中60以上都从事研发工作。 ARM拥有广泛的全球技术合作伙伴,这其中包括领先的半导体系统厂商、实时操作系统(RTOS)开发商、电子设计自动化和工具供应商、应用软件公司、芯片制造商和设计中心。ARM合作伙伴包括了许多世界顶级的半导体公司。 ARM技术具有很高的性能和功效,因而容易被厂商接受。同时,合作伙伴的增多,可获得更多的第三

2、方工具、制造和软件支持,又使整个系统成本降低,使产品进入市场的时间加快,从而具有更大的竞争优势。,3,1.1 ARM技术的应用领域及其特点,ARM技术的IP核在下列领域已经取得或正在取得很大的成功。无线设备蓝牙技术联网消费电子汽车海量存储设备成像安全产品,4,将技术授权给其它芯片厂商,形成各具特色的ARM芯片,5,1.1 ARM技术的应用领域及其特点,ARM芯片具有RISC体系的一般特点,如:具有大量的寄存器。绝大多数操作都在寄存器中进行,通过Load/Store的体系结构在内存和寄存器之间传递数据。寻址方式简单。采用固定长度的指令格式。除此之外,ARM体系采用了一些特别的技术,在保证高性能的

3、同时尽量减小芯片体积,减低芯片的功耗。这些技术包括:在同一条数据处理指令中包含算术逻辑处理单元处理和移位处理。使用地址自动增加(减少)来优化程序中循环处理。Load/Store指令可以批量传输数据,从而提高数据传输的效率。所有指令都可以根据前面指令执行结果,决定是否执行,以提高指令执行的效率。,6,1.2 ARM体系结构的版本及命名方法,ARM体系结构共定义了6个版本,版本号分别为16。从版本1到版本6,ARM体系的指令集功能不断扩大。同时,各版本中还有一些变种,这些变种定义了该版本指令集中不同的功能。ARM处理器系列中的各种处理器,其采用的实现技术各不相同,性能差别很大,应用场合也有所不同,

4、但是只要它们支持相同的ARM体系版本,基于它们的应用软件将是兼容的。本节介绍ARM体系结构不同版本指令集的特点,以及各版本包含的一些变种的特点。,7,1.2.1 ARM体系结构的版本,ARM体系结构的6个版本的特点如下。1. 版本12. 版本23. 版本34. 版本45. 版本56. 版本6,8,1. 版本1本版本在ARM1中实现,但没有在商业产品中使用。它包括下列指令:处理乘法指令之外的基本数据处理指令。基于字节、字和多字的读取和写入指令(Load/Store)。包括子程序调用指令BL在内的跳转指令。供操作系统使用的软件中断指令SWI。本版本中地址空间是26位,目前已经不再使用。,9,2.

5、版本2与版本1相比,版本2增加了下列指令:乘法指令和乘加法指令。支持协处理器的指令。对于FIQ模式,提供了额外的两个备份寄存器。SWP指令及SWPB指令。本版本中地址空间是26位,目前已经不再使用。,10,3. 版本3版本3较以前的版本发生了比较大的变化。主要改进部分如下:处理器的地址空间扩展到了32位,但除了版本3G(版本3的一个变种)外的其他版本是向前兼容的,支持26位的地址空间。当前程序状态信息从原来的R15寄存器移到一个新的寄存器中,新寄存器名为CPSR。增加了SPSR用于在程序异常中断程序时,保存被中断的程序的程序状态。增加了指令MRS和指令MSR,用于访问CPSR寄存器和SPSR寄

6、存器。增加了两种处理器模式(数据访问中止模式、未定义指令模式),使操作系统代码可以方便地使用数据访问中止异常、指令预取中止异常和未定义指令异常。修改了原来的从异常中返回的指令。,11,4. 版本4与版本3相比,版本4增加了下列指令:半字的读取和写入指令。读取(Load)带符号的字节和半字数据的指令。增加了T变种,可以使处理器状态切换到Thumb状态,在该状态下指令集是16位的Thumb指令集。增加了处理器的特权模式。在该模式下,使用的是用户模式下的寄存器。另外,在版本4中明确定义了哪些指令会引起未定义指令异常。版本4不再强制要求与以前的26位地址空间兼容。,12,5. 版本5与版本4相比,版本

7、5增加或者修改了下列指令:提高了T变种中ARM/Thumb混合使用的效率。对于T变种的指令和非T变种的指令使用相同的代码生成技术。同时,版本5还具有以下的特点。增加了前导零计数(count leading zeros)指令,该指令可以使整数除法和中断优先级排队操作更为有效。增加了软件断点指令。为协处理器设计提供了更多的可选择的指令。更加严格地定义了乘法指令对条件标志位的影响。,13,6. 版本6ARM体系版本6是2001年发布的。其主要特点是增加了SIMD功能扩展。它适合使用电池供电的高性能的便携式设备。这些设备一方面需要处理器提供高性能,另一方面又需要功耗很低。SIMD功能扩展为包括音频/视

8、频处理在内的应用系统提供了优化功能。它可以使音频/视频处理性能提高4倍。ARM体系版本6首先在2002年春季发布的ARM11处理器中使用。,14,SIMD在性能上的优势: 以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和运算。而在SIMD型的CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有操作数进行运算。这个特点使SIMD特别适合于多媒体应用等数据密集型运算。,15,1.2.2 ARM体系的变种,这里将某些特定功能称为ARM体系的某种变种(variant),例如支持Thum

9、b指令集,称为T变种。目前ARM定义了一些变种。1. Thumb指令集(T变种)2. 长乘法指令(M变种)3. 增强型DSP指令(E变种)4. Java加速器Jazelle(J变种)5. ARM媒体功能扩展(SIMD变种),16,1.2.3 ARM/Thumb体系版本的命名格式,表示ARM/Thumb体系版本的字符串是由下面几部分组成的:字符串ARMv。ARM指令集版本号。目前是16的数字字符。表示变种的字符。由于在ARM体系版本4以后,M变种成为系统的标准功能,字符M通常不需要列出来。使用字符x表示排除某种写功能。比如,xM、ExP。,17,1.3 ARM处理器系列,ARM处理器目前包括下面

10、几个系列的处理器产品以及其他厂商实现的基于ARM体系结构的处理器。ARM7系列。ARM9系列。ARM9E系列。ARM10E系列。SecurCore系列。Intel的Xscale。Intel的StrongARM。,18,19,20,1.3.1 ARM7系列,ARM7系列包括ARM7TDMI、ARM7TDMI-S、ARM7EJ-S和ARM720T 4种类型,主要用于适应不同的市场需求。ARM7系列处理器具体应用于以下场合:个人音频设备(MP3播放器、WMA播放器、AAC播放器)。接入级的无线无线设备。喷墨打印机。数字照相机。PDA。,21,1.3.1 ARM7系列,ARM7系列处理器具有以下主要特

11、点:成熟的大批量的32位RICS芯片。最高主频达到130 MIPS。功耗很低。代码密度很高,兼容16位的微处理器。得到广泛的操作系统和实时操作系统支持,包括Window CE、Palm OS、 Symbian OS、Linux以及业界领先的实时操作系统。众多的开发工具。EDA仿真模型。优秀的调试机制。业界众多领先的IC制造商生产这类芯片。提供0.25m、0.18m及0.13m的生产工艺。代码于ARM9系列、ARM9E、ARM10E兼容。,22,1.3.2 ARM9系列,ARM9系列包括ARM920T、ARM922T和ARM940T 3种类型,主要用于适应不同的市场需求。ARM9系列处理器的具体

12、应用于以下场合:下一代的无线设备,包括视频电话和PDA等。数字消费品,包括机顶盒、家庭网关、MP3播放器和MPEG4播放器等。成像设备,包括打印机、数字照相机和数字摄像机等。汽车、通信和信息系统。,23,1.3.2 ARM9系列,ARM9系列处理器具有以下主要特点:支持32位ARM指令集和16位Thumb指令集的32位RISC处理器。五级整数流水线。单一的32位AMBA总线接口。MMU支持Window CE、Palm OS、Symbian OS、Linux等。MPU支持实时操作系统,包括Vxworks。统一的数据cache和指令cache。提供0.18m、0.15m 及 0.13m的生产工艺。

13、,24,1.3.3 ARM9E系列,ARM9E系列包括ARM926EJ-S、ARM946E-S和ARM966E-S 3种类型,用于适应不同的市场需求。ARM9E系列处理器具体应用在以下场合:下一代的无线设备,包括视频电话和PDA等。数字消费品,包括机顶盒、家庭网关、MP3播放器和MPEG4播放器等。成像设备,包括打印机、数字照相机和数字摄像机等。存储设备,包括DVD域HDD等。工业控制,包括马达控制和能量控制等。汽车,通信和信息系统的ABS和车体控制等。网络设备,包括VoIP、WirelessLAN、xDSL等。,25,1.3.3 ARM9E系列,ARM9E系列处理器具有以下主要特点:支持32

14、位的ARM指令集和16位的Thumb指令集的32位RISC处理器。包括了DSP指令集。五级整数流水线。在典型的0.13m工艺下,主频可以达到300 MIPS的性能。集成的实时跟踪和调试功能。单一的32位AMBA总线接口。可选的VFP9浮点处理协处理器。在实时控制和三维图像处理时主频可达到215 MFLOPS。高性能的AHB系统。MMU支持Window CE、Palm OS、Symbian OS、Linux等。MPU支持实时操作系统,包括Vxworks。统一的数据cache和指令cache。提供0.18m、0.15m 及 0.13m的生产工艺。,26,1.3.4 ARM10E系列,ARM10E系

15、列包括ARM1020E、ARM1022E和ARM1026EJ-S 3种类型,主要用于适应不同的市场需求。ARM10E系列处理器具体应用于以下场合:下一代的无线设备,包括视频电话、PDA、笔记本电脑和Internet设备等。数字消费品,包括机顶盒、家庭网关、MP3播放器和MPEG4播放器等。成像设备,包括激光打印机、数字照相机和数字摄像机等。工业控制,包括马达控制和能量控制等。汽车,通信和信息系统等。,27,1.3.4 ARM10E系列,ARM10E系列处理器具有以下主要特点:支持32位的ARM指令集和16位的Thumb指令集的32位RISC处理器。包括了DSP指令集。六级整数流水线。在典型的0

16、.13m工艺下,主频可以达到400 MIPS的性能。单一的32位AMBA总线接口。可选的VFP10浮点处理协处理器。在实时控制和三维图像处理时主频可达到650 MFLOPS。高性能的AHB系统。MMU支持Window CE、Palm OS、Symbian OS、Linux等。统一的数据cache和指令cache。提供0.18m、0.15m 及 0.13m的生产工艺。并行读取/写入(load/store)部件。,28,1.3.5 SecurCore系列,SecurCore系列处理器除了具有体积小、功耗低、代码密度大和性能高等特点外,还具有它自己的特别优势,即提供了安全解决方案的支持。SecurCore系列处理器具有以下特点:支持ARM指令集和Thumb指令集,以提高代码密度和系统性能。采用软内核技术,以提供最大限度的灵活性,以及防止外部对其进行扫描探测。提供了安全特性,抵制攻击。提供面向智能卡的和低成本的存储保护单元(MPU)。可以集成用户自己的安全特性和其他的协处理器。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号