TMS320C54x DSP原理及应用教学课件 ppt 作者乔瑞萍第1－6章第2章 TMS320C54x的CPU结构和存储器配置

资源描述

《TMS320C54x DSP原理及应用教学课件 ppt 作者乔瑞萍第1－6章第2章 TMS320C54x的CPU结构和存储器配置》由会员分享，可在线阅读，更多相关《TMS320C54x DSP原理及应用教学课件 ppt 作者乔瑞萍第1－6章第2章 TMS320C54x的CPU结构和存储器配置（83页珍藏版）》请在金锄头文库上搜索。

1、第2章 TMS320C54x的CPU结构和存储器配置,2.1 TMS320C54x DSP的结构 2.2 TMS320C54x的总线结构 2.3 TMS320C54x的CPU结构 2.4 TMS320C54x存储器和I/O空间,2.1 TMS320C54x DSP的结构,2.1.1 TMS320C54x DSP的基本结构图2-1和图2-2给出了TMS320C54x的两种结构框图。,图2-1 TMS320C54x的组成框图,图2-2 TMS320C54x的功能框图,TMS320C54x是16位定点DSP。TMS320C54x的中央处理单元(CPU)具有改进的哈佛结构、低功耗设计和高度并行性等特

2、点。除此之外，高度专业化的指令系统可以全面地发挥系统性能。使用TMS320C54x的专用硬件逻辑的CPU，再配以按照用户需要所选择的片内存储器和片内外设，可组成用户的ASIC(Application Specific Intergrated Circuit，专用集成电路)以应用于电子产品的不同领域。,2.1.2 TMS320C54x DSP的主要特点 TMS320C54x系列定点DSP芯片共享同样的CPU内核和总线结构，但每一种器件片内存储器的配置和片内外设不尽相同。表2-1提供了TMS320C54x各DSP基本性能的概要。,表2-1 TMS320C54x系列基本配置汇总表,TMS320C54

3、x的主要特征如下： (1) CPU(中央处理单元)利用其专用的硬件逻辑和高度并行性提高芯片的处理性能。 1条程序总线、3条数据总线和4条地址总线组成的改进型哈佛结构，提供了更快的速度和更高的灵活性。 40 bit的算术逻辑单元(ALU)包括40 bit的桶形移位器和两个独立的40 bit累加器A、B。 1717 bit并行乘法单元和专用的40 bit加法器用于无等待状态的单周期乘/累加操作。, 比较、选择和存储单元(CSSU)能够完成维特比(Viterbi，通信中的一种编码方式)的加/比较/选择操作。指数译码器可以在单周期内对40 bit累加器进行指数运算。两个地址发生器包括8个辅助寄存器

4、(AR0AR7)和两个辅助寄存器算术运算单元(ARAU0、ARAU1)。 TMS320C5420还包括一个双CPU的结构。,(2) 存储器具有192 K字可寻址存储空间(包括64 K字程序存储空间、64 K字数据存储空间和64 K字I/O空间)。其中，TMS320C548、TMS320C549、TMS320C5402、TMS320C5410和TMS320C5420的程序存储空间还可以扩展到8 M字。片内存储器配置因型而异。,(3) 高度专业化的指令集能够快速地实现算法并用于高级语言编程优化。其包括：单指令重复和块指令重复。用于更好地管理程序存储器和数据存储器的块移动指令。 32位长整数操

5、作指令。指令同时读取2或3个操作数。并行存储和加载的算术指令。条件存储指令。快速中断返回。,(4) 片内外设和专用电路采用模块化的结构设计，可以快速地推出新的系列产品。其包括：可编程软件等待状态发生器。可编程分区转换逻辑电路。可使用内部振荡源或外部振荡源的锁相环(PLL)时钟发生器。当使用外部振荡源时，内部允许使用多个值对芯片倍频。, 外部总线接口可以禁止或允许外部数据总线、地址总线和控制线的输出。数据总线支持总线挂起的特征。可编程定时器。 8 bit并行主机接口(HPI)。串行口：全双工串口(支持8 bit或16 bit数据传送)、时分多路(TDM)串口和缓冲(BSP)串

6、口。,(5) TMS320C54x执行单周期定点指令时间为25/20/15/12.5/10 ns，每秒指令数为40/66/100MIPS。 (6) TMS320C54x电源由IDLE1、IDLE2和IDLE3功耗下降指令控制功耗，以便DSP工作在节电模式下，使之更适合于手机。其控制CLKOUT引脚的输出，省功耗。 (7) 在片仿真接口、片上的JTAG接口符合IEEE1149.1边界扫描逻辑接口标准，可与主机连接，用于芯片的仿真和测试。,2.2 TMS320C54x的总线结构,TMS320C54x DSP片内由8组16 bit总线(1组程序总线、3组数据线和4组地址总线)构成。程序总线(PB)传

7、送从程序存储器装载的指令代码和立即数。这些总线的功能分别是：3组数据总线(CB、DB和EB)负责将片内的各种元器件相互连接，例如CPU、数据地址产生逻辑、程序地址产生逻辑、片内外设和数据存储器等。,TMS320C54x能利用两个辅助寄存器算术单元(ARAU0和ARAU1)在同一个周期内生成两个数据存储器地址。 PB能加载保存于程序空间的操作数(例如，系数表)，并将操作数传送到乘法器和加法器中进行乘累加操作，或利用数据移动指令(MVPD和READA)把程序空间的数据传送到数据空间。,TMS320C54x还有一组双向的片内总线用于访问片内外设，这组总线轮流使用DB和EB与CPU连接。访问者使用这组

8、总线进行读/写操作需要两个或更多的周期，具体所需周期数取决于片内外设的结构。表格2-2总结了各种不同类型的总线访问。,表2-2 总线访问类型,2.3 TMS320C54x的CPU结构,CPU是DSP芯片中的核心部分，是用来实现数字信号处理运算和高速控制功能的部件。CPU内的硬件构成决定了其指令系统的性能。TMS320C54x的CPU包括：, 40位算术逻辑单元(ALU)；两个40位的累加器A、B；桶型移位寄存器(Barrel Shifter)；乘法器/加法器单元(Multiplier/Adder)；比较、选择和存储单元(CSSU)；指数编码器(EXP Encoder)； CPU状态和

9、控制寄存器(ST0、ST1和PMST)；寻址单元(Addressing Unit)。,2.3.1 算术逻辑运算单元使用算术逻辑单元(ALU)和两个累加器(A、B)能够完成二进制的补码运算，同时，ALU还能够完成布尔运算。算术逻辑单元的输入操作数可以来自： 16位的立即数；数据存储器中的16位字；暂存器T中的16位字；数据存储器中读出的2个16位字；累加器A或B中的40位数；移位寄存器的输出。,2.3.2 累加器累加器A和B可作为ALU和乘法器/加法器单元的目的寄存器，累加器也能输出数据到ALU或乘法器/加法器中。累加器可分为三部分：保护位、高位字和低位字。累加器A和B的示意图如

10、图2-3和图2-4所示。,图2-3 累加器A,图2-4 累加器B,保护位用于保存计算时产生的多余高位，防止在迭代运算中产生溢出，例如自相关运算。 AG、AH、AL、BG、BH和BL都是存储器映像寄存器(在存储空间中占有地址)，由特定的指令将其内容放到16位数据存储器中，并从数据存储器中读出或写入32位累加器值。,2.3.3 桶形移位器桶形移位器能把输入的数据进行031位的左移和015位的右移。40位桶形移位器的输入来自数据总线DB的16位输入数据、DB和CB的32位输入数据及任意一个40位累加器，并输出到ALU，经过MSW/LSW(最高有效字/最低有效字)写选择单元至EB总线。它所移的位数就

11、是指令中的移位数。移位数都是用二进制补码表示，正值表示左移，负值表示右移。移位数可由立即数、状态寄存器ST1中的累加器移位方式(ASM)字段和被指定为移位数值寄存器的暂存器T来决定。,桶形移位器可以执行以下定标操作：在执行ALU操作前预定好一个数据存储器操作数或累加器内容；对累加器的值进行算术或逻辑移位；归一化累加器；在保存累加器到数据存储器之前定标累加器。,2.3.4 乘累加器单元 TMS320C54x CPU的乘累加器单元能够在一个周期内完成一次17*17 bit的乘法和一次40位的加法。乘法器和ALU并行工作可在一个单指令周期内完成一次乘累加(MAC)运算。该单元能够快速高效地完

12、成如卷积、相关和滤波等运算。乘法器/加法器单元由1717 bit的硬件乘法器、40位专用加法器、符号位控制逻辑、小数控制逻辑、0检测器、溢出/饱和逻辑和16位的暂存器(T)等部分组成，可支持有/无符号的整数、小数乘法运算，并可对结果进行舍入处理。,乘累加器单元的一个输入操作数来自T寄存器、数据存储器或累加器A(3116位)；另一个则来自于程序存储器、数据存储器、累加器A(3116位)或立即数。乘法器的输出加到加法器的输入端，累加器A或B则是加法器的另一个输入端，最后结果送往目的累加器A或B。,2.3.5 比较选择存储单元通信领域常常用到维持比(Viterbi)算法，该算法需要完成大量的加法/

13、比较/选择(ACS)运算。CSSU单元支持各种Viterbi算法，其中加法由ALU单元完成，只要将ST1中的C16置1，所有的双字指令都会变成双16位算术运算指令，这样ALU就可以在一个机器周期内完成两个16位数的加/减法运算，其结果分别存放在累加器的高16位和低16位中。CSSU可以最大限度地完成累加器高字与低字的比较操作，即选择累加器中较大的字，并存储在数据存储器中，且不改变状态寄存器ST0中的测试/控制位TC字段和状态转移寄存器TRN的值。CSSU利用优化的片内硬件加速Viterbi的蝶形运算。,2.3.6 指数编码器指数编码器是一个专用硬件，它支持单周期指令EXP。它可以求出累加器中

14、的指数值，并以二进制补码形式存放于T中。用EXP和NORM指令可以对累加器中的内容归一化，完成定点数和浮点数之间的转换。,2.3.7 CPU状态控制寄存器 1状态寄存器(ST0和ST1) 使用置位指令SSBX和复位指令RSBX可以单独设置和清除状态寄存器的各位。例如： SSBX SXM ；符号扩展SXM=1 RSBX SXM ；禁止符号扩展SXM=0 APR、DP和ASM字段可以通过LD指令装载一个短立即数，ASM和DP也可以通过LD指令由数据存储器装载。 ST0的结构如图2-5所示，含义见表2-3。,图2-5 ST0寄存器结构,表2-3 ST0 寄存器,图2-6 ST1寄存器结构,表2-

15、4 ST1寄存器,2处理器工作方式状态寄存器(PMST) PMST可由存储器映像寄存器指令装载，如STM。图2-7是PMST寄存器的结构图。PMST各位的含义列于表2-5中。,图2-7 PMST寄存器结构,表2-5 PMST寄存器,2.3.8 寻址单元 TMS320C54x有两个地址发生器：PAGEN(Program Address Generation Logic)和DAGEN(Data Address Generation Logic)。PAGEN包括程序计数器PC、IPTR、块循环寄存器(RC、BRC、RSA和REA)，这些寄存器可支持程序存储器寻址。DAGEN包括循环缓冲区大小寄存

16、器BK、DP、堆栈指针寄存器SP、8个辅助寄存器(AR0AR7)和2个辅助寄存器算术单元(ARAU0和ARAU1)。8个辅助寄存器和2个辅助寄存器算术单元一道可进行16位无符号数算术运算，支持间接寻址模块，AR0AR7由ST0中的ARP来指定。,2.4 TMS320C54x存储器和I/O空间,DSP扩展存储器主要分为两类：ROM和RAM。ROM包括EPROM、EEPROM、Flash Memroy等。这一类存储器主要用于存储用户程序和系统常数表，一般映像在程序存储空间。RAM主要指静态RAM(SRAM)。本章主要讨论片内存储器，而片外扩展存储器将在第8章中详细介绍。,所有TMS320C54x芯片内都包含随机存储器(RAM)和只读存储器(ROM)。在芯片中有两类RAM：双寻址RAM(DARAM)和单寻址RAM(SARAM)，分别也可称为双口RAM和单口RAM。DARAM每个机器周期可被访问两次。TMS

展开阅读全文

TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1－6章 第2章 TMS320C54x的CPU结构和存储器配置

TMS320C54x DSP原理及应用教学课件 ppt 作者乔瑞萍第1－6章第2章 TMS320C54x的CPU结构和存储器配置