TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章 TMS320C54x的CPU结构和存储器配置

上传人:E**** 文档编号:89350641 上传时间:2019-05-23 格式:PPT 页数:83 大小:1.20MB
返回 下载 相关 举报
TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章  TMS320C54x的CPU结构和存储器配置_第1页
第1页 / 共83页
TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章  TMS320C54x的CPU结构和存储器配置_第2页
第2页 / 共83页
TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章  TMS320C54x的CPU结构和存储器配置_第3页
第3页 / 共83页
TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章  TMS320C54x的CPU结构和存储器配置_第4页
第4页 / 共83页
TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章  TMS320C54x的CPU结构和存储器配置_第5页
第5页 / 共83页
点击查看更多>>
资源描述

《TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章 TMS320C54x的CPU结构和存储器配置》由会员分享,可在线阅读,更多相关《TMS320C54x DSP原理及应用 教学课件 ppt 作者 乔瑞萍 第1-6章 第2章 TMS320C54x的CPU结构和存储器配置(83页珍藏版)》请在金锄头文库上搜索。

1、第2章 TMS320C54x的CPU结构和存储器配置,2.1 TMS320C54x DSP的结构 2.2 TMS320C54x的总线结构 2.3 TMS320C54x的CPU结构 2.4 TMS320C54x存储器和I/O空间,2.1 TMS320C54x DSP的结构,2.1.1 TMS320C54x DSP的基本结构 图2-1和图2-2给出了TMS320C54x的两种结构框图。,图2-1 TMS320C54x的组成框图,图2-2 TMS320C54x的功能框图,TMS320C54x是16位定点DSP。TMS320C54x的中央处理单元(CPU)具有改进的哈佛结构、低功耗设计和高度并行性等特

2、点。除此之外,高度专业化的指令系统可以全面地发挥系统性能。使用TMS320C54x的专用硬件逻辑的CPU,再配以按照用户需要所选择的片内存储器和片内外设,可组成用户的ASIC(Application Specific Intergrated Circuit,专用集成电路)以应用于电子产品的不同领域。,2.1.2 TMS320C54x DSP的主要特点 TMS320C54x系列定点DSP芯片共享同样的CPU内核和总线结构,但每一种器件片内存储器的配置和片内外设不尽相同。表2-1提供了TMS320C54x各DSP基本性能的概要。,表2-1 TMS320C54x系列基本配置汇总表,TMS320C54

3、x的主要特征如下: (1) CPU(中央处理单元)利用其专用的硬件逻辑和高度并行性提高芯片的处理性能。 1条程序总线、3条数据总线和4条地址总线组成的改进型哈佛结构,提供了更快的速度和更高的灵活性。 40 bit的算术逻辑单元(ALU)包括40 bit的桶形移位器和两个独立的40 bit累加器A、B。 1717 bit并行乘法单元和专用的40 bit加法器用于无等待状态的单周期乘/累加操作。, 比较、选择和存储单元(CSSU)能够完成维特比(Viterbi,通信中的一种编码方式)的加/比较/选择操作。 指数译码器可以在单周期内对40 bit累加器进行指数运算。 两个地址发生器包括8个辅助寄存器

4、(AR0AR7)和两个辅助寄存器算术运算单元(ARAU0、ARAU1)。 TMS320C5420还包括一个双CPU的结构。,(2) 存储器具有192 K字可寻址存储空间(包括64 K字程序存储空间、64 K字数据存储空间和64 K字I/O空间)。其中,TMS320C548、TMS320C549、TMS320C5402、TMS320C5410和TMS320C5420的程序存储空间还可以扩展到8 M字。 片内存储器配置因型而异。,(3) 高度专业化的指令集能够快速地实现算法并用于高级语言编程优化。其包括: 单指令重复和块指令重复。 用于更好地管理程序存储器和数据存储器的块移动指令。 32位长整数操

5、作指令。 指令同时读取2或3个操作数。 并行存储和加载的算术指令。 条件存储指令。 快速中断返回。,(4) 片内外设和专用电路采用模块化的结构设计,可以快速地推出新的系列产品。其包括: 可编程软件等待状态发生器。 可编程分区转换逻辑电路。 可使用内部振荡源或外部振荡源的锁相环(PLL)时钟发生器。当使用外部振荡源时,内部允许使用多个值对芯片倍频。, 外部总线接口可以禁止或允许外部数据总线、地址总线和控制线的输出。 数据总线支持总线挂起的特征。 可编程定时器。 8 bit并行主机接口(HPI)。 串行口:全双工串口(支持8 bit或16 bit数据传送)、时分多路(TDM)串口和缓冲(BSP)串

6、口。,(5) TMS320C54x执行单周期定点指令时间为25/20/15/12.5/10 ns,每秒指令数为40/66/100MIPS。 (6) TMS320C54x电源由IDLE1、IDLE2和IDLE3功耗下降指令控制功耗,以便DSP工作在节电模式下,使之更适合于手机。其控制CLKOUT引脚的输出,省功耗。 (7) 在片仿真接口、片上的JTAG接口符合IEEE1149.1边界扫描逻辑接口标准,可与主机连接,用于芯片的仿真和测试。,2.2 TMS320C54x的总线结构,TMS320C54x DSP片内由8组16 bit总线(1组程序总线、3组数据线和4组地址总线)构成。程序总线(PB)传

7、送从程序存储器装载的指令代码和立即数。这些总线的功能分别是:3组数据总线(CB、DB和EB)负责将片内的各种元器件相互连接,例如CPU、数据地址产生逻辑、程序地址产生逻辑、片内外设和数据存储器等。,TMS320C54x能利用两个辅助寄存器算术单元(ARAU0和ARAU1)在同一个周期内生成两个数据存储器地址。 PB能加载保存于程序空间的操作数(例如,系数表),并将操作数传送到乘法器和加法器中进行乘累加操作,或利用数据移动指令(MVPD和READA)把程序空间的数据传送到数据空间。,TMS320C54x还有一组双向的片内总线用于访问片内外设,这组总线轮流使用DB和EB与CPU连接。访问者使用这组

8、总线进行读/写操作需要两个或更多的周期,具体所需周期数取决于片内外设的结构。表格2-2总结了各种不同类型的总线访问。,表2-2 总线访问类型,2.3 TMS320C54x的CPU结构,CPU是DSP芯片中的核心部分,是用来实现数字信号处理运算和高速控制功能的部件。CPU内的硬件构成决定了其指令系统的性能。TMS320C54x的CPU包括:, 40位算术逻辑单元(ALU); 两个40位的累加器A、B; 桶型移位寄存器(Barrel Shifter); 乘法器/加法器单元(Multiplier/Adder); 比较、选择和存储单元(CSSU); 指数编码器(EXP Encoder); CPU状态和

9、控制寄存器(ST0、ST1和PMST); 寻址单元(Addressing Unit)。,2.3.1 算术逻辑运算单元 使用算术逻辑单元(ALU)和两个累加器(A、B)能够完成二进制的补码运算,同时,ALU还能够完成布尔运算。算术逻辑单元的输入操作数可以来自: 16位的立即数; 数据存储器中的16位字; 暂存器T中的16位字; 数据存储器中读出的2个16位字; 累加器A或B中的40位数; 移位寄存器的输出。,2.3.2 累加器 累加器A和B可作为ALU和乘法器/加法器单元的目的寄存器,累加器也能输出数据到ALU或乘法器/加法器中。累加器可分为三部分:保护位、高位字和低位字。累加器A和B的示意图如

10、图2-3和图2-4所示。,图2-3 累加器A,图2-4 累加器B,保护位用于保存计算时产生的多余高位,防止在迭代运算中产生溢出,例如自相关运算。 AG、AH、AL、BG、BH和BL都是存储器映像寄存器(在存储空间中占有地址),由特定的指令将其内容放到16位数据存储器中,并从数据存储器中读出或写入32位累加器值。,2.3.3 桶形移位器 桶形移位器能把输入的数据进行031位的左移和015位的右移。40位桶形移位器的输入来自数据总线DB的16位输入数据、DB和CB的32位输入数据及任意一个40位累加器,并输出到ALU,经过MSW/LSW(最高有效字/最低有效字)写选择单元至EB总线。它所移的位数就

11、是指令中的移位数。移位数都是用二进制补码表示,正值表示左移,负值表示右移。移位数可由立即数、状态寄存器ST1中的累加器移位方式(ASM)字段和被指定为移位数值寄存器的暂存器T来决定。,桶形移位器可以执行以下定标操作: 在执行ALU操作前预定好一个数据存储器操作数或累加器内容; 对累加器的值进行算术或逻辑移位; 归一化累加器; 在保存累加器到数据存储器之前定标累加器。,2.3.4 乘累加器单元 TMS320C54x CPU的乘累加器单元能够在一个周期内完成一次17*17 bit的乘法和一次40位的加法。乘法器和ALU并行工作可在一个单指令周期内完成一次乘累加(MAC)运算。该单元能够快速高效地完

12、成如卷积、相关和滤波等运算。乘法器/加法器单元由1717 bit的硬件乘法器、40位专用加法器、符号位控制逻辑、小数控制逻辑、0检测器、溢出/饱和逻辑和16位的暂存器(T)等部分组成,可支持有/无符号的整数、小数乘法运算,并可对结果进行舍入处理。,乘累加器单元的一个输入操作数来自T寄存器、数据存储器或累加器A(3116位);另一个则来自于程序存储器、数据存储器、累加器A(3116位)或立即数。乘法器的输出加到加法器的输入端,累加器A或B则是加法器的另一个输入端,最后结果送往目的累加器A或B。,2.3.5 比较选择存储单元 通信领域常常用到维持比(Viterbi)算法,该算法需要完成大量的加法/

13、比较/选择(ACS)运算。CSSU单元支持各种Viterbi算法,其中加法由ALU单元完成,只要将ST1中的C16置1,所有的双字指令都会变成双16位算术运算指令,这样ALU就可以在一个机器周期内完成两个16位数的加/减法运算,其结果分别存放在累加器的高16位和低16位中。CSSU可以最大限度地完成累加器高字与低字的比较操作,即选择累加器中较大的字,并存储在数据存储器中,且不改变状态寄存器ST0中的测试/控制位TC字段和状态转移寄存器TRN的值。CSSU利用优化的片内硬件加速Viterbi的蝶形运算。,2.3.6 指数编码器 指数编码器是一个专用硬件,它支持单周期指令EXP。它可以求出累加器中

14、的指数值,并以二进制补码形式存放于T中。用EXP和NORM指令可以对累加器中的内容归一化,完成定点数和浮点数之间的转换。,2.3.7 CPU状态控制寄存器 1状态寄存器(ST0和ST1) 使用置位指令SSBX和复位指令RSBX可以单独设置和清除状态寄存器的各位。例如: SSBX SXM ;符号扩展SXM=1 RSBX SXM ;禁止符号扩展SXM=0 APR、DP和ASM字段可以通过LD指令装载一个短立即数,ASM和DP也可以通过LD指令由数据存储器装载。 ST0的结构如图2-5所示,含义见表2-3。,图2-5 ST0寄存器结构,表2-3 ST0 寄 存 器,图2-6 ST1寄存器结构,表2-

15、4 ST1寄 存 器,2处理器工作方式状态寄存器(PMST) PMST可由存储器映像寄存器指令装载,如STM。图2-7是PMST寄存器的结构图。PMST各位的含义列于表2-5中。,图2-7 PMST寄存器结构,表2-5 PMST寄存器,2.3.8 寻址单元 TMS320C54x有两个地址发生器:PAGEN(Program Address Generation Logic)和DAGEN(Data Address Generation Logic)。PAGEN包括程序计数器PC、IPTR、块循环寄存器(RC、BRC、RSA和REA),这些寄存器可支持程序存储器寻址。DAGEN包括循环缓冲区大小寄存

16、器BK、DP、堆栈指针寄存器SP、8个辅助寄存器(AR0AR7)和2个辅助寄存器算术单元(ARAU0和ARAU1)。8个辅助寄存器和2个辅助寄存器算术单元一道可进行16位无符号数算术运算,支持间接寻址模块,AR0AR7由ST0中的ARP来指定。,2.4 TMS320C54x存储器和I/O空间,DSP扩展存储器主要分为两类:ROM和RAM。ROM包括EPROM、EEPROM、Flash Memroy等。这一类存储器主要用于存储用户程序和系统常数表,一般映像在程序存储空间。RAM主要指静态RAM(SRAM)。本章主要讨论片内存储器,而片外扩展存储器将在第8章中详细介绍。,所有TMS320C54x芯片内都包含随机存储器(RAM)和只读存储器(ROM)。在芯片中有两类RAM:双寻址RAM(DARAM)和单寻址RAM(SARAM),分别也可称为双口RAM和单口RAM。DARAM每个机器周期可被访问两次。TMS

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号