基于tms320c55xx系列dsp的系统硬件和软件设计

资源描述

《基于tms320c55xx系列dsp的系统硬件和软件设计》由会员分享，可在线阅读，更多相关《基于tms320c55xx系列dsp的系统硬件和软件设计（53页珍藏版）》请在金锄头文库上搜索。

1、基于TMS320C55XX系列DSP的系统硬件和软件设计,16.1 引言,数字信号处理是通信、语音、图像等工程技术领域的一门关键基础学科，它以数字的形式对信号进行分析、采集、合成、变换、滤波、估计、识别等加工处理以提取有用的信息。与模拟信号处理相比，数字信号处理具有全软件方式实现、模块间不存在阻抗匹配问题、抗干扰能力强和易于集成等优点。在近三十年里，数字信号处理技术在理论和工程应用中都取得了长足的进步。数字信号处理是以众多学科为理论基础的，所涉及的范围极其广泛，它包含算法的研究和算法实现两部分。常见的数字信号处理算法，如语音与图像的压缩编码、识别和鉴别，信源的加密与解密，通信信号的调制与解

2、调，通信信道的估计与均衡，神经网络等智能算法，这些算法的研究目标是如何以最小的运算速度和存储器空间来完成给定的信号处理任务。数字信号处理的实现是指用硬件、软件或软硬件结合的方法来实现各种算法，各种数字信号处理方法可以在通用处理器上实现、在各种专用数字信号处理ASIC上实现、在各种通用的可编程数字信号处理器上实现或在包含有通用数字信号处理器的ASIC上实现，应用最广泛的还是在各种通用数字信号处理器上的实现方式。,数字信号处理器是一种专门为快速实时实现各种数字信号处理算法而设计的、具有特殊结构的微处理器。自从20世纪80年代初数字信号处理器芯片出现以来，DSP技术已取得了突飞猛进的发展，DSP芯片

3、的性能不断提高，价格却不断下降。DSP的应用领域也在不断的扩展，从军用、航天等高端产品到各种民用产品，今天人们的生活中已经到处可以见到数字信号处理器应用的例子，在我国DSP技术也正以极快的速度被应用到国民经济的各个领域。目前，我国的DSP产品主要来自海外。1983年TI公司的第一代产品TMS32010最先进入中国市场，以后TI公司通过提供DSP培训课程，使该公司DSP产品的市场份额不断扩大。现在TI公司的DSP产品约占据国内DSP市场份额的80%以上而遥遥领先，其余的市场份额由Lucent, AD, Motorola, ZSP和NEC等公司占有。本章通过一个水声通信系统的硬件和软件开发例子，

4、详细介绍了DSP的发展现状、TI公司DSP芯片的开发技术及基于TMS320C55XX系列DSP系统的硬件和软件的开发过程。,16.1 引言,第16章基于TMS320C55XX系列DSP的系统硬件和软件设计,1. DSP芯片的特点 2. TI公司DSP 3. DSP芯片选型,16.2 TMS320C55XX系列DSP简介,1. DSP芯片的特点算术单元 (1) 硬件乘法累加器数字信号处理算法中的数据操作具有高度重复的特点，特别是乘、加操作。专门的硬件乘法累加器是DSP芯片区别于通用微处理器(General-Purpose Processors，GPP)的一个重要标志。在GPP内通过微程

5、序实现的乘、加操作往往需要100多个时钟周期，非常费时；而专门的硬件乘法累加器单周期实现乘、加操作，并用累加器寄存器来处理多个乘积的累加。 (2) 多功能单元在CPU内部设置多个并行操作功能单元(ALU、乘法器和地址产生器等)，使DSP芯片在相同时间内能够完成更多的操作，提高了程序执行速度。,16.2 TMS320C55XX系列DSP简介,总线结构早期的微处理器内部大多采用冯诺依曼(Von-Neumann)结构：统一的程序和数据空间，共享的程序和数据总线。取指和取操作数分时进行，造成传输通道上的瓶颈。而DSP内部采用的是程序空间和数据空间分开的哈佛(Harvard)结构，允许同时取指令(来

6、自程序存储器)和取操作数(来自数据存储器)。很多DSP芯片内部有两套或两套以上的内部数据总线，这种总线结构称为修正的哈佛结构。多总线结构可以保证一个机器周期内多次访问程序空间和数据空间。 TI公司的C6000系列DSP芯片采用了甚长指令字(VILW)结构，片内提供了8个独立的运算单元、256位的程序总线、两套32位数据总线和一套32位的DMA专用总线。灵活的总线结构大大缓解了数据瓶颈对系统性能的限制。,16.2 TMS320C55XX系列DSP简介,片内存储器 DSP面向的是数据密集型应用，存储器的访问速度对处理器的性能至关重要。现代通用微处理器内部一般集成有高速缓存器(cache)，但是片内

7、不设存储数据的RAM和存储程序的ROM。这是因为通用微处理器的程序一般很大，片内存储器不会给处理器性能带来更大的改善。而DSP算法的特点是需要大量简单的计算却程序短小，程序存放于片内能有效减少指令传输时间，缓解芯片外总线接口的压力。另外，在内部集成存储数据的RAM，能够匹配访问速度，防止总线竞争，缓解了DSP芯片的数据瓶颈。,16.2 TMS320C55XX系列DSP简介,流水线结构 DSP芯片内部的流水线结构将指令分解为取指令、译码、取操作数和执行等几个阶段，每一个阶段称为一级流水。在程序运行过程中，不同指令的不同阶段在时间上是重叠的，流水线结构提高了指令执行的整体速度，有助于保证数字信号处

8、理的实时性。图16.1给出四级流水线操作示意图，在执行本条指令的同时，还依次完成后面3条指令的取操作数、译码和取指，将指令周期降低到最小值。理想情况下，一条k段流水线能在k+(n-1)个周期内处理n条指令。其中前k个周期用于完成第一条指令的执行，其余n-1条指令的执行需要n-1个周期。而在非流水线处理器上执行n条指令，需要nk个周期。当指令条数n较大时，可认为每个周期内执行的最大指令数为k，即流水线理想情况下效率为1，但由于流水线的填充和排空，这种理想情况很难达到。,图16.1 四级流水线操作示意图,16.2 TMS320C55XX系列DSP简介,2. TI公司DSP 世界上第一个单片DSP

9、芯片是1978年AMI公司宣布的S2811，1979年美国Intel公司发布的商用可编程器件2920是DSP芯片的一个重要里程碑，这两种芯片内部都不是现代DSP芯片所必须的单周期芯片。1980年日本NEC公司推出的PD7720是第一个具有乘法器的商用DSP 芯片。第一个采用CMOS工艺生产浮点DSP芯片的是日本的Hitachi 公司，它于1982年推出了浮点DSP芯片。1983年日本的Fujitsu公司推出的MB8764，其指令周期为120 ns，且具有双内部总线，从而处理的吞吐量发生了一个大的飞跃。而第一个高性能的浮点DSP芯片是AT&T公司于1984年推出的DSP32。在这么多的DSP芯

10、片种类中，最成功的是美国得克萨斯仪器公司(Texas Instruments, TI)的一系列产品。TI公司在1982年成功推出了第一代DSP芯片TMS32010及其系列产品TMS32011, TMS32C10/C14/C15/ C16/C17等，之后相继推出了第二代DSP芯片TMS32020, TMS320C25/C26 /C28、第三代DSP芯片TMS32C30/C31/C32、第四代DSP芯片TMS32C40 /C44、第五代DSP芯片TMS32C50/C51/C52/C53及集多个DSP内核于一体的高性能DSP芯片TMS32C80/C82等。,16.2 TMS320C55XX系列DSP

11、简介,自1980年以来，DSP芯片得到了突飞猛进的发展，DSP芯片的应用越来越广泛。从运算速度来看，MAC(一次乘法和一次加法)时间已经从20世纪80年代初的400 ns(如TMS32010)降低到40 ns(如TMS32C40)，处理能力提高了10多倍。DSP芯片内部关键的乘法器部件从1980年的占模区的40%左右下降到5%以下，片内RAM增加一个数量级以上。从制造工艺来看，1980年采用4 m的N沟道MOS工艺，而现在则普遍采用亚微米CMOS工艺。DSP芯片的引脚数量从1980年的最多64个增加到现在的200个以上，引脚数量的增加，意味着结构灵活性的增加。此外，随着DSP芯片的发展，DSP

12、系统的成本、体积、质量和功耗都有很大程度的下降。,TMS320 C2x和TMS320 C4x称为C2000系列，主要用于数字控制系统。 TMS320 C54x和TMS320 C55x称为C5000系列，主要用于功耗低、便于携带的通信终端。 TMS320 C62x和TMS320 C64x和TMS320 C67x称为C6000系列，主要用于高性能复杂的通信系统，如移动通信基站。,表16.1 TI公司的DSP芯片系列,16.2 TMS320C55XX系列DSP简介,3. DSP芯片选型设计DSP应用系统时，选择DSP芯片是非常重要的一个环节。只有选定了DSP芯片，才能进一步设计外围电路和系统的其他

13、电路。总的来说，DSP芯片的选择应根据实际应用系统的需要而确定。 DSP芯片的综合性能指标除了与芯片处理能力直接相关外，还与片内、片外数据传输能力相关。DSP芯片的数据处理能力通常用处理速度来衡量；数据传输能力用内部总线和外部总线的配置，以及总线或I/O口的数据吞吐率来衡量。,16.2 TMS320C55XX系列DSP简介,一般来说，选择DSP芯片时应考虑如下诸多因素。 (1) DSP芯片的运算速度。运算速度是DSP芯片的一个最重要的性能指标，也是选择DSP芯片时所需要考虑的一个主要因素。DSP芯片的运算速度可以用以下几种性能指标来衡量：指令周期，就是执行一条指令所需要的时间，通常以ns为单

14、位。 MAC时间，即一次乘法加上一次加法的时间。 FFT执行时间，即运行一个N点FFT程序所需的时间。 MIPS，即每秒执行百万条指令。 MOPS，即每秒执行百万次操作。 MFLOPS，即每秒执行百万次浮点操作。 BOPS，即每秒执行十亿次操作。 (2) DSP芯片的价格。 (3) DSP芯片的硬件资源。 (4) DSP芯片的开发工具。 (5) DSP芯片的功耗。 (6) 其他的因素，如封装的形式、质量标准、生命周期等。,16.2 TMS320C55XX系列DSP简介,第16章基于TMS320C55XX系列DSP的系统硬件和软件设计,16.3 TI DSP开发集成环境CCS简介,1. CC

15、S的简介 2. CCS的安装与使用,1.CCS的简介 CCS(Code Composer Studio)是TI公司推出的用于开发DSP芯片的集成开发环境，采用Windows风格界面，集编辑、编译、链接、软件仿真、硬件调试及实时跟踪等功能于一体，极大地方便了DSP系统的开发与设计，是目前使用最为广泛的DSP开发环境之一。 CCS有两种工作模式，即软件仿真器和硬件在线编程。软件仿真器工作模式可以脱离DSP芯片，在PC上模拟DSP的指令集和工作机制，主要用于前期算法实现和调试。硬件在线编程可以实时运行在DSP芯片上，与硬件开发板相结合进行在线编程和调试应用程序。图16.2是CCS的主要组件示意图。

16、,图16.2 CCS主要组件示意图,16.3 TI DSP开发集成环境CCS简介,CCS的主要功能如下： (1) 工程项目管理工具对用户程序实行项目管理。在生成目标程序和程序库的过程中，建立不同程序的跟踪信息，通过跟踪信息对不同的程序进行分类管理； (2) 具有集成可视化代码编辑界面，用户可通过其界面直接编写C语言程序、汇编语言程序、.cmd文件等； (3) 高性能的编辑器支持汇编文件的动态语法加亮显示，使用户很容易阅读代码，发现语法错误； (4) 含有集成代码生成工具，包括汇编器、C编译器、链接器等，将代码的编辑、编译、链接和调试等诸多功能集成到一个软件环境中； (5) 基本调试工具具有装入

17、执行代码(.out)、查看寄存器、存储器、反汇编、变量窗口等功能，并支持C源代码级调试；,16.3 TI DSP开发集成环境CCS简介,(6) 探针工具(probe point)，可用于算法的仿真、数据的实时监视等； (7) 断点工具，能在调试程序的过程中，完成硬件断点、软件断点和条件断点的设置； (8) 分析工具，包括模拟分析和仿真器分析，可用于模拟和监视硬件的功能、评价代码执行的时钟； (9) 数据的图形显示，可以将运算结果用图形显示，包括显示时域频域波形、眼图、星座图、图像等，并能进行自动刷新； (10) 提供GEL工具，利用GEL扩展语言，用户可以编写自己的控制面板菜单，设置GEL菜单选项，可以方便直观地修改变量和配置参数； (11) 支持多DSP调试； (12) 支持RTDX(Real Time Data Exchange)技术，可在不中断目标系统运行的情况下，实现DSP与其他应用程序(OLE)的数据交换； (13) 提供DSP/BIOS工具，增强对代码的实时分析能力，减小开发人员对硬件资源熟悉程度的依赖性。,

展开阅读全文