【2017年整理】DSP芯片特点及选择

上传人:豆浆 文档编号:989077 上传时间:2017-05-24 格式:DOC 页数:15 大小:87KB
返回 下载 相关 举报
【2017年整理】DSP芯片特点及选择_第1页
第1页 / 共15页
【2017年整理】DSP芯片特点及选择_第2页
第2页 / 共15页
【2017年整理】DSP芯片特点及选择_第3页
第3页 / 共15页
【2017年整理】DSP芯片特点及选择_第4页
第4页 / 共15页
【2017年整理】DSP芯片特点及选择_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《【2017年整理】DSP芯片特点及选择》由会员分享,可在线阅读,更多相关《【2017年整理】DSP芯片特点及选择(15页珍藏版)》请在金锄头文库上搜索。

1、6 DSP 芯片特点及选择DSP(Digital Signal Proceccing)芯片也称为数字信号处理器,它是仿真系统硬件构成的核心器件,它的性能对仿真功能的实现非常重要。只有选定 3DSP 芯片,才能设计其外围电路及系统的其它电路。总的来说,DSP 芯片的选择应根据仿真系统的规模,运算速度、存贮容量而定,但一般来说,选择 DSP 芯片时应考虑到如下因素2(1)DSP 芯片的运算速度。运算速度是 DSP 芯片的一个最重要的性能指标,也是选择 DSP 芯片时所需要考虑的一个主要因素。 DSP芯片的运算速度可以用以下几种性能指标来衡量:a. 指令周期(执行一条指令所需的时间) 。b. MAC

2、 时间(一次乘法加上一次加法的时间) 。c. FFT 执行时间(运行一个 N 点 FFT 程序所需的时间) 。d. MIPS(每秒执行百万条指令) 。e. MOPS(每秒执行百万次操作) 。f. MFLOPTS(每秒执行百万次浮点操作) 。g. BOPS(每秒执行十亿次操作) 。(2) DSP 芯片的价格。(3) DSP 芯片的硬件资源。(4) DSP 芯片的运算精度。(5) DSP 芯片的开发工具。(6) DSP 芯片的功耗。一般而言,定点 DSP 芯片的价格较便宜,功耗较低,但运算精度稍低。而浮点 DSP 芯片的优点是运称精度高,用 C 语言编程方便,开发周期短,但价格和功耗相对较高。6.

3、1 DSP 芯片的特点和种类DSP 芯片是一种特别适合于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法,一般具有如下主要特点2:(1)在一个指令周期内可完成一次乘法和一次加法;(2)程序和数据空间分开,可以同时访问指令和数据;(3)片内具有快速 RAM,通常可通过独立的数据总线在两块中同时访问;(4)具有低开销或无开销循环及跳转的硬件支持;(5)快速的中断处理和硬件 I/O 支持;(6)具有在单周期内操作的多个硬件地址产生器;(7)可以并行执行多个操作;(8)支持流水线操作,使取指、译码和执行等操作可以重叠执行。从 1978 年出现的第一个单片 DSP 以来,D

4、SP 芯片在这 20 几年来得到了高速发展,DSP 芯片的应用也越来越广泛,根据其用途可分为通用型 DSP 芯片和专用型 DSP 芯片;按基础特性分为静态 DSP 芯片和一致性 DSP 芯片;按数据格式分为定点 DSP 芯片和浮点 DSP 芯片。美国德州仪器公司(Texas Instruments,简称 TI)推出的 TMS系 列 DSP 芯片已经成为当今世界上最有影响的 DSP 芯片2,TI 公司在 1982 年推出第一代 DSP 芯片 TMS3201、TMS320C1X 系列,随后推出第二代 DSP 芯片 TMS3202、TMS320C2X 系列,第三代 DSP芯片 TMS320C3X 系

5、列,第四代 DSP 芯片 TMS320C4X 系列,第五代DSP 芯片 TMS320C5X 系列,第六代 DSP 芯片 TMS320C6X 系列。6.2 TMS320 系列 DSP 芯片可编程 DSP 芯片是一种具有特殊结构的微处理器,为了达到快速进行数字信号处理的目的,DSP 芯片一般都具有程序和数据分开的总线结构、流水线操作功能、单周期完成乘法的硬件乘法器以及一套适合数字信号处理的指令集。6.2.1 TMS320 系列 DSP 芯片的基本结构。TM320 系列 DSP 芯片基本结构包括:(1)哈佛结构;(2)流水线操作;(3)专用的硬件乘法器;(4)特殊的 DSP 指令;(5)快速的指令周

6、期。这些特点使得 TMS320 系列 DSP 芯片可以实现快速的 DSP 运算,并使大部分运算(例如乘法)能够在一个指令周期内完成。由于TMS320 系列 DSP 芯片是软件可编程器件,因此具有通用微处理器具有的方便灵活的特点。(1) 哈佛结构哈佛结构是不同于传统的冯诺曼(Von Neuman)结构的并行体系结构,其主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线,从而使数据的吞吐率提高了一倍。为了进一步提高运行速度和灵活性,TMS320 系列 DSP 芯片在

7、基本哈佛结构的基础上作了改进,一是允许数据存放在程序存储器中,并被算术运算指令直接使用,增强了芯片的灵活性;二是指令存储在高速缓冲器(Cache)中,当执行此指令时,不需要再从存储器中读取指令,节约了一个指令周期的时间。(2) 流水线与哈佛结构相关,DSP 芯片广泛采用流水线以减少指令执行时间,从而增强了处理器的处理能力。TMS320 系列处理器的流水线深度从 26 级不等。也就是说,处理器可以并行处理 26 条指令,每条指令处于流水线上的不同阶段。(3) 专用的硬件乘法器TMS320 系列 DSP 芯片中具有一个专用的硬件乘法器,用 14 条指令就能完成一次乘法和一次加法运算,因此,在一个指

8、令周期内可完成乘法运算,而在通用的微处器中,乘法指令是靠一系列加法来实现的,因此,TMS320 系列 DSP 乘法速度远远高于通用微处理器。(4) 特别的 DSP 指令利用 DSP 的特殊指令可以将多条指令才能完成的功能用一条指令来完成,这样可大大提高运算速度。(5) 快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的 DSP 指令再加上集成电路的优化设计,可使 DSP 芯片的指令周期在 200ms 以下。6.2.2 几种 TMS320 系列 DSP 芯片的比较(1) 第一代 TMS320 系列 DSP 芯片 TMS320C1X 是定点 DSP 芯片,采用二级流水线,其主要特点如下:

9、 指令周期:160ns/200ns/280ns 片内 RAM:144 字/256 字(TMS320C15/E15/C17/E17) 片内 ROM:1.5K 字/4K 字(TMS320C15/C17) 4K 字片内程序 EPROM(TMS320E15/E17) 4K 字外部全速存储器扩展 并行乘法器:乘积为 32 位 桶形移位器:将数据从存储器移到 ALU 并行移位器 允许文本交换的 412 位堆栈 两个间接寻址的辅助寄存器 双通道串行口(TMS32011,TMS320C17/E17) 片内压扩硬件(TMS32011,TMS320C17/E17) 协处理器接口(TMS320C17/E17) 器件

10、封装:40 脚双列直插(DIP)/44 脚塑封(PLCC)(2) 第二代 TMS320 系列 DSP 芯片 TMS320C2X 系列是定点 DSP 芯片,采用三级流水线,其主要特点如下: 指令周期:100ns/120ns/80ns 片内掩膜 ROM: 4K 字 片内 RAM:544 字,分 B0、B1 和 B2 三块 程序和数据空间均为 64K 字 具有 8 级硬件堆栈、8 个辅助寄存器 具有全静态双缓冲串行口,可与许多串行器件直接接口 与低速片外存储器通信的等待状态插入 采用 HOLD 操作的 DMA FFT 变换用的比特反转寻址 扩展精度算术和自适应滤波支持 从外部存储器全速执行的 MAC

11、/MACD 指令 具有在多处理器之间进行同步的能力,支持多处理器共享存储器 1-8umCMOS 工艺,68 脚 PGA 或 PLCC 封装(3) 第三代 TMS320 系列 DSP 芯片 TMS320C3X 系列芯片是浮点 DSP芯片,采用四级流水线。其主要特点如表 6-1表 6-1 三种 TMS320C3X 芯片的比较特征 TMS320C30 TMS320C31 TMS320C32指令周期 50/60/74ns 33/40/50/60/74ns 33/40/50ns数据/程序总线主总线 STRB:32 位数据,24 位地址扩展总线 IOSTRB:32位数据,13 位地址STRB:32 位数据

12、,24 位地址STRB0:8/16/32 位STRB1:8/16/32 位IOSTRB:32 们内部 RAM 2K 字 2K 字 512 字串行 I/O 口 2 个串行口 1 个串行口 1 个串行口用户程序、数据 4K 字/16K 字节 无 无ROMDMA 控制器 单通道 单通道 双通道程序和数据存储器宽度 32 位 32 位程序 16/32 位可选数据 8/16/32 位可选外部中断触发 电平触发 电平触发 电平/边沿可选中断矢量表地址 固定 固定 用户可重定位程序引导 无 用户可选 用户可选40/32 浮点/整数乘法器 有 有 有整数/浮点算术逻辑单元 ALU 有 有 有两个辅助寄存器算术

13、单元(ARAU0 和ARAU1)有 有 有(4) 第四代 TMS320 系列 DSP 芯片 TMS320C4X 系列芯片是浮点 DSP芯片,采用五级流水线,其主要特点如下: 具有 6 个用于处理器间高速通信的通信口,每个口的最大数据吞吐量达 20Mbyte/s 的异步传输速率。 6 个 DMA 通道实现了 I/O 操作与 CPU 操作的并行化。 CPU 处理能力达 275MOPS,数据吞吐量为 320Mbyte/s,指令周期时间为 40ns/50ns。 两条分开的外部数据、地址总线支持共享存储器系统和高速数据速率、单周期传输。 片内分析模块支持高效的并行处理调试。 片内程序高速缓冲存储器(Ca

14、che)和双向存取/单周期 RAM提高了存储器访问的性能。 分开的内部程序、数据和 DMA 总线使程序和数据的 I/O 操作高度并行化,最大限度地保证了 CPU 的性能。(5) 第五代 TMS320 系列 DSP 芯片 TMS320C5X 系列芯片是定点 DSP芯片,采用四级流水线,其主要特点如下: 25/35/50ns 的指令周期(2040MIPS) 224K16 位最大可寻址外部存储空间(64K 程序、64K 数据、64KI/O、32K 全局) 算术逻辑单元(ALU) ,32 位累加器(ACC)以及 32 位加法器的缓冲器(ACCB) 并行逻辑单元(PLU) 结果具有 32 位的 1616

15、 位并行乘法器 单周期乘累加指令 具有一个专用算术单元的 8 个辅助寄存器,可用于间接寻址 8 级硬件堆栈 016 位数据左移和右移 两个间接寻址的循环缓冲器,用于循环寻址 程序代码的单指令重复和程序块重复 全双工同步串行口,用于完成 TMS320C5X 与其他串行器件之间的直接直接通信 时分多址访问(TDM)串行口 内部定时器,可用软件控制 64K 并行 I/O 口,其中 16 个有存储器映像 可软件编程的等待状态发生器 扩展保持操作,用于并发外部 DMA 四级流水线操作,用于延迟跳转、调用、返回指令 比特反转寻址方式,用于 FFT 运算 JTAG 扫描仿真接口(IEEE 标准,P1149.

16、1)(6) 第六代 TMS320 系列 DSP 芯片 TMS320C6X 系列芯是一种新型定点 DSP 芯片,该芯片的内部结构与以前的 DSP 芯片不同,内部集成了多个功能单元,可同时执行 8 条指令,运算能力达 1600MIPS。其主要特点有: 运行速度快。指令周期为 5ns,运算能力为 1600MIPS; 内部结构不同于一般 DSP 芯片。内部同时集成了 2 个乘法器和 6 个算术运算单元,且它们之间是高度正交的,使得在一个指令周期内最大能支持 8 条 32bit 的指令; 指令集不同。为充分发挥其内部集成的各执行单元的独立运行能力,TI 公司使用了 VelociTT 超长指令字(VLIW)结构。它在一条指令中组合了几个执行单元,结合其独特的内部结构,可在一个时钟周期内并行执行几个指令; 大容量的片内存储器和大范围的寻址能力。片内集成了 512K字

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号