DSP体系结构系统设计方案

上传人:夏** 文档编号:496218590 上传时间:2023-05-01 格式:DOCX 页数:6 大小:54.22KB
返回 下载 相关 举报
DSP体系结构系统设计方案_第1页
第1页 / 共6页
DSP体系结构系统设计方案_第2页
第2页 / 共6页
DSP体系结构系统设计方案_第3页
第3页 / 共6页
DSP体系结构系统设计方案_第4页
第4页 / 共6页
DSP体系结构系统设计方案_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《DSP体系结构系统设计方案》由会员分享,可在线阅读,更多相关《DSP体系结构系统设计方案(6页珍藏版)》请在金锄头文库上搜索。

1、DSP体系结构系统设计方案姓名:学号:一、DSP技术简介DSP一方面是DigitalSignalProcessing的缩写,意思是数字信号处理,就是指数字信号理论研究。DSP另一方面是DigitalSignalProcessor,意思是数字信号处理器,就是用来完成数字信号处理的器件。作为数字信号处理器来说,DSP结构复杂,片内设计有硬件乘法器及累加器,多处理单元,多总线结构,流水线技术,专门的指令系统,能够高速、实时地实现具有乘积累加特点的、复杂的数字信号处理算法。如TI的TMS320系列等。二关键技术为了完成高速、高精度的数字信号处理任务,DSP有如下关键技术的应用:1)VLIMVLIM是V

2、eryLongInstructionWord的缩写,意即“超长指令集架构”。超长指令字说的是计算机处理结构,在这个结构里面语言编译器或者预处理器中断程序指令分解到可以被处理器并行执行的基本操作(也就是同时)。这些指令放在一个超长指令字里,这样处理器就可以直接分解它而不用进一步分析,对应每个指令到适当的功能单元。VLIW处理器主要的优点是复杂性从硬件移到了软件,这就意味着硬件可以变得更小、更便宜并且耗电量也更少。VLIM是一种非常长的指令组合,它把许多条指令连在一起,增加了运算的速度。超长指令字(VLIW)是指令级并行,超线程(Hyper-Threading)是线程级并行,而多内核则是芯片级并行

3、。这三种方式都是提高并行计算性能的有效途径。2)专门的DMA和DMACDMA传输是“直接存储器访问”的缩写,由DMA控制器完成数据传输,不需要CPU操作,因此可节省CPU开销,传输速度快,突发操作每时钟搬移一个数据。要通过CPU搬移数据的话,CPU要先读到他的寄存器,再从寄存器写到存储器,就是流水操作总要4-8个时钟或更多,速度就差了几倍。DSP的DMA传输的数据可以细分,一个总的传输块(BLOCK)里面,又可以分若干个帧(FRAME),每传完一帧都可以开启中断。而且在整个DMA传输期间,不管是循环模式或者是其他一次性的模式,都可以中途暂停,因为它的DMA控制器可以记录当前暂停时的传输大小,和

4、传输地址索引,然后下次再次开启的时候,会紧接着上次中断后的地方来传输。在DMA传输方式下,外设通过DMA控制器(DMAC)向CPU提出接管总线控制权的总线使用请求。CPU在当前总线周期结束后,响应DMA请求,把总线控制权交给DMA控制器。于是在DMAC的控制下,外设和存储器挪用CPU的一个总线周期,直接进行数据交换,而无需CPU进行数据传输控制干预。DMA传输结束后,再将总线控制权交还给CPU。在高速大数据流量传输场合,DMA方式由于系统开销小,传输效率高,比中断方式优越,被采用。3)定点数乘法的booth算法比较好的带符号数乘法的方法是布斯(Booth)算法。它采用相加和相减的操作计算补码数

5、据的乘积。Booth算法对乘数从低位开始判断,根据两个数据位的情况决定进行加法、减法还是仅仅移位操作。判断的两个数据位为当前位及其右边的位(初始时需要增加一个辅助位0),移位操作是向右移动。在上例中,第一次判断被乘数0110中的最低位0以及右边的位(辅助位0),得00;所以只进行移位操作;第二次判断0110中的低两位,得10,所以作减法操作并移位,这个减法操作相当于减去2a的值;第三次判断被乘数的中间两位,得11,于是只作移位操作;第四次判断0110中的最高两位,得01,于是作加法操作和移位,这个加法相当于加上8a的值,因为a的值已经左移了三次。一般而言,设y=y0,yly2.yn为被乘数,x

6、为乘数,yi是a中的第i位(当前位)。根据yj与yi+1的值,Booth算法表示如下表所示,其操作流程如下图所示。在Booth算法中,操作的方式取决于表达式(yi+1-yi啲值,这个表达式的值所代表的操作为:0无操作+1加x-1减xBooth算法操作表示yiyi+1操作说明00无处于0串中,不需要操作01加x1串的结尾10减x1串的开始11无处于1串中,不需要操作乘法过程中,被乘数相对于乘积的左移操作可表示为乘以2,每次循环中的运算可表示为对于x(yi+1-yi)2A31-i项的加法运算(i=3l,30,,1,0)。这样,Booth算法所计算的结果可表示为:xx(0-y31)x2A0+xx(y

7、31-y30)x2A1+xx(y30-y29)x2A21+xx(y1-y0)x2A31=xx(-y0x231+y1x2A30+y2x2A29+y31x2A0)=xxy4) 零开销循环技术如果了解到DSP算法的一个共同的特点,即大多数的处理时间是花在执行较小的循环上,也就容易理解,为什么大多数的DSP都有专门的硬件,用于零开销循环。所谓零开销循环是指处理器在执行循环时,不用花时间去检查循环计数器的值、条件转移到循环的顶部、将循环计数器减1。在存在大规模循环的情况下,显著降低算法复杂度。5) 流水线技术流水线(pipeline)技术是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。流水

8、线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由56个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成56步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。6) 超标量技术将一条指令分成若干个周期处理以达到多条指令重叠处理,从而提高cpu部件利用率的技术叫做标量流水技术。超级标量是指cpu内一般能有多条流水线,这些流水线能够并行处理。在单流流水线技术水线结构中,指令虽然能够重叠执

9、行,但仍然是顺序的,每个周期只能发射(issue)或退休(retire)条指令。超级标量结构的cpu支持指令级并行,每个周期可以发射多条指令(2-4条居多)。可以使得cpu的IPC(InstructionPerClock),从而提高cpu处理速度。超级标量机能同时对若干条指令进行译码,将可以并行执行的指令送往不同的执行部件,在程序运行期间,由硬件(通常是状态记录部件和调度部件)来完成指令调度。超级标量机主要是借助硬件资源重复(例如有两套译码器和ALU等)来实现空间的并行操作。熟知的pentium系列(可能是p-II开始),还有SUNSPARC系列的较高级型号,以及MIPS若干型号等都采用了超级

10、标量技术。7)SDRAM、SRAM、ROM、FLASH、FIFORAM(RandomAccessMemory)的全名为随机存取记忆体,它相当于PC机上的移动存储,用来存储和保存数据的。它在任何时候都可以读写,RAM通常是作为操作系统或其他正在运行程序的临时存储介质(可称作系统内存)。不过,当电源关闭时RAM不能保留数据,如果需要保存数据,就必须把它们写入到一个长期的存储器中(例如硬盘)。正因为如此,有时也将RAM称作可变存储器”。RAM内存可以进一步分为静态RAM(SRAM)和动态内存(DRAM)两大类。DRAM由于具有较低的单位容量价格,所以被大量的采用作为系统的主记忆。ROM(ReadOn

11、lyMemory)的全名为唯读记忆体,它相当于PC机上的硬盘,用来存储和保存数据。ROM数据不能随意更新,但是在任何时候都可以读取。即使是断电,ROM也能够保留数据。但是资料一但写入后只能用特殊方法或根本无法更改,因此ROM常在嵌入式系统中担任存放作业系统的用途。现在市面上主流的PDA的ROM大小是64MB以及128MB。RAM和ROM相比,两者的最大区别是RAM在断电以后保存在上面的数据会自动消失,而ROM就不会。由于ROM不易更改的特性让更新资料变得相当麻烦,因此就有了FlashMemory的发展,FlashMemory具有ROM不需电力维持资料的好处,又可以在需要的时候任意更改资料,不过

12、单价也比普通的ROM要高。SRAM速度非常快,是目前读写最快的存储设备了,但是它也非常昂贵,所以只在要求很苛刻的地方使用,譬如CPU的一级缓冲,二级缓冲。动态RAM(DynamicRAM/DRAM)保留数据的时间很短,速度也比SRAM慢,不过它还是比任何的ROM都要快,但从价格上来说DRAM相比SRAM要便宜很多,计算机内存就是DRAM的。现在的单片机,RAM主要是做运行时数据存储器,FLASH主要是程序存储器,EEPROM主要是用以在程序运行保存一些需要掉电不丢失的数据.FIFO:FirstInputFirstOutput的缩写,先入先出队列,这是一种传统的按序执行方法,先进入的指令先完成并引退,跟着才执行第二条指令。是一种先进先出的数据缓存器,他与普通存储器的区别是没有外部读写地址线,这样使用起来非常简单,但缺点就是只能顺序写入数据,顺序的读出数据,其数据地址由内部读写指针自动加1完成,不能像普通存储器那样可以由地址线决定读取或写入某个指定的地址。三、总结及致谢通过这个学期DSP体系结构这么课程的学习,使我对DSP硬件有了全面而细致的了解,通过相关的实验让我对硬件的操作能力和硬件语言的编程能力都上升了一个台阶,感谢王老师孜孜不倦的指导和生动详实的讲解。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 商业计划书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号