《计算机硬件基础集训班第四课》由会员分享,可在线阅读,更多相关《计算机硬件基础集训班第四课(16页珍藏版)》请在金锄头文库上搜索。
1、硬件基础集训班第四课显卡 今天,我们要说的是显卡。DIY市场中,专业显卡基本见不到,所以我们主要讲游戏显卡。 随着MXM(见附录1)技术的不断进步,笔记本显卡也具有了良好的可更换性。但是MXM显卡毕竟还在起步阶段,产品也不多,所以今天笔记本也不再做讲解,重点还是在台式机显卡。 首先,我们先讲讲选购显卡最重要的一部分显卡的型号以及参数。 经过十几年的激烈竞争,目前民用独立显卡图形芯片供应商主要包括AMDATI和NVIDIA两家。需要注意的是,这两家是负责供应图形芯片的,而不是生产显卡的。 下面是市面上比较常见的(有的卡虽然停产了,但是还是能买到,二手也有很多)显卡的各种参数(皆为公版参数,由于显
2、存方面少有按照公版执行的,所以频率和容量不在此列出): 看了此表,可能有些新手朋友对里面的一些项目还不甚了解。下面我们就从显卡的组成入手,来具体讲解一下各项数值的意义,带领大家认识整个显卡。 一、GPU GPU可以说是显卡的中枢核心了。GPU全称是Graphic Processing Unit,中文翻译为图形处理器。这是NVIDIA公司在发布GeForce 256图形处理芯片时首先提出的概念。GPU是显示卡的“大脑”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,GPU的作用时是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。GPU通常是显示卡上最大的
3、芯片。 那么,除了衡量通常芯片性能的频率之外,GPU的性能还由什么决定呢? 在DX10时代之前,GPU采用像素、顶点管线分设的结构。 顶点处理单元是显示芯片内部用来处理顶点信息并完成着色工作的并行处理单元。顶点着色单元决定了显卡的多边形处理和生成能力,所以也是衡量显示芯片性能特别是3D性能的重要参数。 像素渲染管线是一个比较笼统的称谓,比较传统的说法是,一条渲染管线是由Pixel Shader Unit(像素渲染单元)和TMU(纹理单元)两部分组成的。它们的分工是:像素渲染单元完成像素处理,纹理单元负责纹理渲染,最后由ROP(光栅操作处理器)负责像素的最终输出。由此看来,一条完整的像素管线在一
4、个时钟周期可以完成至少一次像素运算,并输出一次纹理。 同样的频率和架构,GPU的性能不仅取决于管线的数量,还取决于管线个数的比例。于是便出现了同级别的1950GT和7900GS在某些游戏之中性能相差一倍的现象。这是由于在某些游戏中,顶点单元大量空闲,而在另外一些游戏中,像素单元大量空闲。GPU的核心不能得到充分的利用。 进入DX10时代之后,NV和ATI都不约而同得意识到分离架构的弊端,于是统一渲染架构诞生了。在统一渲染架构里,之前所介绍的顶点处理单元和像素渲染管线被名叫“streaming processors”(SP)的东西所替代,也就是流处理器,这个东西可以说是统一渲染架构中的核心所在。
5、它拥有之前所介绍的顶点单元、像素渲染单元和纹理单元的功能,可以根据不同类型3D画面的特点进行自由的分工协作,当遇到需要大量顶点单元完成的工作时,可能这些流处理器大部分担当顶点单元的角色,当遇到需要大量像素渲染和纹理渲染的工作时,流处理器中就会有较大比重的去担当像素渲染和纹理渲染的角色,这样就避免了之前分离式渲染架构中出现的资源浪费情况。当然,SP在处理某种工作的时候效率肯定不如专门的管线。但是它可以实现整体效率的最大化。 虽然A和N都是采用流处理器,但是两家的结构也有不同,所以不能以流处理器的数量简单的判断显卡的性能。 NVIDIA采用的标量1D流处理器设计可以最大化晶体管利用率。理论上,不管
6、执行任何类型的标量/矢量/混合指令,GPU的流处理器都能够按照分配次序按部就班的完成,不存在流处理器闲置的情况,再加上超高的流处理器频率(达到核心频率的两倍以上),GPU的执行效率得到了显著提升。 ATI依然沿用了DX9时代的Shader Unit设计,只是将4D ALU改进为4D+1D的5D单元,在遇到复杂指令时的效率依然不够理想。5D ALU对于指令分配器的要求非常高,如果每个Shader Unit没有被分配到打包好的4D或者5D矢量指令,而是1D/2D这样的小指令,那么GPU的执行效率就会非常低,数量巨大的流处理器也成为了一纸空文。所以,虽然3850拥有320个SP,但是性能甚至不及64
7、个SP的9600GT。而且ATI目前没有分频设计,流处理器的频率很低,因此执行效率差距挺大。 了解了GPU的主要参数,下面我们再讲一下其他与GPU有关的参数指标。 制造工艺:制造工艺决定了GPU的核心面积,从而也影响了GPU的能耗、发热和超频性能。现在主流的制造工艺为65NM和55NM,40NM正在准备之中,预计在ATI明年春天发布的RV870或者RV740上会首次使用。 核心代号:就是一个GPU的代号,有的显卡虽然型号不同,但是GPU核心是一样的。区别只是频率和体质。另外值得一提的是,上表未提供核心代号的后缀。 高清解码:拥有高清硬解码技术的GPU在播放高清视频的时候可以代替CPU的工作。目
8、前这方面NV和ATI都做的不错,A卡稍强一些。 图形API:即图形编程借口。这决定了显卡支持的图形特效和显卡的渲染效率。虽然主流显卡都支持多种图形API,但是由于绝大部分PC游戏都是基于微软DirectX的,所以在此仅讨论显卡所支持的DirectX版本。 有关DirectX的详细信息请参看附录2。 二、显存 GPU在处理信息的过程中,它会产生大量的临时数据(未处的、正在处理的、已经处理完成的),这就需要一个专门的地方来存放这些临时数据,那就是显存了。显存作为辅助GPU计算的芯片,同显卡的性能息息相关。下面我们就来介绍显存的主要参数。 容量:显存容量是显存最直观的指标,。一般地说,显存越大,渲染
9、及2D和3D图形的显示性能就越高。随着时代的发展,分辨率的增加和AA等技术的运用极大的增加了显存的需求。但是显存也不是越大越好。达到一定程度之后,显存增加对性能的影响就微乎其微了。所对于要求分辨率不高的消费者来说,购买中低端显卡的时候完全没有必要追求超大显存,所谓1G显存之类的基本都是商家的噱头。 类型:用于显卡的显存,虽然和主板用的内存同样叫DDR、DDR2甚至DDR3,但是由于规范参数差异较大,不能通用,因此也可以称显存为GDDR、GDDR2、GDDR3。DRAM的技术在不断的进步,显存也在不断的更新换代。新一代的显存能带来更高的频率、更低的能耗和更大的带宽。当前的主流显存为GDDR3,G
10、DDR2和GDDR基本已经被淘汰,但是市场上还能见到。GDDR4由于性能不够理想,只是昙花一现,现在的厂商的发展趋势是GDDR5。关于各代显存的具体介绍见附录3。 位宽:位宽指的是在一个时钟周期之内能传送的bit数,它是决定显存带宽的重要因素,与显卡性能息息相关。当显存种类相同并且工作频率相同时,位宽越大,它的性能就越高。 频率(速度):显存的速度一般以ns为单位。目前常见的显存有1.6ns、1.4ns、1.2ns、1.0ns甚至0.8nsGDDR3的显存。额定工作频率=1/显存速度。当然,对于一些质量较好的显存来说,显存的实际最大工作频率是有一定的余量的。这里还要说一说显存的实际运行频率和等
11、效工作频率。DDR显存因为能在时钟的上升沿和下降沿都能传送数据,因此,在相同的时钟频率和数据位宽度的情况下显存带宽是SDRAM的两倍。换句话说,在显存速度相同的情况下,DDR显存的实际工作频率是普通SDRAM显存的2倍。而现在流行的GDDR3显存由于采用8bit预取设计(DDR2为4bit预取),这样DRAM内核的频率只有接口频率的1/8,DDR3-1600的核心工作频率只有200MHz。值得一提的是,显卡制造时,厂商设定了显存实际工作频率,而实际工作频率不一定等于显存最大频率。此类情况现在较为常见,如0.8ns的显存最大能工作在2200 MHz,而制造时显卡工作频率被设定为2000 MHz,
12、此时显存就存在一定的超频空间。这也就是目前厂商惯用的方法,让显卡以超频为卖点。 综合位宽和频率之后,我们就可以得出显存的带宽。带宽是GPU与本地存储器传输的数据量标准。显存带宽的计算方法是:等效频率数据带宽/8。以公版RD4870为例,其显存系统带宽=3600MHz256/8= 115.2GB/sec。在显卡工作过程中,Z缓冲器、帧缓冲器和纹理缓冲器都会大幅占用显存带宽资源。有的时候显存的容量并不重要,相同显存带宽的显卡采用1GB和512MB显存在性能上区别不大。因为这时候系统的瓶颈在显存带宽上,当碰到大量像素渲染工作时,显存带宽不足会造成数据传输堵塞,导致显示芯片等待而影响到速度。 另外,同
13、内存一样,显存也存在延迟问题。这就导致了某些GDDR4频率高于GDDR3而性能却较低的窘境。 三、显卡做工及用料 PCB以及上面的原件虽然不直接影响显卡性能,但是却大大影响显卡的稳定性、超频性、寿命和2D画质。比较重要的部分,主要有供电模块、低通滤波电路、PCB本身和其他部分原件等。 先说说PCB本身吧。PCB是承载和连接显卡各种原件的基础和中枢。由于布线复杂,显卡都采用多层PCB制作。显卡所采用的PCB板层数对显卡影响很大,它会直接关系到包括核心、显存等的电磁干扰、屏蔽等问题,现在比较常见的是6或者8层的PCB设计,当然PCB层数越多越好。高端的显卡一般会选择10层或者12层PCB来设计显卡
14、,这是因为高端的显卡对PCB的电气性能要求非常的高,即使很小的信号干扰也可能造成严重的后果。高端显卡的屏蔽层也非常重要,例如当初的GF7900GT花屏事件,很大的原因是其使用的P455公版PCB较GeForce 7900GTX的P348型号PCB少了两层屏蔽层。为了保证稳定,顶级的GTX280和当年的卡皇2900XT甚至采用了14层PCB的设计。 除了层数之外,PCB的布线也十分重要。优良的走线可以保持信号可靠性,同时兼顾抗电磁干扰能力和尽可能少的对外电磁辐射,为此设计者常常在显卡上大量采用蛇型布线和安排电容来解决这个问题,设计良好的电路除了提高信号稳定性外,还有助于消除电路在电流通过时产生的
15、交越电感现象。 说完PCB,再谈谈显卡的心脏供电模块吧。 这是一个显卡的供电模块(貌似缩水很大的说)的照片。从左上到右下的原件依次为电容、电感、MOS管。 供电模块一般由电容、MOS管、和电感组成。在供电模块,电容主要起滤波作用,通过这些电容,可以过滤掉电源中不纯净的那一部分杂波,使显卡供电更加稳定。电容品质的优劣直接决定了显卡工作的稳定性和显卡的使用寿命。由于电容容量有大有小,我们不能通过电容的多少来简单判断用料的好坏。而电容的耐压值和可承受温度是不能忽视的最重要方面。如果使用耐压值较低的电容,长期工作在临界电压,很容易造成电容的损坏。于是,固态电容近几年便大大流行开来。与普通的液态铝电容相比,固态铝质电解电容器在物理上的区别是使用的导电性高分子介电材料为固态而非液态,在长期不通电的情形下该材料不会与氧化铝产生作用,通电后不致于发生像普通的液态铝电容一样容易造成开机或通电时形成爆浆甚至爆炸的现象。在一般低阻抗电容的使用环境中,固态铝质电解电容器的寿命为液态电容的2.5倍以上,且导电性、频率特性及寿命均较普通电容强,更适用于目前低电压、高电流的应用,所以可以彻底解决普通电容爆浆问题。虽然如此,我们也不能完全迷信固态电容。由于