珠海平板电脑招商-epai中国大学生团队创业计划

资源描述

《珠海平板电脑招商-epai中国大学生团队创业计划》由会员分享，可在线阅读，更多相关《珠海平板电脑招商-epai中国大学生团队创业计划（2页珍藏版）》请在金锄头文库上搜索。

1、运算来优化的，如 z-buffering 消隐，纹理映射（texture mapping），图形的坐标位置变换与光照计算（transforming & lighting）等等。这类计算的对象都是针对大量平行数据的，运算的数据量大。但是 GPU 面对的数据类型比较单一，单精度浮点占到其处理数据的绝大多数，直到 GTX200 和 HD 4800 系列显卡才对双精度运算提供了支持。产品：ATI Radeon HD 4850 显示芯片 GPU 并行编程为何加速发展 GPU 并行编程为何加速发展回到我们刚开始讨论的地球科学、医学研究与金融建模那些计算问题，可能有很多读者会问到“为什么要花

2、这么大力气将传统 CPU 上运行的程序移植到 GPU 环境中运行？”答案其实很简单追求更高的性价比和性耗比。 GPU 能够明显加速算术密集型并行计算任务虽然 GPU 并不适用于所有问题的求解，但是我们发现那些对运算力量耗费巨大的科学命题都具备天然的“算术密集型”特色。这类程序在运行时拥有极高的运算密度、并发线程数量和频繁地存储器访问，无论是在音频处理、视觉仿真还是到分子动力学模拟和金融风险评估领域都有大量涉及。这种问题如果能够顺利迁移到 GPU 为主的运算环境中，将为我们带来更高效的解决方案。浮点能力首次超越 TFLOPS 的 ASCI Red 超级计算机在 996 年，美国

3、 Sandia 国家实验室研发了超级计算机“ASCI Red” ，浮点运算性能首次突破 TFlops，但它需要非常多的节点和耗电。它是一套基于 mesh 网状结构（38 X 32 X 2）的 MIMD 大规模并行机（MIMD massively parallel machine），起初包含 7264 个计算节点、22GB 分布式内存和 2.5TB 磁盘存储容量。该机器的原型使用的是英特尔的 Pentium Pro 处理器，每个处理器的时钟频率达到 200MHz，后来才升级到 Pentium II OverDrive 处理器。升级后的系统拥有 9632 个处理器，每个处理器的主频为

4、 333MHz。ASCI Red 超级计算机由 04 个机柜组成，占地面积达到了 230 平方米。廉价的 TFLOPS 解决方案Radeon HD4000 系列产品时间一晃而过到 2008 年，ATI 发布了统一渲染架构下的第二代 PC 领域 GPU 产品 Radeon HD4000 系列产品，其中定位在中高端市场的 Radeon HD4850 显卡在当时使用了 800 个频率达到 625MHz 的流处理器，仅用 0W 的耗电带来了 TFlops 的运算能力。这时人类获取 TFlops 的经济支出仅为 99 美元。一款 HD5870 相当于 77 台深蓝超级计算机节点仅仅一年之后

5、，ATI 再次发力优化统一渲染架构，发布了 Radeon HD5000 系列产品，其中高端产品 HD5870 已经集成了 2.7 TFlops 运算能力。这颗 GPU 的问世标志着 ATI 已经成熟掌握了 40nm 制程工作、DirectX 应用程序接口和吞吐带宽极高的 DDR5 显存。同时这颗 GPU 的运算能力相当于 77 台深蓝超级计算机节点。传统意义上的 GPU 不善于运行分支代码，但是 ATI 和 NVIDIA 经过长期改进其内部架构已经使得 GPU 可以较为高效地运行分支、循环等复杂代码。同时因为 GPU 属于并行机范畴，相同的运算可以应用到每个数据元素的时候，它们可以达

6、到最好的性能。在 CPU 编程环境中，写出每个输入数据元素有不同数量的输入的程序很容易，但在 GPU 这种并行机上还是有不少麻烦。通用的数据结构正是 GPU 编程的最大困难之一。CPU 程序员经常使用的数据结构如列表和树在 GPU 身上并不容易实现。GPU 目前还不允许任意存储器访问，而且 GPU 运算单元的设计为主要操作是在表现位置和颜色的四维向量上。不过这些并不能阻挡 GPU 编程的加速发展，因为 GPU 不是真的为通用计算而设计的，需要一些努力才能让 GPU 高速地服务通用计算程序。这些努力前些年是程序员而单独实现的，而随着 ATI 和 NVIDIA 开始看到高性能计算市

7、场的硬件需求，我们看到无论是 Fermi 架构添加全能二级缓存和统一定址还是 RV870 架构不断优化 LDS 并放大并发线程数，这些都是 GPU 自身硬件体系为了适应未来的运算环境而做出的变革。产品：ATI Radeon HD 4850 显示芯片 GPU 并行计算已成未来趋势 GPU 并行计算已成未来趋势无数游戏玩家疯狂的购买力已经使得 GPU 这种芯片的价格下跌到只要花一百美元就能买到一颗性能级 GPU 产品，那为什么不大面积部署这种产品，来降低超级计算机的价格呢？从 2006 年的第一款 Fire Stream 产品开始，业内人士已经发现了 GPU 在处理大并行度程序时所表现出

8、的超常性能。在传统的 GPU 种， Shader 单元从出现（200 年 DirectX 8 发布标志着 Shader 单元出现）到运算能力迅速提升（2007 年 Geforce 8800GTX 发布，通用计算影响力显著扩大）经过了很长时间。在这段时间里，显卡对于高端大规模并行运算是毫无价值的，即使有少量业界先行者开始了思考和研究，也无法形成对整个产业的影响力。 GPU 开始应用于超级计算机这个阶段在超级计算机与集群中，往往要拆除“多余的”显卡以节能功耗，而自从 AMD 公司的 Stream 架构 NVIDIA 公司的 CUDA 架构奠定了 GPU 通用计算地位之后，现在的设计开始逐渐采用大量 G

展开阅读全文

珠海平板电脑招商-epai中国大学生团队创业计划

最新文档