珠海平板电脑招商-epai中国大学生团队创业计划

上传人:子 文档编号:42769018 上传时间:2018-06-03 格式:DOC 页数:2 大小:55.50KB
返回 下载 相关 举报
珠海平板电脑招商-epai中国大学生团队创业计划_第1页
第1页 / 共2页
珠海平板电脑招商-epai中国大学生团队创业计划_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《珠海平板电脑招商-epai中国大学生团队创业计划》由会员分享,可在线阅读,更多相关《珠海平板电脑招商-epai中国大学生团队创业计划(2页珍藏版)》请在金锄头文库上搜索。

1、运算来优化的,如 z-buffering 消隐,纹理映射(texture mapping) ,图形的坐标位置变换与 光照计算(transforming & lighting)等等。这类计算的对象都是针对大量平行数据的,运 算的数据量大。但是 GPU 面对的数据类型比较单一,单精度浮点占到其处理数据的绝大多 数,直到 GTX200 和 HD 4800 系列显卡才对双精度运算提供了支持。 产品:ATI Radeon HD 4850 显示芯片 GPU 并行编程为何加速发展 GPU 并行编程为何加速发展 回到我们 刚开始讨论的地球科学、医学研究与金融建模那些计算问题,可能有很多读者会问到“为 什么要花

2、这么大力气将传统 CPU 上运行的程序移植到 GPU 环境中运行?”答案其实很简 单追求更高的性价比和性耗比。 GPU 能够明显加速算术密集型并行计算任务 虽然 GPU 并不适用于所有问题的求解,但是我们发现那些对运算力量耗费巨大的科学命题都具 备天然的“算术密集型”特色。这类程序在运行时拥有极高的运算密度、并发线程数量和 频繁地存储器访问,无论是在音频处理、视觉仿真还是到分子动力学模拟和金融风险评估 领域都有大量涉及。这种问题如果能够顺利迁移到 GPU 为主的运算环境中,将为我们带来 更高效的解决方案。 浮点能力首次超越 TFLOPS 的 ASCI Red 超级计算机 在 996 年,美 国

3、 Sandia 国家实验室研发了超级计算机“ASCI Red” ,浮点运算性能首次突破 TFlops,但 它需要非常多的节点和耗电。它是一套基于 mesh 网状结构(38 X 32 X 2)的 MIMD 大规 模并行机(MIMD massively parallel machine) ,起初包含 7264 个计算节点、22GB 分布式 内存和 2.5TB 磁盘存储容量。 该机器的原型使用的是英特尔的 Pentium Pro 处理器,每个处 理器的时钟频率达到 200MHz,后来才升级到 Pentium II OverDrive 处理器。升级后的系统 拥有 9632 个处理器,每个处理器的主频为

4、 333MHz。ASCI Red 超级计算机由 04 个机柜组 成,占地面积达到了 230 平方米。 廉价的 TFLOPS 解决方案Radeon HD4000 系列产 品 时间一晃而过到 2008 年,ATI 发布了统一渲染架构下的第二代 PC 领域 GPU 产品 Radeon HD4000 系列产品,其中定位在中高端市场的 Radeon HD4850 显卡在当时使用了 800 个频率达到 625MHz 的流处理器,仅用 0W 的耗电带来了 TFlops 的运算能力。这时人 类获取 TFlops 的经济支出仅为 99 美元。 一款 HD5870 相当于 77 台深蓝超级计算机节点 仅仅一年之后

5、,ATI 再次发力优化统一渲染架构,发布了 Radeon HD5000 系列产品,其中 高端产品 HD5870 已经集成了 2.7 TFlops 运算能力。这颗 GPU 的问世标志着 ATI 已经成熟 掌握了 40nm 制程工作、DirectX 应用程序接口和吞吐带宽极高的 DDR5 显存。同时这颗 GPU 的运算能力相当于 77 台深蓝超级计算机节点。 传统意义上的 GPU 不善于运行分支 代码,但是 ATI 和 NVIDIA 经过长期改进其内部架构已经使得 GPU 可以较为高效地运行分支、循环等复杂代码。同时因为 GPU 属于并行机范畴,相同的运算可以应用到每 个数据元素的时候,它们可以达

6、到最好的性能。在 CPU 编程环境中,写出每个输入数据元 素有不同数量的输入的程序很容易,但在 GPU 这种并行机上还是有不少麻烦。 通用的数 据结构正是 GPU 编程的最大困难之一。CPU 程序员经常使用的数据结构如列表和树在 GPU 身上并不容易实现。GPU 目前还不允许任意存储器访问,而且 GPU 运算单元的设计 为主要操作是在表现位置和颜色的四维向量上。 不过这些并不能阻挡 GPU 编程的加速发 展,因为 GPU 不是真的为通用计算而设计的,需要一些努力才能让 GPU 高速地服务通用 计算程序。这些努力前些年是程序员而单独实现的,而随着 ATI 和 NVIDIA 开始看到高性 能计算市

7、场的硬件需求,我们看到无论是 Fermi 架构添加全能二级缓存和统一定址还是 RV870 架构不断优化 LDS 并放大并发线程数,这些都是 GPU 自身硬件体系为了适应未来的运算环境而做出的变革。 产品:ATI Radeon HD 4850 显示芯片 GPU 并行计算已成未来趋势 GPU 并行计算已成未来趋势 无数游戏玩家疯狂的购买力已经使得 GPU 这 种芯片的价格下跌到只要花一百美元就能买到一颗性能级 GPU 产品,那为什么不大面积部 署这种产品,来降低超级计算机的价格呢?从 2006 年的第一款 Fire Stream 产品开始,业 内人士已经发现了 GPU 在处理大并行度程序时所表现出

8、的超常性能。 在传统的 GPU 种, Shader 单元从出现(200 年 DirectX 8 发布标志着 Shader 单元出现)到运算能力迅速提升 (2007 年 Geforce 8800GTX 发布,通用计算影响力显著扩大)经过了很长时间。在这段时 间里,显卡对于高端大规模并行运算是毫无价值的,即使有少量业界先行者开始了思考和 研究,也无法形成对整个产业的影响力。 GPU 开始应用于超级计算机 这个阶段在超级计 算机与集群中,往往要拆除“多余的”显卡以节能功耗,而自从 AMD 公司的 Stream 架构 NVIDIA 公司的 CUDA 架构奠定了 GPU 通用计算地位之后,现在的设计开始逐渐采用大 量 G

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号