《球谐函数展开快速算法及其并行算法研究》由会员分享,可在线阅读,更多相关《球谐函数展开快速算法及其并行算法研究(90页珍藏版)》请在金锄头文库上搜索。
1、球 谐 函 数 展 开 快 速 算 法 及 其 并 行 算 法 研 究 国 防 学 技 术 大 学 研 究 生 院 ) 分类号 TP312 学号 09060065 密级 公 开 工学硕士学位论文 球谐函数展开快速算法及其并行算法研究球谐函数展开快速算法及其并行算法研究 硕士生姓名 王 翔 学 科 专 业 计算机科学与技术 研 究 方 向 计算机应用技术 指 导 教 师 宋君强 研究员 国防科学技术大学研究生院国防科学技术大学研究生院 二二一一一一年十一年十一月月 Research on Parallel Algorithms of the Fast Algorithm for Spherica
2、l Harmonic Expansions Candidate: Wang Xiang Supervisor: Prof. Song Junqiang A thesis Submitted in partial fulfillment of the requirements for the degree of Master of Engineering in Computer Science and Technology Graduate School of National University of Defense Technology Changsha,Hunan,P.R.China N
3、ovember,2011 国防科学技术大学研究生院工学硕士学位论文 第 I 页 目目 录录 摘 要. i ABSTRACT . ii 第一章 引 言 . 1 1.1 数值天气预报与谱模式. 1 1.1.1 谱模式的发展与现状 . 1 1.1.2 球谐函数与 Silberman 方法 . 2 1.1.3 变换法 . 4 1.1.4 谱模式的优缺点 . 5 1.2 球谐函数 . 6 1.2.1 球谐函数的推导 . 6 1.2.2 截断问题 . 6 1.2.3 球谐函数展开算法的发展 . 7 1.3 GPU 通用计算与数值天气预报 . 9 1.4 本文研究内容 . 10 1.5 论文结构 . 11
4、第二章 CPU/GPU 异构集群研究 . 12 2.1 GPU 发展的历史与现状. 13 2.2 CPU/GPU 异构集群 . 14 2.2.1 CPU 与 GPU 的性能对比 . 14 2.2.2 典型 CPU/GPU 异构集群 . 16 2.3 并行编程环境 . 19 2.3.1 MPI 并行程序设计原理 . 19 2.3.2 CUDA 架构与编程模型 . 20 2.3.3 MPI+CUDA 混合编程模型研究 . 22 第三章 球谐函数展开快速算法研究 . 24 3.1 球谐函数展开简介 . 24 3.2 Rokhlin-Tygert 球谐函数展开快速算法 . 25 3.2.1 SerST
5、EP1:函数分解 . 25 3.2.2 SerSTEP2:快速 Fourier 变换 . 25 3.2.2.1 余弦变换 . 25 3.2.2.2 正弦变换 . 27 国防科学技术大学研究生院工学硕士学位论文 第 II 页 3.2.3 SerSTEP3:低阶连带 Legendre 多项式展开系数 . 27 3.2.4 SerSTEP4:任意阶连带 Legendre 多项式展开系数 . 29 3.3 0 阶 Legendre 多项式展开系数的计算 . 31 3.3.1 直接法 . 31 3.3.2 变换法 . 32 3.3.3 两种方法比较 . 34 3.4 标准特征向量矩阵的计算 . 35 3.5 RT 算法串行程序实现 . 36 第四章 RT 算法的 MPI 并行程序设计 . 38 4.1 RT 算法的并行策略 . 38 4.2 RT 并行算法描述 . 40 4.3 RT 并行算法的 MPI 实现 .