计算化学软件计算化学软件计算化学软件计算化学软件使用使用使用使用经验经验经验经验 张宝花 中国科学院超级计算中心 2012.11.09 提 纲 �量子化学软件 �分子模拟软件 �Gaussian软件 �VASP软件 �MS软件——DMOL3和CASTEP �总结 量子化学软件 �量子化学——应用量子化学的基本原理和方法研究化学 问题 �基于第一性原理,主要处理体系电子效应相关 �分子轨道理论、价键理论、密度泛函理论 �研究分子结构、化学反应、分子性质 �常见量子化学软件:Gaussian、NWChem、VASP、Q-Chem、 ADF、Turbomole、Molpro、Gamess等 �计算特点:对CPU、内存、IO等需求比较大,大量的集合通信 4 分子模拟软件 �分子模拟——依靠牛顿力学来模拟分子体系的运动 �基于经典牛顿方程,不考虑电子效应,应用不同的力场 �主要处理大分子体系:动力学行为、宏观性质 �考虑不同系综的计算:NPT,NVE,NVT等 �常见的分子动力学软件:Gromacs、NAMD、 AMBER、 LAMMPS、Charmm等 �计算特点:对CPU和IO需求较大,大量的点到点通信。
5 Gaussian软件 概述 �GaussianGaussianGaussianGaussian是一个功能强大的量子化学综合软件包是一个功能强大的量子化学综合软件包其可执 行程序可在不同型号的大型计算机,超级计算机,工作站 和个人计算机上运行,并相应有不同的版本 �最新版本:G09 C01 �特点优势:处理反应机理和过渡态、计算分子性质 �程序设计时考虑到使用者的需要所有的标准输入采用自 由格式和助记代号,程序自动提供输入数据的合理默认选 项,计算结果的输出中含有许多解释性的说明程序另外 提供许多选项指令让有经验的用户更改默认的选项,并提 供用户个人程序连接Gaussian 的接口 7 计算特点 �并行策略分为节点间openmp并行和节点间的linda并 行 �对计算能力的需求很大,单个节点配备越多的CPU将 提供越强大的计算能力 �对内存要求较高(例如CIS,CCSD等计算),节点内 存比较大,计算效率高 �在计算过程中要写出大量临时文件,I/O要求高 �网络要求低延迟通信 8 胖节点:2套SGI Altix 4700, Intel Itanium 2 处理器,NUMA结构,主频 1.66GHz, 内存2.5TB,188颗处理器,376个CPU核心 刀片节点: 1140个两颗四核Xeon处理器E4540,主频3.00GHz,内存32GB %chk=A_INT1-H2-1.chk # opt iop(1/8=5) b3lyp/geneCP Title Card Required 0 1 坐标和键长、键角、二面角等参 数。
C N P O H 0 6-31+G** **** Ru 0 lanl2dz **** Ru 0 lanl2dz GaussianGaussianGaussianGaussian Overlay1Overlay1Overlay1Overlay1 Overlay9,10,11,99Overlay9,10,11,99Overlay9,10,11,99Overlay9,10,11,99 L101L101L101L101 L102L102L102L102 L122L122L122L122 Overlay0Overlay0Overlay0Overlay0 L0L0L0L0 L001L001L001L001 Gaussian Gaussian Gaussian Gaussian 程序的结构程序的结构 link0: link0: link0: link0: 初始化程序,控制初始化程序,控制overlayoverlayoverlayoverlay link1: link1: link1: link1: 读入并处理读入并处理Route Route Route Route SectionSectionSectionSection,,建立要执行的建立要执行的linklinklinklink列表列表 link9999: link9999: link9999: link9999: 终止计算终止计算 Overlay99Overlay99Overlay99Overlay99 L9999L9999L9999L9999 其中部分程序可以并行执行,部分 程序只能串行执行 几个比较消耗CPU的Link 都实现了 并行(如L502,L701、L913) 10 越是精确的计算,就越需要大的资源,就越昂贵。
一般的,体 系的大小用总基组函数数量(N)表示,也有的方法取决于占据轨 道和非占据轨道的基组函数数量(O和V) 下表列出不同方法理论上的资源消耗(N4=N^4) 资源使用 对于小的体系,其计算成本差别是不大的,只有处理大 的体系时,其差别才显现出来 正常的实际消耗 CPU内存磁盘CPU磁盘 传统SCFN4N2N4N3.5N3.5 直接SCFN4N2-N2.7N2 MP2能量 传统ON4N2N4ON4N4 直接ON4OVN-O2N3N2 半直接ON4N2VN2O2N3VN2 MP2梯度 传统ON4N2N4ON4N4 直接ON4N3-O2N3N2 半直接ON4N2N3O2N3N3 MP4,QCISD(T)O3V4N2N4O3V4N4 全CI(CPU)((O+V)!/O!V!)2 11 使用经验——计算设置 �Route.Rou修改缺省使用核数,内存大小 �节点内采用openmp并行,效率较高节点间采用Linda并 行,效率不高建议采取节点内并行计算 �读写文件指定 �优先使用当前作业所在文件系统 �可以跨文件系统存储读写文件(03不可以) �内存并非给得越多越好,需要综合考虑到计算的需要和硬 件水平,最有效率的方法是根据作业类型估算所需要内存 的大小。
可以使用 “freqmem natoms nbasis r|u c|d functions”估算内存 Functions可以使用%kjob=301来得到 一般的出错都是由于内存不够或RWF文件空间不够引起的 级别越高的算法对内存和REF文件空间的要求就越高 12 使用经验——快速得到所需结果 �一般情况: 1.做足homework,构建合理输入文件,选取合适的方法基组 (问题规模会随所选取的粒子的种类数目、基组大小以及算法收 敛快慢等多种因素的变化而变化) 2.坐标形式对于效率没有影响对称性比较高的分子,用矩阵输 入比较容易保持对称性 3.控制输出标准,可以简化输出,节省时间 4.建立检查点文件 �关于优化: 1.先小基组优化,再大基组优化 2.对于大体系,先固定优化一部分结构,再放开优化 3.在结构出现震荡时,取出最低能量结构重新计算力场数,往往 很快得到优化结果 4.有些体系收敛不要求4个YES,如大体系(势能面比较平缓)只 要求前两项收敛即可 13 �关于频率计算: 1.在优化的结构基础上进行,并且计算采用的方法和基组必须一 致,否则没有意义 2.所需内存一般为优化的2倍 �关于过渡态: 1.合理选取方法得到合适的过渡态。
TS、QST2、QST3) 如TS法:使用势能面扫描法或者控制主反应坐标法找到与过渡态结构相 近的初始结构势能面扫描代价控制主反应坐标法 QST2法:两个输入结构不必须为优化的稳定点(无需花时间对叠合结构 优化),关键在于确保两个结构叠合出来的结构最接近过渡态 2.优化得到过渡态结构后,一定要进行IRC验证IRC验证走不到 反应物或产物构型时,可以取结构做优化判断 使用经验——快速得到所需结果 14 VASP软件 概述 �VASP是Vienna Ab-initio Simulation Package的缩写,它是使用赝势和平面波基组,进行从头量子力 学分子动力学计算的软件包 �最新版本:5.3.2 �功能: �采用周期性边界条件(或超原胞模型)处理原子、分子、团簇、纳米线(或管)、薄膜、晶体、准晶和无定性材料,以及表面体系 和固体 �计算材料的结构参数(键长,键角,晶格常数,原子位置等)和构型 �计算材料的状态方程和力学性质(体弹性模量和弹性常数) �计算材料的电子结构(能级、电荷密度分布、能带、电子态密度和ELF) �计算材料的光学性质 �计算材料的磁学性质 �计算材料的晶格动力学性质(声子谱等) �表面体系的模拟(重构、表面态和STM模拟) �从头分子动力学模拟 �计算材料的激发态(GW准粒子修正) �计算特点: �CPU、内存要求高。
特别是内存容量和内存带宽对性能影响较大 �要求低通信延迟,其磁盘I/O相对较少 16 软件安装 �编译器,BLAS,fftw,mpi,vasp&vtst �步骤: �安装包解压 �cd vasp/src �修改makefile,make 编译出vasp可执行文件 �Trick: �推荐Intel编译器,采用goto-blas,intelmpi/openmpi获取 更好性能 �选择合适的优化指令(-O3,-xSSEX等) 17 应用特征分析 组成组成选配方案选配方案 WorkloadCoSb3超胞方钴矿(Atoms:864,bands:3110) VASP5.2 CPUIntel Xeon处理器 内存64GB DDR3 1600MHz OSLinux 18 19 使用建议 Memory=NKDIM*NBANDS*NPLMV*16/10(Byte) NKDIM:K点数目 NBANDS:能带数目 NPLMV:平面波数目 �输入文件INCAR文件: NPAR:并行计算band的节点数,这个选项可能会大幅 增加内存的需求建议设置等于一个节点的核心数 20 Material Studio软件包 概述 �能够提供分子模拟、材料设计以及化学信息学和生物信息 学全面解决方案的高度模块化的集成产品。
�最新版本:6.0 �MS软件能使任何研究者达到与世界一流研究部门相一致 的材料模拟的能力模拟的内容包括了催化剂、聚合物、 固体及表面、晶体与衍射、化学反应等材料和化学研究领 域的主要课题 �灵活的Client-Server结构其核心模块Visualizer运行于 客户端PC,计算模块(如Discover,DMol3,CASTEP等) 运行于服务器端 �SCCAS购买Visualizer ,DMOL3DMOL3DMOL3DMOL3,,CASTEPCASTEPCASTEPCASTEP,ONETEP, Discover 22 CASTEP and Dmol3 �CASTEP:先进的量子力学程序,广泛应用于陶瓷、 半导体、金属等多种材料,可研究:晶体材料的性质 (半导体、陶瓷、金属、分子筛等)、表面和表面重 构的性质、表面化学、电子结构(能带及态密度)、 晶体的光学性质、点缺陷性质(如空位、间隙或取代 掺杂)、扩展缺陷(晶粒间界、位错)、体系的三维 电荷密度及波函数等 �DMOL3:独特的密度泛函(DFT)量子力学程序,是 唯一的可以模拟气相、溶液、表面及固体等过程及性 质的商业化量子力学程序,应用于化学、材料、化工、 固体物理等许多领域。
可用于研究均相催化、多相催 化、分子反应、分子结构等,也可预测溶解度、蒸气 压、配分函数、熔解热、混合热等性质 23 一些经验 �CASTEP与VASP计算特点相近,计算量与平面波数量 的3次方成正比 �DMol3:对内存和I/O要求比较高 计算产生大量的 临时文件需要考虑临时文件的存放问题 24 总 结 �关于软件安装 �细读readme或者install文件,选取合适的编译器,并行 库,数学库等 �安装后测试,调优 �软件是人写的,都有或多或少的缺陷,排除安装错误, 修改源码或者联系软件开发团队 �关于软件使用 �根据计算体系及特点选取合适的软件,模型的选定和建 构非常重要 �进行收敛性测试非常必要对于人为选择。