《PDM系统健康检查报告》由会员分享,可在线阅读,更多相关《PDM系统健康检查报告(21页珍藏版)》请在金锄头文库上搜索。
1、PDM系系统健康健康检查报告告2目录目录检查计划与内容1系统整体运行状况2服务器无法访问问题分析34WGM问题分析5应用系统与服务器配置分析6系统检查结论与优化建议7系统运维建议3检查计划和内容检查计划和内容时间检查内容第一天了解系统整体运行状况、基本配置和存在问题第二天应用系统、数据库配置分析队列检查可视化服务检查第三天分析后台日志,调查服务器无法访问及系统报错问题第四天收集与分析WGM出错问题分析后台日志,调查定制功能问题第五天服务器配置分析健康检查报告4u用户使用情况注册用户:2652(截止11月14日),有效用户约600个日平均访问量:178个左右u应用系统与服务器状况1台Master
2、、2台Slaver、1台数据库服务器,客户端使用固定IP访问Slaver。u当前系统存在问题分类功能问题:执行过程中会报错,问题汇总表中的问题90%属于功能性问题,即需要更改现有定制功能,此类问题不在本次健康检查的处理范围之内。性能问题:执行速度较慢,但可以完成,不会报错。经调查,除可视化转档问题外,尚未反馈性能问题。发布单个1M左右CATIA零件的时间不超过60秒,速度正常,不需要调优。系统整体运行状况系统整体运行状况5u当前系统存在问题分类(续)服务器问题:服务器无法访问反馈较为严重的问题之一,9月份约出现610次,10月份2次无法访问系统,手动启动后即可访问。客户端软件问题客户端使用Ja
3、va打开产品浏览器报错,或无法打开。WGM使用过程中经常报错,数据无法检入,发生频率较高,反馈较严重的问题。综合以上问题分类,本次健康检查着重处理三个问题:服务器无法访问、WGM使用报错、系统配置优化。系统整体运行状况系统整体运行状况6u10月15日系统无法访问时后台日志分析结论Slaver上MethodServer未启动,可能原因:Master上Apache和BackgroundMethodServer未启动。Slaver1用户目录空间不足(截止11月11日剩余0.46G)10月15日系统无法访问时后台日志分析结论u10月31日系统无法访问时后台日志分析结论为PTC收集日志打开了后台Debu
4、g,使BackgroundMethodServer产生大量日志,本地20G磁盘写满, BackgroundMethodServer 运行异常。因系统日志较大,没有保留10月份之前的日志,错误无法追踪,建议调整系统配置后再观察2个月,并保留最近3个月的系统日志。如果在某个时间段内系统出现异常,应保留该段时间内的日志记录,直至问题确认和解决为止。服务器无法访问问题分析服务器无法访问问题分析7目前收集和反馈的WGM主要问题u脚本错误因PTC官方并不支持CATIA V5R18和WGM在Windows7环境下集成,Windchill9.1系统支持IE6,而在WGM中使用IE7或IE8作为内嵌的浏览器,无
5、法保证完全兼容。根据在其他客户的实施经验,在Windchill9.1对应的WGM中内嵌IE6以上版本的浏览器,可能出现异常。u与服务器的连接不可用WGM中出现无法连接服务器错误时,KK2012也无法连接,确认是否网络问题。系统配置了HTTPS,应当在Apache中配置SSL支持HTTPS。IE8、IE9存在安全性缺陷,需要按照补丁。WGMWGM问题分析问题分析8目前收集和反馈的WGM主要问题(续)u运行时间错误IE打开了调试功能,IE设置中关闭调试。u检入数据时页面卡检入模型时监控客户端电脑CPU使用情况。设置AIX网络参数,增加网卡发包数量。u工作区对象过期本地工作区模型与服务器工作区数据不
6、一致,同步即可解决。u对数据无操作权限:系统权限控制正常报错,策略管理统一分配权限。WGMWGM问题分析问题分析9u应用服务配置目前配置1个BackgroundMethodServer,每个Slaver配置3个MethodServer,1个Tomcat,现有配置能否满足用户数量的访问要求,不需要调整方法服务器JVM内存。u服务器内存参数设置Slaver1内存参数maxperm、maxclient设置较大。u服务器网络参数设置设置服务器网络参数,增加网卡对上载数据的吞吐量,提升上载速度。u服务器环境变量设置设置系统环境变量,取消操作系统对内存使用的记录。应用系统与服务器配置分析应用系统与服务器配
7、置分析10u系统健康状况总揽系统检查结论与优化建议系统检查结论与优化建议检查项主要问题原因状况系统架构系统架构较稳定,支持扩展,能够满足现有业务量要求Cluster架构,Slaver易扩展系统资源物理内存能够满足当前及未来35年业务需求Slaver剩余物理内存可以支持再增加一个MethodServer和Tomcat参数配置操作系统内存参数、Windchill缓存存在问题,导致系统性能下降。未根据系统情况调整参数性能(1)WGM上载数据性能较差(2)操 作 系 统 产 生 大 量 的 javaCore和hump文件,占用系统硬件资源。(1)操作系统配置存在问题(2)IE存在安全漏洞代码定制功能存
8、在报错等问题,需要根据业务要求更改。代码功能Bug,业务需求变更运维(1)系统配置直接更改文件,不使用管理命令(2)缺乏系统监控历史原因导致难以直接使用管理命令更改配置文件。11u主要问题解决方案系统参数配置建议系统检查结论与优化建议系统检查结论与优化建议配置文件参数原值建 议值db.propertieswt.pom.maxDbConnections1030wt.pom.queryLimit200000wt.pom.paging.snapshotQueryLimit-120000wt.pom.cachedStatementReuseLimit5032000wt.propertieswt.cac
9、he.size.WTPrincipalCache500020000com.ptc.windchill.search.queryLimit-15000wt.cache.size.AclCache12578 26635wt.cache.size.NotificationListCache20068218wt.cache.size.ReferenceCache200500wt.admin.cache.maxDomains20007195wt.cache.size.WTCalendarCache1001000wt.manager.maxHeap3781536wt.cache.size.IBAModel
10、Implementation$DefaultIBATypeCache5004000wt.cache.size.PrefEntryCache30003000012u主要问题解决方案(续)Apache配置,SSL支持HTTPSconfhttpd.conf文件中添加:KeepAliveTimeout15Apacheconfextrahttpd-ssl.conf文件:#注释以下部分BrowserMatch.*MSIE.*nokeepalivessl-unclean-shutdowndowngrade-1.0force-response-1.0#添加以下部分#AllMSIEversionsneedssl
11、-unclean-shutdownBrowserMatchMSIEssl-unclean-shutdown#MSIEversions2-5needadditionaldowngradesBrowserMatchMSIE2-5nokeepalivedowngrade-1.0force-response-1.0系统检查结论与优化建议系统检查结论与优化建议13u主要问题解决方案(续)服务器参数配置Slaver1内存参数:maxperm%=80maxclient%=80minperm%=3Master、Slaver1、Slaver2网络参数:tcp_nodelayack=1系统变量exportIBM_
12、HEAP_DUMP=falseexportIBM_HEAPDUMP=falseexportIBM_HEAPDUMP_OUTOFMEMORY=falseexportIBM_JAVACORE_OUTOFMEMORY=false设置环境变量后,操作系统将不再对内存泄露等异常情况记录,如果操作系统出现问题,缺少分析的依据,在磁盘空间充足的情况下,建议不设置此变量。系统检查结论与优化建议系统检查结论与优化建议14u主要问题解决方案(续)客户端安装安全补丁通过安装微软补丁KB973536和KB974455,修复IE8、IE9的缺陷,补丁下载地址:KB973536:KB974455:http:/ windo
13、ws.browser.type=Mozilla_based_browser系统检查结论与优化建议系统检查结论与优化建议17uWGM用户手册和常见问题处理方法根据用户反馈的WGM相关问题及调查结果,用户对WGM使用的熟练程度并不理想,建议根据设计过程指定WGM用户手册,并记录用户在使用过程中遇到的问题和解决方法,形成常见问题处理方法文档。对于重复出现的问题,用户可以根据常见问题处理方法自行解决。u系统配置文件更改方法因历史原因,系统配置文件的更改不能使用管理命令添加,而是直接在配置文件中手动更改,如此操作将对后续的系统运维管理带来很大的风险。一旦执行系统补丁安装、小版本升级或其他实施人员在不知情
14、的情况下执行xconfmanager p,在配置文件中手动更改的配置,将全部被覆盖。为避免风险,建议整理系统配置,统一将配置更新到site.conf文件中。系统运维建议系统运维建议18u磁盘检测工具因应用系统安装目录所在的逻辑盘符剩余空间较小,必须实时监控磁盘使用情况,一旦出现磁盘无空间的情况,将引起服务的失败。建议将以下备份文件移至其它目录,同时安装磁盘监控软件,当磁盘空间剩余量小于设定的值时,系统管理员可以获得邮件通过,以便及时处理,避免服务宕机。u系统备份文件与日志将服务器上的备份文件移至其它目录。关闭不必要的日志输出系统运维建议系统运维建议19u系统监控系统更改记录对生产服务器的任何更改、重启必须做好详细的记录,以便于反查和追踪问题。日志保留期限系统日志(Apache、MethodServer)建议保留近3个月,如果某段时间系统出现异常,一定保留该段时间内的错误日志。系统运维建议系统运维建议Thanks谢谢观赏谢谢观赏