FMEA方法培训

上传人:公**** 文档编号:567353634 上传时间:2024-07-20 格式:PPT 页数:31 大小:1.31MB
返回 下载 相关 举报
FMEA方法培训_第1页
第1页 / 共31页
FMEA方法培训_第2页
第2页 / 共31页
FMEA方法培训_第3页
第3页 / 共31页
FMEA方法培训_第4页
第4页 / 共31页
FMEA方法培训_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《FMEA方法培训》由会员分享,可在线阅读,更多相关《FMEA方法培训(31页珍藏版)》请在金锄头文库上搜索。

1、l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的11 1、概述概述通信网的可用性通信网的可用性接接 入入 层层骨骨 干干 网网设设 备备 层层骨骨干干网网接接 入入 层层骨骨 干干 网网设设 备备 层层骨骨干干网网骨骨干干网网1、设备都是通信网络中的一个设备都是通信网络中的一个接点,网络的可靠性或者说端到接点,网络的可靠性或者说端到端的可靠性是用户最终关心的。端的可靠性是用户最终关心的。不能仅仅关注设备可靠性而忽视组网、网络其他部件对可靠性的影响;2、 不同网络层次的设备有不同不同

2、网络层次的设备有不同的可靠性要求。的可靠性要求。核心层设备偏重于HA,中间层设备偏重于成本与HA的良好结合,终端设备偏重于成本与返修率;3、HA不仅仅包括设备软、硬件不仅仅包括设备软、硬件的的HA,而且包括计划性中断、人,而且包括计划性中断、人为差错等的为差错等的HA,所以也要关注升级、数据配置、补丁等造成的业务中断;4、需求的落实需要可靠性工程、需求的落实需要可靠性工程师对产品设计方案的了解,需求师对产品设计方案的了解,需求跟踪,跟踪,FIT测试验证。更需要开发测试验证。更需要开发人员的并肩作战。人员的并肩作战。HA网络级HA设备HA人为差错HA系统HA连接设备HA计划性活动HA交换模块HA

3、线路处理模块HA平台软件模块HA主控模块HA电缆HA背板HA硬件HA软件HA机电模块HA服务器模块HA 功能框1HA功能框2HA功能框3HA 2l产品的可靠性可以理解为三个规定,即规定条件下、规定时间内、产品完成规定功能的能力。l从用户的角度考虑,可简单地理解为几个层面的要求:硬件故障,仅对性能硬件故障,仅对性能有部分影响,设备的有部分影响,设备的功能不受损。功能不受损。硬件不出故障硬件不出故障硬件故障,设备部分或硬件故障,设备部分或全部功能受损。但能尽全部功能受损。但能尽快恢复业务。快恢复业务。第二层面第二层面第一层面第一层面第三层面第三层面1 1、概述概述可靠性的层次可靠性的层次电路应用规

4、范、器件应力降额、环境适应性、EMC、防护、安规、HALT试验等冗余、倒换策略,倒换条件完善,数据备份策略故障检测、隔离,定位,维修性等元器件降额分析元器件降额分析可靠性可靠性FMEAFMEA、CACA分析分析l系统结构的考虑。如冗余、负荷分担。l其他容错设计l故障检测。重要故障需要“知情”。检测灵敏度;l故障隔离。能隔离到影响最小,定位到FRU;l故障恢复。倒换策略、复位、重启、数据恢复等;l故障测试验证。重要、影响或措施不明确的故障、故障模式,FIT模拟测试;l器件使用的考虑。如降额、热设计、器件应用审查;l简化设计等3nAWP:availability work process故障插入计

5、划故障恢复设计故障隔离设计故障检测设计可用性计划更新设计FMEA分析操作过程操作最简化计划操作界面故障原因和影响可用性模型测试和现场数据可用性工作过程数据流1 1、概述概述业界可靠性流程(业界可靠性流程(MOTOROLAMOTOROLA的的AWPAWP)41 1、概述概述可靠性流程可靠性流程验证阶段概念阶段计划阶段开发阶段需求提出需求分析综合映射需求分解与回溯规格形成概要设计详细设计与实现单元测试、SDV、SITBeta测试工程设计调研与设计建议l可靠性工程基线2.0l板间信号级FMEA分析报告l单板总体设计方案(可靠性)系统可靠性系统可靠性设计报告设计报告l可靠性指标论证报告TR2TR3TR

6、1l器件级FMEA分析报告l单板硬件详细设计报告(可靠性)l元器件降额分析报告TR4TR4ASVTIPDSEHCMM 3.0FIT可靠性验证测试可靠性工程师可靠性工程师硬件/软件开发工程师可靠性工程师测试工程师可靠性工程师可靠性工程师51 1、系统可靠性设计报告、系统可靠性设计报告2 2、板间信号级、板间信号级FMEAFMEA分析报告分析报告1产品构成及功能定义2产品功能层次框图3产品可靠性框图4产品编码原则5环境定义6严酷度等级定义7功能模块(单板)接口信号FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5分析总结1产品概

7、述2产品系统结构及可靠性建模3系统可靠性分析4主控类单板可靠性设计5网板(交叉)类单板可靠性设计6业务类单板可靠性设计7时钟子系统设计8电源子系统设计9监控及散热系统保护设计10存储保护与数据安全11系统及单板复位设计12系统可靠性设计规格及测试验证需求汇总1、概述可靠性流程、概述可靠性流程61 1、器件级、器件级FMEAFMEA分析报告分析报告1单板构成及功能定义2单板功能层次框图3单板可靠性框图4编码原则(可选)5环境定义6严酷度等级定义7单板器件级FMEA分析7.1 单板器件级FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分

8、析8.5故障定位率计算8.6冗余单元倒换成功率计算8.7分析总结2 2、产品元器件降额分析报告、产品元器件降额分析报告1、系统功能2、 环境定义3 、测试环境4、 单板元器件降额分析4.1 单板1元器件降额分析4.2单板2元器件降额分析5、总结1、概述可靠性流程、概述可靠性流程7l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的8故障检测在线故障诊断故障隔离故障恢复故障修复离线故障诊断预警告警2 2、故障管理设计、故障管理设计故障插入计划故障恢复设计故障隔离设计故障检测设计可用性计划

9、更新设计FMEA分析操作过程操作最简化计划操作界面故障原因和影响可用性模型测试和现场数据可用性工作过程数据流9故障检测:发现故障故障检测:发现故障故障诊断方法:1、自诊断(如:电压模块、风扇自带诊断);2、在线诊断;故障定位方法:1、功能单元隔离(如影响到总线或通信通道的故障、二路电源的二极管隔离等)2、禁止功能单元工作;3、安全值输出(如:参考时钟的自激振荡)4、重选路由;故障检测方法:1、数值范围检查;(如:温度、电压、槽位号、MAC地址等)2、数据正确性检查(如:奇偶校验、求检验和、CRC校验、槽位号异或校验等)3、比较检查(有冗余输出时)4、时间检查(如:心跳检测)5、用户直观检查(如

10、:告警、声光显示)故障诊断(定位):确定造成故障的单元故障诊断(定位):确定造成故障的单元故障定位:故障定位:把检测到的故障隔离到必须进行修理范围的过程,通常是现场可更换单元。即确保单元的故障不会造成系统的故障。故障恢复方法:1、倒换;(对主备用冗余)2、重新分配资源(对N+1冗余、资源池)3、软件复位;4、重启;故障恢复(自动):恢复产品执行规定功能故障恢复(自动):恢复产品执行规定功能的能力。的能力。2 2、故障管理设计、故障管理设计10故障修复方法:1、更换功能单元;2、调试和诊断(离线)3、软件补丁;4、软件升级;告警方法:告警方法:1、趋势图法;2、多变量综合分析法;3、专家系统法;

11、故障修复:故障完全排除的过程。故障修复:故障完全排除的过程。2 2、故障管理设计、故障管理设计1、报警;2、信息文本(如:写入运行日志中)3、故障分级处理(不同级别的故障采取不同的告警方法)预警方法:预警方法:11l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证测试(可靠性验证测试(FITFIT)课程目的课程目的12系统系统薄弱环节薄弱环节可靠性设计可靠性设计故障概率高故障影响大可靠性定性分析FMEA可靠性定量分析建模预计可靠性分析方法3 3、可靠性分析方法、可靠性分析方法在产品设计过程中,通过对产品各组成单元潜在的各种故障模式及其

12、对产品功能的影响进行分析,并把每一个潜在的故障模式按它的严酷度予以分类,提出可以采取的预防改进措施,以提高产提出可以采取的预防改进措施,以提高产品可靠性品可靠性的一种设计分析方法。Failure Mode Effect AnalysisFailure Mode Effect Analysis,故障模式影响分析,故障模式影响分析遍历性、系统性。FMEAFMEA的基本思想:的基本思想:.3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEAFMEAFMEA目的:目的:n能帮助设计者和决策者从各种方案中选择满足可靠性要求的最佳方案n保证所有元器件、单元的各种故障模式及影响都经过周密考虑保

13、证所有元器件、单元的各种故障模式及影响都经过周密考虑n能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分析其影响程度析其影响程度n有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价n能为进一步更改产品设计、定量计算提供资料FMEAFMEA的分析层次:的分析层次:n系统级:系统级:按各功能模块进行分析n板间信号级:板间信号级:单板的接口信号进行分析n器件级:器件级:按各器件的故障模式进行分析 3 3、可靠性分析方法

14、可靠性、可靠性分析方法可靠性FMEAFMEA15FMEAFMEA的分析方法的分析方法 :n硬件法硬件法:从硬件的角度,对每个器件管脚输出分别去考虑故障模式、故障影响、检测补偿措施。n功能法功能法:每个产品可以完成若干功能,而功能可以按输出分类。这种方法将输出一一列出,并对它们的故障模式进行分析。对应系统级、单板级分析。 3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEAF FM ME EA A分分析析步步骤:骤:3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA 从可靠性工程师的角度去理解系统; 包括对系统完成的功能、工作阶段以及各种工作方式给出详细的描述; 网

15、络位置、组网方式和典型配置描述系统功能系统按照功能划分,通常可以分为:电源模块、风扇监控模块、网管模块、功能模块。对于功能模块,再继续划分到功能实体上,如主控功能模块、交换网功能模块、线路处理功能模块等。3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA定义严酷度类别 给产品故障造成的最坏潜在后果规定一个量度。 I. 这种故障会导致整个系统崩溃或主要功能受到严重影响;II. 这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患;III. 系统次要功能丧失或下降,须立即修理,但不影响系统主要功能实现的故障;IV. 部分次要功能下降,只须一般维护的,不对功

16、能实现造成影响(一般告警或指示灯故障等)。III类故障通常称为重大故障,也即“单点故障”;III类故障可简单理解为需要尽快修复的故障。当一个故障不能被检测出来时,是“隐患”,级别上升一级。具体产品具体定义;3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA描述功能层次框图目的:为了描述系统各功能单元的工作情况、相互影响及相互依赖关系,以便可以逐层分析故障模式产生的影响。表示系统及系统各功能单元的工作情况和相互关系,以及系统和每个约定层次的功能逻辑顺序。3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA描述可靠性模型框图目的:表示系统可靠性与各功能模块可靠性之间的

17、关系。可靠性模型框图分为基本可靠性模型框图和任务可靠性模型框图。 3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA描述结构图 目的:清晰功能模块之间的相互关系,主要输入/输出信号。确定故障模式和故障原因确定故障模式和故障原因(板间信号级)(板间信号级)光信号光信号无光、光功率衰减过大、时序错误电信号电信号常高、常低、开路、时序错误确定故障模式和故障原因(器件级)确定故障模式和故障原因(器件级)分类类型失效形式百分比电容器纸/塑料薄膜电容器 短路74开路13参数漂移13玻璃釉电容器 短路53开路25参数漂移22云母电容器 短路83开路10参数漂移73 3、可靠性分析方法可靠性、

18、可靠性分析方法可靠性FMEAFMEA确定故障模式和故障原因(系统级)确定故障模式和故障原因(系统级)业务类功能故障;对接类功能故障;信息上报类故障;故障诊断类故障;业务保障类故障;安全类故障;用户界面类故障;子系统层面:全部功能不能实现;各部分功能不能实现;功能异常。22FMEAFMEA分析表格分析表格3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA软件故障管理需求列表硬件故障管理需求列表3 3、可靠性分析方法可靠性、可靠性分析方法可靠性FMEAFMEA测试验证需求列表Criticality AnalysisCriticality Analysis,危害性分析,危害性分析按每

19、一种故障模式的严酷度类别及故障模式发生概率所产生的影响对其分类,以便全面地评价各种可能的故障模式的影响。是FMEA的补充和扩展。用RPN(Risk Priority Number,风险占先数)来定量表示RPNSPD*其中:S严重程度,对于IIV类故障分别选取100,5,1,0.2P故障发生的概率 ,器件失效率与故障模式发生概率的乘积,FIT;D客户发现故障的概率 ,很容易发现5,稍加注意即可发现1,不会发现0.2。* 通常可不考虑该参数3 3、可靠性分析方法、可靠性分析方法CACA25l可靠性工作介绍可靠性工作介绍l故障管理设计故障管理设计lFMEAFMEA分析方法介绍分析方法介绍l可靠性验证

20、测试(可靠性验证测试(FITFIT)课程目的课程目的26开发阶段验证产品开发阶段验证产品MTBFMTBF或或A A:l可靠性是基于统计的结果,需要有足够的样本量;l时间较长;试验量大;l难以模拟现场应用环境;4 4、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试可靠性可靠性FIT测试验证目的:测试验证目的:1、可靠性增长,测试发现问题,提高系统可靠性;2、验证系统可靠性,验证系统的故障管理能力;3、对产品故障恢复能力定量估计(可靠性指标验证);FIT(Fault Insertion Test):故障插入测试软件硬件维护操作274 4、可靠性验证测试及评估可靠性验证测试、

21、可靠性验证测试及评估可靠性验证测试硬件常用器件失效模式 4 4、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试验证系统故障管理能力 1)出现故障后系统处理不当引起业务中断;比较典型的例子:出现故障后系统处理不当引起业务中断;比较典型的例子:线路的1.8V电源失效,网络发生复用段倒换,但几分钟后倒换确恢复了,导致网络业务中断;2)主备之间的信号检测未加过滤,导致误倒换;比较典型的例子:主备之间的信号检测未加过滤,导致误倒换;比较典型的例子:主备单板之间的主备信号、好坏信号等等的检测没有增加过滤,由于这些信号是时钟信号,因此外界出现干扰,系统主备出现误倒换;3)模块之间处理

22、错误;比较典型的例子:模块之间处理错误;比较典型的例子:时钟板的1.5V电源出现问题,由于BOIS和单板软件的接口错误,导致倒换失常;再比如:线路发现交叉过来的业务出现LOS,会上报给主机,但却被主机给抑制了,系统无法知道原因;4)重大故障无法准确定位;比较典型的例子:重大故障无法准确定位;比较典型的例子:线路的622M晶振失效,系统出现很多业务的告警,但无法准确定位是哪一块单板出现故障;5)检测不全面;比较典型的例子:检测不全面;比较典型的例子:在位线或者ID线在单板运行过程中出现故障,系统无法知道,单板硬复位或者重起后,无法和主控联系,业务中断;6)告警抑制不正确;这个问题很多,其中比较典

23、型的例子:告警抑制不正确;这个问题很多,其中比较典型的例子:单板电源出现问题,系统会上报电源或者单板不在位告警,但其他会随之上报很多读写错误、总线错误等等杂乱的告警,定位困难,没有做到真正的抑制关系。4 4、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试验证系统故障管理能力 不但要保证故障后可以倒换,还需要提供相应的告警指示。产品可靠性指标验证产品可靠性指标验证4 4、可靠性验证测试及评估可靠性验证测试、可靠性验证测试及评估可靠性验证测试l主用单板故障定位率l备用单板故障定位率l切换成功率l平均故障恢复时间l主备倒换时间l主备倒换过程中业务的受损情况FMEAFIT测试验证

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号