《交换技术基础第七章》由会员分享,可在线阅读,更多相关《交换技术基础第七章(63页珍藏版)》请在金锄头文库上搜索。
1、7交换技术基础第第章章北京邮电大学出版社目前,电话业务仍是电信业务的主要内容。设计电话局交换设备(交换网)及局间中继线配备数量时主要根据设备所要承受的电话业务量(话务量)及规定的QoS (阻塞程度) 。QoS:交换设备未能完成接续的电话呼叫业务量与用户发出的电话呼叫量之比,即呼叫损失率。呼损越低,服务质量越高。研究话务量、呼损与交换设备数量间固有关系的理论即为话务理论。最早从事话务量研究的丹麦学者A.K.Erlang在1909年发表了话务理论的经典著作。北京邮电大学出版社数字程控交换技术出现后,话务交换网络可实现无呼损。影响交换系统QoS的因素除公用设备的数量外,还有处理机的处理能力。通信业务
2、从语音拓展到数据、多媒体后,将输入信息统称通信呼叫。话务理论发展为通信业务量理论,研究QoS与所需通信设备间的关系。北京邮电大学出版社7.1 话务量基本概念7.1.1 话务量定义1、什么叫话务量 电话用户进行通话要占用电话交换机的资源(交换网络、中继线、处理机、信令设备等)。 用户通话次数的多少和每次通话时间都从数量上说明了用户需要使用电话的程度,或者说交换机资源被占用的程度。话务量:从数量上表明用户或中继线占用交换机资源的程度,具有随机性和波动性。北京邮电大学出版社用户的电话呼叫完全是随机的,因此话务量是一个随机变量。时间T内的话务量A: A=Ct (7-1)其中,CT内发生的呼叫次数; t
3、每次呼叫的平均占用时间。话务量的单位为爱尔兰Erl 或小时呼TC。也可用分钟呼(cm)或百秒呼(ccs)表示:1Erl=1TC=60 cm=36 ccs例、某交换机在一小时内共发生250次用户呼叫,每次呼叫的平均占用时间为3分钟。则在这一小时内该交换机承受的话务量为:A=Ct=2503/60=12.5Erl交换系统能承受的话务量由交换网络可同时连接的话路数决定现代局用数字交换机的话务量可达数万Erl以上。北京邮电大学出版社2、忙时、忙时呼叫和忙时话务量 交换局一昼夜期间所承受的话务量,即平均同时占用数,是变化的波动性。一昼夜时间内,话务最繁忙的一小时称为忙时。北京邮电大学出版社话务量强度(话务
4、流量):单位时间内流过的话务量 A1=A/T=Ct / T (7-2)考虑交换局的机线数量时,总是以忙时话务量为基本数据。通常所说的话务量,即指电话局在忙时的话务量强度电话局在忙时的话务量强度,是一个平均值随机性。例、设一个用户在2hr内共呼叫5次,每次呼叫的保持时间为800s,300s,700s,400s,50s。求该用户的话务量A和话务量强度A1解: T=2hr,C=5,t=(800+300+700+400+50)/5=450s=0.125hrA=Ct=0.625Erl A1=A/T=0.625/2=0.315Erl (1,表现单个用户的占用率)北京邮电大学出版社3、呼损概率呼叫损失(呼损
5、):在用户的一次呼叫过程中,由于在交换网络中找不到空闲输出线或控制系统过负荷,而未能完成呼叫接续。呼损是偶然事件,所以叫做呼损概率。对待呼损有两种不同处理方式: (1)明显损失制:如果用户呼叫不能立即接通时,公用交换设备不再受理这次呼叫,用户立即听到忙音,表示本次呼叫遭到损失需重新摘机呼叫,如电路交换;(2)等待制:用户呼叫不能立即接通时,不是立即听忙音而是等待公用交换设备空闲时给予接续。接通顺序按排队系统。不需重新呼叫,如分组交换,客服电话。北京邮电大学出版社4、原发话务量和完成话务量原发话务量:流入到交换网络的输入线上的话务量。Ao Offered traffic完成话务量:在输出端送出的
6、话务量,已完成接续。 AcCarried traffic损失话务量:原发话务量与完成话务量之差,即由于交换网络有阻塞而遭受损失的话务量。 AoBLost traffic明显损失制中,Ac=Ao(1-B)=Ao-AoB 其中, B呼损,正常情况下很小,如规定1或5,因此通常在工程中不严格区分Ac或Ao;但设备超负荷时较大。等待制中,Ac=Ao北京邮电大学出版社7.1.2 线束的概念交换网络是若干输入线和能被这些输入线达到的若干输出线之间的交叉矩阵。输出线可以组成一个或几个线束,满足:入线上发生呼叫时,能接续到指定路由的一条空闲出线上去任意一对输入-输出线上只允许有一个呼叫。北京邮电大学出版社线束
7、按以下标准分为两类:线束容量M输出线数量利用度D每条输入线能达到的输出线范围1、全利用度线束线束中的任意一条出线能被任一条入线所达到,M=D,只要有空闲出线即可接续,数字交换机采用。北京邮电大学出版社2、部分利用度线束任意一条输入线不能达到所有出线中的任意一条,只能达到部分出线,DM。可能产生内部阻塞,即使输出线空闲也不能立即实现接续。对应明显损失制和等待制两种情况。北京邮电大学出版社7.1.3 爱尔兰呼损公式及其应用对于交换节点,若呼叫到达是泊松过程,中继线是全利用度线束,系统发生呼叫阻塞时,按明显损失制处理,则该系统达到统计平衡状态时,可使用爱尔兰公式:其中,A原发话务量(爱尔兰);n输出
8、线数En(A)呼损,同时有n个呼叫的概率,即n条出线全被占用,拒绝新呼叫造成的呼损。可用于开局时,在已知话务量和规定QoS的情况下计算所需输出线数;也可用于故障诊断和确定忙时。北京邮电大学出版社例1:一个交换机,其交换网络接1000个用户终端,每个用户忙时话务量为0.1Erl,该交换机能提供123条话路同时接受123个呼叫。求该交换机的呼损和线路利用率。 解:电路交换采用明显损失制且,123条话路可同时接受123个呼叫M=D全利用度线束符合爱尔兰公式应用条件交换机的总话务量为 Ao=0.1 Erl1000=100 Erl;输出线数n=123;查爱尔兰表,可得呼损 E123(100)=0.3%。
9、话务流量损失 AoE=0.3%100=0.3 Erl;完成话务量Ac=Ao(1-E)=99.7% 100=99.7 Erl通过了该交换机内的123条话路每条话路负荷99.7/123=0.8 Erl话务量,即忙时出线利用率 (1-0.3%)100Erl)/123100%=80%。北京邮电大学出版社例2:设10个用户公用交换机的2条话路,每个用户忙时话务量为0.1Erl。求该交换机的呼损和线路利用率。 解:电路交换采用明显损失制且,2条话路可同时接受2个呼叫 M=D全利用度线束 符合爱尔兰公式应用条件交换机的总话务量为 Ao=0.1 Erl10=1 Erl;出线数n=2;查爱尔兰表,可得呼损 E2
10、(1)=20%。每条话路忙时出线利用率为 (1-20%)1Erl/2100%=80%/2=40%。北京邮电大学出版社分析交换机输出线话路数,即线束容量M很小时,线束的利用率很低,呼损很大;要保持较高的QoS就须减小流经的话务量。M100时,线束的利用率较高,呼损很小对于利用率较高的大容量线束,当流经的话务量增加时很容易引起过负荷;利用率较低的小容量线束,对过负荷不敏感。按ITU-T建议,我国电话网全程(发端-收端交换机)呼损:数字长途电话网0.098;数字市内电话网0.027。北京邮电大学出版社7.2 交换网络的内部阻塞 前面讨论的呼损仅仅是由于出线全忙而引起的。实际上,交换机的交换网络往往由
11、若干级组成。在入线和出线间还有内部各级之间的链路。内部阻塞:当交换网络内部级间链路全忙时,由于入线找不到空闲链路而不能达到空闲出线,导致呼叫损失的情况。北京邮电大学出版社TST三级交换网络,有16条输入母线和16条输出母线,每条母线有256个时隙,即输入、输出端各有25616=4096条话路。T接线器:入线数=出线数,无阻塞S接线器:一条出线上有16条入线与之相连;出线上有256个时隙而每条入线上都有256个时隙(共4096个时隙),极易造成阻塞。北京邮电大学出版社1、阻塞概率的计算假设每条入线上的话务量为Y,即每条入线的占用概率为Y,则空闲概率为(1-Y)主被叫通话时所占用的两条通路同时空闲
12、的概率为同时忙的概率为当两条通路都处于同一个T接线器内时,通路的阻塞概率为当两条通路分别处于两个T接线器内时,通路的阻塞概率为所以呼叫在交换网中发生阻塞的平均概率为可见网络的阻塞概率与每条入线上的话务量有关:Y=0.4Erl时, ; Y=0.8Erl时,这种无集中、无扩散的网络在话务量较高时有较大的内部阻塞 北京邮电大学出版社2、无阻塞网络要降低内部阻塞概率,就要增加级间的链路数即内部时隙数,使级间链路上的话务量降低,从而降低阻塞率。Y=0.4Erl时, Y=0.8Erl时,可见中间链路数增加一倍,使网络的内部时隙数为输入/输出时隙数的2倍时(本例中链路数=32,内部时隙数=512),网络内部
13、阻塞概率很低,近似为0。输入端AB级扩散,输出端BC级集中,以增加设备、提高成本为代价。交换网络在整个交换机的成本中所占的比重不大。对于采用体积小、功耗小的大规模集成电路构成的数字交换网络来说是可行的。北京邮电大学出版社7.3 控制部件的呼叫处理能力BHCA评价一台程控交换机的话务能力一般有两个基本参数:话务量:通过交换网络可以同时连接的路由数BHCA(Busy Hour Call Attempts):忙时试呼次数,单位时间内控制设备能够处理的呼叫数,表明控制部件对呼叫的处理能力。对于数字交换机,交换网络的阻塞率很低,能通过的话务量较大,交换机的话务能力往往受到控制设备的呼叫处理能力的限制。B
14、HCA值是一个评价交换系统的设计水平和服务能力的重要指标。 北京邮电大学出版社7.3.1 计算BHCA的基本模型BHCA值随机变化,难以测算,常用一个线性模型粗略估算。系统开销:在充分长的统计时间内,处理机运行处理软件的时间和统计时长之比,即时间资源的占用率。固有开销:与呼叫处理次数无关的系统开销,如各种周期级扫描程序的开销。非固有开销:与呼叫处理次数有关的系统开销,如呼叫处理程序对CPU的占用、号码分析。北京邮电大学出版社单位时间内处理机用于呼叫处理的时间开销为 tabNa固有开销,主要是用于非呼叫处理的机时,与系统结构、系统容量、设备数量等参数有关;b处理一次呼叫的平均开销,是非固有开销。
15、不同呼叫所执行的指令数不同,与呼叫的不同结果,如中途挂机、被叫忙、完成呼叫;不同的呼叫类别,如局内呼叫、出/入局呼叫、汇接呼叫等有关。这里取的是各种情况的加权平均值(小时/次);N为单位时间内所处理的呼叫总数,即BHCA值。t是每次成功呼叫所用的时间,是一个统计值。例,某处理机忙时(单位时间)用于呼叫处理的时间开销平均为0.85(占用率),固有开销a=0.29,处理一个呼叫平均需时32ms,则可得 0.85=0.29+(32103/3600)N。因此,该处理机忙叫呼叫处理能力值 N=63000 次/小时。北京邮电大学出版社7.3.2 影响程控交换机呼叫处理能力的因素1、交换系统容量:交换系统的
16、用户数量越多,处理机的固定开销就越大,如扫描,降低了处理机的呼叫处理能力。2、控制系统结构:普遍采用多处理机结构。各级处理机的负荷或功能分配合理,提高了处理机的处理能力若某级处理机负荷过重,其他处理机效率不能充分发挥,系统的呼叫处理能力就相对降低。多处理机间通信需要开销,处理机越多,开销越大。避免效率低的多处理机间的通信方式(如串行口通信)。备用方式的开销不同:如同步方式要增加“比较”的开销;话务分担方式要求增加单机处理能力和余量,以便在故障时有单机工作的可能性。北京邮电大学出版社3、处理机的处理能力:指令系统功能的强弱,主时钟频率的高低能访问的存储空间范围以及I/O口的类别和数量等。4、软件
17、设计水平:提高OS的效率和数据结构的合理性均能减少实时系统的系统开销;高级语言有较高的可读性和可移植性,编程效率较高,但执行文件效率较低,在实时要求高、重复次数多的部分采用汇编语言能提高处理机的处理能力。北京邮电大学出版社7.3.3 系统开销及其分配系统开销及其分配交换机运行期间,控制系统的机时主要由OS和呼叫处理软件占用OS:任务调度不随话务负荷大小而变化,属于固有开销。其他如通信控制、存储器/处理机/进程/文件/时间管理等,与话务量有关,话务负荷越大,开销越大,属于非固有开销。呼叫处理软件:周期级程序,如各种扫描的开销不随话务负荷的大小而变化,属于固有开销;基本级程序,如各种分析处理的开销
18、与话务负荷有关,属于非固有开销。余量开销:处理机的占用率不设计成100(95),以备过负荷时需要北京邮电大学出版社7.3.4 呼叫类别和试呼的不同结果1、呼叫类别 A发端呼叫;B局内呼叫;C出局呼叫;D入中继呼叫; E入局呼叫;F汇接呼叫;G终端呼叫;H出中继呼叫。其中,A和D为原发呼叫量。因此 总呼叫量B+C+E+F=A+D北京邮电大学出版社2、成功呼叫和不成功呼叫成功呼叫:一次试呼就完成通话,否则就是不成功呼叫。来自用户线或入中继线的占用信号占用信号形成原发呼叫(A+D):(1)地址有效占用信号占用信号被交换机正确接收向被叫振铃。若被叫应答,可从下一级交换局收到应答信号或计次脉冲信号,试呼
19、成功;否则失败。(2)未接通或无效试呼主叫用户或对端交换机错误引起的试呼失败:主叫拨号或送信号(0.4s)超时;摘机不拨号或主叫放弃使拨号不全;主叫或对端局送出不存在的地址或非法号码;被叫用户引起的试呼失败:如被叫忙,被叫不应答。交换机引起的试呼失败:如交换网络阻塞;无空闲公用资源,如中继线等;系统故障。北京邮电大学出版社北京邮电大学出版社7.3.5 BHCA的测量 交换机的呼叫处理能力BHCA值的估算中,各种呼叫类型和呼叫结果所占的百分比,是随机和不准确的。一般采用模拟呼叫器,利用大话务量测试得到测量值(标准值)。须简化参数,规定:(1)一次试呼处理指一次完整的呼叫接续,即从摘机开始到通话、
20、挂机为止的一次成功呼叫,其他不成功呼叫不考虑。(2)只考虑最大原发话务量:我国规定,交换机局内用户(用户线):话务量最大为0.20Erl/用户,双向,(作为)发端呼叫和终端呼叫的话务量相等,即用户的原发话务量为0.1Erl/用户。入中继:话务量为0.70Erl/中继线。(3)每次呼叫平均占用时长:用户:拨号结束至第一声振铃不超过60s,否则送忙音,呼叫失败中继线:90s。 北京邮电大学出版社由A=Ct可得 BHCA用户=(0.11)/(60/3600)=6 次/小时BHCA中继线=(0.71)/(90/3600)=28 次/小时这就是要测量的标准值。交换机达到该值就算达到指标。测量BHCA时规
21、定的前提条件,实际情况往往不能满足:(1)假设试呼全是成功呼叫,平均一次呼叫占用时长60s,实际还有未成功试呼,占用时长小(如45s),系统开销少。使实际值比测试值高(2)测量时取最大原发话务量,实际小些,使实际值比测试值小;(3)接通率较高局,平均呼叫占用时长可能超过60s,使BHCA减少。我国规定测量呼叫的不成功概率不应大于万分之4.4。经调查,交换机BHCA实际值比测量值高2030,误差不大。北京邮电大学出版社过负荷控制1、测量BHCA时,只考虑完成的呼叫,BHCA值的特性曲线形成斜率为1的直线。假设某交换机提供的设计处理能力为10万次/hr,正常情况下应完成10万次/hr。2、若一个有
22、效时间周期内出现在交换设备上的话务负荷(呼叫次数)超过了控制系统的设计处理能力时,形成过负荷状态。北京邮电大学出版社3、为避免交换机处理能力大幅下降,当出现在交换设备上的呼叫次数超过设计能力的50%时,允许交换设备的呼叫处理能力下降至设计能力的90%,即BHCA不低于9万次/hr。4、不可接受区:分级限制某些用户的呼叫,终止相应的呼叫源;至少分为4级,每级限制25%的用户呼叫;限制顺序:从普通用户到优先级高的用户;过负荷程度下降时,逐步减少呼叫限制的用户数。北京邮电大学出版社7.3.7 呼叫处理能力的提高1.提高系统结构的合理性2.提高处理机本身处理能力3.设计高效率的操作系统4.提高软件设计
23、水平5.精心设计数据结构6.合理选用编程语言北京邮电大学出版社7.4 可靠性设计 可靠性指标衡量电路交换系统维持良好QoS的持久能力7.4.1 概述可靠性:系统在规定时间内和规定条件下完成规定功能的能力。可靠度:交换机设备/部件在规定时间内和规定条件下完成规定功能的成功概率成功概率。定量指标,对可维修系统,可靠度可以从三个角度来描述:北京邮电大学出版社1、系统的技术性能系统的平均故障间隔时间MTBF(Mean Time Between Failure):系统的正常运行时间,依赖于系统中各元器件正常工作的概率和系统的组成,通常所指的可靠度就是这个含义;失效率:单位时间内出现的失效次数,即失效速率
24、。时间函数,单位为1/hr(或hr-1)。对于大量电子元件构成的电子设备,系统稳定运行时,经过一段时间的老化后,失效率是个常数。对可维修系统,失效率也称故障率。失效率和平均故障间隔时间互为倒数时刻 t 的可靠度为 不可靠度为 F(t)=1-R(t)北京邮电大学出版社2、系统的维修性能系统的平均故障修复时间(MTTR,Mean Time to Repair):系统因故障而停止运行的时间。修复率:单位时间内修复的故障数,记做,单位为hr1系统稳定运行时接近常数。修复率和平均故障修复时间互为倒数维修度:对可维修系统,系统在规定的条件下和规定的时间内,完成维修而恢复到规定功能的概率。 时刻 t 的维修
25、度为3、系统的综合性能指标可用度A:对可维修系统,在规定时间内和规定条件下,完成规定功能的概率。常用。在系统稳定运行时和接近常数,不可用度U=1-A 北京邮电大学出版社7.4.2 可靠性指标预计对产品的可靠性指标,预计结果和所用数学模型的真实性和参数的真实性密切相关。预计时所用的参数大都是统计数据,实际应用条件与统计条件不尽相同,预计结果与真实结果相差50200都认为是正常的。常用通用元器件计数法。某系统由若干元器件组成,通过了解元器件的失效率来计算系统的失效率。式中:第i个通用元器件的通用失效率; 第i个通用元器件的质量系数; Ni 第i个通用元器件的数量; m 不同的通用元器件种类数。北京
26、邮电大学出版社7.4.3 降额设计系统的可靠性除了与元器件本身可靠性有关外,还和系统设计有关1、降额设计基本原理和应力降额:使元器件在低于额定值的应力条件下工作。合理的降额可大幅降低元器件的失效率。降额设计已成为电子设备可靠性保障设计的最有效方法之一。元器件的设计通常保证元器件使用时能承受一定的预定应力。 合格产品只有在各种应力的综合作用下才出现老化、失效。额定失效率:将大量元器件放在额定条件下工作可观察到一定的失效率。北京邮电大学出版社降额设计的理论基础:降低元器件所承受的应力可以显著地降低失效率。工作应力高于额定应力时,失效率增加,反之下降。同时,降额设计必须合理,降额不足或降额太大都会产
27、生不良后果。对产品有影响的应力:包括时间、温度、湿度、腐蚀、机械应力(直接负荷、冲击、振动)、电应力(电压、电流、功率)。元器件所受的应力是随机的。元器件在较高温下进行温度应力试验获得经验公式,温度每升高10左右,失效率增大一倍。电子元器件的工作电压过高就会产生击穿失效。设备的工作环境和寿命也有关系,固定环境下比移动或振动环境下寿命长。工艺也对可靠性产生影响,好的工艺比差的工艺可靠性高。北京邮电大学出版社2、常用元器件的降额设计电阻器寿命与工作功耗直接相关,电应力为功率应力,降额系数Sp取0.10.6,工作温度低于45电容器电应力为电压应力,降额系数Su0.6,工作温度低于50半导体器件如二极
28、管,电应力为电流应力,降额系数SI0.5,工作温度低于50电感元件电应力为电流应力,降额系数SI取0.60.7 ,工作温度低于50继电器接点工作电流的降额,如振铃继电器SI0.3接插件电流通过接点时,对接点寿命的影响,同继电器,如用户电路板开关同继电器北京邮电大学出版社7.4.4 系统可靠性模型从可靠性的角度出发用方框图描述系统与分系统间的逻辑关系。是可靠性数学模型的一种图形表示。独立:系统中的事件(故障或正常运行) 的发生与否相互均不产生影响,否则就是相关。北京邮电大学出版社1、独立串联系统独立串联结构较多见。由分系统S1.Sn串联组成,任一分系统故障则系统失效。由概率的乘法定理,所有分系统
29、都正常,系统才正常的概率等于所有分系统正常的概率的乘积,即系统的可靠度为其中,分系统的失效率i等于常数 。因此,系统失效率为系统的平均故障间隔时间为北京邮电大学出版社2、独立并联系统和表决系统当所有分系统都坏时,系统才坏。根据概率的乘法定理,系统的不可靠度等于所有分系统不可靠度的乘积,即 或北京邮电大学出版社表决系统可靠度相同的n个分系统,只要有k个(kn)分系统正常时,系统就正常,构成(n,k)系统结构。例如常见的三中取二的(3,2)表决系统,n=3,k=2。根据概率的加法定理,系统正常的概率即可靠度为 Rs=3R2-2R3 , MTBFs=5MTBF/6 (3,2)表决系统中,系统的MTB
30、Fs要比单个分系统低。这是因为3个分系统同时工作时,至少要有2个是好的,等效为2个分系统的串联结构。分系统的可靠度R=0.5时,表决系统的可靠度Rs=0.5分系统的可靠度R0.5时,表决系统的可靠度Rs R ,可靠度提高北京邮电大学出版社3、简单的混合系统:可等效为独立串联和独立并联的混合结构4、复杂系统:各分系统间的关系不能等效为串联和并联结构的组合北京邮电大学出版社7.4.5 马尔科夫过程前面讨论可靠性时假定系统元器件是互相独立的。如果元器件是相互依赖的或可修复的情况,则由于修复本身也包含随机因素,问题就要复杂得多。在失效率和修复率为常数时,常用马尔科夫过程求解。马尔科夫过程:对于某个可重
31、复实验,如果现在的试验结果只和过去有限次试验有关,而与此前的经过无关。简单的马尔科夫过程:现在的状态仅与前一个状态有关的马尔科夫过程。既简单又有足够精度,通常用于对可维修系统进行分析。马尔科夫过程是随机过程,可用状态转移图描述。 北京邮电大学出版社 假设,某程控交换机有2台处理机并联工作,构成三个状态:0态:两台设备都正常工作的系统状态;1态:一台设备工作,另一台设备故障的系统状态;2态:两台设备都故障的状态。对应简单的马尔科夫过程: 在状态转移过程中,假设任何一个状态只与相邻的前一状态和后一状态有关,把跨越一个和两个以上的状态,即同时两台设备故障或同时两台维修的概率看作为零。北京邮电大学出版
32、社圆圈表示状态,标号为状态符号,箭头表示从状态的转移。和分别为状态转移的失效率和修复率。 两台相同设备并联的系统状态转移图如下:自循环:0态的总失效率为2,环状箭头表示该状态无转移。自循环转移概率转移概率:该状态下箭头向外指向的转移之和取负号。根据状态转移图可直接写出微分转移矩阵。北京邮电大学出版社7.4.6 可维修系统的可靠性指标的计算程控交换机是可维修系统,系统可以从设备损坏的故障状态经过维修,以一定修复概率使系统转移到正常状态。这种状态转移过程可用马尔科夫过程计算。首先确定系统可能存在的各种状态,列出微分转移矩阵,求解各状态的概率,最后算出系统的可用度。可维修系统中,系统的故障概率服从指
33、数分布,修复的概率也近似服从指数分布,若多台设备从0态到m态正常工作,A(t)为可维修系统的可用度; Pi(t)是系统能正常工作状态的概率则, 北京邮电大学出版社1、单一系统1台设备有两种状态:0-工作状态,1-故障状态。当时间 时得,A()=/(+)=MTBF/(MTBF+MTTR)稳定状定状态可用度或系可用度或系统的固有可用度的固有可用度:系统处于长期连续工作状态时的可用度。北京邮电大学出版社2、串联系统设在由两个分系统(设备)串联的系统中,两个分系统的失效率和维修率相等,分别为近似常数的和。当时,可得系统的固有可用度若有n台相同设备串联时,稳定状态可用度北京邮电大学出版社3、等待系统等待
34、系统中两台设备处于主主/备用备用工作方式,对程控交换系统,通常备用机处于通电状态,即热备用工作方式,由于通电、振动和高温影响,备用机在备用状态时的失效率0。双机倒换时数据丢失者为冷备用,不丢失者为热备用。程控交换机控制系统从可靠性角度看都是热备用。设主用机的失效率为1,备用机的失效率为2。1、2时,1=2=时,4、并联系统两台相同设备并联,时,北京邮电大学出版社7.4.7 程控交换系统的特点及其可靠性指标的计算 与一般电子设备相比,程控交换机除了作为一台计算机控制的电子设备具有一般电子设备的特点之外,还具有大量用户线和中继线等外围设备,要考虑系统中断时还处于呼叫状态的用户线和中继线的数据失效问
35、题、单个用户线或中继线的失效概率。程控交换系统的可靠性指标需考虑:用户线中断(交换网络)中继线中断(交换网络);系统中断(CPU、电源):北京邮电大学出版社1、单个用户线中断时间:评价用户使用电话(单条电话线)的可靠性,相当于用户线的不可用度U。用每一实装用户线平均一年中的服务中断时间表示,以小时计算,1年365天共8760小时:其中,n-用户线一年中断次数Ny-交换机在一年中实装用户线的平均数ki-第i次故障造成中断的用户数Ri-第i次故障的修复时间,即中断时间(小时) 2、单个中继线中断时间:计算一年内单个中继线服务中断平均时间,与用户线相似。北京邮电大学出版社3、系统中断:常用系统中断的
36、概率,即若干年(或一年)时间内平均系统中断时间不超过若干小时(或分钟)来评价换系统的可靠性。可维修系统的不可用度U:系统的总失效率s不可用度Us=1-A=s/(s+s)是单位时间单位时间内系统失效(系统中断)的概率。如果单位时间扩展到20年,可算出20年中的小时数为(15365十5366)24=175320hr,即可算出20年内系统中断时间一般要求局用电路交换机的系统中断时间在一年内不超过3min,20年内不超过1hr。例,假设某交换系统中,平均故障间隔时间MTBFs=104hr 失效率s=1/MTBFs=10-4hr-1;平均故障维修时间MTTRs=1hr 修复率s=1/MTTRs=1hr-
37、1 ss U=s/(s+s)= 10-4(0)折合20年内系统中断时间为t20=10-4175320=17.53hr。北京邮电大学出版社 交换系统包含许多部件,如用户电路、中继电路、交换网络、信号设备及控制部件(CPU)等,等效为串并联的简单混合系统:用户电路、中继电路、交换网络等包含多套设备,只有在全部设备发生故障时才引起系统中断,属于并联结构。不同部件之间的组合属于串联结构。计算可靠性参数时要考虑各部件的失效率,即其中,i系统中部件i的失效率;n系统中部件的总数。交换机s =CPU+交换网络+用户电路+中继器+信号电路+对并联系统,一般随着并联部件的增加,等效不可用度按幂次下降。所以并联系
38、统的等效失效率占系统总失效率的比例很小。对总失效率起重要影响的是单套设备(如CPU,电源等)的失效率。尤其是CPU,不同的组合方式和工作方式直接影响系统的可靠性北京邮电大学出版社4、CPU(控制部件)可靠性指标的计算(1)单CPU系统(集中控制)对单机系统,CPU的可靠性参数可通过通用元器件计数法估算再考虑降额使用的各种应力所产生失效率降低的倍数。例如,某CPU的总失效率为CPU=10-3 ;修复率CPU=1不可用度 UCPU=CPU/(CPU+CPU)= 10-3折合20年内CPU中断服务时间为t20=10-3175320=175hr 北京邮电大学出版社(2)双CPU系统可靠性参数计算(集中
39、控制)为提高CPU的可靠性,程控交换机常采用双机结构。假设自动故障诊断时间和维修(换板)时间相对较小,其间产生第二套(备用) CPU故障的概率为0,且不考虑双机监测和倒换设备的可靠性。话务分担方式:2个CPU成为并联结构。 可用度 不可用度U话=1-A话=2(单/单)2=2(10-3/1)2=210-6; 折合20年内系统中断时间 t20=210-6175320=0.34h。各种主备用方式:两台CPU组成等待系统。 不可用度U主备=1-A主备=2(单/单)2=2(10-3/1)2=210-6;折合20年内系统中断时间 t20=210-6175320=0.34h。考虑双机倒换、CPU间通信和监视
40、设备的可靠性时,实际的t20值还要高。北京邮电大学出版社(3)分散控制系统的可靠性计算全部(100)用户服务中断算作系统中断: 从可靠性模型来看,是n个CPU并联结构。时 单个模块/单一设备:2个模块/双套CPU:3个模块/2套CPU:4个模块/4套CPU: =24(10-3/1)3=2410-9;t20=4.210-3hr 分散控制系统的可靠性较高。分散控制,CPU间通信增多了,将在软件和硬件上降低可靠性。分散控制是一个CPU只控制一个模块,而集中控制CPU控制一个系统,一个模块的控制部件比较简单。这一因素能提高可靠性指标认为部分用户服务中断即是系统中断:考虑部分用户的百分比,应该具体分析,
41、与分散系统由几个模块组成有关。北京邮电大学出版社7.4.8 软件可靠性1、软件故障主要是设计及实现阶段由人为因素所产生的缺陷和错误造成的。与硬件故障有本质区别,以上讨论不适合软件可靠性指标计算。2、软件错误分类语法错误和语义错误运行时错误规范错误性能错误3、提高软件可靠性的途径软件复杂度,包括软件正确运行所需时间及其所占空间,和软件测试技术 北京邮电大学出版社7.4.9 容错技术为提高程控交换系统软件的可靠性,主要采用避错技术和容错技术。硬件避错:尽量减少硬件故障的发生概率,减小系统失效率。主要方法是选用高可靠高集成度器件,提高可靠性设计水平,提高耐环境设计和严格质量控制。软件避错:包括寻求高
42、可靠软件的程序设计方法,如结构化程序设计和提高软件测试技巧以排除软件内隐藏的错误。硬件容错:用额外的冗余掩盖故障的影响1.硬件-备用2.时间-校验,同一任务执行两次软件冗余:尚不成熟北京邮电大学出版社华为C&C08交换机的可靠性指标:可用度A=99.99938%,系统年平均中断时间t1=3.285 分钟平均无故障运行时间MTBF=79955小时(3331 天)。(1)分布式系统结构,采用单板的主备份、负荷分担、冗余配置等可靠性设计方法,确保系统高可靠运行。(2)整机低功耗设计,单板部件的功耗小,有效延长单板器件的使用寿命(3)提供任务监控、数据校验、存储保护等软件设计,提高软件容错能力(4)系统处理能力高,在系统忙时呼叫次数再增加100%的设计冗余。有效预防瞬间大话务量的冲击。(5) 对局部的或系统性的拥塞进行自动话务控制,提高了系统在大话务量冲击下的自愈能力。(6)BAM业务活动监视服务器:数据库功能;连接交换机和维护终端,各维护终端是整个结构中的客户端。采用专用防护工具,有效地防止病毒的入侵,并有告警检测功能。北京邮电大学出版社