可靠性-基础知识
2. 可靠性物理基本知识和基本概念2.1 可靠性的基本理论知识 可靠性的概念可靠性的概念,可以说,自古以来从人类开始使用工具起就已经存在然而可靠性理论作为一门独立的学科出现却是近几十年的事可靠性归根结底研究的还是产品的可靠性,而通常所说的“可靠性”指的是“可信赖的”或“可信任的” 一台仪器设备,当人们要求它工作时,它就能工作,则说它是可靠的;而当人们要求它工作时,它有时工作,有时不工作,则称它是不可靠的最早的可靠性定义由美国AGREE在1957年的报告中提出,1966年美国的MIL-STD-721B又较正规地给出了传统的或经典的可靠性定义:“产品在规定的条件下和规定的时间内完成规定功能的能力”它为世界各国的标准所引证,我国的GB318-82给出的可靠性定义也与此相同 [3]赵海波这里的产品是泛指的,它可以是一个复杂的系统,也可以是一个零件出厂检验合格的产品,在使用寿命期内保持其产品质量指标的数值而不致失效,这就是可靠性问题因此,可靠性也是产品的一个质量指标,而且是与时间有关的参量只有在引进了可靠性指标后,才能和其它质量指标一起,对产品质量作全面的评定所谓产品是指作为单独研究和分别试验对象的任何元件、设备或系统,可以是零件也可以是由它们装配而成的机器,或由许多机器组成的机组和成套设备,甚至还把人的作用也包括在内。
在具体使用“产品”这一词时,其确切含义应加以说明例如汽车板簧、汽车发动机、汽车整车等从定义可以看出,产品的可靠性是与“规定的条件”分不开的这里所讲的规定条件包括产品使用时的应力条件(温度、压力、振动、冲击等载荷条件)、环境条件(地域、气候、介质等)和贮存条件等规定的条件不同,产品的可靠性是不同的产品的可靠性又与“规定的时间”密切相关一般说来,经过零件筛选、整机调试和跑合后,产品的可靠性水平会有一个较长的稳定使用或贮存阶段,以后随着时间的增长其可靠性水平逐渐降低产品的可靠性还和“规定的功能”有密切的联系一个产品往往具有若干项技术指标定义中所说的“规定功能”是指产品若干功能的全体,而不是其中的一部分在实际工作中,产品往往由于各种偶然因家而发生故障,如零件的突然失效,应力突然改变,维护或使用不当等由于这些原因都具有偶然性,所以对于一个具体产品来说,在规定的条件下和规定的时间内,能否完成规定的功能是无法事先知道的也就是说,这是一个随机事件但是,大量的随机事件中包含着一定的规律性,偶然事件中包含着必然性我们虽然不能知道发生故障的确切时刻,但是可以估计在某时间段内,产品完成规定功能的能力大小因此,应用概率论与数理统计方法对产品的可靠性进行定量计算是可靠性理论的基础。
包括下列四要素:(1)规定条件:一般指的是使用条件,环境条件包括应力温度、湿度、尘砂、腐蚀等,也包括操作技术、维修方法等条件对于汽车来说,主要有公路条件、气候条件和行使速度;对于显示器来说,环境条件、供电条件和工作条件,比如:开机时间比、待机时间比、关机时间比等参数2)规定时间:是可靠性区别于产品其他质量属性的重要特征,一般也可认为可靠性是产品功能在时间上的稳定程度因此以数学形式表示的可靠性各特征量都是时间的函数这里的时间概念不限于一般的年、月、日、分、秒,也可以是与时间成比例的次数、距离例如应力循环次数、汽车行驶里程3)规定功能:要明确具体产品的功能是什么,怎样才算是完成规定功能产品丧失规定功能称为失效,对可修复产品通常也称为故障怎样才算是失效或故障,有时很容易判定,但更多情况则很难判定当产品指的是某个螺栓,显然螺栓断裂就是失效;当产品指的是某个设备,对某个零件损坏而该设备仍能完成规定功能就不能算失效或故障,有时虽有某些零件损坏或松脱,但在规定的短时间内可容易地修复也可不算是失效或故障若产品指的是某个具有性能指标要求的机器,当性能下降到规定的指标后,虽然仍能继续运转,但已应算是失效或故障。
究竟怎样算是失效或故障,有时要涉及厂商与用户不同看法的协商,有时要涉及当时的技术水平和经济政策等而作出合理的规定4)能力:只是定性的理解是比较抽象的,为了衡量检验,后面将加以定量描述产品的失效或故障均具有偶然性,一个产品在某段时间内的工作情况并不很好地反映该产品可靠性的高低,而应该观察大量该种产品的工作情况并进行合理的处理后才能正确的反映该产品的可靠性,因此对能力的定量需用概率和数理统计的方法 造成故障的主要原因 下图为造成产品故障的主要原因由该图可知,造成故障的的主要原因为设计、制造和管理等因素,其它原因很少产品的故障设计69%制造10%管理13%其它7 %下图为造成产品故障的因素分布该图来自于美国RAC的可靠性数据库,由该图可知元器件故障不再是造成产品故障的主要原因2.1.3 可靠性术语可靠性 reliability 产品在规定条件下和规定时间内,完成规定功能的能力 维修性 maintainability 在规定条件下使用的产品在规定的时间内,按规定的程序和方法进行维修时,保持或恢复到能完成规定功能的能力 有效性 availability 可以维修的产品在某时刻具有或维持规定功能的能力。
耐久性 durability 产品在规定的使用和维修条件下,达到某种技术或经济指标极限时,完成规定功能的能力 失效(故障) failure 产品丧失规定的功能对可修复产品通常也称故障 失效模式 failure mode 失效的表现形式 ]失效机理 failure mechanism 引起失效的物理、化学变化等内在原因 误用失效 misuse failure 不按规定条件使用产品而引起的失效 本质失效 Inherent weakness failure 产品在规定的条件下使用,由于产品本身固有的弱点而引起的失效 早期失效 early failure 产品由于设计制造上的缺陷等原因而发生的失效 偶然失效 random failure 产品由于偶然因素发生的失效 耗损失效 wear out failure 产品由个老化、磨损、损耗、疲劳等原因引起的失效 维修 maintenance 为保持或恢复产品能完成规定功能的能力而采取的技术管理措施 维护 preventlive maintenance 为防止产品性能退化或降低产品失效的概率,按事前规定的计划或相应技术条件的规定进行的维修,也可称预防性维修。
修理 corrective maintenance 产品失效后,为使产品恢复到能完成规定功能而进行的维修 可靠度 reliability 产品在规定的条件下和规定的时间内,完成规定功能的概率 可靠度的观测值 observed reliability a.对于不可修复的产品,是指直到规定的时间区间终了为止,能完成规定功能的产品数与在该时间区间开始时刻投入工作的产品数之比 b.对于可修复产品是指一个或多个产品的无故障工作时间达到或超过规定时间的次数与观察时间内无故障工作的总次数之比 注:在计算无故障工作总次数时,每个产品的最后一次无故障工作时间若不超过规定的时间则不予计人 累积失效概率 cumulative failure probability 产品在规定的条件下和规定的时间内失效的概率,其数值等于一减可靠度 累积失效概率的观测值 observed cumulative failure probability 对于不可修复和可修复的产品都等于一减可靠度的观测值 平均寿命(平均无故障工作时间) mean life(mean time between failures) 寿命(无故障工作时间)的平均值。
平均寿命(平均无故障工作时间)的观测值 observed mean life(observed mean time between failures) a.对于不可修复的产品,当所有试验样品都观察到寿命终了的实际值时,是指它们的算术中均值;当不是所有试验样品都观测到寿命终了的截尾试验时是指受试样品的累积试验时间与失效数之比 b.对可修复的产品,是指一个或多个产品在它的使用寿命期内的某个观察期间累积工作时间与故障次数之比 失效率 failure rate 工作到某时刻尚未失效的产品,在该时刻后单位时间内发生失效的概率 失效率的观测值 observed failure rate 在某时刻后单位时间内失效的产品数与工作到该时刻尚未失效的产品数之比 平均失效率的观测值 observed mean failure rate a.对于不可修复的产品是指在一个规定时期内失效数与累积工作时间之比 b.对于可修复的产品是指它的使用寿命期内的某个观察期间一个或多个产品的故障发生次数与累积工作时间之比 维修度 maintainability 在规定条件下使用的产品,在规定时间内按照规定的程序和方法进行维修时,保持或恢到能完成规定功能状态的概率。
平均修复时间 mean repair time 修复时间的平均值 平均修复时间的观测值 observed mean repair time 修复时间的总和与修理次数之比 修复率 repair rate 修理时间已达到某个时刻但尚未修复的产品,在该时刻后的单位时间内完成修理的概率 平均修复率的观测值 observed mean repair time 在某观察期内完成修理的概率 维修度 maintainability 在规定条件下使用的产品,在规定时间内按照规定的程序和方法进行维修时,保持或恢复到能完成规定功能状态的概率 平均修复时间 mean repair time 修复时间的平均值 平均修复时间的观测值 observed mean repair time 修复时间的总和与修理次数之比 修复率 repair rate 修理时间已达到某个时刻但尚未修复的产品,在该时刻后的单位时间内完成修理的概率 平均修复率的观测值 observed mean repair time 在某观察期内完成修理的概率 耐久性试验 endurance test 为考察产品的性能与所加的应力条件的影响关系而在一定时间内所进行的试验。
寿命试验 life test 为评价分析产品的寿命特征量而进行的试验 可靠性验证试验 reliability compliance test 为确定产品的可靠性特征量是否达到所要求的水中而进行的试验 可靠性测定试验 reliability determination test 为确定产品的可靠性特征量的数值而进行的试验 实验室可靠性试验 laboratory reliability test 在规定的可控条件下进行的可靠性验证或测定试验试验条件可以模拟现场条件,也可与现场条件不同 现场可靠性试验 field reliability test 在现场使用条件下进行的可靠性验证或测定试验 筛选试验 screening test 为选择具有一定特性的产品或剔除早期失效而进行的试验 恒定应力试验 constant stress test 应力保持不变的试验 步进应力试验 step stress test 随时间分阶段逐步增大应力的试验 序进应力试验 progressive stress test 随时间等速增大应力的试验。
加速试验 accelerated test 为缩短试验时间,在不改变失效机理的条件下,用加大应力的方法进行的试验 冗余 redundancy 产品所包含的为完成规定功能所必不可少的组成部分元件的成分(包括硬件或软件)当冗余为硬件时也称贮备 串联 series 组成系统的所有单元中任一单元的失效就会导致整个系统失效的逻辑关系 串联系统 series system 组成系统的所有单元中任一单元的失效就会导致整个系统失效的系统 并联 parallel 组成系统的所有单元都失效时才失效的逻辑关系 并联系统 parallel system 组成系统的所有单元都失效时才失效的系统 表决系统 K-out-of-n system(voting system) 组成系统的n个单元中,不失效的单元数不少于k(k介于1和n之间的某个数),系统就不会失效的系统,又称k/n系统 旁联系统 standby system 组成系统的n个单元中只有一个单元工作,当 工作单元失效时通过失效监测装置及转换装置接到另一个单元进行工作的系统 失效模式、效应及后果分析 failure mode effect and criticality analysis 在系统设计过程中,通过对系统各组成单元潜在的各种失效模式及其对系统功能的影响,与产生后果的严重程度进行分析,提出可能采取的预防改进措施,以提高产品可靠性的一种设计分析方法。
失效树分析 failt tree analysis 在系统设计过程中,通过对可能造成系统失效的各种因素(包括硬件、软件、环境、人均因素)进行分析,画出逻辑框图(即失效树),从而确定系统失效原因的各种可能组合方式或及其发生概率,以计算系统失效概率,采取相应的纠正措施,以提高系统可靠性的一种设计分析方法 安全性 fail safe 在设计时为使产品失效不致引起人身物质等重大损失而采取的预防措施 可靠性计划 reliability programm 产品的研制、生产、使用计划的一个重要组成部分,它包括为使产品达到预定的可靠性指标,在研制、生产、使用各阶段的任务内容、进度要求、保障条件及为实施计划的组织、技术措施等可靠性增长 reliability growth 随着产品设计、研制、生产各阶段工作的逐渐进行,产品的可靠性特征量逐步提高的过程 可靠性认证 reliability certification 有可靠性要求的产品的质量认证的一个组成部分它是由生产方和使用方以外的第三方,通过对生产方的可靠性组织及其管理和产品的技术文件进行审查,对产品进行可靠性试验,以确定产品是否达到所要求的可靠性水平2.2 可靠性参数体系可靠性参数用于定量地描述产品的可靠性水平和故障强度,可靠性参数体系完整地表达了产品的可靠性特征。
可靠性工程中使用的可靠性参数多达数十个,参数的使用随着工程对象或者装备类型的不同而变化,在同一种装备中还可能随着产品层次的不同而不同系统级的可靠性参数一般以可靠度为主;设备级的可靠性参数一般以MTBF为主在实际应用中人们逐步感到了传统的可靠性定义的局限性,因为它只反映了任务成功的能力在进行可靠性设计时需要综合权衡完成规定功能和减少用户费用两个方面的需求,于是美国于1980年颁发的MIL-STD-785B按照DODD5000.40指令(国防重要武器系统采办指令)将可靠性分为基本可靠性和任务可靠性把可靠性概念分为两种不同用途的可靠性概念,是美国国防部对可靠性工作实践经验总结和对这一问题认识的深化这无疑是一个新的重要发展我国1988年颁布的军标GJB450-88就引用这两种新的可靠性定义基本可靠性的定义:“产品在规定条件下,无故障的持续时间或概率”它包括了全寿命单位的全部故障,它能反映产品对维修人力和后勤保障资源的需求确定基本可靠性指标时应同几产品的所有寿命单位和所有的故障例加MTBF(平均无故障间隔时间),MCBF(平均故障间的使用次数),MTBM(Mean Time Between Maintenance,平均维修间隔时间,一种与维修方针有关的可靠性参数,其度量方法为:在规定的条件下和规定的时间内产品寿命单位总数与该产品计划和非计划维修时间总数之比)。
任务可靠性的定义:“产品在规定的任务剖面内完成规定功能的能力”它反映了产品的执行任务成功的概率,它只统计危及任务成功的致命故障常见的任务可靠性参数有任务可靠性,MCSP(Mission Completion Success Probability,完成任务的成功概率,其度量方法为:在规定的条件下和规定的时间内系统完成规定任务的概率),MTBCF(Mission Time Between Critical Failure,致命故障间的任务时间,其度量方法为:在规定的一系列任务剖面中,产品任务总时间与致命性故障数之比)等 可靠性参数还可分为使用参数和合同参数使用可靠性参数及指标反映了系统及其保障因素在计划的使用和照章环境中的可靠性要求,它是从最终用户的角度来评价产品的可靠性水平的,如MCSP,MTBM等合同可靠性参数及其指标反映了合同中使用的易于考核度量的可靠性要求,它更多的是从产品制造方的角度来评价产品的可靠性水平,如MTBF,MTBCF等一般合同可靠性参数采用固有可靠性值固有可靠性是指产品从设计到制造整个过程中所确定了的内在可靠性一般使用可靠性指标都采用使用可靠性值使用可靠性在固有可靠性的基础上还考虑了使用、维护对产品可靠性的影响,包括使用维护方法和程序,以及操作人员的技术熟练程度等。
可靠性参数体系要完整全面,例如洗衣机产品的可靠性参数体系要包括:MTBF(小时)和MTBF(次)可靠性指标是规定要达到的可靠性参数值,例如要求洗衣机达到MTBF为5000小时,则5000小时为该洗衣机的MTBF指标;可靠性指标分为目标值和最低可接受值两类2.3 常用可靠性参数产品一般都有多个可靠性参数描述衡量产品可靠性水平有好几种标准,有定量的,也有定性的,有时要用几种标准(指标)去度量一种产品的可靠性, 下面根据GB3187-82和有关IEC标准,介绍最基本、最常用的几个可靠性特征量 寿命剖面、任务剖面与故障判据寿命剖面的定义为:产品从制造到寿命终结或退出使用这段时间内所经历的全部事件和环境的时序描述寿命剖面说明了产品在整个寿命期所经历的事件(如装卸、运输、贮存、检测、维修、部署、执行任务等)以及每个事件的顺序、持续时间、环境和工作方式它包含一个或多个任务剖面任务剖面的定义:产品在完成规定任务这段时间内所经历的事件和环境的时序描述对于完成一种或多种任务的产品都应制定一种或多种任务剖面任务剖面一般应包括:(1)产品的工作状态;(2)维修方案;(3)产品工作的时间与顺序;(4)产品所处环境的时间与顺序;(5)任务成功或致命故障的定义。
寿命剖面和任务剖面在产品指标论证时就应提出精确地和比较完整地确定产品的任务事件和预期的使用环境,实际进行正确的系统可靠性设计分析的基础故障判据:判别是否发生故障的依据故障判据应该分级:1)从安全性考虑—不导致危险;2)从基本功能考虑—保持基本功能;3)从附加功能考虑—保持附加功能任何产品只要有可靠性要求就必须有故障判据故障判据需要根据下面的依据进行确定1)研制任务书;2)技术要求说明书;3)由可靠性人员制定 可靠度可靠度就是在规定的时间内和规定的条件下系统完成规定功能的成功概率一般记为R它是时间的函数,故也记为R(t),称为可靠性函数如果用随机变量T表示产品从开始工作到发生失效或故障的时间,其概率密度为f(t)如上图所示,若用t表示某一指定时刻,则该产品在该时刻的可靠性 对于不可修复的产品,可靠性的观测值是指直到规定的时间区间终了为止,能完成规定功能的产品数与在该区间开始时投入工作产品数之比,即式中:N——开始投入工作产品数;Ns(t)——到t时刻完成规定功能产品数,即残存数;Nf(t)——到t时刻未完成规定功能产品数,即失效数对于可修复的产品,仍可以用上面这个公式来描述举例:某型号的10000手机在一年共有10部次发生了功能性故障(不能正常使用部),该型号手机在一年内的可靠度为:R(1)=(10000-10)/10000 =0.999。
伴随可靠度的还有可用度,可用度的概念是-A (t),在规定时间t内的任意随机时刻, 产品处于可用状态的概率用下式表示: 失效率(故障率)及浴盆曲线 通俗的讲,失效率是工作到某时刻尚未失效的产品,在该时刻后单位时间内发生失效的概率失效率为系统运行到t时刻后单位时间内,发生故障的系统数与时刻t时完好系统数之比失效率有时也称为瞬时失效率或简单地称为故障率一般记为λ,它也是时间t的函数,故也记为λ(t),称为失效率函数,有时也称为故障率函数或风险函数 按上述定义,失效率是在时刻t尚未失效产品在t+△t的单位时间内发生失效的条件概率即: 它反映t时刻失效的速率,也称为瞬时失效率 失效率的观测值是在某时刻后单位时间内失效的产品数与工作到该时刻尚未失效的产品数之比,即 式中: Δr(t)— t时刻后, Δt时间内故障的产品数;Δt—所取时间间隔; Ns(t)—残存产品数通常:故障次数除以总工作时间;单位一般为10-6/小时或10-9/小时(fit)失效率(或故障率)曲线反映产品总体个寿命期失效率的情况图示2-4-5为失效率曲线的典型情况,大多数产品的故障率随时间的变化曲线形似浴盆,故称之为浴盆曲线形象地称为浴盆曲线。
失效率随时间变化可分为三段时期: 图2-4-5失效率典型曲线(浴盆曲线)① 早期失效期(Infant Mortality) ,失效率曲线为递减型产品投入使用的早期,失效率较高而下降很快主要由于设计、制造、贮存、运输等形成的缺陷,以及调试、跑合、起动不当等人为因素所造成的当这些所谓先天不良的失效后且运转也逐渐正常,则失效率就趋于稳定,到t0时失效率曲线已开始变平t0以前称为早期失效期针对早期失效期的失效原因,应该尽量设法避免,争取失效率低且t0短② 偶然失效期,也称随机失效期 (Random Failures) 失效率曲线为恒定型,即t0到ti间的失效率近似为常数失效主要由非预期的过载、误操作、意外的天灾以及一些尚不清楚的偶然因素所造成由于失效原因多属偶然,故称为偶然失效期偶然失效期是能有效工作的时期,这段时间称为有效寿命为降低偶然失效期的失效率而增长有效寿命,应注意提高产品的质量,精心使用维护加大零件截面尺寸可使抗非预期过戴的能力增大,从而使失效率显著下降,然而过份地加大,将使产品笨重,不以济,往往也不允许③ 耗损失效期(Wearout),失效率是递增型。
在t1以后失效率上升较快,这是由于产品已经老化、疲劳、磨损、蠕变、腐蚀等所谓有耗损的原因所引起的,故称为耗损失效期 针对耗损失效的原因,应该注意检查、监控、预测耗损开始的时间,提前维修,使失效率仍不上升,如图4-3-1中虚线所示,以延长寿命不多当然,修复若需花很大费用而延长寿命不多,则不如报废更为经济5】王小栋2.3.4 平均寿命平均寿命是寿命的平均值,对不可修复产品常用失效前平均时间,也叫平均首次故障时间,一般记为MTTF(Mean Time to Failures),对可修复产品则常用平均无故障工作时间,也叫平均故障间隔时间,一般记为MTBF平均无故障工作时间 MTBF(Mean Time Between Failure) ;是指相邻两次故障之间的平均工作时间,也称为平均故障间隔它仅适用于可维修产品同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为 MTBF MTBF= 总的工作时间 / 故障数 =1/λ付宁宁MTTF和MTBF都表示无故障工作时间T的期望E(T)或简记为t两个参数的计算没有区别,下文只提到MTBFMTBF越大,说明产品的可靠性越高如已知T的概率密度函数f(t),则 =E(T)=经分步积分后也可求得: = 可靠寿命 可靠寿命是给定的可靠性所对应的时间,一般记为t(R)。
如图所示,一般可靠性随着工作时间t的增大而下降,对给定的不同R,则有不同的t(R),即t(R)=R-1(R);式中R-1——R的反函数,即由R(t)=R反求t 累积失效概率累积失效概率表示电子元器件产品在规定条件下工作到t这段时间内的失效概率,用F(t)表示,又称为失效分布函数,其表达式为 F(t)=P(T≤t)如果N个电子元器件产品从开始工作到t时刻的失效数为你(t),则当N足够大时,产品在该时刻的累积失效概率可近似表示为 F(t)≈显然,R(t)+F(t)=1电子产品属于可维修的产品,其失效率λ一般为定值,知道了λ,就可以找到产品连续工作了t时间后还正常的概率为R(t)=e-t,此时已经失效的概率为F(t)=1-R(t)=1-e-tR(t)=e-t是一个经验公式,一般电子产品的寿命服从这一指数分布 常见的寿命特征描述可靠寿命:制定可靠度对应的产品工作时间;使用寿命:具有可接受的故障率的工作时间区间;大修期;总寿命:开始使用到报废(可能经过好几次大修);贮存寿命:贮存的日历持续时间;首保期:质量保证期。
2.3.8 其它典型的可靠性参数(1)BX 寿命( B10 寿命、B5寿命)B10寿命:产品出厂后,工作到T时间后,有10%的产品发生了耗损故障(关键部件的更换),则T为B10寿命,非电类产品一般采用BX寿命描述2)任务成功率:执行任务S次,有N次成功,则N/S为任务成功率常用于非寿命类产品,如开关类等3)非正常停机率:在S工作小时内有N次非正常停机,则N/S为非正常停机率常用于电子、电力设备以及发动机类产品2.3.9 可靠性特征量间的关系可靠性特征量中可靠度R(t),累积失效率(也叫不可靠性)F(t)、概率密度f(t)和失效率λ(t)是四个基本函数,只要知道其中一个,则所有变量均可求得.基本函数间的关系如下表:可靠性特征量R(t)F(t)f(t)λ(t)R(t)(可靠性)-1-F(t)F(t)(累积失效率)1-R(t)-f(t)(概率密度)-λ(t)(失效率)- 表2-5-1可靠性参数之间的关系: 典型产品的可靠性参数体系1)飞机:军用飞机:可靠度、MTBHF、MCSP、空中停车率等;民用飞机:可靠度、空中停车率、机械原因延误率、机械原因返航率、机械原因取消率、空中停车率等。
2) 导弹:可靠度:贮存可靠度、发射可靠度、飞行可靠度、引爆可靠度等3) 汽车:平均首次故障时间MTTF(公里)、平均故障间隔时间MTBF(公里)、B10寿命小例子:某洗衣机在1999年的广告中称其MTBF为5000小时, 问:假设有1000台洗衣机,大概有多少台工作到5000小时不坏?90%的可靠寿命是多少? 答案:首先计算失效率λ(t),该参数为MTBF的倒数,即0.02%,然后计算可靠度R(5000)=e-0.02%×5000=e-1=0.3679,即36.79%故1000台工作到5000小时大概有368台不坏B10寿命为526.8,即526.8小时2.4 可靠性常用分布2.4.1 概率与统计基础 .1 概率与统计定义 (1)概率的古典定义如果某一试验的全部可能结果为n个,且每个结果都具有等可能性和互不相容性,而其中对应于A的结果是m个,则事件A发生的概率为 例10 有50件产品,合格品数是48件,令从这批产品中“任取一件是合格品”为事件A,则在这批产品中任取一件是合格品的概率为P(A)=48/50=96%此外,由于必然事件包括了所有基本事件,设其用U表示,则可用概率的观点作如下解释:而不可能事件不包含任何基本事件,设其用V表示,也可用概率的观点作如下解释:随机事件A所含基本事件数m必然满足不等式0≤m≤n,所以0≤P(A)≤1(2)概率的统计定义由概率的古典定义可见,它要求事件数是有限的,且要求事件的发生是等可能的。
但许多实际问题不具备这种性质例如英文书籍中26个字母出现的可能性就很不相同,字母“e”就比字母“z”出现的可能性大得多又如某流域的年降雨量可以取某一区间的任意实数值,这就不能满足有限结果的要求但是这些事件仍有其本身的规律性只要进行大量重复的试验,就会发现许多随机事件是随着试验次数的不断增加而趋近于某一稳定值由此可引入概率的统计定义设n次重复试验中,事件A出现f次,则称f为事件A出现的频数,称为事件A出现的频率:定义:当试验次数n足够大时,事件A出现的频率渐趋于一个稳定值P(A),则称这一稳定值P(A)为事件A发生的统计概率,记为.2 概率分布的概念 (1)随机变量实际工程中往往需要通过试验或现场的运行记录来收集可靠性评估要求的足够数据这样的数据不可能得到单一的准确值,常常得到的是可能的取值范围这些数值或者说发生的这些事件是带偶然性的因此测试事件的参数是一些随时间或空间变化的变量,将其称为随机变量,并可以用概率分布来描述这种随机变量为了分析问题的方便,通常根据这些参数取离散值或是取连续的实数值而区分为离散或连续随机变量为使概念清晰,可以了解一下它们的定义:【6】其函数值由样本空间中每一个元素所确定的函数称为随机变量。
要注意的是,随机变量本身就是一个函数,其取值是随机的,因之可用概率来量化描述其函数值如果样本空间只包含有限个可能的数或一个可数无穷数列,则这个样本空间称为离散样本空间;由这个样本空间定义的随机变量称为离散随机变量例如,一条架空线路一年内可能发生的故障次数记为λL ,其取值范围理论上是{ λL = 0,1,2,3⋯ },这是一个可数无穷数列,因之λL是一个离散随机变量如果样本空间包含无限个可能的实数,则这个样本空间称为连续样本空间;由这个样本空间定义的随机变量称为连续随机变量例如,一台变压器的有效寿命T的取值范围理论上是S = { 0 < T ≤ R },其中R是一个足够大的实数;因之T是一个连续随机变量在工程问题中,计数数据通常是离散随机变量,测量数据通常是连续随机变量 (2)随机变量的概率分布及其主要数字特征如前述,随机变量的函数值是不确定的,要由一定的取值范围来描述,通常即用概率方法来研究这种函数取值范围的分布规律,这就是常说的概率分布于是,可以用概率分布来研究工程中通过试验或通过观察收集的数据,根据可靠性评估的要求来研究对它们进行处理和估计的方法下面将结合具体例子分别叙述离散和连续随机变量概率分布及其数字特征的概念。
a. 离散随机变量例设有三台型号相同的水泵作灌溉之用,根据统计数据推断,每台水泵三年内不发生故障的概率是p = 0.8 ,研究这三台水泵三年后还能正常运转台数的概率分布解 设随机变量X表示三年后还能正常运转的水泵的台数,并令(X = 0),(X = 1),(X = 2),(X = 3)分别代表三年后没有水泵能正常运转,以及1台泵、2台泵和3台泵能正常运转的事件根据题意可假设这些事件是相互独立的,则按前两节的基本规则可知,三台水泵组合可能出现的全部状态为以下8种结果:{SSS, SSF, SFF, FFF, FSS, FFS, SFS, FSF}其中,S和F分别表示三年后水泵正常运转和失效的基本事件于是事件(X = 0)由{FFF}构成;事件(X = 1)由{SFF,FFS,FSF}构成;事件(X = 2)由{SSF,FSS,SFS}构成;事件(X = 3)由{SSS}构成从而有以下概率P(X = 0) = = 0.008P(X = 1) = 3[0.8] = 0.096P(X = 2) = 3[0.2] = 0.384P(X = 3) = = 0.512以上四个等式就构成离散随机变量概率分布的一种表列形式,通常将其称作概率密度函数PDF(probability density function),也可将它表示成如图6a的直观形式。
由这个例子可以注意到:对应于离散随机变量X的每一个取值,都有一个确定的函数(概率)值另一种表达这些数据的方法是累积概率分布函数,常将其简称为累积分布函数DF(cumulative distribution function)它的构成方式是从随机变量的最小值开始,按随机变量递增的顺序对各相应的概率值累加,直至每个变量的概率均被计入,得到如图图6b的函数a) 概率密度函数(b) 累积分布函数图4.3.2 离散随机变量于是可以定义相应的离散变量CDF为 由此可见,离散随机变量累积分布函数CDF的终值必为1即式中,为随机变量X的第i个取值;S为样本空间如果一个随机变量的分布函数及有关参数完全确定,则其概率特征可以得到完全描述但在实际问题中可能并不知道分布函数,因而常常需要找出对它的近似描述这时可以用某几个主要的或者说关键的数值来近似刻画随机变量及其分布的宏观特性,并将它们称为随机变量的数字特征即使是在分布函数已知的情况下,这些随机变量的数字特征也很有用,因为它们可以给出应用中随机变量有关的重要信息,而且还可用于表达概率分布的解析函数式这些特征量中最常用的有均值和方差由于一个随机变量有许多取值,就很自然地要找一个有代表性的中心值,例如平均值。
又因为随机变量的不同取值有不同的概率,显然用概率来加权的平均值就更有意义,数学上将这种加权平均值称为数学期望,实用中常简称为均值,用E (X)表示,并定义为为了进一步刻画分布的特征,还引用一个对均值离散程度的量度,称其为随机变量的方差,用V(X)表示,并定义为或 在实用中,从量纲处理的角度来看,使用方差的平方根更为方便,因之引用随机变量方差的平方根,称为标准差,用表示,并定义为例17 按例16中的已知条件,计算三年后尚能正常运转的水泵的平均台数解 由已知条件并应用式(16)可得三年后尚能正常运转的水泵平均台数为E(X) = 0(0.008)+1(0.096)+2(0.384)+3(0.512) = 2.40由这个结果可以注意到,一个离散随机变量的期望值有可能不再是该随机变量的可能取值这时可从工程角度判断认为三年后尚能正常运转的水泵平均台数约为2台应用式(17)和式(18)还可计算出相应的方差和标准差:V(X) = [12(0.096)+22(0.38)+32(0.512)]- (40)2 = 0.48= 0.69也就是说三年后尚能正常运转的水泵台数对2.4台的平均数可能相差 ±0.69 台,或者说对均值有±0.69/2.40 = ±29% 的偏差。
b .连续随机变量对于连续随机变量而言,只有当落在某一个取值的区间时,其概率才有意义于是对X的某个特定值X = x ,就只能定义一个概率密度因此通常用一个所谓的概率密度函数PDF(probability density function)来描述连续随机变量的概率分布,常用表示,并可得X落在区间(a,b)中的概率为且 与离散情形类似,可以定义连续随机变量的累积概率分布函数CDF(cumulative distribution function),也简称为累积分布函数,并用表示为 且 由此可得应当注意,不是概率,而为随机变量X 的值落入区间的概率连续随机变量的概率密度函数和累积分布函数的形状分别示于图7a和7b中 (a) 概率累积分布函数 (b) 概率密度函数图4.2.2 连续随机变量与离散情形类似,可定义连续随机变量均值和方差的如下表达式:均值方差V(X) = = 式中E()称为X的均方差同样可得标准差为 例18 计算具有以下概率密度函数的随机变量X的均值和方差:解 均值均方差方差V(X)同样还可计算出标准差= 0.2357 可靠性常用分布函数应用举例可靠性问题的提出,来自于对产品寿命的关注。
任何产品从开始使用到第一次发生故障,时间究竟有多长,不可能确切知道显然,产品的正常使用寿命不是一个确定的时间,而是一个随机变量同样,如果产品是可修复的,则其故障修复后再次使用,到下一次故障的时间仍然是一个随机变量因此,可以用概率分布来模拟可靠性相关的问题由此可见,对产品“寿命”的概率模拟也就可以用“失效时间”来表征对不可修产品,就是指失效前时间;对可修产品,最关心的是其相邻两次故障之间的持续可用时间,可称之为“无故障可用时间”下面,先介绍一般可靠性函数,然后简述二项分布、泊松分布、正态分布以及指数分布的应用7】.1 一般可靠性函数 (1) 解析表达式可靠度定义:在规定的条件下和规定的时间区间内无故障持续完成规定功能的概率,常用R(t)表示工程计算中常常使用不能完成规定功能的概率Q(t),或称不可靠性,并有或Q(t)根据概率基本概念,有故障密度函数定义故障率函数为上式等号两边积分得当l为常数时,上式简化为将这种特殊情形称为指数分布,这是使用得非常广泛的一种分布此外,还可推导出随机变量t的均值m的函数式为在工程应用中常将m用一个专门术语MTTF(mean time to failure)表示,称为平均失效前时间,它就是不可修复元件的平均寿命。
2) 可靠度函数的形状许多实际元件的故障率特性如图4.1a所示,由于它的形状而常常称其为浴盆曲线通常将其分为三个区间,第I个区间常称初期损坏期或调试阶段它可能由于大批量产品中的次品,或设备制造过程中的偶然缺陷或设备在初期运行的不稳定等因素造成,这时故障率是一个随时间下降的曲线第Ⅱ个区间常称正常使用或有效寿命期,故障率为常数,这时故障的发生纯属偶然,是唯一适用指数分布的区域第Ⅲ个区间则代表衰耗或元件疲劳屈服的阶段,这时故障率随时间急剧上升对于故障密度函数,也可区别出相应的三个区间如图4.1b所示区域Ⅱ非常近似于负指数曲线,区域Ⅰ则有比指数曲线高得多的数值区域Ⅲ可用正态分布,g分布或威布尔分布等来描述图4.1a典型电子元件的故障率曲线图 图4.1b 故障密度函数可靠度函数及累积故障分布函数的一般形状则分别如图4.1c和图4.1d所示由图4.1.a的曲线形状看出,电子元件有一个较长的有效寿命期电力系统中机械磨损较小的元件,其故障率曲线也可假设符合这一形状在工程应用中,常常假设大多数元件可以通过经常而细心的维护和预防性维修使其维持在经济有效寿命期内,这样一来,就可以利用指数分布模拟元件和系统的可靠性,使问题的分析大大简化。
当然,这样的假设将带来偏乐观的估计尤其是当元件估计已临近出厂规定的有效使用年限时,老化失效将可能起主导作用,常数故障率的假设将失效8】 图5.1c 可靠度函数 图5.1d 累积故障分布函数.2 二项分布如果某个试验只有成功和失败两种结果,且假设成功的概率是p,失败的概率是q,则对于n次试验有称其为二项分布,并须满足以下条件:(1) 有限的试验次数(2) 每次试验只能出现两种结果之一(3) 所有试验结果必须有相同的概率(4) 每次试验必须是独立的例 有4个完全相同的元件组成并联工作系统,如果元件的故障概率或者说不可靠性为F,其可靠性则为R=1–F,这个系统的概率分布为显然第一项代表4个元件都工作的事件出现的概率,这也就是要求全部元件都必须工作的系统的可靠性;前两项之和则可表示容许一个元件失效的系统的可靠性;余此类推,最后一项就是只须一个元件工作的系统的不可靠性例 用以下4个假想的发电系统的数据,进行确定性准则和概率性准则的对比研究设4个系统分别由以下发电机组构成:系统1 24×10兆瓦机组,每台机组的FOP=0.01系统2 12×20兆瓦机组,每台机组的FOP=0.01系统3 12×20兆瓦机组,每台机组的FOP=0.03系统4 22×10兆瓦机组,每台机组的FOP=0.01其中FOP(Forced outage probability)代表机组的强迫停运概率。
假设这4个系统的峰荷依次分别是200、200、200和183兆瓦即每个系统都有20%的容量备用裕度,因之按照传统的百分数备用确定性准则,这4个系统发电容量的的风险度是相同的,或者说它们的可靠性是一致的现在利用二项分布的假设,按照例2.16的思路,计算出这4个系统的概率风险度分别是:系统1 0.000004系统2 0.000206系统3 0.004847系统4 0.000063系统3的真实风险度是系统1的1000倍,可见“百分数备用”的确定性准则不能科学地评估系统的风险度3 泊松分布泊松分布描述给定时间或空间内发生率为常数,一定次数单个事件发生的频率,也就是说事件的发生必须是随机的它与二项分布的主要区别是只考虑事件的发生而不考虑事件的不发生一定时期内的着雷数,一个系统的故障数等就是这种例子1) 分布函数如果利用泊松分布来模拟失效过程,这时常将其参数λ称为故障率这样一个工程上的术语因此令dt是一个足够小的时间单元,使得在这个时间单元内多于一次的故障概率可以忽略,则可得 ()这个表达式计及了故障数,但并未计及元件故障后需要修复或更换的时间2) 均值由离散分布均值的计算式可得 如果令,则式()可写成例某系统中电缆线路的故障率l是每100公里0.5次/年,求40年内10公里长度电缆线路不发生故障和发生一次故障的概率。
解 由已知数据,10公里电缆40年内发生故障次数的均值为由此可得故障概率密度函数因此不发生故障,即x=0的概率为而发生一次故障,即x=1的概率为例 如图所示两相同元件构成的旁待备用系统的可靠性设监测信号和切换装置均100%可靠,备用元件处于备用状态时不发生故障解 由式(33)可知,当备用元件不工作时该系统的工作概率,也就是可靠性应等于系统不发生故障的概率,即 图5.3.1 旁待备用系统当工作元件发生故障时,由于系统中有1个备用元件可以被切换继续工作,使系统不致失效因之,在发生1次故障时,也属于系统的工作状态于是这种系统的工作概率是而根据式(31),其平均持续工作时间则为现在假设每个元件的故障率均为0.02次/小时,要求系统工作时间不低于10小时,则可计算出该系统的如下可靠性指标:【9】系统可靠性系统平均持续工作时间这个例子的计算过程可以推广到n个相同备用元件的情形:.4 正态分布正态概率分布有时称为高斯分布,是使用得最广泛的一种分布之一,它的概率密度函数对均值完全对称,其形状和位置由均值μ和标准差σ唯一确定正态分布密度函数可表达为: ()图示出典型正态密度函数、累积分布函数以及故障率函数。
它的主要特点是当随机变量为时,概率为0.5,因之是正态分布的均值,而且由于确定了曲线的横坐标位置,常称它为位置参数;确定了离散度的大小,常称其为尺度参数,它也就是正态分布的标准差10】图5.4.1 正态分布概率函数(a) 概率密度函数;(b) 累积分布函数;(c) 故障率式()不能用简单的积分方法求解,通常是用数值积分由计算机解算,并编制了不同积分限时曲线下面积的标准表,从而可查表进行计算标准表的依据是在式(5.4.1)中用标准正态变量Z进行以下代换由图4.1a的曲线形状看出,电子元件有一个较长的有效寿命期电力系统中机械磨损较小的元件,其故障率曲线也可假设符合这一形状在工程应用中,常常假设大多数元件可以通过经常而细心的维护和预防性维修使其维持在经济有效寿命期内,这样一来,就可以利用指数分布模拟元件和系统的可靠性,使问题的分析大大简化当然,这样的假设将带来偏乐观的估计尤其是当元件估计已临近出厂规定的有效使用年限时,老化失效将可能起主导作用,常数故障率的假设将失效 ()而得出下面的标准形式: 图 正态函数曲线如果手边没有标准正态分布表,正态函数曲线下的面积可以用近似多项式求解。
例如要求图所示面积Q(Z),则式中b1=0.31938153 b2= - 0.3563782b3=1.781477937 b4= - 1.821255978b5=1.330274429 r = 0.2316419经验式的计算误差,因之结果足够精确例 某城镇新安装2000盏公用照明灯具,其平均寿命为1000小时,标准差为200小时投入使用700小时后,需要准备多少灯具作为更换可能损坏的灯具之用?解 设灯具的使用寿命服从正态分布,则灯具使用700小时后可能损坏的概率可由图15的阴影面积表示11】于是由式()有据此可从标准正态分布表中查得相关数据,按下式计算出相应的概率Q(-1.5):Q(-1.5) = 0.5 – 0.4332 = 0.0668图5.4.3 正态分布曲线从而得到使用700小时后灯具的期望故障数是即是说使用700 小时后大约需要134盏灯具作更换损坏灯具的备用此外,应用近似式(39)也可计算出Q(-1.5) = Q(1.5) = 0.0668两种方法结果相同5 指数分布一般所说的指数分布,严格说来应该是负指数分布,也可。




