当前位置:首页 >> 信息与通信 >>

可靠性工程技术


可靠性工程技术
1.1 基本概念 1)可靠性 reliability

产品在规定的条件下和规定的时间内,完成规定功能的能力。 2)可靠性工程 reliability engineering

为了确定和达到产品的可靠性要求而进行的一系列技术和管理活动。 钱学森: “产品的可靠性是设计出来的、生产出来的、管理出来的” 。 3)基本可靠性 basic reliability

产品在规定的条件下,规定的时间内,无故障工作的能力。基本可靠性反映产品对维修 人力的要求。确定基本可靠性值时,应统计产品的所有寿命单位和所有的关联故障。 4)任务可靠性 mission reliability 产品在规定的任务剖面内完成规定功能的能力。 基本可靠性和任务可靠性比较见表 1-1。
表 1-1 基本可靠性和任务可靠性的比较 任务可靠性 系统完成任务能力的度量 仅涉及引起任务失败的故障 通过冗余可提高任务可靠性 通常高于基本可靠性

基本可靠性 在没有后勤保障情况下系统工作能力的度量 计及所有需要维修保障的故障 采用冗余会降低基本可靠性 通常等于或低于任务可靠性

5)固有可靠性

inhernet reliability

在规定的使用和保障条件下,通过设计和制造使产品所具有的可靠性。 6)使用可靠性 operational reliability

产品在实际的环境中使用时所呈现的可靠性,它反映产品设计、制造、安装、环境、使 用和维修等因素的综合影响。 可靠性合同指标一般用固有可靠性表示,使用可靠性与固有可靠性比较见表 1-2
表 1-2 使用可靠性与固有可靠性的比较 使用可靠性 ?用于描述产品在计划环境中使用时的可靠性水平 固有可靠性 ?用于度量和评价承制方的可靠性工作水平

?由使用需要导出 ?受到产品设计、制造、使用环境、维修策略、修理 等的组合影响 ?用使用值表示 ?一般低于固有可靠性 ?典型参数: 基本可靠性:平均维修间隔时间(MTBM) 任务可靠性:任务成功概率(MCSP)

?根据使用可靠性要求转换 ?只受产品设计与制造的影响

?用固有值表示 ?一般高于使用可靠性 ?典型参数 基本可靠性:平均故障间隔时间(MTBF) 任务可靠性: 致命性故障间的任务时间 (MTBCF)

可靠性使用指标又分目标值和门限值,可靠性合同指标又分规定值和最低可接受值,它 们的定义及指标比较见表 1-3 和表 1-4。
表 1-3 可靠性使用指标与合同指标的比较 使 用 指 标 目标值 期望装备达到的使用指 标,它既能满足装备使用 需求,又可使装备达到最 佳的效费比,是确定规定 值的依据 门限值 装备必须达到的使用指 标,它能满足装备的使 用需求,是确定最低可 接受值的依据,也是现 场验证的依据 规定值 合同和研制任务中规定 的期望装备达到的合同 指标,它是承制方进行 可靠性设计的依据 合 同 指 标 最低可接受值 合同和研制任务书中 规定的、 装备必须达到 的合同指标, 它是进行 厂内考核或验证的依 据

表 1-4

某歼击机可靠性维修性参数与指标 合同中参数项目 固有可用度 A1 规定值 目标值 0.85 15 0.76 15 最低可接受值 门限值 研制结束最低可接 受值 0.61 15 3 0.86 3.43 暂不考核 暂不考核 2.74 16 1000 4000 20 暂不考核 给出初始值 逐步给出

再次出动准备时间 TTA(min) 出动架次率 rSG 任务成功概率 PMC(空地任务剖面任 务时间 2 飞行小时) 平均故障间隔时间 MTBF(h) 每飞行小时直接维修工时 LDMF (工时 /飞行小时) 首翻期(飞行小时) 总寿命(飞行小时) (日历年) 4.29

4 0.95

20

1.2 关于可靠性工作的职责

如上所述,可靠性工程是为了确定和达到产品的可靠性要求而进行的一系列技术和管理 活动。显然, “确定和达到”的活动离不开组织(承制方)和顾客(订购方)的共同参与,特 别是较大型的、复杂的装备系统可靠性工作的开展,明确订购方和承制方的职责是重要的。 1.2.1 订购方的职责 订购方的职责主要有: a)与承制方协商提出可靠性要求和可靠性工作项目要求, 将可靠性使用要求转化为合同 要求,并纳入研制总要求及相关附件; b)制定并实施可靠性计划,对装备寿命周期的可靠性工作进行有效的管理; c)对承制方的可靠性工作进行监控,主持或参与可靠性评审,对可靠性鉴定和验收试验 以及维修性验证试验的结果进行认定; d)向承制方提供开展可靠性工作必须的信息; e)装备部署后,组织进行使用可靠性评估和改进。 1.2.2 承制方的职责 承制方的职责主要有: a)协助订购方对装备的可靠性要求进行可行性分析, 确保可靠性要求的合理性和可以实 现; b)制定并实施详细的可靠性工作计划,落实并实现合同规定的可靠性要求; c)对转承制方的可靠性、维修工作进行监控,按转承制或供应合同严格验收转承制产品 和外购器材; d)及时与订购方沟通,按规定向订购方提供资料及数据; e)负责对使用中暴露的产品设计、制造的可靠性问题,采取纠正措施。

2

可靠性及其工作项目要求的确定
确定可靠性要求是可靠性工程活动的重要内容,也是开展可靠性工作的前提。 GJB450A

《装备可靠性工作通用要求》规定了在装备全寿命过程中可靠性工作的五个系列共 32 个工 作项目(见表 1-5) 。确定可靠性要求及其工作项目的要求被列为 100 系列的工作项目 101 和 102。
表 1-5 GJB450A 工作项 条款编 目编号 号 段 段 工作项目名称 阶段 阶段 型阶 用阶 论证 方案 制与定 与使 可靠性工作项目应用矩阵表 工程研 生产

工程研 GJB450A 工作项 条款编 目编号 号 段 5.1 5.2 6.1 6.2 6.3 6.4 6.5 6.6 6.7 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 7.12 7.13 8.1 8.2 8.3 101 102 201 202 203 204 205 206 207 301 302 303 304 305 306 307 308 309 310 311 维修对产品可靠性的影响 312 313 401 402 403 有限元分析 耐久性分析 环境应力筛选 可靠性研制试验 可靠性增长试验 × × × × × △ △ △ △ △ √ √ √ √ √ 确定可靠性要求 确定可靠性工作项目要求 制定可靠性计划 制定可靠性工作计划 对承制方、转承制方和供应方的监督和控制 可靠性评审 建立故障报告、分析和纠正措施系统 建立故障审查组织 可靠性增长管理 建立可靠性模型 可靠性分配 可靠性预计 故障模式、影响及危害性分析 故障树分析 潜在通路分析 电路容差分析 制定可靠性设计准则 元器件、零部件和原材料的选择与控制 确定可靠性关键产品 确定功能测试、包装、贮存、装卸、运输和 × △ √ √ √ √ △ △ √ × × × △ △ △ △ × × × △ × × √ √ √ √ √ √ △ △ √ √ √ √ √ △ × × √ △ △ × × √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ 工作项目名称 阶段 阶段 型阶 论证 方案 制与定

生产 与使 用阶 段 × × √ √ √ √ √ √ ○ ○ ○ ○ △ △ ○ ○ ○ √ ○ ○ ○ ○ √ ○ ○

工程研 GJB450A 工作项 条款编 目编号 号 段 8.4 8.5 8.6 8.7 9.1 9.2 9.3 符号说明: 404 405 406 407 501 502 503 可靠性鉴定试验 可靠性验收试验 可靠性分析评价 寿命试验 使用可靠性信息收集 使用可靠性评估 使用可靠性改进 √???适用 ○???仅设计更改时适用 × × × × × × × △???可选用 ×???不适用 × × × × × × × √ △ √ √ × × × 工作项目名称 阶段 阶段 型阶 论证 方案 制与定

生产 与使 用阶 段 ○ √ √ △ √ √ √

2 .1

确定可靠性要求 可靠性要求分为定性要求和定量要求两类。 定量要求包括任务可靠性要求和基本可靠性

要求。当任务期间不能维修时,任务可靠度等于可信度。 2.1.1 定性可靠性要求

可靠性定性要求的示例见表 1-6。
表 1-6 可靠性定性要求示例

序号 1 2 3 4 5 6 7 8 9 10 11 成熟设计 简化设计 热设计 降额设计 余度设计

项目名称

元器件、零部件和原材料的选择与控制 确定可靠性关键产品 环境防护设计 耐久性设计 软件可靠性设计 包装、装卸、运输、贮存等设计

2.1.2

定量可靠性要求

1)可靠性参数的类型 可靠性参数可分为以下四类: a)基本可靠性参数,如反映使用要求的平均维修间隔时间 (MTBM),反映设计要求的平均 故障间隔时间(MTBF)等; b)任务可靠性参数,如致命性故障间的任务时间(MTBCF)、成功概率 P(S)等; c)耐久性参数,如使用寿命、贮存寿命等; d)贮存可靠性参数,如贮存可靠度等。 2)常用的可靠性参数 a) 故障率(亦称失效率) failure rate 记为λ (t)

产品可靠性的一种基本参数。其一种度量方法为:在规定的条件下和规定的时间内,产 品的故障总数与寿命单位总数之比。 故障率有瞬时故障率(λ (t))和平均故障率(λ )之分。 瞬时故障率(也可简称为故障率)在实际工作计算时可按式(1-1)计算。 λ (t)= 式中: r(t+△t)-r(t) [No-r(t)]· △t = △r(t) Ns(t)·△t (1-1)

△r(t)—时间间隔(t,t+△t)内发生故障的产品数 r(t)—从 o 到 t 时刻,产品累积故障数

No-产品总数 Ns(t)—到 t 时刻尚未发生故障的产品数 △t—所取时间间隔(h)。 故障率一般取 10-5/h 为单位,对于低故障率的产品常取 10-9/h 为单位,称为菲特(Fit)。 许多产品(如电子设备)在其寿命周期过程中的故障率呈现为“浴盆曲线” ,如图 1-2。 入(t)

使用寿命

规定的故障率

t
早期故障 期 偶然故障期 耗损故障期

图 1-2

浴盆曲线

电子元器件经材料、工艺检验,进行可靠性筛选,可加速进入偶然故障期。此时, λ 可 视为常数。 b)平均故障间隔时间 Mean Time Between Failure(MTBF) 可修复产品可靠性的一种基本参数。其度量方法为:在规定的条件下和规定的时间内, 产品寿命单位总数与故障总次数之比。
No


MTBF=
i=l

ti
No

(1-2)

式中:No-故障总次数 ti-各次工作时间 Σ ti-总工作时间 当产品的寿命服从指数分布时,λ 为常数,有

MTBF=1/λ

(1-3)

例如:从一批电子管中随机抽取 20 支做寿命试验。试验同时开 始,直到 5 支管子发生故障时为止(定数截尾)。这 5 支管子发生故障 的时间是:t(1):26 小时,t(2):64 小时,t(3)=118 小时,t(4): 145 小时,t(5)=182 小时。那么,这批电子管的寿命单位总数: T=∑t(i)+(20-5)×182=3265 小时 (i: 1-5)

这批电子管平均寿命 MTTF 的估计值:θ =T/5=3265/5=653 小 时。

c)可靠度 reliability 记为 R(t) 可靠性的概率度量。 由可靠度的定义可知: R(t)= No-r(t) No (1-4)

式中: No—t=o 时,在规定条件下进行工作的产品数; r(t)—在 o 到 t 时刻工作时间内,累积的故障产品数。 可靠度是在(o,∞)区间内的非增函数,取值范围为 o≤R(t)≤1 例如: 任务要求某测量船在 60 天的航海任务中,雷达不发生故障的概率为 90%,则该雷达在 此任务期内的可靠度要求就是: R(60)=P(ξ >60)=90%。 在一般情况下, 不同的规定时间 t, 对应不同的可靠度, 因此可靠度是时间的函数, R(t) 也称为可靠度函数。 下式给出了用一批产品的故障统计结果来评估该产品可靠度的方法: 式中:No--t=0 时,在规定条件下的产品数; r(t)--在 0 到 t 时刻期间,产品的累积故障数 这批产品开始时(t=0)都是好的, 产品累积故障数 r(0)=0, 则 R(0)=1。 随着时间的增加, 产品累积故障数也不断增加,可靠度相应下降。所有的产品最后总是要出现故障(失效)的。 因此: r(∞)=No,R(∞)=0,0≤R(t)≤1。

在工程实践中,经常需要利用可靠度来表述产品功能的持续能力。 如要求某核电站在规定运转周期内的可靠度为 0.98; 某广播通信卫星在 7 年寿命期内的可靠度为 0.85; 某型车辆行驶 1000 公里无故障的概率为 95%等。 d) 致命故障间的任务时间 mean time between critical failures (MTBCF) 与任务有关的一种可靠性参数。 其度量方法为:在规定的一系列任务剖面中,产品任务总 时间与致命故障总数之比。

1)

可靠性参数选择

可靠性使用指标通过指标转换模型可以转换为合同指标。详见 GJB1909.1-94 的附录 A。 使用参数一般不应直接用于合同中,但如果参数的贮存限定条件明确,也可用于合同中。 GJB1909.2-10 分别规定了导弹武器系统和运载火箭、核战斗部、卫星、军用飞机、舰船、 装甲车辆和军用汽车、火炮、弹药、电子系统的装备可靠性维修性参数选择和指标确定要求。 例如电子系统典型的可靠性参数见表 1-7。
表 1-7 电子系统典型的可靠性参数 参 数 名 称 使用参数 √ √ √ √ √ 参数类型 合同参数 (√) (√) (√) (√)

可靠性类型 基本可靠性 任务可靠性

平均故障间隔时间(MTBF) 任务可靠度(MR) 致命故障间的任务时间(MTBCF)

耐久性 注:( √)—可用于合同的使用参数

首翻期 储存寿命(STL)

GJB450A 附录 A 列出了可靠性设计参数示例见表 1-8。
表 1-8 可靠性设计参数示例 装备使用特征 产品层次 连续或间歇工作 (可修复) 装备 分系统、设备 组件、零件 R(t)或 MTBF R(t)或 MTBF λ 连续或间歇工作 (不可修复) R(t)或 MTTF R(t)或λ λ 一次性使用 P(s)或 P(F) P(s)或 P(F) P(F)

注:MTTF:平均故障前时间 P(s) :成功概率 P(F) :故障概率

2.1.3 装备可靠性参数、指标确定的程序 可靠性参数、指标确定的程序见表 1-9。

表 1-9 序号

装备可靠性参数、指标确定的程序 寿命周期阶段 主要工作内容 a. 对新研制装备进行使用需求分析 b. 对相似现役装备的可靠性状况分析 c. 初步确定新装备的寿命剖面、任务剖面及使用保 障等方案的约束条件 责任者 订购方 订购方 订购方 订购方为主, 与有 关部门协商 订购方为主, 承制 方、专家参加 f. 纳入《研制立项综合论证》中 a. 根据可靠性指标,进行可靠性方案设计与分析 b. 根据成熟期的使用指标,确定工程研制、生产阶 段的使用指标,并将它们转换为合同指标 c. 评审 d. 纳入《研制总要求》中 e. 根据装备可靠性指标分配结果,确定转承制产品 的合同指标 a. 使用、维修、保障方案等变动时,修订可靠性指 标 b. 严格履行有关审批手续 订购方 承制方 订购方为主、 与承 制方协商 订购方为主、 承制 方、专家参加 订购方 承制方为主, 与转 承制方协商 订购方为主, 与承 制方协商 订购方

1

论证阶段

d. 经综合权衡后,选择可靠性使用参数,提出成熟 期的使用指标 e. 评审

2

方案阶段

3

工程研制阶段 (含设计定型)

定量可靠性要求制订过程的流程图,如图 1-3 所示。 图 1-3 中的符号意义如下: MTBM:平均维修间隔时间;

MCSP:完成任务的成功概率; MTBCF:致命故障间的任务时间。

Y

Y

Y

Y

Y

图 1-3 定量可靠性要求确定过程

2.1.4

确定可靠性要求应注意的事项

1) 确定可靠性要求时应全面考虑和权衡使用要求、费用、进度、技术水平等因素,使 要求尽可能合理、可行;

2)确定可靠性定量要求时,应明确产品的寿命剖面和任务剖面。寿命剖面是描述产品 从制造到退役(或报废)这段时间内所经历的事件和环境,任务剖面是描述产品在执行任务 过程中所经历的事件和环境。 火炮寿命剖面和作战任务剖面的方框图见图 1-4 和图 1-5

图 1-4

火炮寿命剖面方框图

图 1-5

火炮作战任务剖面方框图

3)应明确故障判别准则和可靠性指标的验证方法; 4)应明确可靠性指标何时或何阶段应达到; 5)应明确其它假设和约束条件; 6)可靠性要求论证工作的安排应纳入可靠性计划; 7)要求承制方参与或承担的论证工作应在合同中明确。 2.2 可靠性工作项目要求 2.2.1 可靠性工作项目在各阶段的应用

以上给出的“可靠性工作项目在各阶段的应用矩阵表” (表 1-5) ,为初步选择工作项目 提供了一般性的指导。 表 1-5 主要依据了常规武器装备的研制阶段,战略武器装备和军用卫星等可根据实际情 况,按相应研制程序划分。 从表 1-5 不难发现,与原 GJB450 比较,GJB450A 的适用阶段由原来的研制与生产扩展为 论证、研制、生产和使用。 2.2.2 可靠性工作项目的选择 订购方应选择并确定适合且有效的可靠性工作项目,以便用可接受的寿命周期费用,最 终实现规定的可靠性要求。 装备的可靠性要求和费用效益是选择可靠性工作项目的基本依据。 为此, 可采用 GJB450A 推荐的“工作项目重要性系数分析矩阵” (见表 1-10)的方法,对工作项目的适用性进行分 析, 得出各工作项目的重要性系数, 重要性系数相对高的工作项目就是可选择的适用的项目。
表 1-10 工 作 项 目 101 102 · · · 注 1:乘积=各因素加权系数的连乘 注 2:重要性系数:假设乘积值最大的工作项目重要性系数为 10(或 20、30) , 其他工作项目的重要性系数= 复杂 程度 关键 性 工作项目重要性系数分析矩阵 加权系数(1-5) 产品类 型特点 新技 术含量 使用 环境 所处 阶段 ?? 乘积
1

重要性系数

2

该工作项目乘积 ×10(或 20、30) 最大乘积

2.2.3

可靠性工作项目选择应注意的事项

a) 确定的可靠性工作项目应与可靠性要求相适应; b) 选择可靠性工作项目的安排应纳入可靠性计划;

c) 对承制方的可靠性工作项目要求应纳入合同和相关文件。

3

制定可靠性工作计划
可靠性要求和可靠性工作项目确定之后,可靠性工程的主要工作内容就是如何达到已经

确定的要求。为此,组织(承制方)首先要根据可靠性要求制定可靠性工作计划。 应当注意到,可靠性是产品质量特性的组成部分,组织对产品实现的策划所涉及的“产 品质量目标和要求”应当包括可靠性方面的内容;GJB9001B7.1 要求“组织应编制质量计划 (质量保证大纲) ” ,可靠性工作计划不论其形式如何,都应当成为产品整个质量计划(质量 保证大纲)的组成部分。 参考 GJB450A,可靠性工作计划的主要内容有: a) 产品的可靠性要求和可靠性工作要求及安排,计划中至少应包括合同规定的全部可 靠性工作项目; b) 各可靠性工作项目的实施细则,如工作项目的目的、内容、范围、实施的程序、完 成形式及评价方式; c) 可靠性工作的实施和管理部门及其职责,以及资源配备; d) 可靠性工作与产品研制计划中其他工作(如:安全性、维修性、综合保障、质量管 理、工程设计、工程试验和制造等)协调的说明; e) 实施计划所需数据资料的获取途径及需提交的资料项目; f) 可靠性评审安排; g) 关键问题及解决这些问题的方法或途径; h) 工作进度等。 可靠性工作计划随着研制的进度不断完善,需要时计划应做相应更改。 制定可靠性工作计划应注意的事项有: a) 可靠性工作计划应包含合同规定的全部可靠性工作项目; b) 可靠性工作计划应经评审和订购方认可; c) 当订购方的要求变更时,计划应做相应更改。

4

可靠性设计与分析
可靠性设计与分析是可靠性工程的核心,正是通过可靠性设计与分析活动才能将可靠性

注入到产品中去。可靠性设计与分析的方法是很多的,这里我们参考 GJB450A,介绍其中部 分设计与分析技术和方法。由于篇幅的限制,对有关工作项目也不可能都作详细的说明,读 者可以查阅相应的标准和资料。

4 .1

可靠性设计与分析的工作项目 GJB450A 提出的可靠性设计与分析的工作项目见表 1-11。

表 1-11 序号 1 2 3

可靠性设计与分析的工作项目 工作项目名称 目 的

建立可靠性模型 可靠性分配 可靠性预计 故障模式、影响及危害性分析 (FMECA)

用于定量分配、预计和评价产品的可靠性 将产品的可靠性定量要求分配到规定的产品层次 预计产品基本可靠性和任务可靠性,并评价所提出的设计方 案是否满足规定的可靠性定量要求 通过系统地分析,确定元器件、零部件、设备、软件及设计 和制造过程中所有可能的故障模式,以及每一故障模式的原 因及影响,以便找出潜在的薄弱环节,并提出改进措施 运用演绎法逐级分析,寻找导致某种故障事件(顶事件)的 各种可能原因,直到最基本的原因,并通过逻辑关系的分析 确定潜在的硬件、软件的设计缺陷,以便采取改进措施 假定所有元件、器件均正常工作的情况下,分析确认能引起 功能异常或抑制正常功能的潜在通路 分析电路的组成部分在规定的使用温度范围内其参数偏差和 寄生参数对电路性能容差的影响,根据分析结果提出改进措 施 制订贯彻可靠性设计准则,以指导设计人员进行产品的可靠 性设计 控制标准的和非标准的元器件、零部件及原材料的选择和使 用 确定和控制其故障对安全性、战备完好性、任务成功性和保 障要求有重大影响或费用昂贵的产品 分析确定功能测试、包装、贮存、装卸、运输、维修对产品 可靠性的影响 在设计过程中对产品的机械强度和热特性等进行分析和评 价,尽早发现承载结构和材料的薄弱环节及产品的过热部分, 以便及时采取改进措施 发现可能过早发生耗损故障的零部件,确定故障的根本原因 和可能采取的纠正措施

4

5

故障树分析(FTA)

6

潜在通路分析(SCA)

7

电路容差分析

8

制定可靠性设计准则 元器件、零部件和原材料选择 与控制 确定可靠性关键产品 确定功能测试、包装、贮存、 装卸、运输、维修对产品可靠 性的影响 有限元分析

9

10

11

12

13

耐久性分析

4.2

建立可靠性模型 概述

4.2.1

1)可靠性模型和可靠性框图 可靠性模型(reliability model)是指为分配、预计或估算产品的可靠性所建立的框

图和数学模型。 可靠性框图(reliability block diagram)是对于复杂产品的一个或一个以上的功能 模式,用方框表示的各组成部分的故障或它们的组合如何导致产品故障的逻辑图。 2)可靠性建模、预计和分配实施过程 可靠性建模、预计和分配是可靠性定量设计的一种方法,用于估计新设计的产品是否符 合规定的可靠性定量要求,适用于产品的研制和生产,并应该在研制阶段的早期进行。随着 产品设计工作的不断进展,预计和分配需迭代进行,当产品设计条件、结构、环境要求、应 力数据、失效率数据、工作模式等发生重要变更时,需要再次修正可靠性模型,以便进行可 靠性预计和可靠性分配。 可靠性建模、预计和分配的实施过程如图 1-8 所示。

图 1-8

可靠性建模、预计和分配实施过程图

3) 基本可靠性模型和任务可靠性模型 基本可靠性模型包括一个可靠性框图和一个相应的可靠性数学模型。基本可靠性模型是 一个串联模型,包括那些冗余或代替工作模式的单元都按串联处理,用于估计产品及其组成 单元故障引起的维修及保障要求。 任务可靠性模型包括一个可靠性框图和一个相应的数学模型。任务可靠性模型应该能够 描述在完成任务过程中产品各单元的预定用途。预定用于冗余或代替工作模式的单元应该在 模型中反映为并联等结构。 只有在产品既没有冗余又没有代替工作模式情况下,基本可靠性模型才能用来估计产品 的任务可靠性。

4.2.2 建立可靠性模型的步骤 1) 定义产品 确定产品的任务或工作模式;规定产品及其分系统的性能参数及容许界限;确定产品的 物理界限和功能接口;确定构成任务失败的条件;确定产品的寿命剖面和任务剖面。 2) 确定产品可靠性框图 建立可靠性模型的基本信息来自功能框图 (系统原理图) 。 例如某弹上计算机的工作原理 图和基本可靠性框图如图 1-9 和图 1-10。
来自制 导系统

地 面 发 控

脉冲计数器 数 字 板 总线

转换器板

遥测

输入

变流器

舵系统 舵反馈

图 1-9

计算机工作原理图

数字板

脉冲计数器

转换器板 图 1-10 基本可靠性框图

软件

变流器

由于系统没有冗余或代替工作模式,任务可靠性框图也是串联形式。 如果系统工作时有冗余或代替工作模型,基本可靠性框图仍是串联,任务可靠性框图就 不能仅是串联。例如某军用飞机的基本可靠性和任务可靠性框图如图 1-11 所示。

(a)

(b) 图 1-11 某军用飞机的可靠性框图 (b)任务可靠性框图

(a)基本可靠性框图

3)确定可靠性数学模型(概率表达式) 下面介绍用普通概率法来拟定单功能系统的可靠性数学模型。关于布尔真值表法和多功 能系统,见 GJB813。 a)串联模型:m 个单元(其工作互相独立)串联系统的基本可靠性和任务可靠性数学模型 相同。 系统的可靠度 Rs(t)为各单元可靠度 Ri 的乘积,即:
m Rs(t)= ? Ri(t) i ?1

(1-5)

当各单元的寿命服从指数分布时,系统也服从指数分布:

Rs (t ) ? e ??st
系统的故障率:

(1-6)

? s ? ? ?i
i ?1

m

(1-7)

式中,λ s 和λ i 分别为系统和组成单元的故障率。

系统的平均故障间隔时间
MTBF ? 1 ? 1

?s

??
i ?1

m

(1-8)
i

b)并联模型: 组成系统的所有单元都发生故障时系统才发生故障,这样的系统称为并联 系统。若有 n 个单元并联,系统可靠度:
Rs (t ) ? 1 ? ? ?1 ? Ri (t )?
i ?1 n

(1-9)

当各单元的寿命分布为指数分布时,则并联系统的可靠度:
Rs (t ) ? 1 ? ? (1 ? e ??it )
i ?1 n

(1-10)

系统的平均故障间隔时间: MTBF=∫O


Rs(t)dt

(1-11)

对于常用的二单元并联系统:

Rs (t ) ? e ??1t ? e ??2t ? e ?(?1 ??2 )t

(1-12)
1 2

?s (t ) ?

?1e ? ? t ? ?2 e ? ? t ? (?1 ? ?2 )e ?( ? ?? )t
1 2

e ??t1 ? e ??2t ? e ?( ?1 ??2 )t

(1-13)

MTBF ?

1

?1

?

1

?2

?

1 ?1 ? ?2

(1-14)

由式(1-13)见,尽管第一个单元和第二个单元的故障率λ 1、λ 2 都是常数,但并联系统 的故障率λ s(t)不再是常数。 对于 n 个相同单元的并联系统: Rs(t)=1-(1-e-λ t)n MTBF=∫O∞ [1-(1-e-λ t)n]dt =
1

(1-15)

λ

+

1



+ ? +

1 n?

(1-16) 汇

对于混联、表决、旁联、复杂网络等的可靠性数学模型,可参考有关资料。表 1-12 总了几种典型的可靠性模型。

表 1-12

几种典型的可靠性模型 可靠性框图 数学模型

R s ?t ? ?

n n n ? R i ?t ? ? ? e ? ?i t ? e ? ? ?i t i ?1 i ?1 i ?1
(指数分布)

n R s ?t ? ? 1 ? ? ?1 ? Ri ?t ?? i ?1

n i n?i R s ? ? ci n R ? t ? ?1 ? R?t ?? i?r

2 n ? 1? ? ? t ? t ? ? ? ? ? ? ??? R s ?t ? ? e ? ?t ?1 ? ?t ? ?n ? 1?! ? 2! ? ? ? ?
假设各单元相同且服从指数分布,故障监测和转 换装置的可靠度=1

4.2.3

建立可靠性模型应注意的事项

a) 建立可靠性模型应在订购方明确可靠性参数和约束条件(包括故障判据等)的情况 下进行; b) 在可靠性建模中应正确区分产品的原理图和可靠性框图,正确区分基本可靠性框图 和任务可靠性框图; c) 应尽早建立可靠性模型; d) 在产品技术状态发生变化时,可靠性模型应作修改。 4 .3 可靠性分配

4.3.1 概述 可靠性分配(reliability allocation)是为了把产品的可靠性定量要求按照给定的准 则分配给各组成部分而进行的工作。 系统可靠性分配,要将规定的可靠性指标分配给组成该系统的分系统、设备和元器件。 可靠性分配主要适用于方案论证及工程研制早期。 4.3.2 无约束条件的系统可靠性分配方法 1) 等分配法 这种分配法一般在设计初期采用。设系统由 n 个分系统串联而成,若给定系统可靠性指 标为 RS,则按下式分配给各分系统的可靠度指标 R*i :

Ri* ? n RS

(1-17)

这种分配方法简单,但并不合理,因为组成系统的各部分的可靠度实际并不相同。 2 评分分配法 当缺乏有关产品的可靠性数据时,请专家按照几种因素进行评分,按评分情况给每个分 系统或设备分配可靠性指标。选择故障率λ 为分配参数。 分配给每个分系统的故障率为:

λ

*

i= i

C ·λ

* s

(1-18)

式中:λ *s-系统规定的故障率指标

Ci -第 i 个分系统的评分系数(i=1,2, ?,n)
Ci ? 4 n 4 ?i ? ? r ij ? ? ? r ij ? j ?1 i ?1 j ?1

(1-19)

式中:ω i-第 i 个分系统的评分数 ω -系统的评分数 rij—第 i 个分系统、第 j 个因素的评分数,在 1-10 分间取值; j=1 j=2 j=3 j=4 代表复杂度,最复杂的评 10 分,最简单的评 1 分; 代表技术发展水平,水平最低的评 10 分,水平最高的评 1 分; 代表工作时间(也可以代表重要度) ,最长的评 10 分,最短的评 1 分; 代表环境条件,分系统在工作过程中会经受恶劣环境条件的评 10 分,环境 条件最好的评 1 分。 例:某飞机 MFHBF(平均故障间隔飞行时间)的规定值为 3.37 飞行小时,按评分分配法

? ? 1 ? 进行分配。 先将 MTBFs 转为 ? s ? 再转为各分系统的 MFHBFi, ? ? MFHBF ? 分配到各分系统λ i, s? ?
见表 1-13。
表 1-13 评分分配法实例 复杂度 λ i1 8 8 3 5 5 4 4 6 6 7 3 9 2 技术水平 λ i2 4 1 2 2 2 3 5 5 1 2 1 7 5 工作时 间λ i3 10 10 8 10 8 3 8 10 5 10 6 8 5 环境条件 λ i4 4 8 4 8 7 5 3 7 6 6 3 7 5 各分系统 评分数ω i 1280 640 192 800 560 180 480 2100 180 840 54 3582 250 11084 各分系统 评分系数 Ci 0.1155 0.0577 0.0173 0.0722 0.0505 0.0162 0.0433 0.1893 0.0162 0.0758 0.0049 0.3183 0.0226 1 分配给各 分系统的 MFHBFi 28.86 57.78 192.70 46.17 66.01 205.78 76.99 17.59 205.78 43.98 680.35 10.47 147.51 3.337

分系统名称 结构 动力装置 发动机接口 燃油系统 液压系统 空中刹车系统 前轮结构 失速告警系统 电子对抗系统 电源 座舱 航空电子 其他 总计

3) 比例组合法 这种方法适用于新、老产品相似,而且有老系统统计数据或者在已有各组成单元预计数 据基础的情况下来分配给新系统的各分系统的故障率。其数学表达式为: λ λ *i 新=λ *s 新· i 老 或λ i 新=λ *s 新· ki λ s老 * 式中 λ s 新—新系统的故障率指标; λ λ λ
* i新

(1-20)

—分配给新系统中第 i 个分系统的故障率;

s老

—老系统的故障率; —老系统中第 i 个分系统的故障率;

i老

ki—老系统中第 i 个分系统的故障率占系统故障的比例。 例: 某液压动力系统, 老系统和各分系统的故障率已知, λ 系统的故障率指标已知为λ 表 1-14。
表 1-14 某液压动力系统各分系统的故障率 序号 1 2 分系统名称 油箱 拉紧装置 λ
i老

S 老=256*10

-6

/h , λ

i老

见表 1-14,



* s新

=200×10-6/h, 按式(1-20)分配给新系统各分系统的故障率如

(10 /h) 3 1

-6

λ i 新(10 /h) 2.3 0.78

-6

3 4 5 6 7 8 9 10 11

油泵 电动机 止回阀 安全阀 油滤 联轴节 导管 启动器 其他各项 总计(系统)

75 46 30 26 4 1 3 67 256

59 36 23 20 3.1 0.78 2.3 52 20 219.26

4) 重要度和复杂度分配法
t BFi ( j ) ? N ? ? i? ? j? ? ? t i? ? j? ? ? ? ? ? n i ? 1nR? s
n

?

?

(1-21)

式中: N—系统的基本构成部件数,N=∑ni; ni—第 i 个分系统的基本构成部件数; ω i(j)—第 i 个分系统(第 j 个设备)的重要度; ti(j) —第 i 个分系统(第 j 个设备)的工作时间(h); ; t BFi ( j ) —分配给第 i 个分系统(第 j 个设备)的平均故障间隔时间(h) R*s—系统规定的可靠度。 例;某产品要求工作 12h 的可靠度(目标值)R*s=0.923,按重要度和复杂度分配法进行 分配,见表 1-15。
表 1-15 重要度和复杂度分配法实例 i=1

序号 1 2 3 4 5

分系统(设备) 名称 发动机 接收机 起飞用自动装置 控制设备 其它 共计

分系统构 成部件数 ni 102 91 95 242 40 570

工作时间 ti(j) 12 12 3 12 12

重要度ω
i(j)

分给分系 分配给分系统(设备)的 统(设备) * 可靠度 R s 的 tBFt(j) 837 938 67 353 2134 0.9858 0.9678 0.9562 0.9666 0.9944 0.9232

1.0 1.0 0.3 1.0 1.0

5) 可靠度的再分配法 如果预计的系统可靠度 RS 小于规定的可靠度 R*s, 就需要进一步改进原设计以提高其可靠

性,就要对各分系统的可靠性指标进行再分配,基本思想是把原来可靠度较低的分系统的可 靠度都提到某个值,具体步骤如下: a)设各分系统可靠度大小,由低到高依次排序为: R1<R2<?Rko<Rko+1<?<Rn b)现把 R1?Rko 都提高到 Ro,则
ko ? R s ? Ro n ? Ri i ? ko ? 1

(1-22)

(1-23)

使 Rs 满足规定的可靠度指标,即:
ko R s ? R? s ? Ro n ? Ri i ? ko ? 1

(1-24)

c)确定 Ko 及 RO Ko 通过式(1-26)及不等式(1-25)求得,按式(1-27)确定 R0 :
? ? ? ? ? Rs ? rj ? ? n ?1 ? ? ? ?Rj? ? i ? j ?1 ?
1/ j

? Rj

(1-25)

令 Rn+1=1 Ko 就是满足(1-25)不等式的 j 的最大值。
? ? ? ? ? R s ? Ro ? ? n?1 ? ? ? ?Rj? ? j ? ko?1 ?
1 / ko

(1-26)

(1-27)

按式(1-23)验算系统可靠度 Rs。 这样就可得出重新分配后能满足规定可靠性指标的各分系统可靠性指标。 例 : 一个系统由三个分系统串联组成,通过预计得到它们的可靠度为:0.7、0.8、0.9, 则系统可靠度 Rs=0.504, 而规定的系统可靠度 Rs*=0.65。 试对三个分系统进行可靠度再分配。 解 ①已知: Rs*=0.65,n=3 ②把原分系统的可靠度由小到大排到列为

R1=0.7, R2=0.8, R3=0.9 ③按式(1-25)确定 k0: 由式(1-26) : Rn+1=R4=1
1/1 1/1 ? ? R? ? 0.65 ? s ? ? ?? j ? 1, r1 ? ? =0.903>R1 ? R 2 ? R3? R 4 ? ? 0.8 ? 0.9 ? 1 ? ? ? 1/2 1/2 ? R* ? ? 0.65 ? s ? ? ?? ? 0.85 ? R 2 j ? 2, r 2 ? ? ? R3? R 4 ? 0 . 9 ? 1 ? ? ? ? 1/ 3 1/ 3 ? R? ? ? 0.65 ? s ? ?? ? 0.866 ? R 3 j ? 3 , r3 ? ? ? ? R4 ? 1 ? ? ? ?

根据前面所说的,k0 就是不满足不等式(1-25)的 j 的最大值,因此 k0=2。 ④按式(1-27)确定 R0:

? ? ? R0 ? ? ? ? ?

? ? * Rs ? n ?1 ? Rj ? ? ? j ? k 0 ?1 ?

1

k0

? Rs* ? ? 0.65 ? ?? ? ? 0.85 ?R ?R ? ??? ? 3 4 ? ? 0.9 ? 1 ?

⑤得到 R1= R2= R0= 0.85,R3= 0.9。即第 1,2 个分系统的可靠度都提高到 0.85,而第 3 个分系统的可靠度保持不变。 ⑥按式(1-23)验算系统可靠度 RS Rs=Ro
ko

i=ko+1

Π

n

Ri=R02·R1=0.852·0.9=0.65= R*s

经过可靠度再分配后,新系统满足了规定的可靠度指标。 工程中常用的无约束条件可靠性分配方法列于表 3-16 中。
表 1-16 可靠性分配方法

序号 1

分配方法 比例分配法

适用范围 基本可靠性分配

简明说明 根据产品中各单元预计的故障率占产品预计故障 率的比例进行分配 专家根据经验,按几种因素(如复杂度、环境、技 术水平等)对各单元进行评分,按各单元的相对分 值进行分配 根据产品中各单元的复杂度(如元器件、零部件数 量)及重要度(该单元故障对产品的影响)进行分 配

2

评分分配法

基本或任务可靠性分配

3

重要度和复 杂度分配法

基本或任务可靠性分配

4.3. 3 有约束条件的系统可靠性分配方法 如果有约束条件,如费用、重量、体积、消耗功率等,就要用一些数据或公式将约束变 量与可靠性指标联系起来。可靠度分配方法有很多,如: a) 直接寻查法; b) 拉格朗日乘数法; c) 动态规划法。 这些方法也可用于冗余系统,在工程上使用都有一定难度。

4.3.4 可靠性分配应注意的事项 a)应按可靠性指标的规定值(成熟期)并留有适当余量进行分配,例如分配值/目标值 =1.3(国外某军用飞机) ,当分配结果不满足要求时,应进行再分配; b)分配的项目中应有“其它”项; c)要按基本可靠性与任务可靠性分别进行分配; d)在论证与方案阶段,分配与预计工作应反复迭代进行; e)分配的产品层次应满足规定的要求。所有可靠性分配值应与可靠性模型相一致。

4 .4

可靠性预计

4.4.1 概述 可靠性预计是为了估计产品在给定的工作条件下的可靠性而进行的工作。开展可靠性预 计工作的一般要求包括: 1)应对系统、分系统和设备进行可靠性预计,包括基本可靠性和任务可靠性。当有充 分依据(例如通过 FMEA)确认某产品的故障不影响规定的任务可靠性时,可不进行该产品的 任务可靠性预计,但需经订购方认可。

2)应按 GJB813、GJB/Z299 、GJB/Z108 中提供的数据和方法,或订购方认可的其他方 法进行预计。 3)可靠性预计的方法应与所建立的可靠性模型相一致; 4)对机械、电气和机电产品的可靠性预计可采用相似产品数据和其他适合的方法进行, 但需经订购方认可。 4.4.2 可靠性预计的方法

1)相似产品法 利用有关成熟的相似产品所得到的特定经验数据来估计新产品的可靠性。 相似产品法的确切性决定于产品间的相似程度。应考虑的要点有: a) 产品的功能和技术水平; b) 产品的结构和复杂程度; c) 产品的使用环境; d) 产品的使用和保障方案。 预计的基本公式:

? s ? ? ?i
i ?1

n

(1-28)

或者

1 TBFs

??

1 i ?1 TBFi

n

式中 TBFs-预计的系统的 MTBF(h); TBFi-预计的第 i 个分系统的 MTBF(h); λ s--预计的系统的故障率; λ i-预计的第 i 个分系统的故障率。 新产品的λ i 由与相似产品比较而得出。 例:改进设计的教练机,其供氧抗荷系统采用相似产品法,预计的 MTBF 如表 1-17。
表 1-17 统计数据及预计值 产品名称 氧气开关 氧气减压器 氧气示流器 氧气调节器 氧气面罩 单机配 套数 3 2 2 2 2 老产品的 MTBF 1192.8 6262 2087.3 863.7 6000 预计的 MTBF 3000 6262 2087.3 863.7 6500 选用老品 同上 同上 在老品基础上局部改进 备注 选用新型号,可靠性大大提高

产品名称 氧气瓶 跳伞氧气调节器 氧气余压指示器 抗荷分系统 整个供氧抗荷系统

单机配 套数 4 2 2 2

老产品的 MTBF 15530 6520 3578.2 3400 122.65

预计的 MTBF 15530 7000 4500 3400 154.4 选用老品

备注

在老品基础上局部改进 先用新型号,可靠性大大提高 选用老品

根据大量试验结果, 我国一般电子元器件和飞机(使用 1200h 后)用机械产品的故障率(λ ) 大致范围如表 1-18。

表 1-18 部分电子元器件和机械产品的λ 值范围 电子元器件 二极管 三级管 电阻 焊点 单片集成电路 大规模集成电路 λ (1/h) (0.05-3.0)×10 -6 (0.15-1.0)×10 -6 (0.005-1.0)×10 -9 10 -6 (0.10-2.0)×10 -6 10
-6

飞机机械产品 主起落架收放作动筒 蓄电瓶 主冷气瓶开关 应急刹车调压器 襟翼收放作动筒 弹架

λ (1/h) 6.0×10 -5 5.0×10 -5 4.3×10 -5 3.9×10 -5 8.9×10 -5 5.8×10
-5

相似电路法被考虑的对象只是一个电路,其基本用法与产品相似法类似。 2)元器件计数法 为取得近似值可以假设产品可靠性模型是串联的,如果产品中有非串联成分,可先计算 模型的非串联部分的故障率,再与其它部分的元器件故障率相加。 元器件计数法所需要的辅助信息有: a) 通用的元器件种类; b) 元器件数量; c) 元器件质量等级; d) 产品的工作环境。 产品故障率的一般表达式是: λ PS= Σ Ni(λ i=1
n
Gi

·π Qi)

(1-29)

对一定的环境来说,式中: λ PS=预计的系统故障率 λ Gi=第 i 类元器件的通用故障率

π Qi=第 i 类元器件的质量系数 Ni=第 i 类元器件的数量 n=不同的元器件种类数 若产品包括 n 个单元,工作在不同的环境中,公式(1-29)用于每一种环境的产品组成单 元,然后将各环境求得的单元故障率相加,得出产品总故障率。 故障率信息来源可采用 GJB299B 或其他有依据的数据。对于按规范生产的非电零件,可 取π Q=1。 3)应力分析法 应力分析法假设元器件寿命服从指数分布 (即具有恒定故障率 ) 。对于可靠性模型的处 理、需要的辅助信息、故障率信息来源都同元器件计数法。 不同的元器件有不同的计算故障率模型。如晶体管和二极管的故障率模型见式(1-30)。

λ

pi

=λ bi(π Eπ Qπ Rπ Aπ S2π C)

(1-30)

式中 λ pi—第 i 种元器件工作故障率 λ bi—第 i 种元器件基本故障率 π E—环境系数 π Q—质量系数 π A—应用系数 π R—电流额定值系数 π S2—电压应力系数 π C—配置系数 把各种元器件的工作故障率计算出来后,就可求得系统的故障率λ s。分系统可靠性模型 为串联模型,则

? ? ? N ? s i pi
i ?1
式中 λ pi—第 i 种元器件的工作故障率 Ni—第 i 种元器件的数量 N—系统中元器件种类数 上述系数都可从 GJB299B 中查出。 工程中常用的可靠性预计方法列于 1-19。
表 1-19 可靠性预计方法

N

(1-31)

序 号

预计方法

适用范围

适用阶段 方案论证 及初步设 计

简要说明 根 据 元 器 件 的 品 种 及 质 量 要 求 查 MIL-HDBK-217F (国外元器件) 或 GJB/Z299B (国 内元器件) ,得到各元器件故障率数据,按产品 中元器件数量将故障率相加 根据元器件的品种、质量水平、工作应力及环 境应力等因素,查 MIL-HDBK-217K 或 GJB/ZGJB/Z2998B ,得到各元器件故障率数 据,按产品中元器件数量将这些故障率相加 将研制的新产品与其可靠性已知的相似产品进 行比较

1

元器件计数法

电子类产品 基本可靠性预计

2

应力分析法

电子类产品 基本可靠性预计

详细设计

3

相似产品法(含 相似电路、相似 设备)

机械、电子、机电类 方案论证 产品。 具有相似产品 及初步设 的可靠性数据。 基本 计 或任务可靠性预计。

4.4.3

可靠性预计应注意的事项

a) 订购方应明确规定寿命剖面和任务剖面,提供产品可靠性水平和相关的使用与环境 信息; b) 尽早地进行可靠预计,预计工作应反映当前产品的技术状态; c) 一般应按基本可靠性和任务可靠性要求进行预计; d) 预计值应大于目标值(成熟期) ; e) 应说明预计中所用数据的来源。

4.5 故障模式、影响及危害性分析 4.5.1 概述 故障模式与影响分析(FMEA)是指分析产品中每一个潜在的故障模式并确定其对该产品 及其上层所产生的影响,以及把每一个潜在故障模式按其影响的严重程度予以分类的一种分 析技术。故障模式、影响及危害性分析( FMECA)则是同时考虑故障发生概率与故障危害等 级的故障模式与影响分析。 FMEA 自 50 年代开创以来,一直受到工程界的高度重视与广泛应用,被视为最有效且 较经济的可靠性分析技术之一,其基本思路可用于其它领域。在许多行业,FMEA 被明确规 定为技术人员必须掌握的技术; 有的把 FMEA 资料规定为必不可少的设计文件; 有的顾客明 确地将 FMEA 列入产品可靠性定性要求, 是必须做的。 如美国宇航局对通信卫星几乎无一例 外地都采用了这一手段。我国至 80 年代中期开始,主要军品型号工程也普遍开展了 FMEA 活动。FMEA(FMECA)的主要作用是:

——保证不同产品层次的元器件、组件各种故障模式都经过周密的考虑; ——发现影响产品可靠性的薄弱环节,以便采取有效措施加以改进; ——协助确定可靠性关键件和重要件,它们是改进设计、可靠性增长及生产过程质量控 制的重点关注对象; ——为产品的检验程序、故障检测点的设置等提供依据; ——为产品的维修和维修保障分析等提供信息。 以下我们先介绍几个基本概念: 1)故障模式 failure mode 故障的表现形式。如短路、开路、断裂等。表 1-20 给出了组件或整机常见故障模式示 例。
表 1-20 序号 1 2 3 4 5 6 7 8 9 10 11 组件或整机常见故障模式表 故障模式 开路 短路 不能开(接不上) 不能关(断不开) 错误开机 错误关机 无输入 无输出 错误输入 错误输出 误动 序号 13 14 15 16 17 18 19 20 21 22 23 故障模式 间断性工作不稳定 中断 跳动 不能切换 接触不良 提前工作 延迟工作 时通时断 绝缘电阻下降 断裂 软件错误

2)故障影响

failure

effect

故障模式对产品的使用、功能或状态所导致的结果。 ·局部影响:该故障模式对当前分析层次产品的影响; ·高一层次影响:对当前所分析层次高一层的产品的影响; ·最终影响:对最高层次产品的影响。 3)约定层次 indenture levels 根据分析的需要,按产品的相对复杂程度或功能关系划分产品层次,这些层次从比较复 杂的(系统)到比较简单的(零件)进行划分。 ?初始约定层次:要进行 FMECA 总的、完整的产品所在的层次。 ?其它约定层次:相继的约定层次(第二、第三、第四等) ,这些层次表明了直至较简单

的组成部分的有顺序的系列。 4)严酷度 severity 故障模式所产生后果的严重程度。严酷度应考虑到故障造成的最坏的潜在后果,并应根 据最终可能出现的人员伤亡、系统损坏和经济损失的程度来确定。 严酷度的分类如下: ?Ⅰ类(灾难的)—— 这是一种会引起人员死亡或系统(如飞机、坦克、导弹及船舶等) 毁坏的故障。 ?Ⅱ类 (致命的) ——这种故障会引起人员的严重伤害、 重大经济损失或导致任务失败的 系统严重损坏。 ?Ⅲ类 (临界的) ——这种故障会引起人员的轻度伤害、 一定的经济损失或导致任务延误 或降级的系统轻度损坏。 ?Ⅳ类 (轻度的) ——这是一种不足以导致人员伤害、 一定的经济损失或系统损坏的故障, 但它会导致非计划性维护或修理。 5)危害性 4.5.2 criticality 对某种故障模式的后果及其发生概率的综合度量。 故障模式及影响分析(FMEA) 1)FMEA 的方法 有两种 FMEA 的方法:硬件法及功能法。 a)硬件法:根据产品的功能对每个故障模式进行评价,用表格列出各个产品,并对可能 发生的故障模式及其影响进行分析。当产品可按设计图纸及其它工程设计资料明确确定时, 一般采用硬件法。 这种方法适用于从零件级开始分析再扩展到系统级, 即自下而上进行分析。 此种方法进行 FMEA 是较为严格的。 b)功能法:这种方法认为每个产品可以完成若干功能,而功能可以按输出分类。将输出 一一列出,并对它们的故障模式进行分析。当产品构成尚不能明确确定时(例如,在产品研 制的初期,尚得不到详细的产品原理图、部件清单及产品装配图) ,或当产品的复杂程度要求 从初始约定层次开始向下分析,即自上而下分析时,一般采用功能法。这种方法比硬件法简 单。 2)FMEA 的步骤 详细说明见 GJB1391—92《故障模式影响及危害性分析程序》 ) 。 a)被分析的系统 (包括系统的每项任务、 每一任务阶段及每一种工作方式相对应的功能) 的详细说明、内部和外部接口、各约定层次的预期性能、系统限制及故障判据的说明; b)绘制功能和可靠性方框图; c)确定产品及接口设备所有潜在故障模式,并确定其对相关功能或产品的影响,以及对 系统和所需完成任务的影响; d)按最坏的潜在后果评估每一故障模式,确定其严酷度类别; e)为每一故障模式确定检测方法和补偿措施;

f)确定为排除故障或控制风险所需的设计更改或其它措施; g)记录分析结果。
下图大致说明了 FMEA 的工作程序。 了解产品的全部情况维护 (含结构、 功能 、使用 维护、环境等) 确定严酷度





⑦ 绘制功能图和可靠性 方框图

故障检测方法





对策及补偿措施



故障模式 ⑨有 有无 其他故障 模式



分析原因 无 ⑩



分析影响

结束

FMEA 的工作程序

3) FMEA 表格 对某导弹的时序火工品分系统的故障模式影响分析表的示例见表 1-21。

表 1-21
初始约定层次:

故障模式与影响分析表事例
XX 导弹(初样) 任务:控制系统发时序 分析人员:陈乃川
任务阶 段工作 模式

审核:包为民 批准:余延万 填表日期:2004 年 6 月 3 日

约定层次:ⅠⅡ Ⅲ 时序火工品分系统
项目 功能 名称

故障影响 高一 层次影 响 8 发 零 号 工 统 电 导致在 导弹出 筒前执 行时序 故障检 测方法 补偿措 施 严酷度 备注

代 码

功能

故障 模式

故障 原因

局部 影响 7 提前 时序 点信 及火 品系 的配 信号

最终 影响 9 导弹发 射失败

1 11

2 磁 敏 行 程 开关

3 1 .启动弹 上机的时 序模块发 出时序; 2. 给 火 工 品系统配 +D2+D3 以 及+DA; 3. 给 外 测 发出筒信 号; 4. 给 头 部 发出筒信 号 1. 接 收 出 筒信息; 2. 隔 离 抗 干扰

4 继电 器触 点瞬 间闭 合

5 由弹 射振 动引 起

6 筒内弹射 阶段

10 无

11 1. 采 用 触 点 并、串 联; 2. 软 件 采用脉 冲时宽 辨识 1. 严 格 筛选继 电器; 2.降额 使用。 Ⅰ

12

13

任一 对触 点粘 死

121

弹 机 筒 号 耦 入 路

上 出 信 光 输 电

发光 二极 管开 路或 光敏 三级 管 CE 开路 光敏 三极 管 CE 短路

1. 元 件质 量 2. 选 择容 量不 够 元器 件失 效

地面发射 准备阶段

对触点 失控

时序模 块在筒 内运行

导弹发 射计划 失败

地测



地面准备 阶段/发射 阶段

弹上机 收不到 出筒信 号

时序信 号发不 出去

发射失 败或弹 掉下来

地 测 / 无

1. 严 格 筛选元 件; 2.提高 元件可 靠性



设备研制 单位解决

元器 件失 效

地面准备 阶段/发射 阶段

刚一加 电就有 出筒信 号

时序在 筒内提 前运行

可能在 导弹出 筒后先 运行尾 分以后 的时序 导致发 射失败

地 测 / 无

1.严格 筛选元 件; 2.提高 元件可 靠性

IV/Ⅱ

1.若在发 射前发生 时, 地测可 发现为 IV 级, 若在上 天之后发 生就为Ⅱ 类 2.设备研 制前解决。

填写 FMEA 表格,从约定层次(例如零部件)开始逐级向上分析故障造成的影响。表格 中各栏目应填写的内容如下: 第一栏(代码) :填写被分析产品的代码。 第二栏(产品或功能标志) :被分析产品或系统功能的名称,原理图上的符号或设计图纸 的编号,可作为产品或功能的标志。 第三栏(功能) :需完成的功能,包括零部件的功能及与接口设备相互的关系。 第四栏(故障模式) :在约定层次中所有可预测的故障模式,如: ?提前运行 ?在规定的应工作时刻不工作 ?间断地工作 ?在规定的不应工作的时刻工作

?工作中输出消失或故障 ?输出或工作能力下降 ?在系统特性及工作要求或限制条件方面的其它故障状态 第五栏(故障原因) :包括导致故障的物理或化学过程、设计缺陷、零件使用不当等各种 原因。 第六栏(任务阶段与工作方式) :说明发生故障的任务阶段与工作方式。 第七、 八、 九栏 (故障影响) : 评价每一故障模式对局部的 (当前分析的约定层次的产品) 、 高一层次的和最终的在产品使用、功能或状态方面的影响。 第十栏(故障检测方法) :记入操作人员或维修人员检测故障模式的方法。 第十一栏(补偿措施) :指出消除或减轻故障影响的补偿措施。它们可以是设计上的补救 措施,也可以是操作人员的应急补救措施。 第十二栏(严酷度) :根据故障影响确定每一故障模式的严酷度类别(对应初次约定层 次) 。 第十三栏 (备注) :主要记录与其它栏有关的注释及说明,如对改进设计的建议、异常 状态的说明及冗余设备的故障影响等。 4.5.3 危害性分析(CA) 危害性分析是对 FMEA 的补充和扩展,是在进行 FMEA 的基础上才能进行的,总的分析过 程即为故障模式影响及危害性分析(FMECA) 。 危害性分析有定性分析和定量分析两种方法,选择哪种方法应根据具体情况决定。在不 能获得产品的技术状态数据或故障率数据的情况下,应选择定性的分析方法。进行定量分析 时所用的故障率数据源应与其他可靠性分析时所用的数据源相同。 1)危害性的定性分析 定性分析的方法是对 FMEA 中确定的各故障模式发生的概率进行评价,将故障模式发生 概率按一定规定分成不同的等级: ?A 级(经常发生)——在产品工作期间内某一故障模式的发生概率大于产品在该期间 内总的故障概率的 20% ?B 级(有时发生)——在产品工作期间内某一故障模式的发生概率大于产品在该期间内 总的故障概率的 10%,但小于 20% ?C 级(偶然发生)——在产品工作期间内某一故障模式的发生概率大于产品在该期间内 总的故障概率的 1%,但小于 10% ?D 级(很少发生)——在产品工作期间内某一故障模式的发生概率大于产品在该期间内 总的故障概率的 0.1%,但小于 1% ?E 级 (极少发生) ——在产品工作期间内某一故障模式的发生概率小于产品在该期间内 总的故障概率的 0.1% 2)危害性分析表格

危害性分析表的示例如表 1-22 所示。
表 1-22 危害性分析表

初始约定次 约定层次
代 码 产 品 或 功 能 标 志 功 能 故 障 模 式

任务 分析人员
故 障 原 因 任 务 阶 段 与 工 作 方 式 严 酷 度 类 别

审核 批准
故 障 概 率 或 故 障 率 数 据 源 故障 率 故 障 模 式 频 数 比



页共


故障模 式危害 度 (cmj) 产品危害度 备 注

填表日期

?? ?
p

故障影 响概率

?? ?
j

工 作 时 间 (t)

c

r

?

?C

mj

? ? ?
j

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

危害性分析表格的前七个栏目的内容与 FMEA 表格相同。 第八栏(故障概率或故障率数据源) :当进行定性分析时,将对该故障模式发生概率评定 的等级填入即可,不再填写表格的其余栏目而直接绘制危害性矩阵。 (定性分析时也可在 FMEA 表格的最右侧加一列栏目,填写评定的该 “故障模式发生概率等 级”而不必另绘危害性分析表格) 。 第九栏(故障率?p) :?p 可通过可靠性预计得到。如果是从其它资料查到的产品基本故 障率λ b,则需要用应用系数 ?? A? 、环境系数 ?? E ?、质量系数 ? Q 修正工作应力的差异。 第十栏 (故障模式频数比 α j) :α
j

? ?

表示产品以故障模式 j 发生故障的百分比。如果列

N 出某产品所有 N 个模式,则 ? ? j ? 1 。 j ?1

第十一栏(故障影响概率 ?j) :?j 是产品以故障模式 j 发生故障而导致系统任务丧失的 条件概率。 第十二栏(工作时间 t) :以产品每次任务的工作小时数或工作循环次数表示。 第十三栏(故障模式危害度 Cmj) :Cmj 是产品危害度的一部分,是产品的第 j 个故障模式 的危害度:

Cmj = ?p ·α
度的总和:

j

· ?j · t

(1-32)

第十四栏(产品危害度 Cr) :Cr 是该产品在某一特定的严酷度类别下的各故障模式危害

Cr
式中 n

n = ? Cmj j=1

=

j=1

?

n

?p ·α j· ?j ·t

(1-33)

为该产品在相应严酷度类别下的故障模式数。

第十五栏 (备注) : 记入与各栏有关的补充与说明、 有关改进产品质量与可靠性的建议等。 3)危害性矩阵 危害性矩阵用来确定和比较每一故障模式的危害程度,进而为确定改进措施的先后顺序 提供依据。 矩阵图的横坐标用严酷度表示, 纵坐标用产品危害度 Cr 或故障模式发生概率等级表示 (如 图 1-12) 。将各故障模式的严酷度类别及故障模式发生概率或产品的危害度标在矩阵的相应 位置,从原点开始,所记录的故障模式分布点沿着对角线方向距离原点越远,其危害性越大, 越需要采取措施应对。 故障模式发生概率等级 A 危 B 害 C 度 D ( Cr ) E Ⅳ Ⅲ Ⅱ Ⅰ 严酷度类别
图 1-12 危害性矩阵示例

危害性增大

4) FMECA 报告 报告应明确指出分析的层次,总结出分析的结果,写明分析所使用的数据源及方法,并 应包括系统定义说明,所得到的分析数据及表格。 应在报告中列出根据 FMECA 归纳的可靠性关键产品清单,包括 I 类和 II 类故障模式清 单(如表 1-23 所示)和单点故障清单,单点故障清单中列出每个单点故障的发生概率等级 或危害度。

表 1-23

I、II 类故障模式清单 填表人:陈乃川 批 故障 影响 时序提 准:包为民 严酷度 改进、补偿措施 代码 ?继电器触点串并联 I 前运行 合 中继接力 正确时 ?弹上机直接带动 1K84 和 序码发 II 1K85 的光电输出口 ?软件编码冗余 OC 门失效 乱发码 形成多 码,有 八位光耦 ? 换高速光耦 可能成 翻转速度 为乱 差异 发有用 码 II/ ?综合控制器中加入锁存 III 器 试样解决 试样解决 不出或 据 ?软件加肪冲宽度识别判 试样解决 填表日期:2004 年 6 月 25 日 故障模式未 备注 消除原因

初始约定层次: **导弹 约定层次:时序火工品分系统 序 号 产品名 称型号 关键故障 模式 继电器触 1 1K13-31 点瞬时闭

时序分 2 系统

传输中任 一光耦或

时序分 3 系统

4.5.4

FMEA 应注意的事项

1)应在规定的产品层次上进行 FMEA 或 FMECA,并考虑在规定产品层次上寿命剖面和任 务剖面内的所有可能的故障模式; 2)在设计的早期阶段开始进行 FMEA(FMECA) ,应由设计人员在进行产品设计过程中并 行地做 FMEA,并与设计和制造工作协调进行; 3)参照 GJB1391 提供的程序和方法在不同阶段采用功能法、硬件法和工艺法进行分析, 软件的 FMEA 可参考功能法和工艺法进行; 4)同一型号中,FMEA 表格的内涵应统一; 5) 经分析列出的Ⅰ、Ⅱ类故障模式清单,应当与关键件(特性) 、重要件(特性)项目 明细表相协调。

4 .6

故障树分析(FTA)

4.6.1

概述

从上一节我们看到,FMEA 提供了一种自下而上即由元器件、零部件到系统的故障因果 关系的分析方法,由故障模式开始,往上分析这一故障对局部的影响、高层次影响直到最终 影响。与 FMEA 相反,由系统的不希望出现的故障(顶事件)开始,往下分析导致顶事件发 生的直接原因(中间事件) ,再往下分析导致中间事件的原因,依次类推一步一步往下直到找 出可能引发系统故障的全部基本原因 (底事件) , 这种自上而下的故障因果关系分析方法就是 FTA。以顶事件为“根” ,中间事件为“节” ,底事件为“叶”的反映故障因果关系的树状结 构图就是故障树。 故障树分析就是通过对可能造成产品故障的硬件、软件、环境、人为因素等进行分析, 画出故障树,从而确定产品故障原因的各种可能组合方式和(或)其发生概率的一种分析技 术。 FTA 开创于 20 世纪 60 年代的宇航工业,随后很快扩展到核工业及其它工业部门。FTA 至今已被公认为对复杂系统进行安全性、可靠性分析的一种好方法,其基本思路也可用于其 它领域。FTA 的主要作用是: ——评估一个系统的安全性如何, 或者对不同设计方案的安全性进行比较, 供择优决策; ——对于大型复杂系统,FTA 可能发现导致意外的致命事件。这一事件可能是由几个非 致命的故障组合而成的,可能包括硬件、软件、环境、人为等因素或者它们的组合; ——为制定产品的使用、试验及维修程序提供技术依据; ——对于一个不曾参与系统设计的管理和使用人员来说,FTA 为他们提供了一个形象的 管理、使用维修的“指南”及查找故障的“线索表” 。 以下我们介绍 FTA 中常用的几个符号。 由于故障树是一种特殊的倒立树状逻辑因果关系图,所以要用表示事件的符号、逻辑门 符号描述系统中各种事件之间的因果关系。逻辑门的输入事件是输出事件的“因” ,逻辑门的 输出事件是输入事件的“果” 。 a)表示事件的符号(见图 1-13)主要有: ?底事件,是导致其他事件的原因事件,位于故障树底端,总是某个逻辑门的输入事件。 它包括“基本事件” (无须探明其发生原因的底事件)及“未探明事件” (暂时不必或不能探 明其原因的底事件) 。 ?结果事件,是由其它事件或事件组合所导致的事件,位于某个逻辑门的输出端。它包 括“顶事件” (所关心的最后结果事件)及“中间事件” (位于底事件和顶事件之间的结果事 件,它既是某个逻辑门的输出事件,同时又是别的逻辑门的输入事件) 。 ·此外还有开关事件、条件事件等特殊事件符号。

底事件

结果事件

基本事件符号

未探明事件符号 图 1-13

顶事件符号 几个主要表示事件的符号

中间事件符号

b)逻辑门符号:在 FTA 中逻辑门只描述事件间的因果关系。与门、或门和非门是三个基本 门,其它的逻辑门如“表决门” 、 “异或门” 、 “禁门”等为特殊门。 4.6.2 FTA 的步骤 1) 建造故障树 严格定义“顶事件” 。 “顶事件”的发生是由于若干“中间事件”的逻辑组合所导致, “中 间事件”又是由各个“底事件”逻辑组合所导致。这样自上而下的按层次的进行因果逻辑分 析,逐层找出风险事件发生的必要而充分的所有原因和原因组合,就构成了因果关系图。 例如,对飞机的机翼重量这个风险事件进行分析: “重量”为顶事件,可能使飞机的速度 达不到预期的要求;造成超重的原因可能是“材料”的问题,或“设计”未满足重量的预期 值的要求;造成“设计”问题的原因(假设)是设计“人员”只注意靠增加发动机的能力来 提高速度,未考虑重量的影响,同时也未按设计控制“程序”的要求进行认真的评审、未能 及时发现问题。 “设计”即为中间事件,而“人员” 、 “程序”及“材料”即为底事件。根据逻 辑关系画出的故障树如图 1-14: 图中, 事件 T = X1∪ M = X1 ∪(X2∩X 3)

符号 “ ∪” 表示 逻辑“或” ; “∩”表示逻辑“与” 。 这只是建造故障树的一个简单的例子,实际情况要复杂得多。除用人工演绎建造故 障树外还可用计算机进行自动建树。 人工建造故障树的基本规则如下: ?明确建树的边界条件,确定简化系统图; ?顶事件应严格定义; ?故障树演绎过程首先寻找的是直接原因而不是基本原因事件; ?应从上而下逐级建树; ?建树时不允许逻辑门——逻辑门直接相连; ?妥善处理共因事件。

重量 T

+

材料 X1
1

设计

M

· ·

人员
X2 X3

程序

图 1-14

故障树(示例)

2) 对故障树进行规范化、简化和模块分解 a)将建造好的故障树简化变成规范化故障树, “规范化故障树”是仅含底事件、结果事 件及“与” 、 “或” 、 “非”三种逻辑门的故障树。 故障树的规范化的基本规则为: 按规则处理未探明事件、开关事件、条件事件等特殊事件 保持输出事件不变、按规则将特殊门等效转换为“与” 、 “或” 、 “非”门 b) 按集合运算规则(结合律、分配律、吸收律、幂等律、互补律)去掉多余事件和多 余的逻辑门。 c) 将已规范化的故障树分解为若干模块, 每个模块构成一个模块子树, 对每个模块子树 用一个等效的虚设的底事件来代替,使原故障树的规模减少。可单独对每个模块子树进行定 性分析和定量分析。然后,可根据实际需要,将顶事件与各模块之间的关系转换为顶事件和 底事件之间的关系。 3)求故障树的最小割集,进行定性分析 “割集” 指的是故障树中一些底事件的集合, 当这些底事件同时发生时顶事件必然发生。 若在某个割集中将所含的底事件任意去掉一个,余下的底事件构不成割集了(不能使顶事件

必然发生) ,则这样的割集就是“最小割集” 。最小割集是底事件的数目不能再减少的割集, 一个最小割集代表引起故障树顶事件发生的一种故障模式。 a)求最小割集 求最小割集的方法有“下行法” 和“上行法” : ?下行法的特点是根据故障树的实际结构,从顶事件开始,逐级向下寻查,找出割集。 规定在下行过程中,顺次将逻辑门的输出事件置换为输入事件。遇到与门就将其输入事件排 在同一行(布尔积) ,遇到或门就将其输入事件各自排成一行(布尔和) ,直到全部换成底事 件为止。这样得到的割集再两两比较,划去那些非最小割集,剩下的即为故障树的全部最小 割集。 ?上行法是从底事件开始,自下而上逐步地进行事件集合运算,将或门输出事件表示为 输入事件的布尔和,将与门输出事件表示为输入事件的布尔积。这样向上层层代入,在逐步 代入过程中或者最后,按照布尔代数吸收律和等幂律来化简,将顶事件表示成底事件积之和 的最简式。其中每一积项对应于故障树的一个最小割集,全部积项即是故障树的所有最小割 集。 b)定性分析 找出故障树的所有最小割集后,按每个最小割集所含底事件数目(阶数)排序,在各底 事件发生概率都比较小,差别不大的条件下: ?阶数越少的最小割集越重要。 ?在阶数少的最小割集里出现的底事件比在阶数多的最小割集里出现的底事件重要。 ?在阶数相同的最小割集中,在不同的最小割集里重复出现次数越多的底事件越重要。 例如,一个故障树有 4 个最小割集: { X1},{ X2,X 5 },{ X3,X 5},{ X2 ,X3 ,X4} 底事件 X1 最重要,X 5 比 X2 、X3 重要,X 4 最不重要; 底事件的重要程度依次为 X1 ,X 5 , X2 或 X3 ,X 4 。 在数据不足的情况下,进行上述的定性比较,找出了顶事件(风险事件)的主要致因,定 性的比较结果可指出改进系统的方向 。 4)定量分析 在掌握了足够数据的情况下,可进行定量分析。 a)顶事件发生概率的计算 在掌握了“底事件”的发生概率的情况下,就可以通过逻辑关系最终得到“顶事件”的 发生概率,用 Pf 表示。故障树顶事件 T 发生概率是各个底事件发生概率的函数,即

Pf(T)= Q(q1 , q2 ,?, qn)

(1-34)

工程上往往没有必要精确计算,采用近似的计算方法一般可满足工程上的要求。例如, 当各个最小割集中相同的底事件较少且发生概率较低时,可以假设各个最小割集之间相互独 立,各个最小割集发生(或不发生)互不相关,则顶事件的发生概率: r Pf(T)= 1 - ? [ 1 — P(Ki)] (1-35) i=1 式中, r 为最小割集数 P(ki)为第 i 个最小割集事件的发生概率。 在飞机重量风险事件的例子中, 假设底事件 X1, X2, X3 , X 4, X 5 的发生概率分别是 q1 , q2 , q3 ,q4 , q5,顶事件 T 的发生概率 Pf 为 :

Pf = 1 -(1 - q1 ) (1 - q2 q5) (1 – q3 q5) (1 - q2 q3 q4) (1-36)
b)重要度的计算 故障树中各底事件并非同等重要,工程实践表明,系统中各部件所处的位置、承担的功 能并不是同等重要的,因此引入“重要度”的概念,以标明某个部件(底事件)对顶事件发 生概率的影响大小,这对改进系统设计、制定应付风险策略是十分有利的。对于不同的对象 和要求,应采用不同的重要度。比较常用的有四种重要度,即:结构重要度、概率重要度、 相对概率重要度及相关割集重要度。各自的定义及计算公式见 GJB/Z768A。 ?底事件结构重要度从故障树结构的角度反映了各底事件在故障树中的重要程度 ?底事件概率重要度表示该底事件发生概率的微小变化而导致顶事件发生概率的变化 率。 ?底事件相对概率重要度表示该底事件发生概率微小的相对变化而导致顶事件发生概率 的相对变化率。 ?底事件的相对割集重要度表示包含该底事件的所有最小割集中至少有一个发生的概率 与顶事件发生概率之比。 定量分析方法需要知道各个底事件的发生概率,当工程实际能给出大部分底事件的发生 概率的数据时,可参照类似情况对少数缺乏数据的底事件给出估计值;若相当多的底事件缺 乏数据且又不能给出恰当的估计值,则不适宜进行定量分析,只进行定性分析。 5)编写故障树分析报告 报告可包括以下内容: a) 前言(指明本次分析的任务,所涉及的范围) ; b) 系统描述(系统的功能原理、边界定义、运行状态描述) ;

c) 基本假设; d) 系统故障的定义和判据; e) 系统顶事件的定义和描述; f) 系统底事件的定义和描述; g) 故障树建造; h) 故障树的定性分析; i) 故障树的定量分析; j) 故障树分析的结果和建议; k) 附件(可包括可靠性数据表及数据来源说明;其他希望补充说明的系统资料,如系 统原理图、功能框图、可靠性框图等;故障树图;最小割集清单;重要度排序表) 。 4.6.3 FTA 应注意的事项

a)顶事件应有严格定义,向下逐级建树,不允许逻辑门与逻辑门直接相连; b)故障树的边界应与系统的边界相一致,如果简化则不能压缩掉具有隐患的底事件; c)应妥善处理共因事件,故障树的不同分支中出现的同一共因事件必须使用同一事件 标号; d)FTA 应随研制阶段的展开不断完善和反复迭代; e)设计更改时,应对 FTA 进行相应修改; f)分析结果发现设计上的薄弱环节,应当采取相应措施。

4 .7

制定可靠性设计准则 概述

4.7.1

可靠性设计准则是根据在设计、生产、使用中积累起来的能提高产品可靠性的行之有效 的经验和方法,经总结、提炼而成的产品设计中应遵循的细则。 可靠性设计准则是进行可靠性设计的重要依据。可靠性设计准则的制定步骤:收集并分 析有关资料,形成可靠性设计准则初稿;交设计人员和可靠性管理人员讨论,修改补充,使 其进一步型号化、产品化;整理、定稿,使之条理化、系统化、科学化。 产品可靠性设计准则的一般内容: a) 概述:说明产品名称、型号、功能和配套关系,产品合同规定的可靠性定性、定量 要求等; b) 目的:指导设计人员进行可靠性设计,亦是评价产品可靠性设计的一种依据; c)适用范围:适用于何型号、何产品;

d) 依据:一般有合同要求,有关规定、标准、规范,相关的体系文件要求等; e) 可靠性设计准则:以某产品可靠性设计准则条款形式输出,内容见 4.7.2。

4.7.2

可靠性设计准则的主要内容

可靠性设计准则一般包括以下方面。其中每一项内容都可以详细展开。事实上,电路容 差分析、热设计、降额设计等都可以单列为可靠性设计与分析技术。 1)采用成熟的技术和工艺 优先选用经过考验、验证、技术成熟的设计方案(包括硬件和软件)和零、组、部件、 元器件,充分考虑产品设计的继承性。 2)简化设计 优先选用标准件,提高互换性和通用化程度;采用模块化设计;最大限度地压缩和控制 原材料、元器件、零、组、部件的种类、牌号和数量。 3)合理选择、正确使用元器件、零部件和原材料。 (详见 4.8) 4)降额设计 降额是低于额定应力来使用产品,以提高其使用可靠性的一种方法。应遵循降额设计准 则。对于电子、电气和机电元器件根据 GJB/Z35 对不同类别的元器件按不同的应用情况进行 降额。对于机械和结构部件,应重视应力—强度分析,并根据具体情况,采用提高强度均值、 降低应力均值、降低应力均值和强度方差等基本方法,找出应力与强度的最佳匹配,提高设 计的可靠性。

于元器件或降额设计是使元器件或设备工作时承受的工作应力适当低设备 规定的额定值,达到降低基本故障率,提高使用可靠性的目的。电子产品和机 械产品都应做适当的降额设计,过度的降额并无益处,反而对设备的正常工作 和可靠性不利。 一般分 3 个降额等级(? 级、Ⅱ级、Ш级) 。可按 GJB/Z35 元器件降额准

则执行。

表 2.1 元器件降额准则示例 降额等级 元器件种类 降额参数 Ⅰ
电源电压 模拟 电路 分立半 导体器 件 放大器 输入电压 输出电流 功率 反向电压 晶体管 电流 功率 连续触 点电流 小功率负载(<100mW) 电阻负载 电容负载 触点电压 触点功率 光纤与光缆 张力 光纤 光缆 0.5 0.5 0.40 0.40 0.70 0.60 0.70 0.70 0.60 0.60 0.50


0.80 0.70 0.80 0.75 0.70 0.70 0.65 不降额 0.75 0.75 0.50 0.50 耐粒试验的 0.20 拉伸额定值的 0.50


0.80 0.70 0.80 0.80 0.80 0.80 0.75 0.90 0.90 0.70 0.70

开关

5)容错、冗余和防差错设计 容错是指系统在其组成部分出现特定故障或差错的情况下仍能执行规定功能的一种设 计特性。冗余是指产品通过采用一种以上的手段保证在发生故障时仍能完成同一规定功能的 一种设计特性(完成该功能的每一种手段未必相同) 。采用容错、冗余和防差错设计都可以提 高系统的可靠性。需要注意的是采用冗余设计必须综合权衡,冗余使系统或设备的复杂性、 重量和体积增加,会降低基本可靠性,一般在系统中较低层次和可靠性关键环节采用冗余技 术更有效。

余度技术是系统或设备获得高可靠性、高安全性和高生存能力的设计方法
之一。余度系统运行方式如图 4 所示:

简单并联 并联 双重并联 混合并联 简单多数表决 表决 余度技术 多数表决 自适应式多数表决 门连接式多数表决

工作余度类

非运行状态备用

非工作余度类(备用余度类)
运行状态备用

图 4 余度技术分类 采用简化设计、 降额设计等方法都无法满足系统或设备的可靠性要求时, 余度技术可供采用的方法。余度使系统或设备的复杂性、重量和体积增加,会 降低基本可靠性。一般在系统中较低层次单元和可靠性关键环节采用余度技术 更有效。
6)电路容差设计 电路容差设计是基于电路容差分析的一种设计技术。通过电路容差分析可以预测电路性 能参数的稳定性,掌握电子元器件和电路在规定的使用条件范围内,电路组成部分参数的容 差对电路性能容差的影响。电路容差分析的工作要点如下: 1)应对受温度和退化影响的关键电路的元器件特性进行分析。这些特性包括电阻值、 电容量、晶体管增益、继电器动作时间等。必要时,应对线绕电阻器的电感、寄生电容等现 象进行分析。 2)分析时应考虑输入信号或电源电压、频率、带宽、阻抗、相位等参数的最大变化(偏 差、容差)及负载阻抗特性。也应考虑在最坏情况下的电路节点参数(包括电压、电流相位 和波形) 、电路元件的上升时间、时序同步、电路功耗以及负载阻抗的匹配等。应分析上述这 些参数对电路性能的影响。 3)参照 GJB/Z89 提供的方法和程序进行分析。应在电路节点和输入、输出点上分析元 器件寄生参数、输入信号、以及阻抗容差等对电路参数的影响。

4)应在初步设计评审时提出需进行分析的电路清单,提出分析结果并采取相应措施。 7)防瞬态过应力设计 这是确保电路稳定、可靠的一种重要方法。必须重视相应的保护设计,如在受保护的电 线和吸收高频的地线之间加装电容器;为防止电压超过额定值(钳位值) ,采用二极管或稳压 管保护;采用串联电阻以限制电流值等。 8)热设计 对热敏感的产品必须实施热分析,通过分析来核实并确保不会有元器件会暴露在超过线 路应力分析和最坏情况分析所确定的温度环境中。

散热的基本方式:①传导;②对流;③辐射。
热设计的基本方法有: a) 提高元件、材料的允许工作温度; b) 减少发热量; c) 加快设备的散热(传导、对流、辐射)速度; d) 用冷却的方法改变环境温度。 电子产品的可靠性热设计可参照 GJB/Z27 进行。 9)环境保护设计(包括工作与非工作状态) 正确的环境防护设计包括:温度防护设计;防潮湿、防盐雾和防霉菌的三防设计;冲击 和振动的防护;防风沙、防污染、防电磁干扰、抗辐射以及静电防护等。

a) 防潮湿设计 材料、空气循环、干燥装置、保护涂层、灌封、密封等。 b) 防盐雾和腐蚀设计 防止电解液的形成,可采取钢材发兰、铝材阳极化处理,橡皮垫圈、涂覆防 护层,密封等。 c) 防霉菌设计 不用皮革、棉毛等材料,防霉菌处理,密封并置干燥剂等。 d) 抗冲击、振动和噪声的设计 ①、消源(冲击源、振源、声源)设计;②隔离设计,要精心设计隔振器的

阻尼,防止振源频率与隔振频率相近时使隔振器共振;③减振设计,如阻尼减 振,摩擦减振等。④抗震设计,如贴面焊接,贴面安装,点封等。 e) 电子设备抗辐射设计。 一是采用能削弱辐射影响的封装屏蔽材料;二是从线路结构采用限流 电阻。退耦、旁路滤波等措施。 防电磁干扰设计中需考虑的环境因素见图 1-15。
解决系统的电磁兼容性问题,在设计上从三个方面采取措施:①减少消除干扰;②提高 搞干扰能力;③破坏扰传输条件。 全面开展电磁兼容性设计,应进行下列工作:①接地与塔接,②屏蔽,③滤波,④电缆 网设计,⑤仪器电路设计,⑥结构电磁兼容性设计,⑦材料、元件及工艺,⑧防雷电,⑨防 静电,⑩电爆器件电磁兼容性设计。 例如,某工厂对防静电的指标要求如下:防静电手腕与接地线之间的电阻为 800KΩ ≦R ≦9MΩ ;防静电周转箱为 7.5× 105 ? ≤R≤1010 Ω ;防静电台垫为 7.5× 105 ? ≤R≤109 Ω 。 可参考 GJB/Z105-98 电子产品防静电控制手册。

电磁干扰环境

传导干扰源

辐射干扰源

功能干扰源

非功能干扰源

功能干扰源

非功能干扰源

脉冲产生器 陀蚰仪 传感器 步进马达 步进器 计算机时钟信号 多谐振荡器 斩波器 交流基准 信号发生器 磁放大器激励级 程序继电器 交流噪声

电机整流 电子转换器 加温控制器 换流器 继电器 断流器 整流电源 电磁阀 伺服马达 电源卸载 电感载荷通断

本地振荡器 无线电发射机 功率放大器 信号产生器 同步器 转发器 应答机 非线性电路 天线 调制器

环境非线性 点火系统 机动车 工业设备 科研设备 医疗设备 医疗设备 荧光灯 静电放电 自然干扰源 大气雷电 太阳噪音 宇宙噪音

图 1-15 电磁干扰环境组成

a) 系统抗干扰设计 主要有串模干扰和共模干扰。串模干扰是干扰信号和调制信号迭加在一起, 反馈入系统输入端。可采用输入滤波器,双积分型 A/D 变换器等来抑制。共模 干扰是在信号源接地和系统接地之间因不等电位而出现的一类干扰,可采用高

质量稳压电源,对电源变压器采取屏蔽措施,系统输入回路采用完全隔离法或 浮地接入法来抑制 b) 接地设计 〃所有地线尽可能粗、尽可能短,以减小接地电阻; 〃使接地电路各自形成回路,减小电路与地线之间的电源耦合 〃电源安全地、交流地和直流地应分开 〃上天电子产品机壳不得与电路地相连,应通过电缆网与地连接,严禁交 流中性线与系统地混接,系统中的“安全地”与“工作地“均采用一点接地。 c) 布线及其他设计
10)与人的因素有关的设计 与人的因素有关的设计就是应用人类工程学于可靠性设计, 使产品符合使用者的生理特 性,减少由于人为因素可能导致的设备或系统的故障。 11)软件可靠性设计 a)划分并确定关键软件; b)确定软件可靠性定性、定量要求; c)制定并贯彻软件可靠性设计准则,具体的设计准则可参照 GJB/Z102。 ·采用结构化开发方法; ·简化设计; ·采用成熟技术; ·提高软件透明度; ·采用避错、查错、容错设计方法; ·实施安全性设计。 d)进行软件可靠性分析。
—静态分析法 软件可靠性 分析方法 —动态分析法 —Petri 网分析法 —实时逻辑分析法

—软件故障树分析(SFTA)
—软件故障模式影响及危害度分析(SFMEA 或 SFMECA)

SFTA 和 SFMEA 或 SFMECA 可以用通用的 FTA 及 FMEA 或 FMECA 的分析技术。

Petri 网是一种系统的数学和图形的描述和分析工具。 作为一种图形工具, 可以使用 “令 牌”(token)来模拟系统的动态行为与并发活动;作为一种数学工具,可以建立状态方程及 系统行为的数学模型。利用 Petri 网可以得到有关系统结构和动态行为方面的信息,可对开 发的系统予以评价或改进。Petri 网方法已经被认为是进行软件安全性分析的最有效方法之 一。 4.7.3 a) 制定可靠性设计准则应注意的事项 可靠性设计准则应在产品设计前制定, 形成正式的技术文件, 并经审批颁布实施;

b) 根据组织的实际情况,对同一类产品可制定通用的可靠性设计准则,对新的或重新 设计的产品应制定专用的可靠性设计准则; c)可靠性设计准则应与可靠性要求相适应。

4.8 元器件、零部件和原材料选择和控制 4.8.1 概述 元器件、零部件和原材料是构成系统和设备最基本的单元,元器件、零部件和原材料选 择和使用对装备的可靠性有直接影响,必须严加控制。 4.8.2 选择和使用应当遵循的原则 a) 所选元器件、 零部件和原材料的技术性能、 质量等级、 使用条件等应满足产品的要求; b) 优先选用经实践证明质量稳定、 可靠性高、 有发展前景且供应渠道可靠的标准元器件、 零部件和原材料; c) 在产品设计时,应最大限度地压缩元器件、零部件和原材料的品种、规格及其供方的 数量; d) 要严格控制新研制的元器件、零部件和原材料的使用。未经技术鉴定的元器件、零部 件和原材料不得在产品中使用; e) 要严格控制选用进口元器件、 零部件和原材料, 采购产品的质量等级和采购渠道应当 经过认真的审核和确认,以保证它们的质量。 4.8.3 选择和使用工作要点 a) 组织应根据研制产品的特点制定元器件、 零部件和原材料的选择和使用控制要求, 并 形成控制文件; b) 应根据 GJB3404 对元器件的选择、采购、监制、验收、筛选、保管、使用、故障分析 及相关信息进行全面管理。必要时,应进行破坏性物理分析; c) 组织应制定元器件、零部件和原材料的优选目录,并经顾客认可; d) 组织应制定元器件、零部件和原材料的应用指南; e) 组织要通过建立、健全故障报告分析纠正措施系统,加强对元器件、零部件和原材料 质量信息的收集、传递、分析、利用及管理工作。 4.8.4 元器件、零部件和原材料选择和控制应注意的事项 a) 组织应制定关于元器件、零部件和原材料的选择和使用控制的文件; b) 组织制定的元器件、零部件和原材料的优选目录,一般应经顾客认可; c) 应当对禁用的元器件、零部件和原材料作出规定; d) 选用的元器件、 零部件和原材料不仅要有常规的性能要求, 而且还要明确其等级和筛 选要求; e) 应明确对元器件、零部件和原材料的评审要求。 4.9 确定功能测试、包装、贮存、装卸、运输和维修对产品可靠性的影响

4.9.1 概述 产品的功能测试、包装、贮存、装卸、运输和维修常常对其可靠性带来影响,尤其是某些武器装 备很复杂,对维修和综合保障的要求高,有的贮存期很长,因此在设计研制早期就要考虑这些影 响。 a)贮存。对某些产品,必须考虑贮存对可靠性的影响。图 1-16 表示了一个贮存剖面, 表 1-23 列出了国外两种装备贮存时间和实际工作时间的比较情况。

图 1-16

贮存剖面

表 1-23 装备

国外两种装备的贮存时间比 贮存寿命 10-12 年 15 年 工作时间 30min


贮存时间(%) 99.9994 99.97

贮存时间 工作时间 170000 3332

导弹电子仪器 飞机电子仪器

4000 小时

①未统计定期测试的工作时间

贮存期间有气候环境、太阳辐射、冲击、振动、霉菌、电磁辐射等环境因素的影响,最 重要的是温度和湿度,沿海地区还有盐雾。需进行耐环境设计,对于易腐蚀、霉变、老化的 部件(关键件、重要件)还应进行“三防”设计。 b)包装。包装方式及包装材料不符合规定要求,会大大降低产品的贮存可靠性。要防止 包装材料与被包装产品发生化学反应并引起分解和劣化。 包装箱的设计准则包括:①在装卸与运输过程中,包装箱受到的外力主要是冲击力,因 此,要有足够的机械防护能力;②避免运输中的共振现象,一般情况下运输工具的振动频率 与包装箱系统的固有频率的比值必须大于 2 的平方根。 可参考 GJB1454-93 防护包装规范。 c)运输。运输中遇到具有破坏性的环境因素是冲击和振动。冲击与振动的强度取决于运 输方式、包装方式与堆放形式。表征振动特性的参数是振幅和频率,冲击的参数是加速度。

各种参数的大致范围为表 1-24 所示。
表 1-24 不同运输方式的环境因素参数范围 公路 振动频率(HZ) 振动加速度(g) 5-500 1-2 铁路 2-7 30-50 飞机 20-60 >12


轮船 1-100 <2

① 卡车运输 ②起飞或着陆时

4.9.2

对此工作项目应注意的事项

a)对有贮存和使用寿命要求的产品应进行相关的分析、试验和评估,并在设计中考虑 产品的贮存要求; b)产品的包装应与运输、贮存方式相匹配; c)产品设计应考虑投入使用或贮存期间的定期检查、功能测试和维修问题。 4.10 其他设计分析技术 4.10.1 潜在通路分析 潜在通路分析是指在产品的所有组成部分均正常工作的条件下,确定能抑制正常或诱发 不正常功能的潜在状态的一种分析技术。 通常潜在通路有四种表现形式:潜路径 (电路中不希望有的通路)、潜时序(某种功能在 不希望出现的时间内存在或发生)、潜标记(开关或控制系统上的标记不得当,会引起操作失 灵)、潜指示(会造成错误操作的混淆或不正确指示)。 潜在通路分析只考虑对完成任务和安全是关键性的组件和电路,主要是机电电路,其次 是分立式的模拟和数字电路,不应用在贮存器、数据处理设备等成品硬件上。分析时不识别 由于硬件故障制造或对环境敏感所引起的潜在通路,也不识别硬件故障、工作异常引起的潜 在通路,只注重系统各元部件之间的相互连接、相互关系及相互影响。GJB450A 附录 B 提供 了潜在通路分析线索表。 潜在通路分析的依据有:工程图(原理图、布线图、安装图)和生产文件。 潜在通路分析的时机一般在设计阶段的后期文件完成之后,正式投产之前。潜在电路分 析的工作量很大,一般宜用计算机处理。 4.10.2 有限元分析 在可靠性设计中,有限元分析(FEA)的目的是对产品的机械强度和热特性等进行分析 和评价,尽早发现承载结构和材料的薄弱环节及产品的过热部分,以便及时采取改进措施。 特别是对装备任务和安全有关键影响的机械结构件和产品,应尽量实施 FEA。 有限元分析一般在产品研制进展到设计和材料基本确定时进行。进行 FEA 的关键是要正 确建立产品结构和材料对负载或环境响应的模型。

4.10.3 耐久性分析 在可靠性设计中,耐久性分析的目的是发现可能过早发生耗损故障的零部件,确定故障 的根本原因和可能采取的纠正措施。 耐久性分析应当尽早地对关键零部件或已知的耐久性问题进行,应通过评价产品寿命周 期的载荷与应力、产品结构、材料特性和失效机理等进行耐久性分析。随着产品设计过程的 进展,耐久性分析应迭代进行。 不难看出,以上介绍的有限元分析和耐久性分析是主要针对非电子产品可靠性问题的。 可靠性工程技术源于电子产品,但随着技术的发展,非电子产品的可靠性问题越来越引起重 视。事实上,许多系统和设备的故障,甚至许多灾难性故障是由非电子产品引起的。因此, 许多非电子产品的可靠性设计和分析技术处于整个可靠性工程发展的前沿,很多分析技术难 度较大,基础工作和数据信息比较薄弱,还处于起步阶段。 有限元分析和耐久性分析工作的比较可参考表 1-25。
表 1-25 有限元分析和耐久性分析比较 名称 适用对象 应用时机 主要工作 内容 有限元分析 安全和任务关键的机械结构件,如梁、 杆、壳和实体等 初始设计方案之后,产品详细设计完成 之前 根据产品结构和材料对负荷或环境响应 的特点建立合理的模型,通过计算机软 件,对分析对象的机械特性和热特性进 行计算、分析和评价 耐久性分析 机械产品,也可用于机电和电子产品 工程研制早期进行,随设计进度,应迭代进行 用寿命试验、威布尔分析法等,评价产品寿命周 期的载荷与应力、产品结构、材料特性和失效机 理,计算零部件或产品的寿命。

5

可靠性试验与评价
以上我们已经介绍了确定可靠性要求、 根据要求制定可靠性工作计划、 按计划开展可靠性

设计和分析。这些工作完成后的问题是:可靠性要求达到了吗?这就要进行可靠性试验与评 价。可靠性试验是为了了解、评价、分析和提高产品可靠性而进行的试验的总称。 ISO9000 族标准和 GJB9001 都倡导采用“计划——实施——检查——处置、改进” (PDCA)方法。我 们可以用同样的思路来理解可靠性工程实施过程及其中可靠性试验与评价的作用。 回答可靠性要求达到的程度,可采用下面的方法: 1)可靠性鉴定试验; 2)成功的可靠性增长试验; 3)贝叶斯方法评估(不作专门的可靠性试验,利用已有的试验数据进行计算评估) ;

4)连续考机(需科学确定考机时间) ; 5)可靠性分析(适合大型复杂的系统)。 5.1 概述 通常,可靠性试验按照其试验目的可分为可靠性工程试验(含环境应力筛选试验、可靠 性增长试验)和可靠性统计试验(含可靠性鉴定试验、可靠性验收试验) ;按照其试验场地不 同又可分为可靠性内场试验和可靠性外场试验。GJB450A 列出的可靠性试验与评价的工作项 目见表 1-26。
表 1-26 序号 名称 可靠性试验与评价汇总表 适用产品 目的 参考标准 电子产品:设备执行 GJB1032 , GJB/Z 34 ,电 路 板 和 组 件 , 执 行 GJB1032 ;除纯机械产品 以外的非电产品可参考 GJB1032

1

环境应力筛 选

为研制和生产的产品建 立并实施环境应力筛选 主要适用于电子产品, 程序,以便发现和排除 也适用于电气、机电、 不良元器件、制造工艺 光电和电化学产品 和其他原因引入的缺陷 造成的早期故障 通过对产品施加适当的 环境应力、工作载荷, 寻找产品中的设计缺 陷,以改进设计,提高 产品的固有可靠性水 平。

2

可靠性研制 试验

可靠性关键产品

参考 GJB1407 等

3

可靠性增长 试验

通过对产品施加模拟实 际使用环境的综合环境 电子设备 (有定量可靠 应力暴露产品中的潜在 性要求, 任务或安全关 GJB1407 缺陷,并采取纠正措施, 键的、新技术含量高) 使产品的可靠性达到规 定的要求 地面固定设备、 地面移 动设备、舰船用设备、 喷气式飞机设备、 涡轮 螺 旋浆飞机 和直升飞 机设备、 空中发射武器 和 组合式外 挂及其设 备 样 本量少的 复杂产品 (导弹、军用卫星、海 军舰船等) 有使用寿命、 贮存寿命 要求的产品, 加速寿命 试 验一般是 零件或部 件 验证产品的设计是否达 到了规定的可靠性要求

4

可靠性鉴定 试验

GJB899

5

可靠性验收 试验

验证批生产产品的可靠 性是否保持规定的水平 通过综合利用与产品有 关的各种信息,评价产 品是否达到规定的可靠 性要求 验证产品在规定条件下 的使用寿命、贮存寿命

GJB899

6

可靠性分析 评价

7

寿命试验

5.2

环境应力筛选

environmental stress screening(ESS)

5.2.1 概述 环境应力筛选是为预防早期故障,对产品施加规定的环境应力,以发现和剔除制造过程 中的不良零件、元器件和工艺缺陷的一种工序和方法。 环境应力筛选的主要目的是剔除试制、制造过程使用的不良元器件和引入的工艺缺陷, 以便提高产品的可靠性。国内外的实践均表明,采用环境应力筛选技术是提高产品可靠性、 降低使用维修费用的最为有效而且比较经济的手段之一。 ESS 应尽量在每一组装层次上都进行,例如电子产品,应在元器件、组件、设备等各组 装层次上进行,以剔除低层次产品组装成高层次产品过程中引入的工艺缺陷和接口方面的缺 陷。 ESS 可用于装备的研制阶段,生产阶段及大修过程。在研制阶段,ESS 也可作为可靠性 增长试验和可靠性鉴定试验的预处理手段,生产阶段和大修过程可作为出厂前的常规检验手 段,用以剔除产品的早期失效。 GJB1032 提供了电子产品环境应力筛选方法,也可用于电气、机电、光电和电化学产品。 实际进行电子产品的环境应力筛选时,可以有关标准为基础剪裁确定筛选应力的大小和持续 时间。对非电子产品,环境应力筛选应力种类和量值可借鉴 GJB1032 并结合产品结构特点确 定。

5.2.2 元器件筛选
筛选的定义:一种通过试验剔除不合格或有可能早期失效产品的方法。

〃高温存储和温度循环。
筛选分一次筛选和二次筛选,一次筛选是生产厂进行的筛选,使用厂根 据使用的需要再进行一次筛选称为二次筛选。筛选的顺序如下: 如:GJB548 规定集成电路,存储温度(℃)分别为 100、125、150、175,则存 储时间(h)分别为 1000、168、24.6。 〃恒定加速度 电子产品一般只要通过 100g 的离心加速度的试验就可满足使用要求。 〃PDA(percent Defective Allowable)技术。即批允许不合格率。该技术已 被广泛使用,效果显著,成本不高。需确定控制值,即 PDA 值(30%或 50%) ,通

过功率老炼后,计算批缺陷率 P1 值,比较 P1 与 PDA,确定该批拒收还是接受。 〃老炼 使元器件在一定环境温度(室温或高温)下工作一段时间,GJB548 规定了 动态老炼温度和老炼时间对照表。一般要求在试验结束后 96h 内将被测电路测 完。 〃检漏 检验漏气率,分粗检和细检。

5.2.3 ESS 实施程序 a)制定 ESS 方案 方案中应包括实施筛选的产品层次及各层次的产品清单、筛选方法、筛选应力和水平、 筛选过程中监测的性能参数、实施和监督部门及其职责等。 b)实施 ESS 方案 按规定的 ESS 方案实施。GJB1032 对试验有如下规定: ?试验条件: 温度循环图见 GJB1032 的图 1, 要求温度试验箱内温度不得超过试验温度± 2℃,温度变化速率为 5℃/min,一次循环时间 3h20min 或 4h。在故障剔除试验中,温度循 环 10 次或 12 次, 相当试验时间 40h。 在无故障检验中为 10-20 次或 12-24 次, 时间为 40-80h。 随机振动功率谱密度要求见 GJB1032 的图 2,故障剔除试验阶段的振动时间为 5min,无 故障检验阶段为 5-15min。 试验时间的允差为±1%。 可简化试验方案:如从故障剔除算起的最大 120h 范围内,若前 40h 不出现故障,可免 去其后的试验。 ?故障处理:在故障剔除试验中,随机振动出现的故障待试验结束后排除;温度循环出 现故障,立即中断试验排除故障后重新试验,中断前的试验时间应计入试验时间,但不包括 中断所在循环内的中断前试验时间。在无故障检验试验中,80h 温度循环的前 40h 和随机振 动 10min 前,允许排除故障后继续试验。 ?通过准则:无故障检验试验中,温度循环试验在最长 80h 内连续 40h 不出现故障;随 机振动试验在最长 15min 内连续 5min 不出现故障,则认为通过了筛选试验。

c)出具试验报告

5.2.4 ESS 应注意的事项 1)ESS 应有明确的所依据或借鉴的标准,制定并实施 ESS 方案; 2)ESS 的目的是剔除早期失效,因此不必准确模拟产品真实使用环境条件; 3)对关键产品,应按规定实施元器件级、电路板级、设备级的 100%的 ESS; 4)在产品由研制到生产的转移过程中,应根据制造工艺、组装技术等情况的变化,对 ESS 方案作出调整。 5.3 可靠性增长试验 reliability growth test

5.3.1 概述 可靠性增长试验为暴露产品的薄弱环节,有计划、有目标地对产品施加模拟实际环境的 综合环境应力,以激发故障,分析故障和改进设计,并证明改进的有效性而进行的试验。 任何对产品的改进和可靠性分析活动都有可能带来其可靠性的增长。可靠性增长试验则 是指为暴露产品的薄弱环节,并证明改进措施能防止薄弱环节再现而进行的试验。它是一个 组织为提高产品的可靠性水平而采取的有计划、有目标的一种试验活动,是组织持续改进过 程的体现。 增长试验属可靠性工程试验,通常安排在产品的设计试制工作基本完成之后和在鉴定试 验之前进行。由于可靠性增长试验不仅可以使产品可靠性得到提高,而且可以对可靠性作出 用定量评估,因此,在取得顾客同意的情况下,成功的可靠性增长试验可以代替可靠性鉴定 试验。所谓“成功”的标志至少应有以下几点: ——可靠性增长试验具有可靠性鉴定试验所规定的环境条件、工作条件; ——对可靠性增长试验过程的跟踪严格,且故障记录是完整的; ——有完善的故障报告纠正系统,故障纠正过程有详尽的记录; ——可靠性增长试验最终结果的评估是可信的,所用数理统计方法恰当、置信水平选取 符合要求,评估结果能表明产品可靠性满足规定的要求。 可靠性增长试验的核心是试验、分析与改进过程(TAAF) 。TAAF 实际上是反复进行以下 的活动过程: · 借助模拟实际使用条件的试验诱发故障,充分暴露产品的问题和缺陷; · 对故障定位,进行故障分析并找出故障机理; · 根据故障分析结果,提出改进设计的纠正措施; · 制造新设计的硬件;

· 对含有新硬件的产品继续试验,验证改进措施的有效性,并且继续暴露新问题。 可靠性增长试验一般要经过制定计划、试验前的准备、试验中间评审、最终评估等阶段。 其中反映可靠性增长试验显著特点的是在计划阶段要选定一个增长模型及相应的增长曲线。 这个增长模型能依据试验过程中提供的故障次数和故障时间序列,评估当前产品的可靠性水 平;在试验结束后能评估产品最后达到的可靠性水平。因此,可靠性增长模型实际上是描述 产品在试验过程中可靠性增长规律的数学表达式。随着可靠性工程的发展,国内外学者和专 家在增长模型方面作了大量探索与验证,提出了多种数学模型。 应当注意, 按照既定的模型和计划所进行的可靠性增长试验是要花费较多时间和经费的。 目前,在经费十分紧张的情况下,组织可与顾客协商,在提交可靠性鉴定试验前,结合产品 例行试验或专门安排的可靠性摸底(改进)试验开展 TAAF 活动,使产品的可靠性不断增长。 采用这样的方法,可用较少的经费投入达到预定的可靠性要求。 5.3.2 实施程序 可靠性增长试验按 GJB1407 的要求实施,同时可兼顾 GJB/Z77 可靠性增长管理手册的 应用。 a) 确定可靠性增长目标和增长模型; b) 准备综合环境条件并检查是否满足要求; c) 对试验准备工作进行评审; d) 按 GJB1407 的要求进行试验,对试验中使用的环境条件严格控制,对增长模型进行 过程跟踪。对有两台以上的产品试验时,当一个产品发生故障进行纠正时,另一产品可以继 续试验。需要时,应安排试验过程中评审。 推荐既可用于评估又可用于预测可靠性增长趋势的杜安(Duane)模型方法,用图分析法 求 MTBF 见 GJB1407 附录 A,用统计分析法求 MTBF 见 GJB1407 附录 B。 试验结果:采用杜安方法可计算出 MTBF 和λ 的当前估计值以及未来某个时刻的估计值, 在给出置信水平时(如 r=0.90),可计算出 MTBF 的置信下限值和置信上限值。 e) 编写试验报告,明确是否达到预期的可靠性增长目标,提出暴露设计中的缺陷和拟 采取的纠正措施; f) 进行试验后的评审。 5.3.3 可靠性增长试验应注意的事项 a)应根据产品特点、重要程度、经费、进度等权衡分析来确定可靠性增长方法,而不 一定都采用专门的可靠性增长试验; b)试验本身只能暴露问题,如不采取纠正措施,可靠性是不会增长的;

c) 试验应符合 GJB1407 的要求; d) 可靠性增长试验前和试验后应当进行评审。

5.4 可靠性鉴定试验和可靠性验收试验 5.4.1 概述 可靠性鉴定试验和可靠性验收试验属可靠性统计试验或验证试验。可靠性验证试验一般 采用从产品(总体)中抽取一部分(样本)进行试验,根据样本提供的信息,对总体的情况 作出推断,推断的方法可分为两类:一类是参数估计,即依据样本的观测值来估计总体的可 靠性参数是多少,在什么范围;另一类是参数检验,即在总体分布已知的情况下,给定 可靠性参数要求的范围,依据样本的观测值来判定总体是否满足给定的要求。 5.4.2 参数估计 参数估计通常分点估计和区间估计。点估计是通过已知的样本观测值来估计总体可靠性 参数是多少;区间估计是通过已知的样本观测值,在一定的置信度下,来估计总体可靠性参 数的范围 。由于参数的概率统计特性,我们是无法获得真值? 的。对于点估计来说,不同 的试验数据(样本)会有不同的估计结果? ,只能说? 近似于? ,无法回答估计的可信程
? ?

度如何。区间估计则可以给出一个置信区间 ( 了? 。 ≤θ≤

?

L



?

U

),并且指出该区间以多大的概率包含 =1- .来表示这一概率, 即 P(

?
U

L

称为置信下限, ,

?

U

称为置信上限。 如果用

?

)=

就是区间估计的置信度.。

? .称为显著性水平,是置信区间不包含? 的
L

概率,反映了区间估计的精确度。 以下我们讨论服从指数分布产品 MTBF 的估计问题。 在一批产品中投入 n 个样品进行试验(设为定时截尾试验) ,T * 为试验结束时 n 个样品 的累计试验时间, r 为试验结束时出现的故障总数。 为了验证产品的 MTBF 是否达到规定的要求,需给出置信水平 = 1,这样,依据上 的置信区间

述试验所提供的数据, 可以得到 MTBF 的观察值(点估计)和相对于给定置信度 (

? ,?
L

U

) 。

(1)点估计 MTBF 的观察值

? ?T r
?

*

故障率的观察值

? ? rT

?

*

当试验中未出现故障时(即 r=0),有关国际标准建议

??3
(2) 区间估计 对给定的置信水平

?

1
*

T

= 1- ,? 的单恻置信下限

?L?
即 p(

2r

?2

1?

?
2

(2r ? 2)

?

?

?

?

2 1?

2T
?
2

*

(2r ? 2)

?

L

≤? ≤∞)=

?
,r 已知时,其数值可由专门的表查得。

式中 ? 2 是一种概率分布,当

? 的双侧置信区间
?L?
?
p(? L ≤? ≤? U )=
例 从一批晶体管中抽取 10 只作寿命试验, 定时 300 小时仃止 。 此时共有 5 只失效 , 这 5 只晶体管失效前的试验时间共 800 小时, 用点估计,晶体管的 MTBF 的估计值:
?

2r

?

2 1?

?
2

(2r ? 2)
?

?

?

?

?
*

2 1?

2T
?
2

*

(2r ? 2)

2r

U

? ? (2r )
2 2

??

?

2T
2

?
2

2r

?

?
如果取置信度

?

?T

*

r

?

800 ? 5× 300 ? 460小时 5

=0.9,用区间估计,单恻置信下限为:

?

L

?

2×(800+5×300) ? 248h

?

2

0.9

(12)

即我们有 90%的把握说 MTBF 的真值 可 以 计 算 出 双

?

≥ 248 小时 恻 置 信 区 间 为 :

?

L

?

2×(800+5×300) ? 218.8h

?

2

0.95

(12)

即我们有 90%的把握说 MTBF 的真值 在 218.8 h 和 1167.5 h 之间。 从以上的分析和实例可以看出当一次规定的试验结束后。我们可用点估计和区间估计方 法,在一定的置信度下对 MTBF 作出评估。与此同时,在某些情况下,也可以对是否接受总 体产品作出 ? U ?

2×(800+5×300) ? 1167.5h 判断。即当单恻置信下限

?

2

0.05

(10)

?

L

> 顾客提出 的

MTBF 的最低可接受值? LQ 时,可以认为产品总体的 MTBF 达到了要求; 当双恻置信区间 的上限

?

U



?

LQ

时,说明该产品的 MTBF 是不能接受的。

5.4.3 参数检验 在已知产品寿命分布的情况下,参数检验就是对该分布的某些参数的检验或判断。事实 上,这种检验不直接估计 MTBF 是多少,而是先设定 MTBF 的可接受范围,而后根据样本提供 的信息,在一定的置信度下推断是接收还是拒收总体。 可靠性参数检验涉及到大量较复杂的统计分析和计算。有关国家标准和国家军用标准都 已经给出了一系列可供选择的试验方案,许多方案以图表形式出现,使用比较方便 。

GJB 899《可靠性鉴定和验收试验》给出的一个定时截尾试验方案,如下表

方案 号 20-1 20-2 20-3 20-4 20-5 20-6 20-7 20-8 20-9 20-10 20-11 20-12 20-13 20-14 20-15 20-16 20-17 20-18 20-19 20-20

判决故障数 接收 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 拒收 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

总试验时间 (

MTBF 的观测值? (

鉴别比 d =

? /?
0

1

?

1

的倍数)

?

1

的倍数)

? =30%
4.51 2.73 2.24 1.99 1.85 1.75 1.68 1.62 1.57 1.54 1.51 1.48 1.46 1.44 1.42 1.40 1.39 1.38 1.37 1.35

? =20%
7.22 3.63 2.79 2.40 2.17 2.03 1.92 1.83 1.77 1.72 1.67 1.64 1.60 1.58 1.55 1.53 1.51 1.49 1.48 1.46

? =10%
15.26 5.63 3.88 3.16 2.76 2.51 2.33 2.20 2.09 2.01 1.94 1.89 1.84 1.80 1.76 1.73 1.70 1.67 1.65 1.63

1.61 2.99 4.28 5.51 6.72 7.91 9.08 10.23 11.38 12.52 13.65 14.78 15.90 17.01 18.12 19.23 20.34 21.44 22.54 23.63

1.61+ 1.50+ 1.43+ 1.38+ 1.34+ 1.32+ 1.30+ 1.28+ 1.26+ 1.25+ 1.24+ 1.23+ 1.22+ 1.21+ 1.201+ 1.20+ 1.19+ 1.19+ 1.18+ 1.18+

其中

――研制方风险,MTBF 真值为

?

0

而被拒收的概率; ;

? ――使用方风险,MTBF 真值为? 1 而被拒收的概率;

?
?

1

――MTBF 检验的下限,一般取
------MTBF 检验的上限;

?

1

等于最低可接收值

0

d――鉴别比,d =

? ?

0 1

,一般取 1.5 ,2 或 3.

从上表看出,对同样的研制方风险,d(判断的灵敏度)越高,试验时间越短;对同样 的 d, 试验时间越短, 研制方风险越大;对同样的试验时间,d 越小,研制方风险越大。因此, 在确定可靠性验证试验方案时,应当考虑时间和可能提供的费用条件。

5.4..4 可靠性鉴定试验和可靠性验收试验
可靠性鉴定试验是为了验证产品的设计是否达到了规定的可靠性要求。一般用于新设计 的产品、经过重大改进改型的产品。可靠性验收试验是为了验证已批量生产的产品交付时, 其可靠性是否到达了规定的要求,是对已设计到产品中的可靠性能否在生产过程得以保持和 实现的检验。表 1-27 说明了两者的区别和联系。
表 1-27 可靠性鉴定试验和可靠性验收试验的定义及工作项目要点 项目 可靠性鉴定试验 reliability qualification test 为确定产品是否达到规定的可靠性要求, 由订购 方认可的单位, 用有代表性的产品在规定的条件 下所进行的试验。 在工程研制阶段结束时, 环境试验和环境应力筛 选完成后进行。 用于新设计的或经过重大修改的 产品 一般应在独立于订购方和承制方的第三方进行 GJB899 或其他有关标准(可以剪裁) 用于鉴定或定型的同一技术状态的样机或产品 至少 2 台, 但任一台设备的累计试验时间不能少 于全部受试设备的平均试验时间的一半。 可靠性验收试验 reliability acceptance test 为验证产品是否符合规定的可 靠性要求,用要交付的产品在 规定条件下所进行的试验。 在环境应力筛选完成后进行, 用于批量生产阶段。 由订购方确定 批量生产中要交付的产品由订 购方确定 由订购方确定,按批量大小和 抽样原则抽取,推荐 10%,最多 不超过 20 台。

定义

试验时机 试验单位 适用标准 受试设备

受试设备数量

试验方案

采用经订购方认可的统计试验方案,从概率比序贯试验方案、定时截尾试验方案 和全数试验方案中选取,明确试验的样本量、故障判别准则,试验中施加的应力 类型及其量值,包括电应力、振动应力、温度应力,湿度应力(必要时) 、设备工 作循环。 试验中不能更换性能虽已恶化,但未超出允许容限的零部件;试验结束时,对受 试设备进行整修,恢复到规定的技术状态;交货前应通过有关的验收试验程序。 可靠性鉴定试验方案和可靠性验收试验方案需通过评审并经订购方认可,试验前 和试验后必须进行评审。 试验之前应具备下列文件:经批准的试验大纲、 详细的鉴定试验程序、产品可靠性预计报告、功 能试验报告、环境合格试验报告、环境应力筛选 在建立了完善的生产管理制度 报告。 后可以减少抽样的频度,但不 可结合产品的定型试验或寿命试验进行。 成功的 能放弃可靠性验收试验。 可靠性增长试验可以代替可靠性鉴定试验, 但应 得到订购方的批准。

整修要求 评审要求

实施要求

试验报告

应出具相应的试验报告

统计试验方案分为连续型和成败型两类。 当产品寿命服从指数、威布尔、正态、对数正态等分布时,采取连续型试验方案,主要 有定时无替换截尾试验、定时有替换截尾试验、定数无替换截尾试验、定数有替换截尾试验、 序贯截尾试验方案。 对于以可靠度或成功率为指标的重复使用或一次性使用的产品, 可选用成功率试验方案。

例:定时截尾试验,对 MTBF 单侧置信下限的估计方法。
MTBF下限 ? 2T ? (? ,2? ? 2)
2

(1-37)

式中:T – 总试验时间 = 1- r , 为置信度

- 故障数
2

? ?
5.4.5
2

分布,有表可查。

为卡方分布,在概率论和数理统计中介绍。

可靠性鉴定试验和可靠性验收试验应注意的事项

a) 应制定试验方案并通过评审,试验前准备和试验后也应进行评审; b) 可靠性鉴定试验的受试样品不少于 2 台,应随机抽取,应通过功能试验、环境试验 及环境应力筛选,并达到定型状态; c) 产品的故障判据应当与所选择的试验方案的规定一致; d) 可靠性鉴定试验的试验条件要尽量真实; e) 试验中不能更换性能虽已恶化,但未超出允许容限的零部件; f) 受试产品试验后应进行修整,使其恢复到规定的技术状态并通过有关的验收程序后 可出厂交付。 以上我们介绍了几种可靠性试验的基本概念、要求和方法。不难看出,通过可靠性试验 既可使产品的可靠性得到保证和提高,又可对产品的可靠性进行评价。但是,产品的可靠性 是否能满足最终的使用要求,还有待于在使用过程的评价。 GJB450A 立足于装备全寿命过程管理,特别地将“使用可靠性评估与改进”单列为 500 系列工作项目。在该系列工作项目中,标准对使用可靠性信息收集、使用可靠性评估、使用 可靠性改进都提出了明确的要求。其中许多工作是应当以装备订购方为主做的,但是离不开

承制方的密切配合,特别是可靠性的改进还是要从研制生产过程做起。关于这部分的内容不 再详细展开介绍了。

武器装备型号可靠性最低工作项目表

GJB450A 工作项目编 号
301 302 303

工作项目名称

做什么

为什么做

什么时候 做 ●在设计 的一开始 ●随设计 进展不断 修改完善 ●当系统 原理框各 建立 ●随设计 进展不断 修改、 完善 方案阶段 开始 工程研制 阶段调整 方案阶段 编制设计 准则随设 计进展、 修 改、 完善准 则 ●系统设 计阶段 ●重大事 故分析

如何做

谁去做

建立可靠性模型 可靠性分配 可靠性预计

通过建模、 评价设计的 预 计 分 配 可靠性 估计产品 的固有可 靠性 ●系统分 析、零部组 件故障模 式的影响 ●评价故 障模式的 关键性 确定可靠 性关键项 目 建立可靠 性设计准 则 ●鉴别要求 采取纠正措 施的潜在单 点故障 ●确定关键 项目 控制关键项 目

GJB813 可 靠 性 建模与预计 GJB/Z229B - 电 子设备可靠性预 计手册 GJB1391 故障模 式影响及危害性 分析程序

专业可靠 性人员为 主设计人 员配合 设计人员 为主 专业可靠 性人员配 合

304

故障模式、影响 和危害性分析 (FMECA)

310

确定可靠性关键 产品

根据 FMECA 分 析结果编制关键 项目清单 GJB/Z35 元器件 降额准则等

设计人员

308

可靠性设计准则

控制设计

专业可靠 性人员为 主设计人 员配合

305

故障树分析

系统的识 别引起系 统故障或 不希望事 件、状态的 原因

自下而上分 析故障原因 用于关键项 目、特别是 安全性关键 项目

●故障树分析指 南

设计人员 为主 专业可靠 性人员配 合

贝叶斯方法评估系统(产品)的可靠性

用随机抽样进行统计分析计算的可靠性评估方法很多, 而且都已标准化。 但都要专门进行 长时间的可靠性试验。这里介绍应用贝叶斯方法,推导了产品在研制中的增长评定方程式, 充分利用产品在研制过程中和各现场试验信息,进行多母体统计分析,导出一种通用的故障 率计算方程式,利用本方程式计算故障率,不仅简单、方便和经济,而且计算结果更符合产 品的实际。

1 贝叶斯法可靠性评估模型 设产品研制分为 m 个阶段,或产品的可靠性有 m 次改进(一般 m=2 或 m=3) ,每个阶 段产品的故障率为λ 1、λ 2· · ·λ m,且有λ 1>λ 2>· · ·>λ m,各阶段的试验信息为(г 1,r1) 、 (г 2,r2)· · ·(г m,rm),其中τ i 和 ri 分别为 I 阶段的试验时间和故障数。根据贝叶斯公式, 产品在(г 1,r1) · · ·(г m,rm)条件下,λ 的分布密度函数由条件分布密度表示为: f[λ 1· · ·λ m /(г 1,r1) · · ·(г m,rm)] f[(г 1,r1) · · ·(г m,rm) ·λ 1·λ 2· · ·λ m] = f[(г 1,r1) · · ·(г m,rm)] 式中:f[λ 1· · ·λ m /(г 1,r1) · · ·(г m,rm)]为验后密度函数。 f(λ 1· · ·λ m)为验前分布函数 f[(г 1,r1) · · ·(г m,rm)/ λ 1· · ·λ m]为似然函数 f[(г 1,r1) · · ·(г m,rm)]为(г 1,r1) · · ·(г m,rm)的边缘密度函数。 假设验前分布函数已知,通过贝叶斯公式可求得验后密度函数,进而可求得 m 阶段故 障率的密度函数 f(λ m),最后可求得 m 阶段产品故障率上限λ mu。 设产品寿命服从指数分布。在这种假设下,产品的验前分布为伽玛函数,即 r0 m ? 0 r 0 ?1 e- i r0 ) f(λ 1· · ·λ m)= ? ( ? i ? (r 0 ) i ?1

?

式中г 0、r0 为验前分布参数。 似然函数为: f[(г 1,r1) · · ·(г m,rm)/ λ 1· · ·λ m] = [(г 1,r1) · · ·(г m,rm)]的边缘密度函数为: f[(г 1,r1) · · ·(г m,rm)] =? · · · ? f ( λ 1· · ·λ m) · f[(г 1,r1) · · ·(г m,rm)/ λ 1· · ·λ m]dλ 1· · ·dλ 0 ?2 m 经推导,验后密度函数为: f[(г 1,r1) · · ·(г m,rm)/ λ 1· · ·λ m]
?

?
i ?1

m

(

?(r i

?r
i

i

?1

r e ?r) ? ? 1)
i



i

i

i

??

?

?

m

? ?r
(

m

0

?

i ?1

i

r i ?1) e -

? (? ?? )
i 0 i
( ?

=

? ??
0

?

?
m

· · ·?

? ?r ?
2

?

m

0

i ?1

i

r i ?1) e -

? (? ?? )
i 0 i

dλ 1· · ·dλ

m

第 m 阶段产品故障率λ m 的密度函数为, · · · ? f [ λ 1· · ·λ m) · (г 1,r1) · · ·(г m,rm)]dλ 1· · ·dλ m-1 ?2 m 取置信度为 1- ? ,m 阶段产品故障率上限λ mu 可由下面的方程式求得: (λ
m)=

??

?

?

?

? f (λ
0

m)dλ m==1--

?

当 m=2,且取验前分布参数г 0=0,r0=0,经推导并整理其结果,得联立方程组如下:
g m ?1

?
i ?0

Fi+1(1- ?
j ?0

p ?1

1 j -X x e )=1- ? j!

X=

?

mu

? (2)

P=r2-1

g

m ?1

=r1-1 i= 0, g

Fi+1=Ei+1/D
r

m ?1

D=

?( K 1 ? r 2) ? (1) g ( ) K = m ?1 E i+1 K 1! ? (2) 1 ? k ? 01 i ?0

?

?1 1

Ei+1=

?(r 2 ? i ) ? (1) i ( ) i! ? (2)
1 2

i= 0, g

m ?1

τ (1)=τ τ (2)=τ

根据试验数据,给出总试验时间τ 1 ,τ 2,和故障数 r1,r2,并给定置信度 1- ? 和 m=2, 就可通过计算计算机出λ mu 和 MTBF。 此增长评定方程式是一种通用的方程,它也适合只有一个研制阶段的情况。当后一阶段 的试验信息为τ 2=0,r2=1 时(即相当此阶段信息毫无作用) ,由增长方程可解得与单母体 相同的故障率数值。 当 m=3 时,同样可推导出可靠性评估的增长方程,不过计算公式要复杂多了。一般 m 的 最大值为 3。 2 计算结果 以某弹上计算机为例,收集的试验数据如表 1。

试验项目 出厂验收测试

表 1 试验数据统计表 第一阶段试验信息 第二阶段试验信息 试验时间(小时) 失效率 试验时间(小时) 失效率 292 290 2

半实物仿真 72 32 匹配试验 896 112 抗干扰试验 240 184 例行试验 471 157 全弹振动试验 / 112 运输试验 16 4 装前测验 299 7 289 综合测验 292 288 技术阵地测试 432 240 发射阵地测试 100 50 总试验信息 3222 7 1646 注:试验时间为产品台数乘以每台的测试时间

1

3

从表 1 看出,可得试验信息:m=2,γ 1=7,γ 2=3,τ 1=3222,τ 2=1646。 取置信度 1-- ? =90%,根据所得的试验信息,用高级语言编程,在计算机上算得 λ mu=0.0024041409 随之可计算出 MTBF 和 R(t)。 3 讨论 1) 有效使用贝叶斯方法的关键是合理假设验前分布密度函数,对电子产品和机电产品, 许多文献资料都分析和论证了其验前分布密度函数为伽玛函数, 故计算结果是可信得。 2) 可靠性评估应该用区间法进行统计分析,用定点法计算,无置信度参数,计算结果可 信度低。 3) 用贝叶斯法评估产品的可靠性, 充分利用了研制过程和现场的试验信息, 它是一种简 便、经济、可靠的可靠性评估方法。 4) 可靠性评估成效的关键在于: 首先要求建立有效的可靠性模型, 其次要广泛收集有关 产品运行的现场数据,两者不可偏废。用贝叶斯法评估产品的可靠性,离开了有效数 据,便可导致出错误的评估结果。

附录 B

实例:某弹上计算机可靠性预计
(仅供参考) B1 某弹上计算机可靠性模型 B1.1 弹上计算机可靠性物理模型 B1.1.1 产品任务功能和工作模式 弹上计算机是为某武器系统配套使用的专用计算机。其任务是完成捷联惯性导航计算, 形成制导指令,使导弹按给定的制导规律飞向目标,同时还可提供各种遥测数据。 弹上计算机未采用冗余或替换工作模式,弹上计算机失效,将导致武器系统飞行失败。 B1.1.2 产品结构和功能接口 计算机本体除方形机壳和支架外,主要由三块电路印刷板构成,即数字板,脉冲计数器 板和模/数、数/模转换器板。计算机软件分监控程序和应用程序,导弹在发射后的飞行中, 由应用程序完成规定的功能。变流器为直流-直流变换器。计算机的功能接口如图一所示。 脉冲计数器板
CPU 协处理器 RAM EPROM 开关量输入 通信 脉冲计数器 总线 来自捷联 惯导系统

地 面 发 控

模/数、数/模转换器板 A/D、D/A 遥测 舵系统 变流器 输入 舵反馈

图一

计算机功能接口

B1.1.3 构成任务失败的条件 ? 计算机复位,输出到舵系统的信号为零; ? 计算机性能参数,超过容许上、下限; ? 时序错; ? 计算机软件错; ? 变流器工作不正常。

B1.2 产品可靠性框图 可靠性框图要说明成功完成任务时,所有单元之间的相互依赖关系。从可靠性角度,可以 将产品看成由计算机硬件、计算机软件和变流器三个单元串联而成,只要其中一个单元发生 故障,都可导致产品发生故障。其可靠性框图如图二所示。每个方框就故障概率来说,都是 互相独立的。
计算机硬件 数 字 板 脉冲 计数器 板 变 流 器

A/D 、 D/A 板

计算机 软件

图二

计算机可靠性框图

B1.3 产品可靠性数学模型 B1.3.1 计算机硬件和变流器的可靠性数学模型 大量国外资料和国内统计数据证明,电子产品进入偶然故障期后,不论是突然故障或漂 移故障,故障率λ (t)基本上是常数,则可靠度可表示为: R(t)= e
-

? ?(t)dt =e ??t
0

t

设计算机硬件以 A 表示,变流器以 B 表示,则 ?? RA(t)=e A t (1) ?? B t RB(t)=e (2) B1.3.2 计算机软件的可靠性数学模型 随着计算机软件的规模和复杂度不断增加,软件可靠性往往是决定计算机系统可靠性的 重要因素之一。世界上已经提出了很多分析模型来解决可靠性度量问题,各有其实践依据, 也各有其局限性,但都有一个假设:软件故障率与残存软件错误数成正比。 在软件开发的不同阶段和环境中,应采用不同的模型。现采用广泛使用而又简明的 NHPP 模型,即非齐次泊松过程模型。 由 NHPP 模型 λ c (ts) = abe_ bt s (3)

式中:λ c(ts)是测试时刻 ts 软件的故障率, a 是最终观察到的故障期望值,即可能发现的故障总数, b 是每个故障的发现率,即每小时所发现的故障数。 a 和 b 二个参数,可选择最大似然法从故障数据中估计。 计算机软件的可靠度为: R (t)=e ? ?c (t s )t (4)
C

B1.3.3 产品的可靠性数学模型 对于串联系统,各单元的故障是相互无关的,系统的可靠度为:

R(t)= ? R (t )
i ?1 i

n

所以,某弹上计算机的可靠度为: R(t)=RA(t)·RB(t)·Rc(t) (5) B2 弹上计算机可靠性预计 B2.1 可靠性预计的约束条件 B2.1.1 规定的要求 任务书规定的计算机任务可靠度(目标值)为:R(t)≥98.86%。 B2.1.2 可靠性预计的方法 预计是在详细设计的基础上进行的,已经具备了附有元器件应力数据的元 器件详细清单,所以采用元器件应力分析法。首先分类计算各类元器件的工作故障率,然后 汇总相加,计算公式取自 GJB/Z299B,如晶体管和二极管的故障率为: λ pi=λ bi(π Eπ Qπ Rπ SZπ C) 单元的故障率为: λ s= ? N ?
i ?1 i n pi

B2.1.3 任务剖面 ? 任务时间为三分钟,导弹定位到发射为 4 小时,预计分两阶段进行; ? 在导弹发射和飞行中,环境系数按导弹发射环境选取,π E 取 ML 级;在发射阵地为平 稳地面级,π E 取 GM 级; ? 质量系数,对于微电子器件,π Q 取 B1 级; ? 计算机工作环境温度:战地温度:+50℃,车内工作温度:+40℃。 B2.1.4 数据来源 所采用的故障率数据,取自 GJB/Z299B 《电子设备可靠性手册》和《七专电子元器件可 靠性数据手册》 ,个别数据参考了有关文献。 B2.2 可靠性预计结果 B2.2.1 计算机硬件的可靠性预计结果 结果列于表 1 中。 表 1 计算机硬件的元器件清单及其预计故障率 序 数 量 故障率(10_6/小时) 号 元器件种类 A/D 脉 数字 合计 λ ML Σ λ ML λ GM Σ λ GM D/A 冲 1 金属膜电阻 78 30 34 142 0.836 118.712 0.193 27.4 2 精密金属膜电阻 11 11 0.498 5.478 0.123 1.348 3 复合膜电容 17 14 25 56 0.73 40.88 0.1825 10.22 4 独石电容 4 2 8 14 1.5 21.00 0.375 5.25 5 钽电容 5 3 5 13 1.69 21.97 0.423 5.49 6 中小规模 TTL 门电路 5 39 28 72 0.578 41.616 0.262 18.864 7 大规模 TTL 门电路 8 8 1.327 10.616 0.607 4.856 8 运算放大器 8 8 1.94 15.52 0.823 6.584 9 存储器 4 4 1.06 4.24 0.52 2.08 10 A/D D/A 片 6 6 2.066 12.396 1.274 7.644 11 三端稳压器 2 2 1.41 2.82 0.71 1.42 12 普通二级管 3 4 7 0.384 2.688 0.24 1.68

13 14 15 16 17 18 19 20 21 22 23 24

稳压二级管 12 1 13 1.924 25.012 1.2 开关二级管 24 24 7.92 190.08 1.65 低频大功率管 8 8 1.95 15.6 1.11 脉冲变压器 13 13 3.09 40.17 1.236 微调线缆电位器 7 7 19.1 133.7 5.7 继电器 1 1 64.8 64.8 23.58 接插件 162 42 22 226 0.438 98.988 0.0876 插座 8 1 9 9.03 81.27 4.52 石英晶体 1 1 2.175 2.175 0.932 焊点 902 933 1044 2879 0.0182 52.4 0.00676 金属化孔 172 132 370 674 0.012 8.088 0.0024 电路印制板 1 1 1 3 5.44 16.32 3.38 -6 将Σ λ ML 相加,得λ ?A1=1026.539(10 /小时) 将Σ λ GM 相加,得λ ?A2=329.09(10-6/小时) 考虑到上述元器件范围以外的其它杂散零件的故障率,取修正系数α =0.2,有: λ A1=(1+α )λ ?A1 =1.2·1026.539 =1231.85(10_6/小时) λ A2=(1+α ) λ ?A2=1.2·329.09 =394.91(10_6/小时) 计算计硬件的可靠度为: R (t)=e_ ( A1t1 ? A2 t 2)
A

15.6 39.6 8.88 16.068 39.9 23.58 19.798 40.68 0.932 19.462 1.618 10.14

?

?

=99.836% B2.2.2 变流器的可靠性预计结果 变流器元器件故障率计算结果,列于表 2 中。 表 2 变流器元器件故障率 序 故障率(10_6/小时) 元器件种类 数量 号 λ ML Σ λ ML λ GM Σ λ GM 1 电阻 20 0.836 16.72 0.161 3.22 2 电容器 49 1.69 82.81 0.225 11.025 3 集成电路 4 1.327 5.308 0.607 2.428 4 晶体管 49 1.95 95.55 0.44 21.56 5 变压器 2 2.40 4.80 0.96 1.92 6 光电耦合器 2 90.30 180.6 10.40 20.80 0 7 稳压管 1 1.924 1.924 1.20 1.20 8 电感 3 1.86 5.58 0.744 2.232 9 焊点 363 0.018 8.61 0.00676 2.454 2 10 接插件 56 0.438 24.50 0.0876 4.906 λ ?B1=426.4 λ ?B2=71.745 λ B1=(1+α ) λ ? B1=1.2·426.4=511.68 λ B2=(1+α ) λ ?B2=1.2·71.745=86.10 变流器的可靠度为:

RB(t)=e_ (? t ? ? t )
B1 1 B2 2

=99.96% B2.2.3 计算机软件的可靠性预计结果 应用软件的指令数约 6000,总共发现 70 个左右的错误。 根据弹上计算机软件的实际情况,取α =80,而 b 取一个基于实时命令和控制系统的失 效数据的软件可靠性模型中的参数,即 b=0.246 由(3)式,得 λ C(ts)=80·0.1246e_0.1246 t s 其中 ts 为测试和飞行试验总共的测试时间。 计算机软件的可靠度为: )t _ Rc(t)=e ? c (t s (6)

(7)

取不同的 ts,由靶场的实际情况,取 t=0.75 小时(45 分钟) ,根据(6) 、 (7)式,计算 结果列于表 3 中。 表3 计算机软件的失效率和可靠度 t( 40 60 80 100 110 120 s 小时)20 _4 _5 _5 3.199*10_6 0.8248 0.06825 0.005647 4.673*10 3.866*10 1.112*10 Rc(t) 53.87% 95.01% 99.58% 99.96% 99.97% 99.999% 99.9998% 软件的测试时间在 120 小时以上,从表 3 看出,计算机软件的可靠度近似 1,基本上可视 为无错软件。 B2.2.4 计算机产品的可靠性预计 根据(5)式,得某弹上计算机的可靠度为: R(t)=99.836%*99.96%*99.9999% =99.79%% 可见,某弹上计算机的任务可靠度能满足任务书中提出的 98.86%的要求。


相关文章:
可靠性工程技术中的数据建设与数据应用
可靠性工程技术中的数据建设与数据应用 - 可靠性工程技术中的数据建设与数据应用 2017-10-22银博士 国千专家可靠性与维修优化 1 引言 当前炼化领域的可靠性技术...
赛宝大讲堂-质量可靠性提升技术上海专场研讨会
赛宝大讲堂-质量可靠性提升技术上海专场研讨会_电子/电路_工程科技_专业资料。赛宝大讲堂-质量可靠性提升技术 ---上海专场研讨会 5.25-5.27 主办单位: 中国赛宝...
对可靠性工程技术应用的分析
可靠性工程技术应用的分析 - 对可靠性工程技术应用的分析 徐拥军 0629404043 【 摘要 】 本文是对在可靠性工程技术中 可靠性的定义 可靠性指标的选用 可靠性...
可靠性工程技术是为了提高产品的可靠性要求而发展起来...
可靠性工程技术是为了提高产品的可靠性要求而发展起来。。。 - 0 前 言 可靠性工程技术是为了提高产品的可靠性要求而发展起来的新兴科学,是一门综合了统计 学、...
可靠性优化设计简介
可靠性优化设计简介 - 可靠性优化技术简介 班级:2014 级车辆工程 2 班 学号:222014322220127 作者:熊健宇 前言 在现代生产中 可靠性技术已贯穿到产品的开发研制、...
可靠性设计技术工作规范
可靠性设计技术工作规范_机械/仪表_工程科技_专业资料。可靠性设计技术工作规范 1. 范围 本规范规定了可靠性设计大纲、工作计划编制的相关要求。 本规范规定了可靠...
汽车可靠性技术
汽车可靠性技术 - 2016-2017 学年第二学期期末考试《汽车可靠性技术》大作业 一、名词解释(每题 5 分,共 10 分) 1、可靠性 2、失效概率分布函数 二、简...
环境工程技术在可靠性工作中的作用
龙源期刊网 http://www.qikan.com.cn 环境工程技术可靠性工作中的作用 作者:刘建光 来源:《科学与财富》2015 年第 13 期 摘要:可以说,生产产品的可靠性与...
计算机网络可靠性技术的工程应用
计算机网络可靠性技术工程应用 - 龙源期刊网 http://www.qikan.com.cn 计算机网络可靠性技术工程应用 作者:马代军 来源:《中国科技纵横》2014 年第 15 期 ...
配网电力工程技术的可靠性分析
配网电力工程技术可靠性分析 - 龙源期刊网 http://www.qikan.com.cn 配网电力工程技术可靠性分析 作者:孙志丽 来源:《科技资讯》2015 年第 31 期 摘要:...
更多相关标签: