NAFEMS QSS(品质系统补则)— CAE仿真品质管理的国际基准
理论与背景
QSS是什么
老师,NAFEMS的品质管理基准是什么?和ISO 9001有区别吗?
提得好。NAFEMS的QSS——Quality System Supplement(品质系统补则),是将ISO 9001应用于CAE仿真的补充规范。ISO 9001是"产品和服务品质管理"的通用框架,但没有涉及仿真特有的课题——比如"谁进行了分析""网格收敛性是否确认""模型的合理性检验如何进行"——这些内容。
我明白了,单凭ISO 9001的话,"CAE分析的品质"如何管理就很不清楚。
完全正确。QSS具体定义了4个支柱:
- 分析流程的标准化:用手顺书(SOP)明文规定"做什么、按什么顺序做"
- 分析师的力量认定:通过PSE(Professional Simulation Engineer)资格客观证明技术人员的实力
- 模型审查手顺:建立第三方独立审查的机制
- 结果验证手顺:将V&V(验证与确认)作为组织性进行的框架
例如在航空航天领域,EASA或FAA批准仿真结果进行型式认证时,就会要求这样的品质管理体系。核能领域也有类似的动向。
原来规制当局也要看仿真的品质管理体系吗?感觉很严格…
那是当然的。飞行机翼的强度用仿真来证明的话,就必须证明"这个分析是用可信赖的手顺进行的""进行分析的人有足够的力量"。随着用仿真代替物理试验的流程加速,QSS这样的品质基准就成了必不可少的。
与ISO 9001的关系
能再具体讲一下QSS和ISO 9001的关系吗?如果导入QSS的话,还需要ISO 9001吗?
不是那样的。QSS是在ISO 9001的基础上增加的补充层。以ISO 9001的品质管理系统(QMS)为基础,再追加仿真特有的要求。
| 项目 | ISO 9001 | NAFEMS QSS(追加要求) |
|---|---|---|
| 适用范围 | 产品、服务全般 | 专门针对CAE仿真流程 |
| 人员管理 | "确保有力量的人员"(抽象) | 通过PSE资格、力量矩阵具体定义 |
| 流程管理 | "文件化的手顺"(通用) | 明示分析SOP、模型审查、V&V手顺 |
| 结果合理性 | "监视、测量"(通用) | 网格收敛确认、与理论解比较、不确定性量化 |
| 软件管理 | 无规定 | 版本管理、经验证的求解器列表、补丁管理 |
| 结构管理 | "产品的识别和可追踪性"(通用) | 输入文件、网格、边界条件、结果的完全可追踪性 |
ISO 9001只是说"确保有力量的人员",而QSS能具体指定"这个领域这个等级的资格"。相当具体呢。
QSS框架的构成要素
QSS框架主要由5个领域组成:
- 治理(Governance):定义仿真活动的方针、责任、权限。包括经营层的承诺
- 人才(People):分析师的力量要求、PSE资格、教育培训计划
- 流程(Process):分析手顺书、模型审查、承认流程、变更管理
- 技术(Technology):软件、硬件的选定基准、结构管理、许可管理
- 数据(Data):输入输出数据的管理、可追踪性(Traceability)、存档方针
"治理"听起来像大企业的词汇,中小企业或初创企业也需要吗?
按规模缩小就行。比如5人工程师团队,"谁进行审查""使用哪个版本的求解器"可以整理成1张规则表就行。重点是将隐性知识变成显性知识。从"有资深的A先生看就没问题"的人员依赖型品质管理,转变为"按照手顺就能保证一定水准的品质"的状态,这就是QSS的本质。
品质分数的定量评价
QSS的适合程度能定量测定吗?
NAFEMS没有正式规定计分公式,但很多组织都在定量评价QSS要求的适合程度。例如这样的模型:
其中$w_i$是各要求项目的权重系数,$c_i$是适合度(0~1),$M$是QSS要求的总项目数。适合率为:
明白了,有点像核对清单的达成率。实际中以多少%为目标?
航空航天通常要求90%以上。汽车的话70~80%作为初期目标比较现实。不过"提高分数"本身不是目的,持续改善才是本质。用PDCA循环来年年提高分数,这种态度最重要。
PSE资格与分析师力量
PSE资格制度概要
PSE是什么资格?日本似乎很少听说…
PSE(Professional Simulation Engineer)是NAFEMS认定的CAE技术人员国际资格。按领域分类,目前有这些:
- PSE-Structural:结构分析(线性、非线性)
- PSE-CFD:流体分析
- PSE-Thermal:热分析
- PSE-Electromagnetics:电磁场分析
- PSE-Multiphysics:多物理场耦合分析
取得需要实务经验(通常5年以上)、推荐、技术面试(基于作品集)。不是笔试,而是"实际做过什么分析"被评价。
原来不是纸笔考试,而是实务经验型的。日本企业会让员工考PSE吗?
坦白说,日本国内认知度还很低。不过欧洲航空航天Tier 1(Airbus、Safran等)开始要求分析人员有PSE相当的力量证明。日本企业也在全球供应链上,所以不能无视。特别是"用仿真代替试验"(Certificate by Analysis, CBA)的形势下,分析者力量证明会成为必须的。
力量矩阵的设计
如果没有PSE资格,公司内部能自己管理力量吗?
当然可以。QSS建议定义力量矩阵(Competency Matrix)。这是一个技能项目×等级的表,用来可视化各分析师的力量。
| 技能领域 | Level 1(初级) | Level 2(中级) | Level 3(上级) | Level 4(专家) |
|---|---|---|---|---|
| 网格生成 | 自动网格、简单形状 | 手动控制、复杂形状 | 收敛性评价+最优化 | 特殊单元、匹配网格 |
| 材料模型 | 线性弹性只 | 弹塑性、蠕变 | 损伤、破坏模型 | 用户定义材料 |
| 边界条件 | 固定约束、集中荷载 | 对称、周期条件 | 接触、子模型 | 耦合BC设计 |
| 结果检验 | 着色图确认 | 与理论解比较 | 网格敏感性、不确定性 | V&V框架运用 |
| 报告 | 结果截图 | 定型报告作成 | 技术判断文件化 | 审计对应报告 |
有了这个矩阵的话,就知道"这个分析应该交给谁",新人分不了复杂的非线性分析这种事也能避免。
完全同意。QSS要求根据"分析的重要程度(Criticality)"定义必要的力量等级。对安全有关的分析(例如飞机疲劳寿命评价),要分配Level 3以上的分析师,并要求独立的第三方审查。
持续专业能力开发(CPD)
资格一旦取得就完了吗?
PSE有CPD(Continuing Professional Development)的要求。必须每年进行一定时数的学习、培训,才能维持资格。CAE的世界日新月异,5年前的知识是不够的。新的技术要素、求解器功能更新、V&V方法的进展都需要跟上。
具体来说:
- NAFEMS主办的讲座、工作坊参加
- 技术论文的发表、评审
- 公司内部学习会的主持、参加
- 新领域分析项目的挑战
这些记录要提交到PSE的更新审查。类似医生的继续学习制度。
NAFEMS QSS(品质系统补则)的实务应用:QSS导入步骤
间隙分析和路线图
我们公司也想导入QSS,但该从哪开始呢?
第一步是间隙分析。将现状的分析流程与QSS要求进行对比,找出"缺少什么"。
- 现状把握:现在的团队有SOP(标准作业手顺)吗?模型审查谁在做?求解器的版本管理怎么样?
- 间隙特定:按QSS的5个领域(治理、人才、流程、技术、数据),整理现状和要求的差分
- 优先级付与:从风险高的领域(安全相关分析、规制对应)开始
- 路线图制定:6个月、1年、2年的分阶段导入计划
不必一步到位100分。先从"最痛的地方"开始改善是明智的。
间隙分析具体怎么做?有清单之类的工具吗?
NAFEMS提供QSS Self-Assessment Tool。50~80项的提问,各项回答"未实施(0)""部分实施(0.5)""完全实施(1)"。比如这样的问题:
- "分析师的力量要求是否文件化?"
- "是否定义了模型的独立审查流程?"
- "是否维持了使用软件的经验证版本列表?"
- "分析的输入数据、结果是否确保了完全的可追踪性?"
- "网格收敛性确认手顺是否标准化?"
初次实施时,大多数组织都会得到40~60%的分数。有了这个具体数字,就能立下"先争取70%"这样有针对性的目标。
分析手顺书(SOP)的整备
SOP(标准作业手顺)要写到什么程度?太细致的话实际工作就用不上…
你说得没错。SOP的粒度以"新人工程师读了就能正确执行"为标准。资深人士觉得"那不是当然吗"的内容也要明文规定。
典型CAE SOP的构成:
- 适用范围:适用哪种分析(例:线性静力分析、模态分析)
- 必要力量:实施本手顺需要什么力量等级
- 输入数据要求:CAD数据格式、材料数据来源、荷载条件定义
- 网格基准:单元类型、最小尺寸、品质基准(长宽比 < 5.0等)
- 边界条件检查:约束的物理合理性确认手顺
- 分析执行:求解器设置、收敛基准、计算资源
- 结果检验:必须的检查项目(反力平衡、能量守恒、网格收敛)
- 审查、承认:谁审查、谁承认
- 记录保管:输入文件、结果文件、报告的保管位置和保存期限
第9项"记录保管",大家都认真做吗?说实话,结果文件放在哪都不知道…
这正是QSS导入最有效果的地方。"3年前的分析请重现"的时候,输入文件、求解器版本、网格设置都齐全的话10分钟就能对应。少一个的话就要花3天。可追踪性(Traceability)不起眼但投资效益很高。
模型审查流程
模型审查具体审什么?
QSS推荐3阶段审查:
| 审查阶段 | 时间点 | 审查内容 | 审查员要求 |
|---|---|---|---|
| 事前审查 | 分析开始前 | 分析目的的明确性、适用方法的合理性、输入数据的品质 | 同等以上力量的分析师 |
| 中间审查 | 网格完成后 | 网格品质、边界条件的物理合理性、材料模型选择 | 独立的第三者(分析师本人以外) |
| 最终审查 | 结果取得后 | 网格收敛确认、与理论解比较、不确定性评价、结论的合理性 | 上级分析师+项目负责人 |
3次审查?工数会大幅增加…真的有那个价值吗?
分析后发现"边界条件错了"的话,要从网格重新开始,损失好几天。事前审查花30分钟的话,能大大降低那个风险。软件开发界有个常识:"越早发现bug,修复成本越低",CAE分析完全相同原理。
当然,不是所有分析都要3阶段完整审查。按分析的重要程度(Criticality Level)调整审查深度:
- Critical(安全相关):3阶段完整审查+独立验证分析
- Standard(设计判断):事前+最终审查
- Routine(参数研究):仅最终审查
结构管理和可追踪性
结构管理是那种像软件开发的Git那样的东西吗?
概念是一样的。QSS要求的结构管理对象是:
- 软件:求解器名、版本、补丁等级、许可类型
- 硬件:CPU、内存、OS(可能影响计算结果再现性)
- 输入文件:网格、材料数据、边界条件、求解器设置
- 结果文件:输出数据、日志文件、后处理脚本
- 报告:最终版和改订履历
实际上多用Git、PLM系统(Teamcenter、3DEXPERIENCE)来管理。至少要做到"何时、谁、用什么软件、什么输入、得到什么结果"能后来完全追踪的状态。
行业别应用事例
航空航天领域
航空航天怎么使用QSS的?规制很严格吧。
航空航天是QSS应用最发达的领域。背景是CBA(Certification by Analysis)——用仿真代替物理试验取得型式认证的流程。
- EASA(欧洲航空安全机构):CS-25 AMC 25.571中"用分析证明疲劳、损伤容限",要求分析流程的品质管理体系
- FAA(美国联邦航空局):AC 25.571-1D中有类似指导
- DO-178C / DO-330:虽然是嵌入式软件向标准,但仿真工具的验证思考方式被应用
Airbus、Boeing、Safran等大手OEM也开始要求供应商有分析品质管理体系。NAFEMS QSS准拠或同等社内基准成了交易条件。
核能领域
核能应该更严格吧。仿真出错会导致事故…
核能领域有NRC(美国核管制委员会)的RG 1.203"应用评估方法论的开发与评价"和ASME NQA-1(核品质保证规格)为基础。仿真品质管理方面:
- 独立验证分析(IVA):用不同的团队、不同求解器重新分析并比较
- PIRT(Phenomena Identification and Ranking Table):重要现象的特定和优先级付与
- 与实验数据的系统比较:SET(现象试验)+IET(综合试验)的分阶段验证
核能常要求"保守的分析",QSS品质管理也被用来确认"分析的保守性是否适切"。
汽车领域
汽车业没有航空航天那么严格,QSS有必要吗?
汽车是规制以外的商业需求驱动。为了缩短开发期、减少物理试作,往仿真主导型开发转换。试作减少得越多,仿真信度就越重要。
具体方面:
- 碰撞安全:Euro NCAP、IIHS向仿真中,模型合理性确认纳入流程
- NVH(噪音、振动):主观评价与分析的相关管理中应用QSS式的方法
- 电动化(EV):电池安全性分析需要单体~电芯组~车辆各等级的V&V
丰田、大众等大手OEM多自己拟定QSS相当的基准。不一定用NAFEMS这个名字,但做的就是QSS。
不管有没有规制,保证仿真信度的仕组就是必要的呢。
| 行业 | QSS的主要推力 | 要求等级 | 相关规格 |
|---|---|---|---|
| 航空航天 | 规制当局(EASA/FAA)的型式认证要求 | 非常高 | CS-25, AC 25.571, DO-178C |
| 核能 | NRC的安全审查要求 | 非常高 | NQA-1, RG 1.203, ASME V&V |
| 汽车 | 开发效率化、物理试作削减 | 中~高 | 社内基准多 |
| 医疗器械 | FDA批准流程 | 高 | ASME V&V 40, FDA Guidance |
| 土木、建筑 | 设计基准遵守 | 中程度 | Eurocode, AIJ基准 |
| 能源(石油、气体) | 安全管理、规制对应 | 中~高 | API规格, DNV-GL规格 |
前沿动向
数字孪生与QSS
最近常听说"数字孪生",与QSS有关系吗?
数字孪生是QSS应用范围大幅拓展的触发点。数字孪生是"实物的传感器数据不断更新仿真模型,实时预测"的技术。传统CAE分析是"设计阶段做一次",数字孪生是仿真在运用中持续运行。
这给QSS提出新课题:
- 模型自动更新的品质怎么保证?
- 传感器数据的品质管理和异常检知
- 实时预测结果合理性判定的自动化
- 模型偏移(精度下降)的监视和重新标定
NAFEMS在2020年代成立Digital Twin Working Group,推进QSS框架的数字孪生对应扩展。
AI活用时的品质保证
在CAE中用AI和代理模型时,QSS怎么适用?"黑匣子"没法品质管理吧?
正是热点课题。AI/ML代理模型(PINN、神经算子等)速度快得离谱,但"为什么得出那个结果"的说明性低。QSS观点上:
- 训练数据的品质管理:垃圾进垃圾出(GIGO)。训练用物理仿真本身要QSS准拠
- 适用范围明确化:"这个代理模型在什么参数范围有效"要明文,有外推时要警告
- 定期重验:定期与物理仿真比较监视精度
- 决策中的位置付与:"仅凭代理模型结果不进行安全判断"等规则
FDA的AI/ML医疗器械指导很参考。仿真领域也要建立类似框架。
云CAE与治理
云CAE增加了,治理观点上要注意什么?
云CAE(SimScale、Rescale、AWS/Azure上的HPC等)给QSS"技术"领域增加了新课题:
- 软件版本管理:云侧求解器自动更新会导致相同输入产生不同结果。要版本固定机制
- 数据所在地:保密性高的分析数据存在海外服务器的安全风险
- 再现性:云环境硬件动态变化,如何保证比特级计算再现性
- 审计轨迹:云上操作日志的保全和审计时的访问确保
QSS框架对"在哪里计算"是中立的,但可追踪性和再现性要求不管计算环境都适用。云CAE供应商"QSS对应"这类说法的出现也不远了。
NAFEMS QSS(品质系统补则)的故障应对
导入时的常见课题
试图导入QSS失败的模式有吗?
有几个典型的模式:
| 课题 | 症状 | 对策 |
|---|---|---|
| 经营层漠视 | "品质管理是技术人员的事",不分配预算、人员 | 定量提示品质问题引起的成本(返工、重试),用ROI说服 |
| 现场抵抗 | "只是增加额外工作",资深人员不配合 | 先造小成功事例。"由于审查预防了致命缺陷"等 |
| 文件主义泛滥 | 手顺书100页超,没人读 | SOP压缩成"1分析类型A4纸2~3张"。用核对清单 |
| 人员依赖固定 | "只有A先生能做这个分析"的状态被放置 | 用力量矩阵可视化,计划性OJT培养后继者 |
| 工具依赖 | 往PLM、SDM大笔投资,但运用规则未整备 | 先定规则,再选工具。顺序别搞反了 |
"文件主义泛滥"是ISO 9001常见现象呢。又厚又复杂的手册堆在书架上…
为了避免这种情况,QSS采纳了"精益品质管理系统"(Lean QMS)的思想。文件最少、核对清单单页、承认流程3人以内。实务每天用得上的粒度是成功关键。
个人建议是把SOP放在Wiki或SharePoint上做"活的文件"。PDF配布的话更新停滞。版本管理和变更通知自动化的工具最好。
审计应对要点
如果接受QSS准拠的审计,该准备什么?
审计基本上看"言论(手顺)和实行(实态)是否一致"。准备要点是:
- 手顺和实绩一致确认:SOP中"网格收敛确认分3水准进行"的话,过去分析报告中有那个执行记录吗
- 力量矩阵最新化:全分析师的力量评价最新,有教育训练记录吗
- 可追踪性证明:随机选的过去分析,输入→网格→设定→结果→报告的完整连锁能提示吗
- 不适合的改善记录:过去发现的问题和是正措施的记录(CAPA记录)
- 管理审查:经营层对仿真品质定期审查的记录
最重要是不要装得完美。审查官评价"问题消除"不如"认识问题且改善中"。"这个是课题,现在在改善"坦白说的话印象更好。
今天对NAFEMS QSS有了相当具体的理解,自己团队该做什么也看清了。先从间隙分析开始吧!
好主意。QSS不是一下子完成,是分阶段积累的。"比去年好一点"每年继续,结果就是最可信赖且可持续的方法。NAFEMS网站有Self-Assessment Tool和案例研究,先看那些为好。
上了
详细
报告