模拟仿真治理 — 组织级CAE质量管理框架
理论与背景
治理的含义
老师,"模拟仿真治理"是说组织怎样管理CAE吗?
完全正确。简单说,就是从个人的经验依赖,转变为组织的系统性质量管理。NAFEMS在2019年发布了《Simulation Governance & Quality Management》文件,对这个框架进行了体系化说明。
具体怎样决定这些事情呢?
主要有三个支柱。
- 谁来做 — 将分析人员的能力(能力素质)分级,规定各级别允许进行的分析类型
- 怎样检查 — 在分析流程的关键环节设置评审关卡,分阶段确保质量
- 怎样记录 — 对模型、输入数据、结果、评审记录进行统一管理,确保可追踪性
以汽车厂商为例,碰撞安全分析只能由经验丰富的工程师进行,不再是模糊的习惯做法,而是制度规范。
也就是说以前"那个人说没问题就行了",现在变成了有规则的流程?
完全正确。个人的判断很容易因为转岗或离职而失效。治理的本质就是建立即使人员变化也能维持质量的体系。
NAFEMS治理框架
能跟我讲讲NAFEMS框架的整体样子吗?
NAFEMS的治理框架由5层结构组成。
| 层级 | 名称 | 内容 |
|---|---|---|
| 第1层 | 方针(Policy) | 经营层批准的基本方针。声明"使用CAE结果进行设计判断的条件" |
| 第2层 | 流程(Process) | 分析工作流、评审关卡、批准权限的定义 |
| 第3层 | 规程(Procedure) | 各分析类型的具体作业步骤、使用工具、设定值 |
| 第4层 | 能力(Competency) | 分析人员的技能级别定义和教育培训方案 |
| 第5层 | 数据管理(SPDM) | 模型·结果的版本管理、访问控制、保管规则 |
上层关注"为什么",下层关注"怎样"。五层齐全才能发挥治理的效能。
这像ISO 9001的质量管理那样的分层。
观察得很好。实际上NAFEMS框架就是在ISO 9001和AS9100(航空航天质量)的基础上,加入了"仿真特有的需求"。将其看作是在现有质量体系中追加仿真管理条款就对了。
仿真风险分类
不是所有分析都需要同样严格的管理吧?有什么讲究吗?
完全正确。NAFEMS推荐了一种基于风险的方法。仿真风险由两个轴来分类。
- 后果(Consequence):分析结果有误时,对安全性、成本、时间表的影响有多大
- 不确定性(Uncertainty):仿真模型本身有多大不确定性(新材料、复杂物理、试验数据不足等)
| 低 不确定性 | 中 不确定性 | 高 不确定性 | |
|---|---|---|---|
| 高 后果 | 中风险 | 高风险 | 最高风险 |
| 中 后果 | 低风险 | 中风险 | 高风险 |
| 低 后果 | 极低风险 | 低风险 | 中风险 |
比如"现有零部件轻微形状改变的强度验证"属于低风险,而"航空器主翼用新复合材料破坏分析"属于最高风险。根据风险级别调整评审严格程度、必需的分析人员级别、检查项数等。
全部都严格管理的话工作转不过来,但让新人无监督地做人命相关的分析也不行。要有轻重缓急。
完全同意。实际中"80%的分析用简化流程快速完成,剩下20%的高风险分析集中资源"这样的模式最有效率。
仿真成熟度模型
组织的CAE是否"成熟"也有衡量指标吗?
有的。NAFEMS定义了5级成熟度模型。这是借鉴了CMMI(能力成熟度模型集成)的思想。
| 级别 | 名称 | 特征 |
|---|---|---|
| Level 1 | 初期(Initial) | 靠个人,没有体系。结果质量完全取决于分析人员的水平 |
| Level 2 | 受管(Managed) | 项目级有流程定义,但没有跨部门标准化 |
| Level 3 | 定义(Defined) | 组织标准流程文档齐全,全部门执行 |
| Level 4 | 量化管理(Quantitatively Managed) | 用KPI测量·管理流程性能。基于数据持续改进 |
| Level 5 | 优化(Optimizing) | 持续改进已成为文化。主动引入技术创新 |
坦白说,日本制造业很多还是Level 1到2…
现实就是这样。某项调查显示,全球制造业约60%还停留在Level 1~2。但航空航天(空客、波音)和汽车OEM(宝马、丰田)中已有不少企业达到Level 3以上。重点是不要一口气跳到Level 5。从Level 2升到Level 3的收益最大。
仿真成熟度由各要素的最小值决定。
也就是说,哪怕有一个环节薄弱,整体成熟度就会被拖累。
力量矩阵与评审关卡
分析人员的力量级别定义
"力量矩阵"是给分析人员排名吗?有点儿吓人…
与其说排名,不如说是"这个人能胜任哪种仿真"的表述工具。NAFEMS的Professional Simulation Engineer(PSE)制度以及很多企业都采用4级能力定义。
| 级别 | 名称 | 可执行的分析 | 所需经验 |
|---|---|---|---|
| Level 1 | 助手 | 按定型模板执行分析。一次性确认结果 | 完成基础培训。实务不足1年 |
| Level 2 | 执业者 | 标准线性分析、按既定规程的非线性分析 | 实务1~3年。导师指导下独立作业 |
| Level 3 | 专家 | 复杂非线性分析、多物理场耦合、新建模方法应用 | 实务3~7年。有V&V实绩。具备审查他人能力 |
| Level 4 | 杰出专家 | 安全关键分析、方法开发和验证、治理体系设计 | 实务7年以上。有业外发表·论文实绩。业界认知 |
也就是说新入职的员工不会单独做汽车碰撞分析吧。
完全正确。安全碰撞这样的高风险分析,由Level 3以上执行,Level 4专家审查——这是典型配置。反而现有零件的轻微强度确认,Level 1执行,Level 2审查就足够了。
但总不能让Level 1永远停留在第1级吧。有升迁的机制吗?
很好的问题。力量矩阵必须配套职业发展路径。具体包括:
- 升级所需的培训(内部研修、NAFEMS研讨、电子学习等)
- 必需的实务经验类型和数量(例Level 3需要不同分析类型各5个独立案例)
- 评估方法(高级人员技术面谈、作品集审查等)
- 重新认证周期(通常2~3年)
人才培养和治理是一体两面的。
评审关卡流程
评审关卡就是仿真流程中设置的检查点对吗?
很好的比喻。通常CAE治理设置4个关卡。
| 关卡 | 时机 | 检查内容 | 审查人 |
|---|---|---|---|
| Gate 0 | 分析着手前 | 分析目标澄清、风险分类、分配合适分析人、确认使用规程 | 项目负责人 |
| Gate 1 | 模型构建后 | 形状简化合理性、网格质量、材料模型、边界条件、荷载条件 | Level 3以上分析人 |
| Gate 2 | 计算完成后 | 收敛情况、能量平衡、结果物理合理性、网格敏感性确认 | Level 3以上分析人 |
| Gate 3 | 报告完成后 | 结论合理性、不确定性定量、推荐事项具体性、数据归档 | 根据风险Level 3~4 |
Gate 0在着手前就决定该不该做、谁来做,这很有意思。现场通常是"先做了再说"。
这是关键所在。没有Gate 0,分析者会自作聪明地开始,结果出来后才说"其实这个分析不够"导致返工。Gate 0花10分钟就能省掉大量返工。实务中它的ROI是最高的。
关卡核查清单
Gate 1模型构建审查具体怎么检查?
给你个典型的Gate 1核查清单。
- 形状简化:省略的特征(圆角、孔、倒角等)的清单及省略理由
- 网格品质:纵横比 < 5、歪斜度 < 0.8、雅可比数 > 0.3 全要素满足
- 材料模型:使用数据的来源(材料试验报告号 或 手册名)、温度依赖性·速度依赖性的考虑
- 边界条件:约束是否过约束(静态分析的反力是否物理合理)
- 荷载条件:荷载工况的完整性、安全系数的依据
- 接触定义:接触面选择、摩擦系数依据、初始间隙确认
用Excel或SPDM工具标准化这个清单,评审就能高效进行。
有清单就不用纠结"该查什么",审查人负担也小。
模拟仿真治理的实务应用
导入步骤
我们部门也想导入治理。从何开始最好?
全公司一次性推不得。必须先小范围试点。推荐的步骤是这样。
- 现状评估(1~2个月):把现有仿真流程整理清楚,自我评价成熟度级别。挖掘隐含知识。
- 试点选择(2周):选一个产品线或分析团队作试点。成功体验最容易出现的是5~10人中等规模团队
- 治理文件整备(2~3个月):起草方针、流程图、核查清单、力量矩阵
- 试点运行(3~6个月):实际项目中运用治理。收集现场反馈修改文件
- 全面推广(6个月起):将试点成果和KPI数据汇报给经营层,分阶段推广到其他部门
第1步的"隐含知识挖掘"最难。资深人员脑里的东西怎么提出来?
有个很有效的方法——"过去故障分析"。把过去3~5年的仿真错误、返工、不良流出案例都收集起来,分析"为什么没防止住"。问题就会自动浮现:"这个检查点有该防止啦""这个判断只有资深人知道"。故障案例是隐含知识的宝库。
SPDM(仿真流程与数据管理)
SPDM就是CAE数据的管理系统对吧?
一半对,一半不完整。SPDM是Simulation Process and Data Management,不仅管数据,还管流程。具体说:
- 数据管理:CAD模型、FE网格、输入文件、结果文件、报告的版本管理和访问控制
- 流程管理:分析工作流自动化、关卡评审状态追踪、批准电子签名
- 可追踪性:"这个设计变更对应什么结果""谁、何时、用何法、得到何结论"都能后查
- PLM联动:设计变更单(ECN/ECO)和仿真结果关联,一眼看出"设计Rev.C的仿真批准完了吗"
以前共享文件夹里满是"最终版_v3_修正_真的最终.odb"这种,真的乱…
这个混乱就是SPDM的主要目标。有个汽车厂用了SPDM后,找数据的时间降到以前的1/5。监管提问"这个数据从哪来的"也能马上查明。特别是MDR(欧盟医疗器械法规)、FAR Part 25(飞机型式认证)这种规制产业,没SPDM的治理实际上不可能。
治理KPI
治理有没有成效,怎样测?
代表性的KPI有这些。
| KPI | 测量方法 | 目标值例子 |
|---|---|---|
| 分析返工率 | 关卡不合格需要返工的分析比例 | 10%以下 |
| 关卡通过时间 | 关卡提交到评审完成的平均日数 | 3个工作日以内 |
| 能力认证覆盖率 | 全分析人员中已获能力认证的比例 | 90%以上 |
| 数据登记率 | 规范登记到SPDM的分析数据比例 | 95%以上 |
| 分析源缺陷 | 分析错误导致的设计缺陷年件数 | 上年同比50%削减 |
| 分析周期 | 需求到报告签发的平均日数 | 基准的80% |
治理目的是"质量和效率并行",所以质量KPI和效率KPI都要均衡设定。管理为管理而存在,导致周期翻倍就本末倒置了。
软件与平台对比
SPDM/PLM平台
SPDM软件有哪些?
主要的SPDM平台对比一下。
| 产品名 | 厂商 | 特点 | 支持求解器 |
|---|---|---|---|
| SIMULIA Isight / SLM | Dassault Systemes | 与3DEXPERIENCE深度整合。Abaqus亲和性高 | Abaqus, Nastran, Fluent等 |
| SimManager / Teamcenter Simulation | Siemens | 完全整合Teamcenter PLM。NX CAE/Star-CCM+原生对应 | NX Nastran, Star-CCM+, Simcenter等 |
| Ansys Minerva | Ansys | 直接管理Ansys Workbench项目。工作流自动化强 | Ansys Mechanical, Fluent, CFX等 |
| Aras Innovator | Aras | 开源基础。多厂商环境的SPDM适合。可定制性高 | 厂商无关(插件方式) |
| SDM(Simulation Data Management) | MSC Software (Hexagon) | SimManager后继。MSC Nastran / Adams / Marc整合 | MSC Nastran, Adams, Marc等 |
平台选型指南
怎样选最好?
最重要的是"既有CAE环境和PLM环境的整合度"。具体的:
- 单一厂商环境(全Ansys)的话,该厂商的SPDM整合度最高,导入成本最低
- 多厂商混用(Abaqus + Fluent + Star-CCM+ 混合)的话,Aras Innovator或Teamcenter Simulation那样的开放平台更有利
- 已有PLM的话,那个PLM的仿真管理模块扩展最自然
- 分阶段导入的话,先做文件管理和元数据管理,工作流自动化后追加
无论如何,开局不要想一步到位。"先实现版本管理和可追踪性"从简开始最实际。
先端动向
AI与治理的融合
最近AI自动化CAE的话题很多,治理怎么应对?
这是现在热点话题。AI进入CAE,治理面临两个方向的变化。
1. 用AI加强治理:
- 网格品质检查的自动化(Gate 1高效化)
- 结果异常识别(物理非现实结果自动标记)
- 过去类似案例自动比较(基准化自动化)
- 核查清单项自动判定(人工审查负担减轻)
2. AI仿真结果的治理:
- 代理模型或Physics-Informed Neural Network(PINN)结果如何定位其信任度
- AI生成的网格或边界条件的妥当性由谁如何检验
- "AI判断了"的场合,责任主体怎样明确
特别是第2项是未开拓领域。NAFEMS从2024年起启动了"AI in Simulation Governance"工作组。
CAE民主化时代的治理
最近设计者直接用CAE工具的"民主化"进展快。治理不是更难吗?
很敏锐的指摘。没治理的民主化是大风险。有报告说过设计者看着绿色等高线图就认为"行",结果出了问题。
解决方案:
- 模板化:设计者用的只能是专家验证过的模板(固定求解设置、网格、后处理)
- 自动判定:Go/No-Go标准内置工具,不给人判断空间
- 升级规则:超出模板适用范围(复杂形状、材料非线性等)自动送CAE专家
- 仪表板:管理者实时看到"谁执行了什么分析、结果怎样"
治理不是民主化的"敌人",而是安全推进民主化的"护栏"。
模拟仿真治理故障排除
治理导入的典型失败
导入治理失败的例子有吗?
常见的失败模式5种。
| 失败模式 | 症状 | 对策 |
|---|---|---|
| 文件偏重 | 做好了漂亮文件,现场还是老样子 | 文件和试点运行并行。检验实效性 |
| 过度管理 | 全分析都最高级别管理,周期变3倍 | 风险分级调整管理力度 |
| 经营无感 | 现场努力但经营层不配资源 | 用过去故障成本量化,向经营层说明ROI |
| 工具先行 | 买了贵的SPDM工具,流程未定义,工具没人用 | 流程定义→工具选型的顺序。工具辅助流程 |
| 孤立推进 | CAE部门单独完成,设计·品质·试验不参与 | 推进团队纳入设计·品质·试验代表 |
现场抵触的应对
坦白说,很多工程师会想"又多了麻烦文件工作"…
最常见的反应。现场抵触应对有几个办法。
- "守"的讯息改为"攻":不说"防止错误",说"仿真结果信度高→试作·试验减少→开发期缩短"这种进攻讯息强调利益
- 从现场的"痛"出发:"过去这件事返工了,治理能防。"拿具体案例说话
- 负担最小化:清单A4一张、Gate 0打个15分钟会——"这么点就够"要明确
- 早期胜利体现:试点项目实际减少返工、数据查询快了,把成果可视化共享
- 工程师参与设计:治理规则不是"上面下来的",让资深工程师参与设计。当事者意识很重要
原来治理不只是技术,还是组织管理…
本质就是这样。模拟仿真治理的实际内容是技术 × 流程 × 人 三位一体管理。任何一个短板都会失效。NAFEMS框架的价值就在平衡这三个维度。
首先从"现在的成熟度级别是多少?"老老实实评价出发。答案就指出了最初的改善方向。
价值
更详细
有误