跳至正文

PLM AI 实战指南(2):术语归一化——让 AI 听懂工程语言

国产工业软件特惠推广月,有意者关注公众号PLM Vision发送“二维码“添加管理员!


热门文章推荐


 


如果说“文档语义化”解决的是 AI 能不能读文档,那么本篇要解决的,是一个更隐蔽、也更致命的问题:

AI 为什么“读了文档,还是答不对”?

答案往往不在模型,而在——术语混乱


一、一个真实到不能再真实的问题

在 PLM场景中,你可能见过下面这些情况:

  • 同一个对象:

    • 零件 / 物料 / Part / Item / 组件

  • 同一个动作:

    • 发布 / 生效 / 冻结 / Release

  • 同一个流程:

    • 工程变更 / 设计变更 / ECO / ECN

而工程人员会问 AI:

“ECO 发布后,BOM 不一致一般怎么处理?”

但文档里写的是:

“ECN 生效后,物料结构需重新校验。”

人一眼就懂,AI 却可能完全匹配不到。

👉 这就是术语问题。



二、什么是“术语归一化”?

一句话定义:

把工程世界里“指向同一概念的不同说法”,统一映射到一个标准语义。

注意:它不是词典

很多人第一反应是:

“那不就是做个同义词表吗?”

但在工程场景中,术语归一化至少包含三层:

层次
说明
词汇层
中英文、缩写、别名
系统层
PLM对象 / 属性
语义层
工程含义是否一致

三、为什么不做术语归一化,AI 一定会失败?

3.1 向量检索不是“万能翻译”

向量模型确实能捕捉语义相似度,但在工程语境下:

  • ECO ≠ ECN(在很多企业里)

  • Release ≠ Effective

  • BOM 既可能是 EBOM,也可能是 MBOM

这些差异,往往是“制度定义”,不是语言相似度。


3.2 术语混乱带来的直接后果

1️⃣ 召回不全(该找的没找到)
2️⃣ 误召回(找了一堆不相关)
3️⃣ AI 回答“看似合理,实则违规”

👉 在 PLM 场景下,第三点是最危险的。


四、术语归一化在整体架构中的位置

先明确一句话:

术语归一化,介于“文档语义化”和“AI 问答”之间。

架构位置示意

它的作用不是“生成答案”,而是:

  • 降噪

  • 统一语义空间

  • 提高召回稳定性


五、术语归一化应该“归一”什么?

5.1 第一类:对象类术语

标准术语
常见变体
Item
Part / 零件 / 物料
BOM
EBOM / MBOM / 物料清单
Dataset
文件 / 文档 / 附件

👉 这类术语,直接影响检索范围


5.2 第二类:动作 / 状态类术语

标准术语
常见变体
Release
发布 / 生效 / 冻结
Revise
升版 / 改版 / 修订
Obsolete
作废 / 失效

👉 这类术语,直接影响工程规则理解


5.3 第三类:流程 / 业务类术语

标准术语
常见变体
ECO
ECN / 工程变更
Workflow
流程 / 审批
Change Item
变更对象

👉 这类术语,决定 AI 是否“懂业务”。


六、怎么做(可落地方案)

下面是不依赖复杂 AI 训练、完全可工程化落地的做法。


6.1 构建“企业术语主表(Domain Terms)”

术语表结构建议

{

  “canonical_term”“Release”,

  “aliases”: [“发布”“生效”“冻结”],

  “domain”“PLM”,

  “object_type”“ItemRevision”,

  “notes”“在本企业中 Release 等同于生效”

}

术语来源

  • PLM Help / Admin Guide

  • 企业流程规范

  • 现有模板、制度文档

  • 老工程师经验(非常重要)


6.2 术语归一化的三个执行时机

① 文档入库时

  • 文档切片后

  • 统一替换 / 标注术语

  • 写入向量前完成

👉 一次处理,长期受益。


② 检索 Query 时

  • 用户问题先做术语展开

  • ECO → ECO + ECN + 工程变更

👉 提升召回率,但不改变底层数据。


③ 回答生成时(兜底)

  • AI 输出时统一用标准术语

  • 同时标注“原始说法”

👉 适合做用户教育。


七、EasyKB 场景下的实现方式

结合上一篇的架构,这里给出一条现实可行路径

7.1 不新增复杂系统

  • 术语表:

    • YAML / JSON / 表格即可

  • 归一化逻辑:

    • 作为 EasyKB 的预处理插件


7.2 与权限 / 密级的关系

关键原则:

术语可以共享,内容绝不能共享。

  • 普通库 & 高密级库:

    • 共用术语主表

    • 各自独立向量空间

👉 这在安全审计中是完全可接受的。


八、术语归一化之后,AI 会发生什么变化?

你会明显看到:

  • 同样的问题,召回更稳定

  • 回答用词更“像工程规范”

  • 新人提问,也能命中老文档

但更重要的是:

AI 不再是“猜你懂什么”,而是“按你的工程语言工作”。


九、本篇你应该带走的 3 个关键认知

1️⃣ 术语问题不是模型问题,而是工程问题
2️⃣ 不做术语归一化,PLM 场景下 AI 一定不稳定
3️⃣ 术语归一化是“低成本、高收益”的关键一层


十、下一篇预告

《Teamcenter AI 实战指南(3)》将进入工程规则层

结构化条件 —— 为什么 AI 不能“乱答”?

  • BOM 层级

  • 生效条件

  • 规则优先级

👉 这一步,才是真正让 AI “像资深工程师”。



发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注