工程开发
manufacturing-failure-reason-codebook-normalization
根据产品代码手册将测试工程师的缺陷描述标准化,修正错别字、缩写错误与歧义,并执行站点验证。
简介
此技能作为制造质量控制环境的专用数据标准化引擎。它处理测试工程师编写的原始缺陷日志,将非结构化且易出错的文本转换为结构化的有效代码手册条目。该系统特别擅长处理常见的行业痛点,例如歧义描述、术语不一致、中英文混用以及跨项目书写习惯。它通过严格的语义匹配与站点验证管道,确保每个报告的故障都符合预定义的产品代码手册。
-
将原始故障日志自动分割为离散且可处理的片段。
-
执行站点级验证,自动拒绝与特定测试站点或组装线片段不兼容的代码。
-
利用模糊匹配与语义分析,将描述性输入链接到标准代码手册标签。
-
对于接近重复的候选代码,应用确定性平局决胜逻辑,确保在歧义情况下的可重现性。
-
为每个预测生成信心分数,使系统能将低信心结果标记为 UNKNOWN 以进行人工审核。
-
校准输出信心水平,确保可靠的自动匹配与需人工介入的警报之间具有明确的区分度。
-
适用于管理制造数据集的质量保证团队、生产工程师与数据分析师。
-
预期输入包括原始描述文本 (raw_reason_text)、产品特定代码手册、站点标识符以及相关的测试元数据。
-
输出提供标准化的预测代码 (pred_code)、标签 (pred_label) 与标准化的信心分数。
-
限制条件:该技能需要访问有效的产品代码手册,并必须遵守提供的站点范围映射 (station_scope_map) 以维护数据完整性。
-
使用建议:如果条目被识别为 UNKNOWN,则表示提供的理由包含不足的线索或参考资料,无法与当前版本的代码手册匹配;在此情况下,建议检查原始日志中是否缺少站点上下文或使用了非标准的缩写。
仓库统计
- Star 数
- 1,084
- Fork 数
- 271
- Open Issue 数
- 38
- 主要语言
- PDDL
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月30日 12:18