工程开发
manufacturing-failure-reason-codebook-normalization avatar

manufacturing-failure-reason-codebook-normalization

根据产品代码手册将测试工程师的缺陷描述标准化,修正错别字、缩写错误与歧义,并执行站点验证。

简介

此技能作为制造质量控制环境的专用数据标准化引擎。它处理测试工程师编写的原始缺陷日志,将非结构化且易出错的文本转换为结构化的有效代码手册条目。该系统特别擅长处理常见的行业痛点,例如歧义描述、术语不一致、中英文混用以及跨项目书写习惯。它通过严格的语义匹配与站点验证管道,确保每个报告的故障都符合预定义的产品代码手册。

  • 将原始故障日志自动分割为离散且可处理的片段。

  • 执行站点级验证,自动拒绝与特定测试站点或组装线片段不兼容的代码。

  • 利用模糊匹配与语义分析,将描述性输入链接到标准代码手册标签。

  • 对于接近重复的候选代码,应用确定性平局决胜逻辑,确保在歧义情况下的可重现性。

  • 为每个预测生成信心分数,使系统能将低信心结果标记为 UNKNOWN 以进行人工审核。

  • 校准输出信心水平,确保可靠的自动匹配与需人工介入的警报之间具有明确的区分度。

  • 适用于管理制造数据集的质量保证团队、生产工程师与数据分析师。

  • 预期输入包括原始描述文本 (raw_reason_text)、产品特定代码手册、站点标识符以及相关的测试元数据。

  • 输出提供标准化的预测代码 (pred_code)、标签 (pred_label) 与标准化的信心分数。

  • 限制条件:该技能需要访问有效的产品代码手册,并必须遵守提供的站点范围映射 (station_scope_map) 以维护数据完整性。

  • 使用建议:如果条目被识别为 UNKNOWN,则表示提供的理由包含不足的线索或参考资料,无法与当前版本的代码手册匹配;在此情况下,建议检查原始日志中是否缺少站点上下文或使用了非标准的缩写。

仓库统计

Star 数
1,084
Fork 数
271
Open Issue 数
38
主要语言
PDDL
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 12:18
在 GitHub 查看