工程開發
advanced-evaluation avatar

advanced-evaluation

實作生產級別的 LLM-as-a-Judge 系統,用於自動化品質評估、模型輸出比較、評分標準生成以及系統性偏差修正。

安裝

Agent 類型

Claude Code

安裝指令 (macOS)
curl -fsSL "https://mentalok.io/api/v1/skills/advanced-evaluation/install?os=mac&agent=claude" | bash
安裝指令 (Windows)
curl -L "https://mentalok.io/api/v1/skills/advanced-evaluation/install?os=windows&agent=claude" -o install-advanced-evaluation.bat && install-advanced-evaluation.bat

下載技能專案

/agent-skill/advanced-evaluation