工程開發
eval-harness
AI 代理會話的正式評估框架,實施評估驅動開發 (EDD) 原則以確保代理可靠性。
安裝
Agent 類型
Claude Code
安裝指令 (macOS)
curl -fsSL "https://mentalok.io/api/v1/skills/eval-harness/install?os=mac&agent=claude" | bash
安裝指令 (Windows)
curl -L "https://mentalok.io/api/v1/skills/eval-harness/install?os=windows&agent=claude" -o install-eval-harness.bat && install-eval-harness.bat
下載安裝腳本