工程開發
eval
透過自動化測試執行器、人工 LLM 判斷與結構化報告,評估 Deca 代理提示詞與行為一致性。
安裝
Agent 類型
Claude Code
安裝指令 (macOS)
curl -fsSL "https://mentalok.io/api/v1/skills/eval/install?os=mac&agent=claude" | bash
安裝指令 (Windows)
curl -L "https://mentalok.io/api/v1/skills/eval/install?os=windows&agent=claude" -o install-eval.bat && install-eval.bat
下載安裝腳本
下載技能專案