工程开发
eval
通过自动化测试执行器、人工 LLM 判断与结构化报告,评估 Deca 代理提示词与行为一致性。
安装
Agent 类型
Claude Code
安装命令 (macOS)
curl -fsSL "https://mentalok.io/api/v1/skills/eval/install?os=mac&agent=claude" | bash
安装命令 (Windows)
curl -L "https://mentalok.io/api/v1/skills/eval/install?os=windows&agent=claude" -o install-eval.bat && install-eval.bat
下载安装脚本
下载技能项目