reflect-appworld-failure
分析 AppWorld 任務失敗原因,提取具體的 API 模式並生成帶有實作程式碼範例的可執行劇本要點。
簡介
reflect-appworld-failure 技能是專為在 AppWorld 環境中運行的自主代理所設計的 ACE (代理內容工程) 框架中的關鍵組件。其主要目的是將執行失敗轉化為持久、可重用的知識,以防止重複性錯誤。當代理在與 Spotify、Venmo、Gmail 或日曆等應用程序交互時遇到異常、逾時或邏輯錯誤時,此技能充當反射橋樑,將錯誤日誌轉換為結構化、可操作的情報。它識別根本原因(範圍從不正確的 API 命名約定和缺失的身份驗證步驟,到不正確的資料結構導航),並將解決方案正規化為標準化的 JSON 架構。這確保了代理的劇本能夠動態演進,從而提高後續任務的成功率。
-
針對 API 濫用、邏輯錯誤和身份驗證逾時等常見失敗進行根本原因識別。
-
自動提取設計模式,例如強制性的 API 順序(例如搜尋前需先登入)和正確的方法命名約定。
-
生成高品質、可操作的要點,其中包含展示正確 API 交互模式的具體程式碼片段。
-
與更廣泛的 ACE 內容管理系統整合,以進行基於 TF-IDF 的檢索和衝突檢測。
-
豐富的元數據輸出,包括證據追蹤 (任務 ID)、信心評分和分類標記,以便進行高效索引。
-
此技能需要結構化的輸入格式,包括任務說明、使用的應用程序、錯誤訊息和失敗的程式碼片段。
-
輸出需嚴格驗證以符合 JSON 架構,確保與生成器和策展人工作流的兼容性。
-
專為致力於 AppWorld 任務自動化的開發人員和自動化代理而設計,要求始終使用 apis.supervisor.complete_task() 來標記完成。
-
用戶應專注於識別可推廣的模式,而非特定於任務的怪癖,以最大化生成要點在不同場景下的效用。
-
使用生成的信心等級(高、中、低)來決定要點是應自動應用還是由人工審查。
-
有效彌合原始執行錯誤日誌與代理系統長期內容演進之間的差距。
倉庫統計
- Star 數
- 27
- Fork 數
- 3
- Open Issue 數
- 2
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月3日 下午05:29