工程開發自動化生產力
skill-reinforcement
一種自動化元學習技能,透過在每次任務執行後捕獲模式、錯誤和捷徑來改進代理工作流程。
瀏覽: 10★ 220
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 144 個技能
一種自動化元學習技能,透過在每次任務執行後捕獲模式、錯誤和捷徑來改進代理工作流程。
使用 Stable Baselines3 進行生產級強化學習。透過類 scikit-learn API 訓練智能體、設計自定義環境、實作訓練回調函數並優化工作流程。
透過 ReasoningBank 實現代理程式的自適應學習,進行模式識別、策略優化與持續改進。
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。
基於 Notion 的推文效能追蹤系統,透過強化學習原理實現數據驅動的內容實驗與優化。
以小型、可驗證的批次執行實作計劃,並在每個階段設置回饋暫停點,以防止偏離目標並確保代碼品質。
透過管理插件來自我修改 Milady 代理。編輯程式碼、重建並重新啟動運行環境,以開發新功能或本地優化代理工作流程。
一個受強化學習啟發的 YouTube 績效追蹤工具,透過系統化記錄來優化縮圖、標題與影片鉤子。
使用 AgentDB 的超快速向量後端實作 ReasoningBank 自適應學習。具備軌跡追蹤、判斷評估、記憶蒸餾與模式識別功能,適用於構建自我學習的自主智能體。
用於構建健壯 AI Agent 技能的元技能,採用測試驅動開發 (TDD) 方法:定義失敗 (RED)、實作技能 (GREEN) 並修補合理化漏洞 (REFACTOR)。
代碼庫自動化優化循環。根據特定目標與機械指標,自動修改、測量並迭代代碼以提升效能。
一個基於 LLM 的 NetHack 代理框架,透過在安全沙盒中動態合成 Python 程式碼,利用高階 API 執行複雜的地牢探索與遊戲操作。