glyphbox
一個基於 LLM 的 NetHack 代理框架,透過在安全沙盒中動態合成 Python 程式碼,利用高階 API 執行複雜的地牢探索與遊戲操作。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 246 個技能
一個基於 LLM 的 NetHack 代理框架,透過在安全沙盒中動態合成 Python 程式碼,利用高階 API 執行複雜的地牢探索與遊戲操作。
透過價值、易用性、可行性與營運可行性四個維度,利用多角度批判性思維對現有產品功能進行風險假設評估與壓力測試。
透過引入程式碼變異並測量殺死率,驗證測試套件的有效性並找出薄弱斷言。對於證明測試能真正捕捉錯誤,而非僅僅滿足覆蓋率指標至關重要。
在 AI 輔助開發過程中,保持技術規格、測試套件與原始程式碼的完美同步。
使用 Browserbase 將無伺服器瀏覽器自動化部署為雲端函數。適用於定時任務、Webhook 端點以及在雲端執行自動化腳本。
監控專案進度、分析活躍軌道並識別開發工作空間中的阻塞問題。
使用 OpenAI Agents SDK (Python) 構建 AI 代理。支援多代理協作、函數工具、狀態化對話、串流傳輸以及透過 LiteLLM 進行 Azure OpenAI 集成。
開發高品質 MCP (Model Context Protocol) 伺服器的指南,支援使用 Python 或 TypeScript 將外部 API 與服務整合至 LLM 工作流程中。
透過 CLI 提交 OpenAnt 完成的任務。支援文字報告、檔案上傳(圖片、文件、程式碼)及外部證明連結,確保交付成果可被驗證。
透過先進的上下文壓縮、結構化摘要與任務導向的狀態管理,為長期運行的 AI 代理會話優化效能並降低 Token 使用量。
全方位 Python 醫療 AI 工具包,用於臨床數據處理、醫學編碼轉換,以及開發用於 EHR、生理訊號和臨床預測任務的深度學習模型(如 RETAIN 與 Transformer)。
為 AI 代理提供主動式上下文視窗管理,透過智慧令牌監控、快照建立與選擇性狀態恢復,確保長會話期間的連續性。