evaluating-code-models
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 453 個技能
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
當用戶提示模糊、隨意或需要創意決策時,透過塔羅牌占卜為規劃過程注入隨機性與靈感。
AI 驅動的微信消息助手。可直接通過 AI 對話獲取聯繫人/群組的最新消息並發送文字訊息。僅限 Windows 10/11。
自動化模式偵測與技能推薦引擎,透過監控專案記憶、日誌及任務列表,自動進化 AI 代理的能力。
一個高效能 Liquid 模板引擎,透過中間語言 (IL) 將模板編譯為最佳化的 Ruby 和機器碼。
透過 MCP 工具編排 Unity 編輯器。支援 AI 在 Unity 專案中建立遊戲物件、編輯腳本、管理場景及自動化測試。
紫微斗數排盤與分層解讀工具。透過 iztro 引擎進行命盤生成,提供本命、流年、流月、流日之系統化、證據導向的命理分析。
npm-agentskills 框架的測試工具,用於驗證 Nuxt 模組整合與 AI Agent 技能發現機制。
使用 curl 從公開分享的 Google 文件中可靠地讀取並提取內容,確保獲取完整文件。
自動化移除程式碼中多餘或顯而易見的註解,同時保留重要的架構與邏輯說明,優化程式碼的可讀性與品質。
Anthropic 結構化輸出實作專家顧問。協助判斷 JSON 模式與嚴格工具使用之間的取捨,確保 schema 合規性與 Agent 工作流的輸入驗證。
搜尋並發掘 Claude Code 技能與 MCP 伺服器,從市集、GitHub 儲存庫及註冊表獲取資源,優化您的 AI 輔助開發工作流程。