claude-rag-skills
一套專業工具集,用於在 Claude Code 環境中審核、評估、切分文件及構建生產級 RAG 管線。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 150 個技能
一套專業工具集,用於在 Claude Code 環境中審核、評估、切分文件及構建生產級 RAG 管線。
指導代理人記憶系統的實作,比較主流框架(Mem0、Zep、Letta、LangMem、Cognee),並設計用於跨會話知識保留的持久化架構。
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。
防止 AI 幻覺,確保在分析程式碼、技術文件或提供建議時,輸出具備證據支持且可驗證的內容。
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
一個專為模擬提示詞注入攻擊並驗證 AI 代理技能安全掃描器而設計的測試工具。
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
統一的 AI 閘道,支援超過 100 種大語言模型,提供相容 OpenAI 的 API、模型備援、負載平衡及企業級管理工具。
用於在 Claude Code 和 Gemini CLI 擴展之間轉換及同步 AI 代理技能的通用 CLI 工具。
使用 TruLens 對 LLM 應用程式進行檢測、評估與監控的系統化工作流程,支援 LangChain、LangGraph 與 LlamaIndex 等框架。
用於將任務分發給專業背景代理的智能編排系統,具備基於性能的路由與執行追蹤功能。
為構建 Claude API 生產級應用提供專家指導,涵蓋 SDK 使用、提示詞緩存、批量處理、串流傳輸、工具調用及成本優化策略。