trulens-evaluation-workflow
使用 TruLens 對 LLM 應用程式進行檢測、評估與監控的系統化工作流程,支援 LangChain、LangGraph 與 LlamaIndex 等框架。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 236 個技能
使用 TruLens 對 LLM 應用程式進行檢測、評估與監控的系統化工作流程,支援 LangChain、LangGraph 與 LlamaIndex 等框架。
全面的 iOS 與 Android 行動測試解決方案,涵蓋手勢、感測器、權限、設備碎片化及效能,支援超過 1000 種真實與虛擬設備。
一套系統化的程式碼審計框架,用於識別軟體專案中的技術債、安全漏洞、無效程式碼及程式碼品質問題。
使用 Great Expectations、dbt 測試與資料合約實作生產級資料品質驗證,確保資料管線的可靠性。
快速查詢 SaaS 財務指標、公式與基準。透過即時存取定義、決策框架與異常警示指標,提升您的財務分析效率。
JUCE 音訊插件手動測試套件。提供自動化測試執行、pluginval 驗證(嚴格等級 10)以及用於穩定性與品質保證的 DAW 手動測試檢查清單。
使用 Jupyter Notebook 在瀏覽器中互動式測試 Adobe EDS 區塊。支援 ES6 匯入、疊加層預覽、響應式裝置測試,以及零依賴執行環境。
基於 scverse 最佳實踐的自動化單細胞 RNA-seq 品質控制工具。支援 .h5ad 與 .h5 格式,提供 MAD 離群值檢測、細胞過濾及統計視覺化分析。
用於部署、管理和監控 DataRobot 模型的工具,包含預測環境配置、冠軍/挑戰者模型工作流程以及部署操作。
對本地更改或 GitHub 遠端合併請求進行自動化代碼審查。透過整合 git 和 gh CLI,分析代碼的正確性、可維護性及標準遵循。
生產級 Go 開發支援:包含並發模式、慣用語法錯誤處理、介面設計、testify 測試框架,以及用於構建可擴展後端服務的最佳實踐。
用於驗證 AI 代理技能配置並檢測規則違規的測試夾具。