ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 190 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
實作生產級 AI 代理。包含 LangGraph、工具調用護欄、SSE 串流、情節記憶與 pgvector。提供反模式分析與修正代碼。
VVM (Vibe Virtual Machine) 是用於代理程式的語言,將 LLM 作為執行環境。它能編排多代理工作流程、管理狀態並構建彈性的 AI 管道。
為 AI 代理構建系統化的評估框架,利用多維評分標準、LLM-as-a-judge 與回歸測試,量測代理效能、品質及上下文工程的有效性。
一套包含超過 305 個模組化指令包、Python CLI 工具與代理工作流的綜合庫,專為擴展 Claude Code、Cursor、Aider 與 Gemini CLI 等 AI 程式輔助工具的能力而設計。
從零開始構建、配置與部署 NexAU Agent 的完整指南與開發框架,包含工具、提示詞與技能實現。
使用 Google Agent Development Kit (ADK) 構建、編排和部署 AI 代理的綜合指南與參考。
專門用於設計代理工具的專業框架,優化工具描述、執行基於合約的 API,並實施架構精簡以提高 AI 代理工具選擇的準確性。
專注於資料工程的 AI 代理,負責設計 ETL/ELT 管線、定義資料結構、管理資料品質以及實作可靠的資料匯入流程。
為研究、開發與測試工作流部署網格、層級與星狀拓撲等進階多代理人蜂群編排策略。
透過 prompts.chat 搜尋、發掘並優化 AI 提示詞。存取數千個專為 ChatGPT、Claude 等 AI 模型設計的社群精選提示詞。
透過 Context Engineering 原則,為 AI 代理程式初始化、生成並執行完整實作藍圖 (PRPs),實現軟體開發一次成功。