ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 261 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
為您的專案產生 AGENTS.md 與 AI 設定檔 (Cursor, Claude, Gemini, Copilot),優化您的 vibe-coding 工作流並維持跨工作階段的上下文關聯。
使用 agents:// URI 統一管理多種 AI 代理的對話,支援查詢、讀取、分析及撰寫指令,適用於各類 AI 編碼代理。
使用 d3.js 建立互動式自訂資料視覺化,包含圖表、圖形與網路拓樸。適用於需要精細控制視覺元素、轉場動畫與互動行為的場景。
一個統一的文件處理閘道,支援 PDF 解析、文字提取、格式轉換與跨多種本地及雲端供應商的文件操作。
為 Python 代碼提供 6 階段唯讀分析的工作流程,根據專案類型(從 POC 到開源)檢測設計原則違規、程式碼異味並建議現代化改善方案。
AI 代理的執行前安全防護機制。針對 Shell 指令和檔案讀取執行 400 多種安全模式驗證,攔截具破壞性的操作、憑證竊取與未授權的系統存取。
專門用於 Laravel 的 Pest 4 測試代理:編寫、重構、TDD、瀏覽器/冒煙測試及架構驗證。
透過可配置的 YAML 模板將內容轉換為特定的語音配置、語氣或風格,以確保品牌與敘事輸出的一致性。
透過 CLI 在 TLDraw 畫布上繪製圖表、流程圖與註解。適用於架構規劃、程式碼審查與代理程式執行紀錄視覺化。
透過 ReasoningBank 實現代理程式的自適應學習,進行模式識別、策略優化與持續改進。
HASH 程式庫的標準化 Rust 文件編寫規範,確保註解、內部連結與錯誤處理的一致性。