ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 503 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
將瀏覽器原生 Proofreader API 整合至網頁應用,提供 AI 驅動的文本校正、語法檢查與語言支援,並包含受控的模型生命週期管理。
掌握 Godot 4 GDScript 模式,包括信號通信、狀態機、場景架構與效能優化,適用於專業遊戲開發。
為 Peon Trainer 記錄伏地挺身、深蹲等健身次數。透過 AI 代理直接記錄運動進度,觸發音效提示,讓您在編碼時保持動力。
進階提示詞改寫與優化服務。分析提示詞的清晰度、具體性與結構,提供可執行的優化建議、多種變體選項,並教授提示工程的最佳實踐。
一套規範驅動的工作流程管理系統,用於結構化的開發生命週期管理,涵蓋提案、規劃、實作及歸檔階段。
OpenCode 代理的自我維護技能,用於更新文檔、捕捉學習成果並動態擴展工具與代理功能。
為 Claude Code 設計的蜂巢思維多代理協作系統,具備女王式架構、拜占庭共識機制、持續性集體記憶與自適應任務分配,適用於複雜軟體開發。
強制執行低認知與循環複雜度標準。自動在開發過程中維護程式碼的可讀性、模組化與維護性,防止複雜函式的堆疊。
為所有軟體開發任務提供強制性的執行驗證。在確認結果前,透過實際運行來確保代碼功能正確。
使用 Conventional Commits 規範執行 Git 提交,結合智能暫存與基於代碼差異的語義化提交訊息生成。
為程式開發過程維護詳細的步驟實作日記,並整合 docmgr 以追蹤變更、設計決策、執行指令及錯誤記錄。