工程開發資料分析自動化
gemini-audio
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
瀏覽: 15★ 1
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 500 個技能
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
LobeHub 專案架構與結構指南。用於探索程式碼庫、理解專案組織、查找檔案及獲取架構背景資訊。
專門用於設計代理工具的專業框架,優化工具描述、執行基於合約的 API,並實施架構精簡以提高 AI 代理工具選擇的準確性。
智能戰略規劃與需求收集,支援多視角共識循環與結構化審議。
互動式工作區探索指南,提供專家代理人、自動化工作流程、CLI 工具及活動生命週期掛鉤的使用說明。
FlowGram.ai 自定義節點開發指南,支援簡單節點自動表單與複雜節點自定義 UI 開發。
高效管理 git worktrees,支援自動化檔案同步、背景任務執行以及基於 CLI 的工作區編排。
在獨立會話中執行實作計畫並進行審核檢查點,確保逐項任務驗證與代碼品質。
使用 LlamaExtract 實作從 PDF、DOCX 與 PPTX 等非結構化檔案中擷取結構化資料的解決方案,並透過 Pydantic 定義資料架構。
使用 AI 模型(如 FLUX 和 Gemini)生成或編輯影像。適用於照片、插圖、概念藝術和視覺素材,不包含技術圖表或原理圖。
AI 一鍵生成小紅書爆款筆記,包含標題、正文、標籤、封面提示詞及發帖策略,真實種草風格,防封號優化。
基於 Gemini 的 UI 設計審核、無障礙審計與設計系統驗證工具,專為軟體代理設計。