gemini-audio
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 143 個技能
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
透過 Turing Tavily 代理進行即時網頁搜尋。適用於查找最新資訊、研究時事、以及獲取訓練資料庫以外的即時數據。
AI 一鍵生成小紅書爆款筆記,包含標題、正文、標籤、封面提示詞及發帖策略,真實種草風格,防封號優化。
透過 Telegram 或命令行自動發布 Instagram 貼文。支援住宅代理繞過檢測、會話快取,並整合 WaveSpeed 影像生成。
基於 Exa MCP 的免費 AI 網路搜尋。支援深度研究、公司與人物調查及程式碼上下文分析,無需 API 金鑰。
使用 OpenAI Whisper CLI 進行本地語音轉文字轉錄,無需外部 API 金鑰即可提供私密且高準確度的音訊處理。
構建企業級 AI 代理系統,支援 LangGraph、Anthropic/OpenAI/vLLM 與結構化輸出。具備串流傳輸、A2A 協定、Pydantic 驗證、向量記憶體與防幻覺機制,適用於複雜的多代理協作工作流。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
使用 OpenAI ChatKit React 組件實現生產就緒的 AI 聊天介面。功能包含 hook 配置、流式傳輸、主題自定義、對話歷史與 Next.js 應用程式的自定義工具整合。
中文日常實用工具集:天氣預報、匯率查詢、新聞摘要與快遞追蹤。無需配置,開箱即用。
將 Excel (.xlsx) 檔案從英文翻譯為中文,並保留所有格式、圖片與圖表。
OpenCode AI 專家指南:涵蓋 TUI 指令、CLI 操作、AGENTS.md 配置、自訂代理工作流程與專案設定。