gemini-audio
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 283 個技能
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
基於 Qdrant 和 Ollama 的本地 RAG 語義記憶系統。適用於高效檢索工作區文件、筆記、決策記錄與用戶偏好,提供精確的向量語義搜索。
使用 Browserbase 將無伺服器瀏覽器自動化部署為雲端函數。適用於定時任務、Webhook 端點以及在雲端執行自動化腳本。
使用 Python (matplotlib, seaborn, plotly) 創建專業數據可視化。包含圖表選擇指南、設計原則、無障礙標準及出版級圖表的代碼模板。
根據 Grey Haven Studio 標準生成專業的合併請求描述,包含清晰的摘要、動機、實作細節與測試策略。
研究技術文件並自動生成可直接使用的 Markdown 格式軟體代理技能。
ManimGL (3Blue1Brown OpenGL 動畫引擎) 的最佳實踐與程式碼範本。提供 3D 與互動場景開發、攝影機控制、以及 LaTeX 數學視覺化指南,專為技術創作者設計。
MassGen 自我開發指南,支援自動化測試與視覺化 UI/UX 評估流程。
為 Mini-Agent 框架開發與整合自訂 AI 代理技能的靈活模板。
NestJS 11+ 企業級 Node.js 開發專家,涵蓋依賴注入、DTO 驗證、身份驗證、ORM、測試、微服務及架構最佳實踐。
用於構建多代理系統、AgentOS 運行時及整合 MCP 伺服器的 AI 代理開發框架。
Refly 生態系統基礎技能。用於建立、探索及執行特定領域技能,透過符號連結路由使用者意圖至工作流程,並透過 Refly CLI 自動化執行多步驟任務。