gemini-audio
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 531 個技能
整合 Google Gemini API 音訊處理功能:進行錄音轉文字、音訊摘要、聲音分析,並提供語音合成 (TTS) 功能以產生自然語音。
執行基於 Gradle 的 Java 測試,過濾失敗結果與關鍵統計數據,並提供精簡報告以簡化後端開發與除錯。
積極精簡輸入內容中的語法結構與冗餘文字,在保留核心語義的同時優化 LLM 的 Token 使用效率。
實作生產級 AI 代理。包含 LangGraph、工具調用護欄、SSE 串流、情節記憶與 pgvector。提供反模式分析與修正代碼。
React 與 Vite 效能最佳化指南。適用於編寫、審查或優化基於 Vite 構建的 React 元件。
一個基於 Quartz v4 高度客製化的數位花園,支援增強型 Markdown 解析、縮放文字、TikZ 與偽代碼渲染,並整合了 Obsidian 插件生態。
基於 DuckDB 的持久化狀態管理與工作流程分析工具,支援任務依賴追蹤、歷史指標與上下文檢查點功能。
MCP Gateway 設計模式,用於管理 Agent Gateway、子進程 (Subprocess) 及 Daemon 隔離策略,以優化上下文 Token 使用與系統效能。
使用 LlamaExtract 實作從 PDF、DOCX 與 PPTX 等非結構化檔案中擷取結構化資料的解決方案,並透過 Pydantic 定義資料架構。
前端狀態管理指南,涵蓋 Zustand/Pinia 全域儲存、TanStack Query 伺服器狀態以及 URL 狀態處理。
進階多語言除錯支援,包含堆疊追蹤分析、執行時期錯誤分類,以及針對容器與分散式系統的自動化診斷工具。
使用 Playwright 和 serve-web 自動擷取高品質 VS Code 螢幕截圖,適用於文件、簡報與技術視覺內容。