qwen-asr
使用 Qwen ASR 模型將音訊檔案 (wav, mp3, ogg) 轉錄為文字。快速、易於本地部署且無需 API 金鑰。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 154 個技能
使用 Qwen ASR 模型將音訊檔案 (wav, mp3, ogg) 轉錄為文字。快速、易於本地部署且無需 API 金鑰。
存取 Y Combinator 443+ 份創業資源庫,為您提供有關募資、共同創辦人、產品開發、成長與企業擴張的專家級建議。
分析 Claude Code 會話歷史,以識別效率低下的模式、優化 Token 使用量並建議工作流程改進。
基於 OpenAI Whisper 的專業音訊/影片轉錄工具。提供模型選擇、時間軸同步、說話者分離 (diarization) 及批次處理功能,優化影音工作流程。
indiiOS 的自動遞迴執行引擎,負責管理任務完成、狀態驗證與錯誤處理。
獲取 YouTube 字幕與逐字稿。適用於影片摘要、語言學習、無障礙輔助及內容分析。支援時間軸數據與純文字擷取。
一個結構化的提示工程框架,能將隨意輸入轉換為包含角色、背景、任務、格式及防護機制的專業模組化提示詞。
產生用於 Stigmer AI 代理的生產級 McpServer YAML 設定檔,輕鬆整合各類外部工具與 API。
構建企業級 AI 代理系統,支援 LangGraph、Anthropic/OpenAI/vLLM 與結構化輸出。具備串流傳輸、A2A 協定、Pydantic 驗證、向量記憶體與防幻覺機制,適用於複雜的多代理協作工作流。
TikTok 和 Instagram 社群媒體情報蒐集工具。利用 ScrapeCreators API 探索熱門鉤子 (hooks)、分析競爭對手策略,並進行創作者資料研究。
下載 Instagram Reels、提取元數據並使用 Groq Whisper 生成音訊逐字稿。支援透過 yt-dlp 處理 TikTok 與 YouTube Shorts。
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。