qwen-asr
使用 Qwen ASR 模型将音频文件 (wav, mp3, ogg) 转录为文本。快速、支持本地运行,无需 API 密钥。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 154 个技能
使用 Qwen ASR 模型将音频文件 (wav, mp3, ogg) 转录为文本。快速、支持本地运行,无需 API 密钥。
获取 Y Combinator 443+ 份创业资源库,为您提供有关融资、联合创始人、产品开发、增长与企业扩张的专家级建议。
分析 Claude Code 会话历史,以识别效率低下的模式、优化 Token 使用量并建议工作流程改进。
基于 OpenAI Whisper 的专业音频/视频转录工具。提供模型选择、时间轴同步、说话者分离 (diarization) 及批处理功能,优化影音工作流程。
indiiOS 的自动递归执行引擎,负责管理任务完成、状态验证与错误处理。
获取 YouTube 字幕与逐字稿。适用于视频摘要、语言学习、无障碍辅助及内容分析。支持时间轴数据与纯文本提取。
一个结构化的提示工程框架,能将随意输入转换为包含角色、背景、任务、格式及防护机制的专业模块化提示词。
生成用于 Stigmer AI 代理的生产级 McpServer YAML 配置文件,轻松集成各类外部工具与 API。
构建企业级 AI 代理系统,支持 LangGraph、Anthropic/OpenAI/vLLM 与结构化输出。具备流式传输、A2A 协议、Pydantic 验证、向量记忆体与防幻觉机制,适用于复杂的多代理协作工作流。
TikTok 和 Instagram 社交媒体情报收集工具。利用 ScrapeCreators API 探索热门钩子 (hooks)、分析竞争对手策略,并进行创作者资料研究。
下载 Instagram Reels、提取元数据并使用 Groq Whisper 生成音频逐字稿。支持通过 yt-dlp 处理 TikTok 与 YouTube Shorts。
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。