transcription
基于 OpenAI Whisper 的专业音频/视频转录工具。提供模型选择、时间轴同步、说话者分离 (diarization) 及批处理功能,优化影音工作流程。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 308 个技能
基于 OpenAI Whisper 的专业音频/视频转录工具。提供模型选择、时间轴同步、说话者分离 (diarization) 及批处理功能,优化影音工作流程。
全面的 Google Docs 和 Google Drive 管理工具。支持通过 Markdown 创建和编辑文档、文本格式设置、结构分析,以及完整的文件操作(上传、下载、共享与搜索)。
自动化 React/TS 代码库的 i18n 设置、字符串提取与本地化对齐审核。提供框架感知配置、自动化审核脚本与安全的字符串替换,确保无缝的本地化流程。
高级测试报告与质量仪表板,提供 QE 指标、代码覆盖率与部署就绪度分析,通过预测性洞察协助团队进行数据驱动的质量决策。
自动化 Terraform 和 OpenTofu 基础设施到 Pulumi 的迁移,处理状态映射、供应商安装及 HCL 代码转换。
使用 Better Auth 实现完整的 TypeScript 身份验证与授权,支持 OAuth、2FA、密钥 (Passkeys)、会话管理及多租户功能。
在 Dawncaster 游戏扩展包发布后,系统化地更新卡片与天赋浏览器的筛选器下拉菜单及映射数组,确保前端数据与 Blightbane API 同步。
Next.js 项目自动化迁移工具,将其转换为 vinext(基于 Vite 的 Next.js 实现),包含兼容性扫描、依赖项替换与配置文件生成。
从网页中提取 WebGL/Canvas/Shader 视觉特效代码,反混淆后移植为独立原生 JS 项目。
掌握动态规划 (DP) 模式,包含备忘录、表格化与状态设计,提供可直接用于生产环境的高性能代码解决方案。
使用计算机视觉相似度嵌入技术,在 FiftyOne 数据集中查找、查看并移除重复或高度相似的图像。
自动化视频剪辑工作流:使用 Whisper 转录语音,结合 AI 分析识别冗词、停顿与错误片段,并自动生成 FFmpeg 命令进行高质量视频裁剪。