openai-whisper-api
在 OpenClaw 中使用 OpenAI Whisper API 将音频文件直接转换为文字。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 348 个技能
在 OpenClaw 中使用 OpenAI Whisper API 将音频文件直接转换为文字。
为 AI 代理与开发者打造的 MPC 多链钱包 SDK 与 CLI 工具。通过阈值签名技术,无需助记词即可安全地在 40 多个区块链上进行加密货币发送、交换与签署操作。
macOS 视觉自动化工具,提供精确窗口截图、录影、UI 标注、Excalidraw 线框图生成及自动化视觉回归测试。
利用 Azure OpenAI GPT Realtime Mini 模型与 WebSocket 流媒体技术,生成 AI 播客风格的音频叙事,包含 PCM 转 WAV 及前端播放整合。
用于路线图管理的视觉化网页工作区,提供互动式看板与基于图表的依赖关系视图,辅助任务规划与项目进度追踪。
抓取、索引并搜索 GitHub 和网站上的开发者文档,为 AI 代理提供准确、基于真实来源且具备版本控制的代码上下文。
官方 AIRIOT 开发套件,用于构建基于 React、TypeScript 与 shadcn/ui 的应用程序,并集成实时平台功能。
全面的 SEO 和 GEO 优化工具。用于分析域名、查找关键词差距、研究反向链接,并通过 DataForSEO 生成搜索建议。
一套用于开发与打包复杂、多组件 React/TypeScript 网页实体的工具包,整合了 Vite、Tailwind CSS 与 shadcn/ui。
使用 Docker 中的 nektos/act 在本地运行 GitHub Actions CI 工作流程。无需推送到 GitHub 即可测试 CI 配置、调试工作流程失败并验证流水线变更。
为任何网页应用程序建立并测试 AI 就绪的 MCP 工具。通过代码注入与自动化浏览器交互,将网站转化为智能代理程序。
基于 Apple Silicon 与 MLX 的本地机器学习推理服务,整合语音识别 (ASR)、语音合成 (TTS)、翻译、图像生成与视觉识别功能。