openai-whisper-api
在 OpenClaw 中使用 OpenAI Whisper API 将音频文件直接转换为文字。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 158 个技能
在 OpenClaw 中使用 OpenAI Whisper API 将音频文件直接转换为文字。
为 Claude Code 和 AI 代理提供交互式 UI 组件。创建确认框、清单、输入框、表格和视图,以实现非阻塞式交互与监控。
构建具备工具调用与多步推理能力的 AI 代理。生成、管理并编排适用于 Claude Code、Cursor、Cline 等 AI 助手的自定义技能文件,实现开发流程标准化。
基于 Apple Silicon 与 MLX 的本地机器学习推理服务,整合语音识别 (ASR)、语音合成 (TTS)、翻译、图像生成与视觉识别功能。
基于 CLI 的 Linear 集成,用于 AI 辅助的任务管理、工单追踪和自动化开发工作流程。
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
MassGen 自我开发指南,支持自动化测试与可视化 UI/UX 评估流程。
生成 0 到 9999 之间的随机幸运数字,适用于游戏、决策或娱乐需求。
使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。
使用 Cloudflare Agents SDK 在 Workers 上构建有状态的 AI 代理。支持实时 WebSocket、持久化状态管理、定时后台任务与工具集成,专为生产环境设计。
通过 prompts.chat 搜索、发掘并优化 AI 提示词。访问数千个专为 ChatGPT、Claude 等 AI 模型设计的社区精选提示词。
为 AI 代理提供专家级 CLI 指南,涵盖云端、IaC、容器、数据库与开发工具的资深工程师工作流程、安全防护与运作模式。