speak
使用 Kokoro TTS 进行本地文字转语音。在终端中生成音频、朗读文本并处理多语言语音合成。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 161 个技能
使用 Kokoro TTS 进行本地文字转语音。在终端中生成音频、朗读文本并处理多语言语音合成。
读取并控制 Sipeed 开发板(如 LicheeRV Nano、MaixCAM、NanoKVM)上的 I2C 与 SPI 外设。
高性能文档智能库,可从 91 种以上文件格式中提取文本、表格、代码及元数据,支持 OCR 及 LLM 友好输出。
通过 nanaban CLI 使用 Gemini API 生成与编辑图像。适用于制作插图、标志、图标,以及执行背景移除、风格转换等照片编辑任务。
自动化创建 GitHub 草稿合并请求,并强制执行约定式提交规范与严格的验证工作流程。
为 Pull Request 与文档制作精美的终端动画演示,支持使用 asciinema、agg 与 svg-term-cli 进行录制与转换。
Navi 编程语言专家。适用于编写 Navi 代码、调试、实现并发处理、处理错误状态,以及管理 Navi 的类型系统或模块集成。
精通 iOS 人机界面指南 (HIG) 与 SwiftUI。提供原生 iOS 应用程序开发、界面设计、SwiftUI 组件实现与 Apple 平台设计原则的专业指导。
一个系统化的多角度网页研究代理。适用于深度调查、复杂问题查询,以及在内容生成前作为强制性的研究步骤,确保获得有据可查的高质量结果。
结构化、模板驱动的端到端功能开发工作流,包含编码、自动化测试、验证及基于会话的持续改进。
构建企业级 AI 代理系统,支持 LangGraph、Anthropic/OpenAI/vLLM 与结构化输出。具备流式传输、A2A 协议、Pydantic 验证、向量记忆体与防幻觉机制,适用于复杂的多代理协作工作流。
GPT Researcher 是一个自主 AI 代理,专为全面的网页与本地研究而设计,采用规划-执行-发布架构,可产出详尽且具引用的研究报告。