gemini-audio
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 283 个技能
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
基于 Qdrant 和 Ollama 的本地 RAG 语义记忆系统。适用于高效检索工作区文件、笔记、决策记录与用户偏好,提供精确的向量语义搜索。
使用 Browserbase 将无服务器浏览器自动化部署为云端函数。适用于定时任务、Webhook 端点以及在云端执行自动化脚本。
使用 Python (matplotlib, seaborn, plotly) 创建专业数据可视化。包含图表选择指南、设计原则、无障碍标准及出版级图表的代码模板。
根据 Grey Haven Studio 标准生成专业的合并请求描述,包含清晰的摘要、动机、实现细节与测试策略。
研究技术文档并自动生成可直接使用的 Markdown 格式软件代理技能。
ManimGL (3Blue1Brown OpenGL 动画引擎) 的最佳实践与代码模版。提供 3D 与交互场景开发、摄像机控制、以及 LaTeX 数学可视化指南,专为技术创作者设计。
MassGen 自我开发指南,支持自动化测试与可视化 UI/UX 评估流程。
用于在 Mini-Agent 框架内开发和集成自定义 AI 代理技能的灵活模板。
NestJS 11+ 企业级 Node.js 开发专家,涵盖依赖注入、DTO 验证、身份验证、ORM、测试、微服务及架构最佳实践。
用于构建多代理系统、AgentOS 运行时及整合 MCP 服务器的 AI 代理开发框架。
Refly 生态系统基础技能。用于创建、探索及执行特定领域技能,通过符号链接路由用户意图至工作流程,并利用 Refly CLI 自动化执行多步骤任务。