gemini-audio
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 437 个技能
整合 Google Gemini API 音频处理功能:进行录音转文字、音频摘要、声音分析,并提供语音合成 (TTS) 功能以产生自然语音。
使用百度 AI 搜索引擎 (BDSE) 进行即时网络搜索,获取最新资讯、文档与研究资料。
Archon 交互式集成工具,提供知识库与项目管理功能。支持 RAG 语义搜索、网站抓取、文档版本控制以及通过 REST API 进行层级化任务管理。
启动自动化逆向工程,探索代码库架构、层级与技术栈,以利于系统现代化或文档编写。
用于在 Claude Code 和 Gemini CLI 扩展之间转换及同步 AI 代理技能的通用 CLI 工具。
通过检查容器、分析 Squid 日志、检查 iptables 以及排除网络或域名访问问题,对 AWF (Agentic Workflow Firewall) 进行调试。
设计与构建高质量 AI Agent Skills 的专家顾问。通过发现、架构与制作阶段的结构化引导,确保您建立的技能具备高度一致性、可组合性与执行效能。
通过短视频营销自动化您的 B2C 移动应用推广。支持 TikTok、Instagram Reels 与 YouTube Shorts 的内容生成、Post Bridge API 定时发布及效果分析。
用于编排长期代理任务、证据导向交付以及遵循 Simon Willison 迭代循环的自动化 QA 门控的框架。
全面的测试驱动开发 (TDD) 助手,专为工程团队设计,提供智能测试生成、覆盖率分析及多框架支持。
使用 Nano Banana Pro (Gemini 3 Pro) AI 模型生成应用图标、Logo、营销横幅及各类插图等专业视觉素材。
根据 Anthropic 最佳实践创建与管理 Claude Code 技能,包含触发条件、Hook 机制与渐进式披露。