ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 352 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
AI 优化项目追踪系统,利用 YAML 与 Markdown 混合格式,实现高效率的项目编排、阶段管理与自动化任务委派,大幅降低 Token 消耗。
使用 Token Surgeon 审核并优化您的 AI 提示词。检测 10 种常见的冗余模式,计算效率分数,并减少 Token 用量以提升提示词性能。
执行 FastMCP 项目的严格代码审查,专注于 API 设计、依赖管理与代码库的一致性。
自动化 GitHub Issue 分析、分类与解决方案规划工具,完全整合规格驱动开发 (SDD) 工作流程。
分析代码库以生成层次分明的文档、入职指南和架构映射,帮助团队高效理解并记录项目。
React 与 Next.js 专家级 UI/UX 设计助手。提供视觉审核、设计系统架构,以及 Tailwind CSS 与 shadcn/ui 的实现指导,助力打造专业级 Web 应用程序。
编排 Codex CLI 以实现高效并行程序开发、自动化任务与会话管理,优化 Token 使用量并提升开发效率。
一种将测试驱动开发 (TDD) 应用于流程文档的框架,通过压力测试情境来识别并修补 AI 代理的合理化漏洞,确保文档执行的可靠性。
使用 FastMCP 框架构建与管理 MCP 服务器。提供工具开发、资源配置、Prompt 设计、Claude Desktop 集成及 Python/TypeScript 部署指南。
执行全面的代码审查,专注于安全性漏洞、性能优化、可维护性及代码正确性。
智能 GitHub 发布编排,利用 AI 群体智慧进行自动化版本控制、多平台部署、测试与回滚管理。