ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 450 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
自动化质量闸门,使用 5 个并行 AI 代理审查代码变更,确保正确性、风格与一致性。
为 Claude Code 提供基于 Beads 的持久化任务记忆与工作流程同步,实现跨会话项目管理与上下文保留。
根据研究计划与叙事报告,以章节为单位编写 LaTeX 学术论文,并通过多模型审阅机制确保质量。
Claude Messages API 专家指南:涵盖结构化输出、提示词缓存、工具使用,以及从 Claude 3.x 迁移至 4.5 的关键信息,协助开发者解决常见 API 错误与性能问题。
SwiftUI 专家开发助手:重构代码、提升性能,并利用 Xcode Instruments 追踪分析来诊断 App 卡顿或 CPU 性能问题。
全栈软件开发生命周期 (SDLC) 代理工作流程,利用 MCP 工具管理从需求导入、规划到自动化测试、CI/CD 与基础设施部署的完整生产周期。
这是一个友好的欢迎技能,当用户发送“hello”或“hi”时,会以 ASCII 艺术风格显示操作系统信息。
验证 n8n 表达式语法,执行上下文感知测试,检测常见陷阱,并优化工作流程中的数据转换。
indiiOS 的自动递归执行引擎,负责管理任务完成、状态验证与错误处理。
专门用于生成高质量技术文档、代码注释、API 规范和 README 模板的技能。自动化 C# 和 TypeScript 项目的标准文档工作流程。
执行结构化的五阶段代码审查,涵盖需求合规性、正确性、代码质量、测试与安全性。提供分类后的具体改进建议(严重/主要/次要/微调)。