ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 497 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
一个全方位的数据分析助手,支持加载数据集、执行统计计算、可视化趋势并生成专业的分析总结报告。
以小型、可验证的批次执行实施计划,并在每个阶段设置反馈暂停点,以防止偏离目标并确保代码质量。
分析 Claude Code 会话历史,以识别效率低下的模式、优化 Token 使用量并建议工作流程改进。
Java Spring Boot 后端架构指导与模式实现,涵盖 REST API 设计、JPA、缓存、异步处理及日志记录。
开发者专用项目初始化向导,支持超过 70 种 Web、移动、桌面与后端开发项目,提供 SDK、数据库与 DevOps 环境的交互式配置流程。
AI 代理的全面安全审计与加固工具:包含凭证扫描、个人隐私保护 (PII)、提示注入防御,以及工作区配置优化。
在 AI 辅助开发过程中,保持技术规格、测试套件与源代码的完美同步。
掌握 LangGraph 多智能体编排。使用监管者-工作者模式、条件路由与状态管理,构建具备容错能力的复杂 AI 工作流。
自动化 GitHub Issue 分析、分类与解决方案规划工具,完全整合规格驱动开发 (SDD) 工作流程。
Claude Messages API 专家指南:涵盖结构化输出、提示词缓存、工具使用,以及从 Claude 3.x 迁移至 4.5 的关键信息,协助开发者解决常见 API 错误与性能问题。
Multigres 项目开发工具:自动化执行单元测试、集成测试以及环境协调,适用于 Vitess-for-Postgres。