ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 176 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
使用 Gas Town 的车队系统 (convoy) 管理批次任务追踪与排程,实现多代理自动化协作。
一个专为模拟提示词注入攻击并验证 AI 代理技能安全扫描器而设计的测试工具。
使用 Syft 为容器镜像和文件系统生成软件物料清单 (SBOM)。支持 28 种以上生态系统、多种输出格式 (CycloneDX, SPDX),并可集成至 CI/CD 以增强供应链安全。
为构建 Claude API 生产级应用提供专家指导,涵盖 SDK 使用、提示词缓存、批量处理、流式传输、工具调用及成本优化策略。
用于 Ruflo/Claude Flow 生态系统的多代理管道、数据转换与顺序工作流程的 Stream-JSON 串联工具。
自动化每日米兰新闻简报工具,集成天气、罢工查询、国际/AI/意大利新闻及活动抓取。支持 SQLite 去重、RSS/API 源管理与 AI Agent 定时任务调度。
生成逼真的虚拟产品试穿视觉效果,协助客户在购买前评估版型、垂坠感与尺寸比例。
防止 AI 幻觉,确保在分析代码、技术文档或提供建议时,输出具备证据支持且可验证的内容。
为研究、开发与测试工作流部署网格、层级与星状拓扑等进阶多代理人蜂群编排策略。
一个智能网关,可分析、评分并将用户请求路由至 27 个代理、27 个技能与 14 个 MCP,以优化 Claude Code 的执行效率。
提供识别、审查与管理由 GitHub Copilot 编码代理在存储库中创建的提取请求 (PR) 的操作指南与技巧。