ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 190 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
实现生产级 AI 代理。包含 LangGraph、工具调用护栏、SSE 流式传输、情节记忆与 pgvector。提供反模式分析与修正代码。
VVM (Vibe Virtual Machine) 是一种代理程序语言,将 LLM 作为运行时。它可用于编排多代理工作流、管理状态并构建弹性 AI 流水线。
为 AI 代理构建系统化的评估框架,利用多维评分标准、LLM-as-a-judge 与回归测试,量测代理效能、质量及上下文工程的有效性。
一套包含超过 305 个模块化指令包、Python CLI 工具与代理工作流的综合库,专为扩展 Claude Code、Cursor、Aider 与 Gemini CLI 等 AI 编程辅助工具的能力而设计。
从零开始构建、配置与部署 NexAU Agent 的完整指南与开发框架,包含工具、提示词与技能实现。
使用 Google Agent Development Kit (ADK) 构建、编排和部署 AI 代理的综合指南与参考。
用于设计代理工具的专业框架,优化工具描述、执行基于合约的 API,并实施架构精简以提高 AI 代理工具选择的准确性。
专注于数据工程的 AI 代理,负责设计 ETL/ELT 管线、定义数据结构、管理数据质量以及实现可靠的数据导入流程。
为研究、开发与测试工作流部署网格、层级与星状拓扑等进阶多代理人蜂群编排策略。
通过 prompts.chat 搜索、发掘并优化 AI 提示词。访问数千个专为 ChatGPT、Claude 等 AI 模型设计的社区精选提示词。
通过 Context Engineering 原则,为 AI 代理程序初始化、生成并执行完整实作蓝图 (PRPs),实现软件开发一次成功。