ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 333 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
销售AI助手,能将业务场景自动转化为AI提示词,协助销售人员快速生成高质量邮件、方案与分析报告,无需具备提示词编写技能。
使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。
为医疗器械与药物生成临床试验方案。支持模块化路径设计、研究整合,以及符合监管文件的草拟需求。
为小说家设计的结构化引导工具,涵盖从创作宪法、故事规格到计划、任务、撰写与质量分析的七步创作方法论。
使用 React、Next.js 和 shadcn/ui 等现代设计系统,构建专业、易用且具响应式的界面。专注于开发者工具、聊天界面及实时流式组件。
通过引导式访谈提取隐性工程知识,并生成结构化的指导规范 (steerings),以建立一致的项目标准与约定。
通过协调多个专业 AI 代理来执行复杂工作流,实现多角度代码分析、功能开发与系统级审查的自动化编排。
Claude Code 的自主多智能体协调框架,具备记忆驱动工作流程、优先并行执行、基于亚里士多德原则的拆解与多阶段质量把关。
音频插件 WebView UI 设计协调器,处理迭代式原型制作及 JUCE 插件的生产级代码脚手架生成。
通过管理 conductor/ 目录中的项目环境工件(产品、技术栈、工作流程、跟踪)来标准化开发环境。支持项目脚手架创建、工件同步以及针对全新与既有项目的 AI 对齐。
编排 Codex CLI 以实现高效并行程序开发、自动化任务与会话管理,优化 Token 使用量并提升开发效率。