ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 562 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
0 Finance 自动化 AI 电子邮件工作流程,协助 AI 代理管理发票、银行转账及财务对话。
使用 Flow Nexus 平台在分布式 E2B 沙盒中训练与管理神经网络,支持 Transformer、LSTM 和 GAN 等自定义架构。
生成逼真的虚拟产品试穿视觉效果,协助客户在购买前评估版型、垂坠感与尺寸比例。
专为中文社交媒体设计的内容生成器,支持小红书、知乎、微信公众号及抖音,提供平台原生格式与排版。
通过管理 conductor/ 目录中的项目环境工件(产品、技术栈、工作流程、跟踪)来标准化开发环境。支持项目脚手架创建、工件同步以及针对全新与既有项目的 AI 对齐。
自动化生成 App Store「最新内容」版本说明,通过分析上次版本号更新以来的 Git 提交记录来编写发布信息。
将软件开发想法捕捉并形式化为 Hashbrown 存储库中的结构化设计文档,包含研究资料与概念草图。
为您的项目发想创意域名,并即时检查 .com, .io, .ai 等多种顶级域名的可用性,简化您的品牌命名流程。
一个用于大语言模型代理生存记忆的微世界操作系统,将文件系统转化为可导航的房间,并将代码转化为可居住的世界。
设计与构建高质量 AI Agent Skills 的专家顾问。通过发现、架构与制作阶段的结构化引导,确保您建立的技能具备高度一致性、可组合性与执行效能。
为 Claude Code 设计的蜂巢思维多代理协作系统,具备女王式架构、拜占庭共识机制、持续性集体记忆与自适应任务分配,适用于复杂软件开发。