wavespeed-nano-banana-2
通过 WaveSpeed AI 使用 Google Nano Banana 2 模型进行图像生成与编辑。支持文生图、自然语言修图、多图合成、4K 分辨率及多种比例。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 136 个技能
通过 WaveSpeed AI 使用 Google Nano Banana 2 模型进行图像生成与编辑。支持文生图、自然语言修图、多图合成、4K 分辨率及多种比例。
使用 Google Gemini 3 Pro 模型生成与编辑图像、图表和信息图表。支持文本转图像、风格转换及数据准确的视觉化创作。
通过本地 ComfyUI 实例生成高质量图像。适合需要隐私保护、专业 AI 图像合成与自定义工作流的开发者。
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
根据产品代码手册将测试工程师的缺陷描述标准化,修正错别字、缩写错误与歧义,并执行站点验证。
通过 nanaban CLI 使用 Gemini API 生成与编辑图像。适用于制作插图、标志、图标,以及执行背景移除、风格转换等照片编辑任务。
使用 Google Gemini API 生成 3D 城市美食盲盒影像。创作包含标志性美食、文化符号与城市历史元素的四宫格立体模型风格图像。
使用 AI 生成专业 PowerPoint 演示文稿。通过 Gemini 强大的叙事规划与图像生成功能,从主题提示词直接建立全版高分辨率幻灯片。
使用 AI 创作专业商标。涵盖设计讨论、多样化生成、修图去背与 SVG 矢量格式导出,适用于品牌、吉祥物、图标与徽章设计。
使用 Lightkurve 进行天文光变曲线预处理与清洁。提供离群值移除、趋势平滑化、去趋势与数据质量标记处理工具,适用于天文时序数据分析。
分析 AppWorld 任务失败原因,提取具体的 API 模式并生成带有实现代码示例的可执行剧本要点。
使用 Kokoro TTS 进行本地文字转语音。在终端中生成音频、朗读文本并处理多语言语音合成。