gemini-video-understanding
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 207 个技能
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
使用 TypeScript/JavaScript 的 OpenAI Agents SDK 构建 AI 代理、多代理系统和工作流。支持工具、移交、防护栏、MCP 和实时语音。
Asana 项目管理集成。通过 Membrane CLI 直接管理任务、项目、工作区及团队工作流程。
通过本地 ComfyUI 实例生成高质量图像。适合需要隐私保护、专业 AI 图像合成与自定义工作流的开发者。
FFUF 网络模糊测试专家指南,协助自动化发现隐藏目录、文件、参数及测试渗透测试中的漏洞。
一个基于 Git 的 AI 代理技能存储库。通过 CLI 下载、版本控制、编辑与共享自定义的代理技能与程序性知识。
用于在 Claude Code 和 Gemini CLI 扩展之间转换及同步 AI 代理技能的通用 CLI 工具。
设计与构建高质量 AI Agent Skills 的专家顾问。通过发现、架构与制作阶段的结构化引导,确保您建立的技能具备高度一致性、可组合性与执行效能。
通过 WaveSpeed AI 使用 Google Nano Banana 2 模型进行图像生成与编辑。支持文生图、自然语言修图、多图合成、4K 分辨率及多种比例。
通过电子邮件创建任务并发送至 2Do 应用。自动解析自然语言以提取标题、截止日期、优先级、清单和标签。
分析公开 LinkedIn 个人档案与商业数据,建立精准潜在客户名单,协助识别决策者、追踪职业变动并强化业务开发资料。
使用 Tavily API 进行进阶网络搜索、内容提取与网站爬取,为 AI 代理研究与数据收集进行优化。