gemini-video-understanding
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 121 个技能
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
基于 Gemini 的 UI 设计审核、无障碍审计与设计系统验证工具,专为软件代理设计。
功能强大的 Google Workspace 命令行工具,用于自动化与管理 Gmail、日历、云端硬盘、表格与文档。
使用 Apidog 与 MCP 服务器自动化前端 API 整合。从 OpenAPI 规格生成 TypeScript 类型、TanStack Query 钩子与基于 axios 的客户端,确保 API 使用的一致性与类型安全。
使用 WebSearch 和 WebFetch 工具搜索互联网,获取实时信息、技术文档或进行主题研究。
直接从 Claude Code 查询 Google NotebookLM 笔记本,获取基于来源、附带引用的 Gemini 精准回答。支持持久身份验证、笔记本库管理以及自动化浏览器文档检索。
通过 OpenAI Codex 和 Google Gemini 获取架构、代码审查与调试的专家观点,并透明化展示所有 AI 推论与建议。
基于 Gemini 的高级网络搜索插件,具备智能缓存、子代理上下文隔离及自动查询优化功能。
使用 Google Agent Development Kit (ADK) 构建、编排和部署 AI 代理的综合指南与参考。
Google Ads 整合工具,通过 Membrane CLI 管理广告活动、账户、预算与报告。利用自动化身份验证与跨资源管理功能,优化您的广告工作流程。
通过 MCP 操作 Google Tag Manager。直接从您的 LLM Agent 处理 OAuth 认证、资源发现以及代码 (Tags)、触发器 (Triggers) 与变量 (Variables) 的 CRUD 操作。
使用 AI 生成专业 PowerPoint 演示文稿。通过 Gemini 强大的叙事规划与图像生成功能,从主题提示词直接建立全版高分辨率幻灯片。