gemini-video-understanding
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 690 个技能
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
使用 Pandoc 将 Markdown 转换为专业 PDF。支持 Eisvogel 模板、EB Garamond 字体,并针对不同场景优化排版(A4 用于打印/桌面,6x9 用于移动设备/Telegram)。
根据 components.build 规范构建现代化、可组合且易于访问的 React UI 组件。适用于设计系统、组件库及可重用 UI 架构的开发与维护。
全方位办公生产力 AI 代理工具包,支持 PDF、Word、Excel、PowerPoint 文件处理及内部沟通自动化。
控制与监控小米米家智能家居设备,包括开关状态切换、设备列表查询、自动化场景执行以及环境统计数据查看。
MoonBit 开发指南,涵盖项目架构、模块化布局、编译工具链与测试最佳实践。
验证 inventory_master 的 Everything 搜索集成(CLI、HTTP、SDK),确保连接能力、服务健康状态与提供者可用性。
通过 Membrane CLI 直接管理 Facebook 和 Instagram 广告系列、受众群体与成效洞察。
将浏览器原生 Proofreader API 集成至网页应用,提供 AI 驱动的文本校正、语法检查与语言支持,并包含受控的模型生命周期管理。
管理 Vibesafe 单元,通过加密哈希检查点,对 AI 生成的代码进行扫描、编译、测试与验证,确保生产环境的稳定性。
自动化质量监控与度量,包含 DORA 指标、缺陷密度追踪,并为持续交付流水线配置智能质量闸道。
需求分析与文档编写技能。通过深入挖掘根本需求、分析利益相关者、解决冲突,并产出具备测试标准的规格说明,协助软件开发项目精准落地。