工程开发数据分析教育自动化
gemini-video-understanding
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
浏览: 107★ 1
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 139 个技能
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
实现 Google Gemini API 图像分析功能,包含图像描述、对象检测、图像分割、视觉问答及多图对比分析。
专为协调系统设计的决策代理,用于处理复杂的架构选择、任务规划与错误排除。
Upstash Vector DB 设置、语义搜索、命名空间与向量嵌入模型。专为在 Next.js 16 与 Vercel 项目中构建高性能向量搜索功能而设计。
架构与优化生产级别的 RAG 系统。精通嵌入模型、向量数据库、分块策略及检索管线,提升 LLM 应用的精确度。
为创业者、内容创作者与专业人士设计的个人数字大脑系统,利用 AI 协助管理数字足迹、知识库、人际关系与个人目标。
使用 Cloudflare Workers AI flux-1-schnell 模型生成图像。直接在您的工作流程中启用文字生成图片功能。
获取 YouTube 和 Bilibili 视频字幕,支持自动摘要、问答与信息提取,基于 yt-dlp 实现。
高性能文档智能库,可从 91 种以上文件格式中提取文本、表格、代码及元数据,支持 OCR 及 LLM 友好输出。
对知识库文档进行深度结构分析、关键信息提取及质量评估的智能助手。
用于 LLM 后训练(SFT/DPO/RLHF)的高质量数据集策劃指南,涵盖数据格式、质量过滤与收集策略。
积极精简输入内容中的语法结构与冗余文字,在保留核心语义的同时优化 LLM 的 Token 使用效率。