工程開發資料分析教育自動化
gemini-video-understanding
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。
瀏覽: 106★ 1
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 139 個技能
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
專為協調系統設計的決策代理,用於處理複雜的架構選擇、任務規劃與錯誤排除。
Upstash Vector DB 設定、語意搜尋、命名空間與向量嵌入模型。專為在 Next.js 16 與 Vercel 專案中建構高效向量搜尋功能而設計。
架構與優化生產級別的 RAG 系統。精通嵌入模型、向量資料庫、分塊策略及檢索管線,提升 LLM 應用的精確度。
為創業者、內容創作者與專業人士設計的個人數位大腦系統,利用 AI 協助管理數位足跡、知識庫、人際關係與個人目標。
使用 Cloudflare Workers AI flux-1-schnell 模型生成影像。直接在您的工作流程中啟用文字生成圖片功能。
擷取 YouTube 與 Bilibili 影片字幕,支援自動摘要、問答與資訊提取,基於 yt-dlp 實作。
高效能文件智慧程式庫,可從 91 種以上檔案格式中提取文字、表格、程式碼與後設資料,並支援 OCR 與 LLM 格式輸出。
對知識庫文檔進行深度結構分析、關鍵信息提取及質量評估的智能助手。
用於 LLM 後訓練(SFT/DPO/RLHF)的高品質數據集策劃指南,涵蓋數據格式、品質過濾與收集策略。
積極精簡輸入內容中的語法結構與冗餘文字,在保留核心語義的同時優化 LLM 的 Token 使用效率。