gemini-video-understanding
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 328 個技能
使用 Google Gemini API 進行深度影片分析:包含影片摘要、音訊轉錄、時間戳記提取、影片片段剪輯,並支援 YouTube 連結或本機檔案,適用於多種模型與長文本脈絡。
透過 OpenAI Codex 與 Google Gemini 獲取架構、程式碼審查與除錯的專家觀點,並透明化呈現所有 AI 推論與建議。
使用 Chrome 無頭模式自動為 MicroSim 視覺化產生高品質截圖。適用於文件製作、社群媒體預覽及品質評估。
創意研究腦力激盪夥伴,用於探索跨領域連結、挑戰現有假設,並協助產生可驗證的科學假設。
使用電腦視覺相似度嵌入技術,在 FiftyOne 資料集中尋找、檢視並移除重複或高度相似的圖像。
分析並識別代碼庫模式(命名、架構、測試),以確保開發過程中的一致性與標準執行。
透過可配置的 YAML 模板將內容轉換為特定的語音配置、語氣或風格,以確保品牌與敘事輸出的一致性。
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
使用 Tavily 的 LLM 優化搜尋 API 進行網路搜尋,無需編寫程式碼即可獲取帶有引用來源的精準內容。
研究技術文件並自動生成可直接使用的 Markdown 格式軟體代理技能。
生成結構化的 Handoff Pack 提示詞,用於將任務委派給 Gemini,確保明確的範圍、驗收標準與格式規範。
AI 代理的即時技能發現引擎。透過 REST API 或 MCP 按需搜尋並檢索專業代理技能 (SKILL.md),將程序性知識即時注入到代理的上下文中。