生產力
ai-multimodal avatar

ai-multimodal

使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。

安裝

Agent 類型

Claude Code

安裝指令 (macOS)
curl -fsSL "https://mentalok.io/api/v1/skills/ai-multimodal/install?os=mac&agent=claude" | bash
安裝指令 (Windows)
curl -L "https://mentalok.io/api/v1/skills/ai-multimodal/install?os=windows&agent=claude" -o install-ai-multimodal.bat && install-ai-multimodal.bat

下載技能專案

/agent-skill/ai-multimodal