生产力
ai-multimodal avatar

ai-multimodal

使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。

安装

Agent 类型

Claude Code

安装命令 (macOS)
curl -fsSL "https://mentalok.io/api/v1/skills/ai-multimodal/install?os=mac&agent=claude" | bash
安装命令 (Windows)
curl -L "https://mentalok.io/api/v1/skills/ai-multimodal/install?os=windows&agent=claude" -o install-ai-multimodal.bat && install-ai-multimodal.bat

下载技能项目

/agent-skill/ai-multimodal