ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 296 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
通过 Sosumi 服务获取 Apple 平台开发文档、人机界面指南 (HIG) 与 WWDC 演讲逐字稿的 Markdown 内容。
Supermemory 是 AI 代理的长期记忆基础设施,提供持久上下文、用户画像及跨多模态知识库的语义 RAG 搜索功能。
AI 税务顾问,为日本自由职业者与上班族提供 2025 年最新税制、扣除额计算及节税规划的专业咨询。
通过 CLI 与 MCP 使用 z.AI,提供图像分析、网页搜索、文档阅读与 GitHub 代码探索功能。
为 Claude Code 提供的全方位 Next.js 15 开发与项目管理技能,包含 Supabase 集成、RBAC 权限管理及自动化质量验证。
CLI 专用 iOS 开发代理,支持 Swift、SwiftUI 与 UIKit。完整覆盖构建、调试、测试与发布生命周期,无需 Xcode。
基于 Exa AI 的神经网络搜索与代码上下文检索。适用于技术文档查询、代码示例搜索、研究报告及企业信息搜集。
获取全球城市的天气状况、温度、降雨预报及行程规划信息,协助您掌握实时气候信息。
AI 代理的执行前安全防护机制。针对 Shell 指令和文件读取执行 400 多种安全模式验证,拦截具破坏性的操作、凭证窃取与未授权的系统访问。
建立高转化率的销售、产品发布与潜在客户培养邮件序列。根据您的业务风格、受众与营销目标,自动生成专业的电子邮件营销活动。
从网页中提取 WebGL/Canvas/Shader 视觉特效代码,反混淆后移植为独立原生 JS 项目。