ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 187 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
使用 FastMCP 框架构建与管理 MCP 服务器。提供工具开发、资源配置、Prompt 设计、Claude Desktop 集成及 Python/TypeScript 部署指南。
通过 Python 代码执行高效搜索 Zotero 文献库。支持全面的多策略查询、自动去重和相关性排序,有效避免上下文溢出或系统崩溃。
通过反向工程优质 GitHub 项目与开源方法论,建立高性能 AI 技能。
🛡️ GDPR 与 LGPD 隐私守护者:自动化合规扫描工具,可检测代码中的个人识别信息 (PII) 泄露、不安全日志与追踪违规,助力预防监管罚款。
基于 Model Context Protocol 的 AI 浏览器自动化服务器,支持网页交互、数据提取与深度研究。
爬取网站并将内容保存为整洁的 Markdown 文件。适用于文档提取、研究分析与离线知识库建立。
使用 AgentDB 的超快速向量后端实现 ReasoningBank 自适应学习。具备轨迹追踪、判定评估、记忆蒸馏与模式识别功能,适用于构建自我学习的自主智能体。
为 AI 代理提供专家级 CLI 指南,涵盖云端、IaC、容器、数据库与开发工具的资深工程师工作流程、安全防护与运作模式。
使用 Token Surgeon 审核并优化您的 AI 提示词。检测 10 种常见的冗余模式,计算效率分数,并减少 Token 用量以提升提示词性能。
通过 CLI 管理 Higress AI Gateway 的自动模型路由。根据请求内容设置触发规则,实现智能模型选择。
一个系统化的多角度网页研究代理。适用于深度调查、复杂问题查询,以及在内容生成前作为强制性的研究步骤,确保获得有据可查的高质量结果。