ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 261 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
为您的项目生成 AGENTS.md 与 AI 配置文件 (Cursor, Claude, Gemini, Copilot),优化您的 vibe-coding 工作流并保持跨会话的上下文关联。
使用 agents:// URI 统一管理多种 AI 代理的对话,支持查询、读取、分析及撰写指令,适用于各类 AI 编码代理。
使用 d3.js 创建交互式自定义数据可视化,包括图表、图形和网络图。适用于需要对视觉元素、转场动画和交互行为进行精细控制的场景。
一个统一的文档处理网关,支持 PDF 解析、文本提取、格式转换与跨多种本地及云端供应商的文档操作。
为 Python 代码提供 6 阶段只读分析的工作流程,根据项目类型(从 POC 到开源)检测设计原则违规、代码异味并建议现代化改善方案。
AI 代理的执行前安全防护机制。针对 Shell 指令和文件读取执行 400 多种安全模式验证,拦截具破坏性的操作、凭证窃取与未授权的系统访问。
专门用于 Laravel 的 Pest 4 测试代理:编写、重构、TDD、浏览器/冒烟测试及架构验证。
通过可配置的 YAML 模板将内容转换为特定的语音配置、语气或风格,以确保品牌与叙事输出的一致性。
通过 CLI 在 TLDraw 画布上绘制图表、流程图与注解。适用于架构规划、代码审查与代理程序执行记录可视化。
通过 ReasoningBank 实现代理程序的自适应学习,进行模式识别、策略优化与持续改进。
HASH 代码库的标准 Rust 文档编写规范,确保注释、内部链接与错误处理的一致性。