ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 535 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
一套基于阶段驱动的AI写作工作流,专为结构化、可重复、可追溯的深度长文创作而设计,强调人机协作与流程控制。
在软件功能开发过程中,验证跨工件(规格、计划、任务)一致性并检测破坏性变更(API、数据库、UI)。
克劳德代码会话的正式评估框架,实施评估驱动开发(EDD)原则,用于保障 AI 代理的可靠性。
使用严格的测试驱动方法将 Semgrep 规则移植到新语言。包含适用性分析、基于 AST 的转换以及针对每种目标语言的自动化验证。
自动化票务开发代理,从监控任务来源到自动创建拉取请求 (PR),并通过 ERNE 标准进行验证,实现完整的软件开发生命周期管理。
使用 Nano Banana Pro (Gemini 3 Pro) AI 模型生成应用图标、Logo、营销横幅及各类插图等专业视觉素材。
探索并分析 GitHub 热门项目,评估项目活跃度、技术栈与文档质量,快速获取开源生态趋势报告。
使用 STRIDE 威胁建模、OWASP Top 10 及安全编码实践,对代码、架构与基础设施进行系统性安全评估。
AWS SQS 技能,用于管理消息队列、解耦微服务、配置死信队列、处理可见性超时及实现 FIFO 排序。
自动处理 MultiQC 模块请求的分类、优先级排序与反馈流程,通过分析存储库活动、社区参与度及技术可行性来提升维护效率。
ClawHub 是用于管理 OpenClaw AI 代理技能的官方注册表与 CLI 工具。您可以搜索、安装、进行版本控制并发布自定义技能到您的本地 OpenClaw 工作区。