ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 137 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
专业的 Swift 代码审查工具,适用于 macOS/iOS。通过并行分析代理检测内存泄漏、线程错误、并发问题及无障碍功能缺陷。
世界级资深数据工程技能,用于构建可扩展的数据管道、ETL/ELT 系统及现代化数据基础设施,精通 Python、Spark、dbt 与 Kafka。
分析 Markdown 文件以识别浪费 Token 的模式,并提供具体优化建议,以提升文档对 AI 的 Token 使用效率与清晰度。
通过静态与动态分析检测密码学代码中的时间侧通道漏洞,支持多种编程语言。
从零开始构建、配置与部署 NexAU Agent 的完整指南与开发框架,包含工具、提示词与技能实现。
一个 AI 驱动的测试运营平台与 MCP 服务器,提供自动化测试失败分析、根因匹配 (RCA) 及 CI/CD 流水线的智能测试编排。
使用 FlashInfer API 日志功能排查与解决 CUDA 运行时崩溃的教学指南。
用于构建多代理系统、AgentOS 运行时及整合 MCP 服务器的 AI 代理开发框架。
一套用于上下文工程、多代理架构及生产级代理系统优化的结构化代理技能集。
用于建立、维护与增强 CLAUDE.md 文件的自动化工具,确保您的项目 AI 辅助开发准则准确、模块化且符合最佳实践。
Anthropic Claude 集成模式:流式传输、基于 pgvector 的 RAG、工具调用、模型选择(Haiku/Sonnet/Opus)、提示词缓存及 AI 工程成本管理。