ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 608 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
CLI 专用 iOS 开发代理,支持 Swift、SwiftUI 与 UIKit。完整覆盖构建、调试、测试与发布生命周期,无需 Xcode。
执行系统性的安全性稽核、漏洞扫描与风险评估,并结合 OWASP 方法论,确保代码的强健安全性。
通过 GitHub CLI 进行后端 PR 审查,并在严格的只读环境下执行安全性与代码质量检测。
LobeHub 的 Linear 问题管理与同步工具,支持自动化 PR 关联、子任务树状拆解与进度更新。
针对 Go CLI 应用程序的专家级自动化代码审查,涵盖 Cobra/urfave 模式、安全性、性能、Go 惯用语法及完善的错误处理。
提供 GA4 和 GSC 分析数据提取、缓存及处理的最佳实践模式,支持 MCP 服务器集成。
使用 Great Expectations、dbt 测试与数据契约实现生产级数据质量验证,确保数据管道的可靠性。
精通 React Native 状态管理,涵盖 Redux Toolkit、Zustand、TanStack Query 及 AsyncStorage 数据持久化。
实现安全的后端身份验证 (JWT, OAuth, 会话) 与授权 (RBAC, ABAC) 模式,包含密码哈希、多因素认证 (MFA) 及安全最佳实践。
自动化配置 Fumadocs 的国际化 (i18n)。实现 Next.js 多语言路由、语言切换器、侧边栏过滤及文档目录组织。
执行 RDF4J 中可重复的 Maven 测试,提供模块化工作流程、自动环境刷新与实用的错误报告。