ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 411 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
分析本地硬件 (RAM, CPU, GPU/VRAM) 并获取优化的本地 LLM 模型推荐、量化设置与性能预估。
适用于原生 iOS 与 macOS 开发的 SwiftUI 架构与实现模式,专注于状态管理、视图组合与数据持久化。
使用百度 AI 搜索引擎 (BDSE) 进行即时网络搜索,获取最新资讯、文档与研究资料。
使用 Snowflake CLI 创建、修改及验证 Snowflake 语义视图。
通过 Turing Tavily 代理进行实时网页搜索。适用于查找最新信息、研究时事,以及获取训练数据库以外的实时数据。
LangGraph 专家技能,专为构建具状态、多角色 AI 代理工作流而设计,包含持久化、条件分支与 ReAct 模式。
Python 编程助手,提供最佳实践、PEP 8 代码规范检查、使用 pytest 的自动化测试以及基于 uv 的依赖管理。
实现安全的后端身份验证 (JWT, OAuth, 会话) 与授权 (RBAC, ABAC) 模式,包含密码哈希、多因素认证 (MFA) 及安全最佳实践。
构建并执行基于状态机的自动化流程,支持人机协作,适用于复杂的多步骤业务处理。
使用 Design Graph 方法论构建连贯且基于约束的设计系统。自动化设计令牌、排版比例、组件、变体及主题的创建过程。
基于 LangGraph 与 Claude Opus 4.5 的自动化 LinkedIn 内容营销多代理系统,涵盖趋势研究、内容生成、个人品牌语调分析与成效追踪。