ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 231 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
在独立会话中执行实施计划并进行审核检查点,确保逐项任务验证与代码质量。
集成式 Tavily AI Python CLI 工具,支持网页搜索、内容提取、网站爬虫、结构映射以及自动化深度研究报告。
Anthropic Claude AI 模型,专用于高效编码、长文本分析及 GUI 交互。
LobeHub 的 Linear 问题管理与同步工具,支持自动化 PR 关联、子任务树状拆解与进度更新。
将资产从 EVM 链桥接至 Starknet,部署代理帐户,并向 HuginnRegistry 注册身份,以实现自主 AI 代理的入职流程。
一个用于 X/Twitter 的命令行接口,支持使用 Cookie 进行验证的阅读、搜索、发文与社交互动,并集成于 OpenWhale AI 代理生态系统中。
基于 Qdrant 和 Ollama 的本地 RAG 语义记忆系统。适用于高效检索工作区文件、笔记、决策记录与用户偏好,提供精确的向量语义搜索。
基于 Playwright 的完整浏览器自动化技能。具备自动检测开发服务器、生成测试脚本、屏幕截图、表单填写、响应式测试与用户体验验证功能。
针对 PlantUML 序列图的结构化批处理、验证与报表生成工具,适用于跨文件维护。
设计与构建高质量 AI Agent Skills 的专家顾问。通过发现、架构与制作阶段的结构化引导,确保您建立的技能具备高度一致性、可组合性与执行效能。
掌握动态规划 (DP) 模式,包含备忘录、表格化与状态设计,提供可直接用于生产环境的高性能代码解决方案。