ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 517 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
Sage MCP 协议实现,用于整合外部工具服务器与标准化 AI 模型上下文。
通过 PubMed、arXiv 和 Semantic Scholar 进行系统性文献回顾,包含人工智能驱动的综述、核实引用以及强制性的科学图表生成。
A股收盘后深度日报自动生成工具。利用多 Agent 并行分析架构,自动采集 AkShare 行情与 Tavily 新闻,生成包含专业量化锚点与独立判断的交互式 HTML 日报。
自动化 Moonwell 协议治理提案生命周期,从创建、验证到部署与测试。
通过 sssinstagram.com 下载 Instagram Reels,并自动处理为适合 WhatsApp 分享的视频格式。
llmemory 文档存储与搜索入门:涵盖安装、pgvector 数据库配置、文档导入、混合/语义检索,以及构建具备多租户支持的 RAG 系统。
诊断并解决 Dojo.js 应用程序中的连接、同步、订阅及类型问题。用于排解 Torii、实体查询和状态更新故障。
为 Enzo 设计的自动化截图转知识工作流。从截图中捕捉、分类、提取内容并记录模式,构建结构化的参考库。
即时 AI 新闻简报工具。针对任何主题进行实时网络搜索,获取中文摘要与深度洞察,并通过飞书发送专业简报卡片。
智能合同审查工具,用于识别风险、提取关键条款并标记异常条款,支持明智的决策过程。
通过结构化的自我评估检查点,确保 AI 在任务执行前、中、后的方案验证与风险管控,提升程序开发质量。