ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 628 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
实现 Linkerd 服务网格模式,用于 Kubernetes 环境中的安全性、流量策略管理与零信任网络部署。
分析 AppWorld 任务失败原因,提取具体的 API 模式并生成带有实现代码示例的可执行剧本要点。
通过 iTunes Search API 搜索、浏览并下载 Apple Podcasts 节目。适用于音频内容存档、批量下载以及获取丰富的元数据,适合研究需求或个人媒体库管理。
通过 Telegram 或命令行自动发布 Instagram 帖子。支持住宅代理绕过检测、会话缓存,并集成 WaveSpeed 图像生成。
PyTorch Lightning 深度学习框架技能:自动化模型训练、多 GPU 编排、数据管道以及 DDP、FSDP 和 DeepSpeed 等分布式训练策略。
快速查询 SaaS 财务指标、公式与基准。通过即时访问定义、决策框架与异常预警指标,提升您的财务分析效率。
使用 AI 自动化技术,将 CSV 或 JSON 数据转换为适合学术出版的高质量统计图表。
为复杂软件项目建立强健、可扩展且易于维护的技术实施计划。
应用六顶思考帽方法论于软件测试,进行结构化与全面的质量分析、测试策略设计以及团队讨论。
为 Peon Trainer 记录俯卧撑、深蹲等健身次数。通过 AI 代理直接记录运动进度,触发音效提示,让您在编码时保持动力。
用于 Svelte 5 文档查询与代码分析的 CLI 工具。通过实时文档检索与自动修复功能,优化 Svelte 组件的开发、调试与检查流程。