ai-multimodal
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 151 个技能
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
教师专用学生分析工具:通过 OCR 识别试卷、总结学习成效,并自动更新学生档案,提供精准的物理学科辅导策略。
全方位 Python 医疗 AI 工具包,用于临床数据处理、医学编码转换,以及开发用于 EHR、生理信号和临床预测任务的深度学习模型(如 RETAIN 与 Transformer)。
自动检索 PubMed 科学文献并生成生物医学研究的通俗易懂摘要。
分析并审核 React 项目的安全性、性能、正确性与架构问题,并提供可执行的诊断报告与评分。
Anthropic Claude 集成模式:流式传输、基于 pgvector 的 RAG、工具调用、模型选择(Haiku/Sonnet/Opus)、提示词缓存及 AI 工程成本管理。
通过 S.E.E.D. 利基检查、STREAM 6 层分析与恶魔律师反向思维,进行端到端的创业构想验证并生成产品需求文档 (PRD)。
自动化临床报告生成,包括符合 CARE 指南的病例报告、诊断总结、临床试验文件 (CSR/SAE) 及病人笔记,并确保法规合规性。
使用 ElevenLabs 将临床文本转换为自然且具同理心的语音,适用于病患宣教、用药提醒及各类医疗辅助内容。
强制执行严格的实证调试工作流程,利用结构化观察、假设检验和因果验证,消除技术调查中的推测。
PAI 的实体合成桥梁。生成蓝图、3D 打印代码、激光切割 SVG 路径以及 CNC 加工 G-Code,将代理设计转化为实体硬件。
加速在 Lovable 上进行临床与医疗应用开发。专为 OpenClaw 临床黑客松参与者设计,提供临床 MVP 开发与安全合规实践。