ai-multimodal
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 151 個技能
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
教師專用學生分析工具:透過 OCR 辨識試卷、總結學習成效,並自動更新學生檔案,提供精準的物理學科輔導策略。
全方位 Python 醫療 AI 工具包,用於臨床數據處理、醫學編碼轉換,以及開發用於 EHR、生理訊號和臨床預測任務的深度學習模型(如 RETAIN 與 Transformer)。
自動化檢索 PubMed 科學文獻並生成生物醫學研究的平實語言摘要。
分析並審核 React 專案的安全性、效能、正確性與架構問題,並提供可執行的診斷報告與評分。
Anthropic Claude 整合模式:串流、使用 pgvector 的 RAG、工具使用、模型選擇(Haiku/Sonnet/Opus)、提示詞快取及 AI 工程成本管理。
透過 S.E.E.D. 利基檢查、STREAM 6 層分析與惡魔律師反向思維,進行端到端的創業構想驗證並生成產品需求文件 (PRD)。
自動化臨床報告生成,包括符合 CARE 指南的病例報告、診斷總結、臨床試驗文件 (CSR/SAE) 及病人筆記,並確保法規合規性。
使用 ElevenLabs 將臨床文本轉換為自然且具同理心的語音,適用於病患衛教、服藥提醒及各類醫療輔助內容。
強制執行嚴格的實證調試工作流程,利用結構化觀察、假設檢驗和因果驗證,消除技術調查中的推測。
PAI 的實體合成橋樑。生成藍圖、3D 列印代碼、雷射切割 SVG 路徑以及 CNC 加工 G-Code,將代理設計轉化為實體硬體。
加速在 Lovable 上進行臨床與醫療應用開發。專為 OpenClaw 臨床黑客松參與者設計,提供臨床 MVP 開發與安全合規實踐。