podcast-generation
利用 Azure OpenAI GPT Realtime Mini 模型與 WebSocket 串流技術,產生 AI 播客風格的音訊敘事,包含 PCM 轉 WAV 及前端播放整合。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 154 個技能
利用 Azure OpenAI GPT Realtime Mini 模型與 WebSocket 串流技術,產生 AI 播客風格的音訊敘事,包含 PCM 轉 WAV 及前端播放整合。
透過 iTunes Search API 搜尋、瀏覽並下載 Apple Podcasts 節目。適用於音訊內容存檔、批次下載以及獲取豐富的元數據,適合研究需求或個人媒體庫管理。
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
Helm Chart 開發與部署的快速參考工具,提供 Kubernetes 模板語法與自動化部署建議。
影片內容全鏈路處理管線,將原始錄影自動轉化為逐字稿、觀點摘要、短影片切片及完整文章。
使用高精度說話者分離技術轉錄 YouTube 影片與本地影音檔案,提供適合 AI 分析的結構化文字輸出。
FlowGram.ai 自定義節點開發指南,支援簡單節點自動表單與複雜節點自定義 UI 開發。
防止 AI 幻覺,確保在分析程式碼、技術文件或提供建議時,輸出具備證據支持且可驗證的內容。
統一的內容提取與行動規劃引擎。自動將 URL(YouTube、文章、PDF)處理為可執行的行動計畫。
PAI 的實體合成橋樑。生成藍圖、3D 列印代碼、雷射切割 SVG 路徑以及 CNC 加工 G-Code,將代理設計轉化為實體硬體。
使用 OpenAI Whisper CLI 進行本地語音轉文字轉錄,無需外部 API 金鑰即可提供私密且高準確度的音訊處理。
Anthropic Claude 整合模式:串流、使用 pgvector 的 RAG、工具使用、模型選擇(Haiku/Sonnet/Opus)、提示詞快取及 AI 工程成本管理。