ocr
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 627 個技能
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
使用 JXA 與 PyXA 自動化 Apple Keynote 簡報。透過 Apple Events 程式化建立投影片、管理文件、插入圖表、影像與文字。
全面的 SEO 與 GEO 優化工具。用於分析網域、查找關鍵字差距、研究反向連結,並透過 DataForSEO 生成搜尋建議。
Nuxt 框架決策輔助層,用於優化專案開發,引導至正確的 Nuxt 套件、Vue 指南或模組特定邏輯。
為 Pull Request 與文件製作精美的終端機動畫演示,支援使用 asciinema、agg 與 svg-term-cli 進行錄製與轉換。
啟用支援長期、多工作階段的自主開發任務,提供狀態追蹤、可恢復執行以及雙代理程式規劃執行工作流。
影片內容全鏈路處理管線,將原始錄影自動轉化為逐字稿、觀點摘要、短影片切片及完整文章。
監控專案進度、分析活躍軌道並識別開發工作空間中的阻塞問題。
基於 Qdrant 和 Ollama 的本地 RAG 語義記憶系統。適用於高效檢索工作區文件、筆記、決策記錄與用戶偏好,提供精確的向量語義搜索。
Swagger Petstore 的結構化 API 介面,專為 AI 代理設計,透過按需載入文件與寵物、使用者及商店訂單等資源進行互動。
利用 Azure OpenAI GPT Realtime Mini 模型與 WebSocket 串流技術,產生 AI 播客風格的音訊敘事,包含 PCM 轉 WAV 及前端播放整合。
基於頂尖諮詢標準(McKinsey, BCG)的 PowerPoint 簡報審閱工具,支援邏輯架構、敘事、清晰度、設計與 DSFR 合規性分析。