生產力資料分析自動化
ocr
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
瀏覽: 18★ 1,130
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 86 個技能
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
使用 AI 生成專業 PowerPoint 簡報。透過 Gemini 強大的敘事規劃與圖像生成功能,從主題提示詞直接建立全版高解析度投影片。
透過本地 ComfyUI 實例生成高品質圖像。適合需要隱私保護、專業 AI 圖像合成與自訂工作流的開發者。
透過 WaveSpeed AI 使用 Google Nano Banana 2 模型進行圖像生成與編輯。支援文生圖、自然語言修圖、多圖合成、4K 解析度及多種比例。
透過 AI 驅動的品牌邏輯,運用幾何圖形、負空間與平面向量風格,設計專業級的品牌識別標誌。
使用 Google Gemini API 生成 3D 城市美食盲盒影像。創作包含標誌性美食、文化符號與城市歷史元素的四宮格立體模型風格圖像。
透過 nanaban CLI 使用 Gemini API 生成與編輯影像。適用於製作插圖、標誌、圖示,以及執行背景移除、風格轉換等照片編輯任務。
智能筆記與流程圖繪製工具。可根據文字內容自動生成美觀的視覺化筆記、思維導圖與流程圖,並匯出為圖片,無需讀取檔案權限,適合學習與知識總結。
為 Enzo 設計的自動化截圖轉知識工作流。從截圖中捕捉、分類、提取內容並記錄模式,構建結構化的參考庫。
一個用於生成 ASCII 藝術的代理技能,針對無需反覆修改的一次性藝術輸出進行了優化。
產生逼真的虛擬產品試穿視覺效果,協助客戶在購買前評估版型、垂墜感與尺寸比例。
從網際網路擷取、下載並批次處理各種格式(JPG, PNG, WebP, SVG 等)的圖片,適用於嵌入文件、網頁存檔或聊天應用。