生產力資料分析自動化
ocr
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
瀏覽: 18★ 1,130
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 136 個技能
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
提升影像品質、解析度與清晰度,專為螢幕截圖與數位媒體設計。適用於專業文件、部落格與簡報。
根據 SRT 字幕檔案自動產生符合 Bilibili 規範的影片章節清單,並內建格式驗證。
使用電腦視覺相似度嵌入技術,在 FiftyOne 資料集中尋找、檢視並移除重複或高度相似的圖像。
Google Gemini 影像生成 API 介面,支援文字轉影像、影像編輯、風格模板與自動重試工作流程。
使用 scikit-learn 進行經典機器學習。適用於分類、迴歸、分群、降維、資料預處理、模型評估,以及構建 Python 機器學習流程。
功能強大的圖像壓縮與轉換 CLI 工具,支援批次處理、多種引擎(mozjpeg、pngquant、sharp 等)、格式轉換(WebP、AVIF)及遞迴目錄優化。
透過 ViralBaby API 製作 TikTok 輪播圖。自動化圖片搜尋、文字疊加與草稿上傳,輕鬆管理社群內容創作。
使用 GeoPandas 進行地理空間數據分析,包含正確的座標投影轉換,以執行精確的距離計算、空間篩選與地理特徵分析。
用於生成符合出版要求的科學圖表、多面板佈局及期刊格式之元技能,支援 matplotlib、seaborn 及 plotly。
產生逼真的虛擬產品試穿視覺效果,協助客戶在購買前評估版型、垂墜感與尺寸比例。
使用 Nano Banana MCP 和 ImageMagick 為 Claude Office Visualizer 生成並處理 16 位元像素藝術辦公室資源。