生产力数据分析自动化
ocr
使用 Tesseract OCR 引擎从图片中提取文字,支持多种语言、图像预处理以及多种输出格式。
浏览: 18★ 1,130
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 136 个技能
使用 Tesseract OCR 引擎从图片中提取文字,支持多种语言、图像预处理以及多种输出格式。
提升图像质量、分辨率与清晰度,专为屏幕截图与数字媒体设计。适用于专业文档、博客与演示文稿。
根据 SRT 字幕文件自动生成符合 B站规范的视频章节列表,内置格式检查与验证。
使用计算机视觉相似度嵌入技术,在 FiftyOne 数据集中查找、查看并移除重复或高度相似的图像。
Google Gemini 图像生成 API 接口,支持文本转图像、图像编辑、风格模板与自动重试工作流程。
使用 scikit-learn 进行经典机器学习。适用于分类、回归、聚类、降维、数据预处理、模型评估,以及构建 Python 机器学习流程。
功能强大的图像压缩与转换 CLI 工具,支持批处理、多种引擎(mozjpeg、pngquant、sharp 等)、格式转换(WebP、AVIF)及递归目录优化。
通过 ViralBaby API 制作 TikTok 轮播图。自动化图片搜索、文字叠加与草稿上传,轻松管理社交媒体内容创作。
使用 GeoPandas 进行地理空间数据分析,包含正确的坐标投影转换,以执行精确的距离计算、空间筛选与地理特征分析。
用于生成符合出版要求的科学图表、多面板布局及期刊格式的元技能,支持 matplotlib、seaborn 及 plotly。
生成逼真的虚拟产品试穿视觉效果,协助客户在购买前评估版型、垂坠感与尺寸比例。
使用 Nano Banana MCP 和 ImageMagick 为 Claude Office Visualizer 生成并处理 16 位像素艺术办公资源。