ocr
使用 Tesseract OCR 引擎从图片中提取文字,支持多种语言、图像预处理以及多种输出格式。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 382 个技能
使用 Tesseract OCR 引擎从图片中提取文字,支持多种语言、图像预处理以及多种输出格式。
查询 Microsoft 365 Copilot 获取职场情报(电子邮件、会议、文档与团队沟通),为您的 AI 助理提供组织背景信息。
高性能文档智能库,可从 91 种以上文件格式中提取文本、表格、代码及元数据,支持 OCR 及 LLM 友好输出。
为 OpenClaw 智能体设计的进阶网页搜索与推理工具。具备引用来源、多步骤推理及透过 OpenRouter 进行即时网络存取的能力。
Claude Skills 安全扫描工具,用于在安装前检测恶意代码、数据泄露风险及未经授权的系统访问,确保环境安全。
为 Claude 提供持久化、可 Git 管理的记忆功能。自动将项目决策、错误修复和编码模式存储至本地 .mv2 文件中,并可随时检索。
提供识别、审查与管理由 GitHub Copilot 编码代理在存储库中创建的提取请求 (PR) 的操作指南与技巧。
使用 Google Gemini API 进行深度视频分析:包含视频摘要、音频转录、时间戳提取、视频片段剪辑,并支持 YouTube 链接或本地文件,适用于多种模型与长文本上下文。
智能 RAG 知识网关,将编程任务路由至专业的 Swift/iOS 领域知识。通过 MCP 从 100 多种索引技能中提取精准模式,优化开发上下文使用率。
基于 Gemini 的高级网络搜索插件,具备智能缓存、子代理上下文隔离及自动查询优化功能。
直接从终端管理 Apple Notes。通过 macOS 上的 memo CLI 进行笔记的创建、查看、编辑、删除、搜索与导出。
实施 AI 代理委派架构,保持主上下文简洁,降低 Token 成本,并隔离专业基础设施或 API 任务。