openai-whisper
使用 OpenAI Whisper CLI 进行本地语音转文字转录,无需外部 API 密钥即可提供私密且高准确度的音频处理。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 171 个技能
使用 OpenAI Whisper CLI 进行本地语音转文字转录,无需外部 API 密钥即可提供私密且高准确度的音频处理。
实现 Google Gemini API 图像分析功能,包含图像描述、对象检测、图像分割、视觉问答及多图对比分析。
使用此基于 API 的工具自动化管理 GitLab 仓库。通过 AI 代理直接执行文件操作、分支管理与项目追踪。
全方位的 PDF 处理工具包,支持文字与表格提取、文档合并/分割、旋转以及 PDF 文件自动化生成与填写,提供 Python 与命令行工具集成。
将 Markdown 内容无缝发布到飞书文档。支持自动表格转换、权限管理与批量写入,解决格式渲染与权限管理痛点。
全方位办公生产力 AI 代理工具包,支持 PDF、Word、Excel、PowerPoint 文件处理及内部沟通自动化。
从沙盒环境远程控制无头浏览器,进行自动化网页浏览、数据抓取、表单交互及测试工作。
功能全面的 PowerPoint 演示文稿管理工具,支持 .pptx 文件的创建、编辑、文本提取、模板应用以及视觉化分析。
从互联网获取、下载并批量处理各种格式(JPG, PNG, WebP, SVG 等)的图像,适用于文档嵌入、网页归档或聊天场景。
使用 rclone 在本地存储与云端服务商(如 S3、Cloudflare R2、Backblaze B2、Google Drive 和 Dropbox)之间管理、同步与传输文件。
通过 Telegram 或命令行自动发布 Instagram 帖子。支持住宅代理绕过检测、会话缓存,并集成 WaveSpeed 图像生成。
一个模块化的数据处理工具,用于清理、验证和分析 CSV 文件,支持自定义转换及自动化依赖管理。