内容创作
instagram-reels avatar

instagram-reels

下载 Instagram Reels、提取元数据并使用 Groq Whisper 生成音频逐字稿。支持通过 yt-dlp 处理 TikTok 与 YouTube Shorts。

简介

此技能为内容创作者、研究人员和社交媒体分析师提供了一套强大的命令行工作流程,用于提取和处理短视频数据。通过结合 yt-dlp 强大的媒体提取能力与 Groq API 的 Whisper-large-v3-turbo 模型,Agent 可以在几秒钟内将视频内容转换为可用的逐字稿与结构化元数据。本工具专为需要重新利用视频内容、存档社交媒体数据,或对视频平台进行大规模情感与主题分析的用户而设计。

  • 使用 yt-dlp JSON 解析功能,自动提取视频元数据,包含帖文说明、上传者信息与视频时长。

  • 通过 Groq Cloud 进行高速音频逐字稿生成,提供近乎实时的处理效率,支持长达 25 分钟的音频分段。

  • 跨平台兼容性强:支持 Instagram Reels、TikTok、YouTube Shorts 以及所有 yt-dlp 函数库支持的视频来源。

  • 整合 FFmpeg 支持,可将专有容器格式高效转换为 MP3,为转录作业做好准备。

  • 提供详细的 JSON 输出结果,包含全文逐字稿与带有时间戳的分段,便于精确对齐内容。

  • 使用前需在本地安装 yt-dlp 与 ffmpeg 以进行媒体处理。

  • 需配置有效的 Groq API 金钥以使用云端转录服务。

  • 公开视频可直接提取元数据;私人内容需通过 cookies.txt 整合进行验证。

  • 建议定期清理临时文件,避免工作目录空间堆积。

  • 适合开发人员与进阶用户,用于自动化社交媒体研究流程或内容再利用工作流,无需手动操作。

仓库统计

Star 数
4,455
Fork 数
1,215
Open Issue 数
7
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 09:49
在 GitHub 查看