内容创作
video-watcher avatar

video-watcher

获取 YouTube 和 Bilibili 视频字幕,支持自动摘要、问答与信息提取,基于 yt-dlp 实现。

简介

video-watcher 技能是 AI 代理与高阶用户高效处理影音内容的必备工具。通过整合工业标准的 yt-dlp 库,它能从 YouTube 与 Bilibili 这两大教育、技术与创意内容平台中提取隐藏字幕 (CC) 或自动生成的转录稿。本技能将原始视频链接转换为干净、可阅读的文本内容,是后续进行视频摘要、语义搜索与信息检索等流程中极为关键的前处理步骤。

  • 自动检测视频平台来源,包含 youtube.com、youtu.be、bilibili.com 与 b23.tv,无需手动设定参数。

  • 支持多语言字幕提取,用户可通过 CLI 参数指定语言,例如英语 (en)、简体中文 (zh-CN)、繁体中文 (zh-TW)、日语 (ja) 或韩语 (ko) 等。

  • 为大规模影音资料库提供快速处理能力,使 AI 代理能够在不看完视频的情况下精准回答关于视频内容的问题。

  • 可无缝集成至现有的自动化脚本或 Agent 工作流中,通过简单的 Bash 指令即可完成调用。

  • 输出纯文本内容,完美对接后续的大型语言模型 (LLM) 分析或进阶文本处理工具。

  • 执行此脚本前,系统需安装 yt-dlp 并确保其位于系统环境变量 PATH 中。

  • 此工具仅适用于具备隐藏字幕或自动生成字幕的视频;若视频缺乏字幕轨道,系统将返回错误信息。

  • 默认语言设定针对平台特性进行优化,YouTube 默认输出英文,Bilibili 默认输出简体中文。

  • 用户需理解转录稿质量取决于原始视频的元数据以及自动生成字幕的准确度。

  • 非常适合研究人员、内容创作者以及需要大量消化技术教学、系列讲座或纪录片内容的开发者。

仓库统计

Star 数
4,437
Fork 数
1,203
Open Issue 数
7
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月29日 13:14
在 GitHub 查看