songsee
通过此音频分析 CLI 工具,直接在终端中生成频谱图与高级音频特征可视化。
简介
Songsee 是一款强大的命令行界面工具,专为需要对音频文件进行快速视觉分析的音乐家、音频工程师与研究人员所设计。它简化了提取复杂音频特征并将其转换为高质量图像的过程,无需使用繁重的数字音频工作站软件。通过原生库或 FFmpeg 的强大解码能力,它能将原始音频数据转换为可解读的视觉格式,让用户能更容易地识别音轨的频率分布、节奏模式与音色特性。无论您是在进行音频信号的科学研究、准备音乐制作素材,或是单纯检查媒体库的频谱内容,Songsee 都能为您的所有可视化需求提供精简且可编写脚本的工作流程。
-
生成多种音频可视化图表,包括频谱图、Mel 频谱图、Chroma 特征、HPSS (谐波-打击乐源分离)、自相似矩阵、响度曲线、节奏图、MFCC 与通量。
-
支持多面板网格渲染,可将多种特征并排可视化于单一输出图像中。
-
灵活的输出定制选项,支持 magma、inferno、viridis、classic 与灰阶等多种色彩配置。
-
精确的时间区段控制,允许通过开始时间与持续时间标志隔离特定的音频片段进行分析。
-
高度可配置的 FFT (快速傅立叶变换) 设置,包含窗口大小、跳跃长度与特定频率范围筛选。
-
支持 WAV 与 MP3 格式的原生解码,并可通过 FFmpeg 无缝整合几乎所有其他音频格式。
-
支持通过标准输入 (Stdin) 传输音频数据,便于批次处理或整合至大型自动化数据管线中。
-
指定输出尺寸 (宽度与高度) 与文件格式 (JPG 或 PNG),以满足您的特定报告或存档需求。
-
专为命令行高级用户设计;标志可重复使用且支持逗号分隔,简化了复杂分析指令的构建过程。
-
跨平台公用程序,旨在 shell 环境中有效运行,包含 macOS、Linux 以及通过 WSL2 运行的 Windows。
仓库统计
- Star 数
- 366,002
- Fork 数
- 75,040
- Open Issue 数
- 6,956
- 主要语言
- TypeScript
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月29日 05:53