数据分析
songsee avatar

songsee

通过此音频分析 CLI 工具,直接在终端中生成频谱图与高级音频特征可视化。

简介

Songsee 是一款强大的命令行界面工具,专为需要对音频文件进行快速视觉分析的音乐家、音频工程师与研究人员所设计。它简化了提取复杂音频特征并将其转换为高质量图像的过程,无需使用繁重的数字音频工作站软件。通过原生库或 FFmpeg 的强大解码能力,它能将原始音频数据转换为可解读的视觉格式,让用户能更容易地识别音轨的频率分布、节奏模式与音色特性。无论您是在进行音频信号的科学研究、准备音乐制作素材,或是单纯检查媒体库的频谱内容,Songsee 都能为您的所有可视化需求提供精简且可编写脚本的工作流程。

  • 生成多种音频可视化图表,包括频谱图、Mel 频谱图、Chroma 特征、HPSS (谐波-打击乐源分离)、自相似矩阵、响度曲线、节奏图、MFCC 与通量。

  • 支持多面板网格渲染,可将多种特征并排可视化于单一输出图像中。

  • 灵活的输出定制选项,支持 magma、inferno、viridis、classic 与灰阶等多种色彩配置。

  • 精确的时间区段控制,允许通过开始时间与持续时间标志隔离特定的音频片段进行分析。

  • 高度可配置的 FFT (快速傅立叶变换) 设置,包含窗口大小、跳跃长度与特定频率范围筛选。

  • 支持 WAV 与 MP3 格式的原生解码,并可通过 FFmpeg 无缝整合几乎所有其他音频格式。

  • 支持通过标准输入 (Stdin) 传输音频数据,便于批次处理或整合至大型自动化数据管线中。

  • 指定输出尺寸 (宽度与高度) 与文件格式 (JPG 或 PNG),以满足您的特定报告或存档需求。

  • 专为命令行高级用户设计;标志可重复使用且支持逗号分隔,简化了复杂分析指令的构建过程。

  • 跨平台公用程序,旨在 shell 环境中有效运行,包含 macOS、Linux 以及通过 WSL2 运行的 Windows。

仓库统计

Star 数
366,002
Fork 数
75,040
Open Issue 数
6,956
主要语言
TypeScript
默认分支
main
同步状态
空闲
最近同步时间
2026年4月29日 05:53
在 GitHub 查看