資料分析
songsee avatar

songsee

使用 songsee CLI 工具從音訊檔案產生專業級頻譜圖、特徵面板視覺化及音訊分析圖表。

簡介

songsee 技能為您的開發或資料分析工作流程提供高效能的音訊視覺化功能。作為命令列介面,它能將原始音訊檔案轉換為豐富、具有洞察力的視覺表示,協助使用者理解音訊資料的頻譜、節奏和紋理特性。無論您是在進行音樂資訊檢索 (MIR)、除錯音訊處理流程,還是執行鑑識音訊分析,songsee 都是可靠的視覺診斷工具。它原生支援包括 WAV 和 MP3 在內的標準格式,並透過 ffmpeg 提供更廣泛的格式支援。

  • 支援多種視覺化格式,包括頻譜圖、梅爾頻譜圖 (mel-spectrogram)、色度圖 (chroma)、諧波-打擊樂源分離 (hpss)、自相似矩陣、響度、節奏圖 (tempogram)、MFCC 及頻譜通量。

  • 可配置的視覺輸出,提供包括 magma、inferno、viridis、classic 和灰階等多種配色方案,滿足研究或展示需求。

  • 精確的時間切片功能,允許使用者透過定義開始時間和持續時間,提取並視覺化音訊檔案的特定片段。

  • 靈活的輸出自訂選項,包括可調整的 FFT 視窗/跳躍設定、頻率範圍篩選及輸出尺寸。

  • 強大的命令列整合,支援檔案輸入與標準輸入 (stdin) 管道,適用於自動化處理流程。

  • 支援的音訊輸入格式包括原生的 WAV/MP3 解碼,若系統中偵測到 ffmpeg,則會自動處理其他附加格式。

  • 當同時請求多種類型的視覺化時,支援網格樣式佈局,方便進行全面的資料比較。

  • 極力推薦給研究人員與開發人員,特別是在處理 AI 音訊代理、機器學習音訊特徵工程或一般音訊分析任務時。

  • 若處理複雜或非標準音訊編碼,請確保已安裝 ffmpeg 以確保廣泛的相容性。

  • 輸出結果可儲存為 PNG 或 JPG 等標準高品質影像格式,適合整合至報告或文件中。

倉庫統計

Star 數
365,620
Fork 數
74,934
Open Issue 數
6,998
主要語言
TypeScript
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月28日 上午11:27
在 GitHub 查看
songsee | Skills Hub