生產力
mls avatar

mls

基於 Apple Silicon 與 MLX 的本地機器學習推論服務,整合語音識別 (ASR)、語音合成 (TTS)、翻譯、圖像生成與視覺識別功能。

簡介

MLS (MLX Local Serving) 提供了一個高效能的整合式基礎架構,專為在 Apple Silicon macOS 上運行多種本地機器學習模型而設計。透過讓所有模型常駐於 GPU 記憶體中,本系統消除了啟動延遲,並為多模態 AI 任務提供統一的 HTTP 介面。此方案非常適合需要高度隱私、低延遲推論的開發者、研究人員或進階使用者,無需依賴外部雲端 API 即可完成自動化作業與創意工作流。

  • 支援多模態功能,包含自動語音識別 (ASR)、文字轉語音 (TTS)、神經機器翻譯、圖像生成以及視覺語言模型 (VLM)。

  • 統一的 API 架構,使用標準 HTTP/JSON 協定,易於與 LangChain、OpenAI SDK 以及 OpenClaw 等自動化工具整合。

  • 提供即時監控儀表板,可查看 GPU 使用率、記憶體狀態、推論佇列與伺服器日誌。

  • 支援針對長文本翻譯與合成的批次處理功能,並可透過 API 端點監控處理進度。

  • 提供相容 OpenAI 格式的視覺補全端點,便於建構多模態聊天應用程式。

  • 執行需求:macOS 14+ (Apple Silicon)、Python 3.12+ 與 uv 套件管理器。

  • 預設於 http://127.0.0.1:18321 運作,提供在地化服務。

  • 進行 ASR 與檔案轉換任務時,建議使用絕對檔案路徑以確保系統正確存取資源。

  • 支援 70 種以上的翻譯語言,TTS 服務支援透過語意提示 (VoiceDesign) 自定義語調與口音。

  • 提供個別模型控制 API,允許使用者獨立重啟或暫停特定服務,而不影響整體伺服器架構。

  • 效能調整建議:圖像生成可選取 9 步驟 (快速) 或 20 步驟 (高品質),請根據實際應用場景進行平衡。

倉庫統計

Star 數
11
Fork 數
1
Open Issue 數
0
主要語言
HTML
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月4日 上午01:26
在 GitHub 查看