mls
基于 Apple Silicon 与 MLX 的本地机器学习推理服务,整合语音识别 (ASR)、语音合成 (TTS)、翻译、图像生成与视觉识别功能。
简介
MLS (MLX Local Serving) 提供了一个高效能的整合式基础架构,专为在 Apple Silicon macOS 上运行多种本地机器学习模型而设计。透过让所有模型常驻于 GPU 记忆体中,本系统消除了启动延迟,并为多模态 AI 任务提供统一的 HTTP 介面。此方案非常适合需要高度隐私、低延迟推理的开发者、研究人员或进阶使用者,无需依赖外部云端 API 即可完成自动化作业与创意工作流。
-
支援多模态功能,包含自动语音识别 (ASR)、文字转语音 (TTS)、神经机器翻译、图像生成以及视觉语言模型 (VLM)。
-
统一的 API 架构,使用标准 HTTP/JSON 协定,易于与 LangChain、OpenAI SDK 以及 OpenClaw 等自动化工具整合。
-
提供即时监控仪表板,可查看 GPU 使用率、记忆体状态、推理伫列与伺服器日志。
-
支援针对长文本翻译与合成的批次处理功能,并可透过 API 端点监控处理进度。
-
提供相容 OpenAI 格式的视觉补全端点,便于构建多模态聊天应用程式。
-
执行需求:macOS 14+ (Apple Silicon)、Python 3.12+ 与 uv 套件管理器。
-
预设于 http://127.0.0.1:18321 运作,提供在地化服务。
-
进行 ASR 与档案转换任务时,建议使用绝对档案路径以确保系统正确存取资源。
-
支援 70 种以上的翻译语言,TTS 服务支援透过语意提示 (VoiceDesign) 自定义语调与口音。
-
提供个别模型控制 API,允许使用者独立重启或暂停特定服务,而不影响整体伺服器架构。
-
效能调整建议:图像生成可选取 9 步骤 (快速) 或 20 步骤 (高质量),请根据实际应用场景进行平衡。
仓库统计
- Star 数
- 11
- Fork 数
- 1
- Open Issue 数
- 0
- 主要语言
- HTML
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月4日 01:26