工程開發
higress-auto-router avatar

higress-auto-router

透過 CLI 管理 Higress AI Gateway 的自動模型路由。根據請求內容設定觸發規則,實現智慧模型選擇。

簡介

Higress Auto Router 技能提供了一個指令行介面,用於管理 Higress AI Gateway 的智慧模型路由規則。該工具允許開發人員根據用戶請求內容自動切換不同的模型,從而優化 LLM 的使用效率,確保複雜推理、編碼任務、創意寫作或數學問題由最合適的模型處理。透過 get-ai-gateway.sh 指令碼,用戶可以集中管理模型切換配置,而無需重啟網關容器。它作為底層 Wasm 外掛程式配置的抽象層,簡化了路由策略的生命週期管理。

  • 使用觸發短語或自訂正規表示式 (Regex) 定義路由規則,將特定的用戶意圖映射到專業模型(如 Claude、GPT 或 Qwen)。

  • 對路由規則執行增刪改查 (CRUD) 操作,包括新增映射、列出當前啟用的配置以及透過規則 ID 移除過時的規則。

  • 自動觸發 Higress AI Gateway 配置檔的熱重載 (Hot-reload),確保路由更新時零停機。

  • 驗證內部 model-router 配置檔的 YAML 語法,防止動態配置更新期間產生錯誤。

  • 支援複雜的路由場景,包含多語言觸發支援(例如:'深入思考' 與 'deep thinking')。

  • 適用於在雲端原生 API 閘道環境中管理多模型 LLM 部署的 AI 基礎架構工程師與平台維運人員。

  • 要求已啟動 Higress AI Gateway 容器,並確保可存取 get-ai-gateway.sh CLI 工具。

  • 路由邏輯依賴於用戶請求中的 'higress/auto' 模型識別碼。

  • 配置資訊持久化儲存於閘道內部檔案系統的 /data/wasmplugins/model-router.internal.yaml 路徑下。

  • 在定義特定模型路由之前,建議先在 Higress 控制台中配置好相應的模型供應商憑證,以防止請求失敗。

倉庫統計

Star 數
8,297
Fork 數
1,090
Open Issue 數
689
主要語言
Go
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月1日 上午08:34
在 GitHub 查看