研究
jina-cli avatar

jina-cli

專為 AI Agent 設計的網頁閱讀與搜索工具,透過 Jina AI Reader API 將網頁轉換為適合 LLM 閱讀的 Markdown、文字或 HTML 格式。

簡介

Jina CLI 是一款專為開發者、研究人員及 AI Agent 設計的強大工具,用於高效進行網頁數據提取與網絡搜索。透過整合 Jina AI Reader API,本工具能將部落格、新聞網站及社交媒體(如 X/Twitter)等複雜且非結構化的網頁內容,快速轉換為乾淨、適合大型語言模型處理的 Markdown、純文字或原始 HTML 格式。它扮演著即時網頁數據與 LLM 之間的橋樑,確保上下文檢索的準確性與 Token 使用效率。

  • 執行基於 AI 的網頁搜索,並自動提取搜尋結果中的核心內容,非常適合作為研究管線或自動化數據收集的一部分。
  • 進階提取功能包含 CSS 選擇器定位、針對動態頁面 (SPA) 的元素等待機制、Cookie 轉發,以及針對社群媒體圖片的視覺模型 (VLM) 字幕生成。
  • 支援透過文字檔進行批次 URL 處理,方便執行大規模的數據抓取與自動化作業。
  • 高度可配置的運行環境,支援代理伺服器設定、自訂 API 基底網址、請求逾時控制以及 API 金鑰管理,確保在大規模請求下的速率限制穩定性。
  • 提供 Linux、macOS 與 Windows 的原生二進位檔案,並針對 OpenClaw 與 Claude Code 等 AI 原生開發環境提供專用的安裝整合路徑。
  • 提供靈活的輸出選項,支援機器友好的 JSON 格式以及人類易讀的 Markdown 格式,適用於直接生成技術文件或數據集。

使用說明與限制:

  • 非常適合用於建立 RAG(檢索增強生成)管線、內容策展工作流以及自動化網絡研究助理。
  • 本工具需要網路連接才能存取 Jina AI Reader 與 Search API;對於高頻率請求,強烈建議配置 API 金鑰以獲得更高的速率限制。
  • 針對複雜的動態網站,建議使用 --wait-for-selector 或 --post 選項,以確保網頁 DOM 完全載入後再進行提取。
  • 本 CLI 使用 Go 語言編寫,具備體積小、除 Cobra 外零外部依賴的特性,執行速度極快,非常適合部署在本地或容器化的 AI Agent 環境中。

倉庫統計

Star 數
292
Fork 數
27
Open Issue 數
2
主要語言
Go
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月1日 上午09:05
在 GitHub 查看