工程開發
parxy avatar

parxy

一個統一的文件處理閘道,支援 PDF 解析、文字提取、格式轉換與跨多種本地及雲端供應商的文件操作。

簡介

Parxy 是一個高效能的文件處理閘道,旨在為複雜的文件工作流程提供統一的介面。它抽象化了各種解析後端之間的差異,使開發人員和自動化代理程式能夠在本地庫(如 PyMuPDF 和 Unstructured)或雲端服務(如 LlamaParse、LLMWhisperer 和 PdfAct)之間切換,而無需更改底層應用程式邏輯。Parxy 的核心價值在於其一致的層級資料模型,能將文件處理為頁面、文字區塊、行、字距和單個字元的結構化流程,並提供精確的邊界框座標和語意角色資訊。這使其成為 AI 驅動的資料提取、RAG 管線和系統性文件轉換任務的理想工具。

  • 統一的 API 介面,可在 PyMuPDF、PdfAct、LlamaParse、LLMWhisperer 和 Unstructured 等解析引擎之間切換。

  • 層級化的文件模型,提供結構性洞察(段落、標題)與空間資料(邊界框座標)。

  • 進階 PDF 操作工具,包括合併指定頁面範圍的文件、將檔案拆分為單頁,以及最佳化大型 PDF(清除中繼資料、字型子集化、影像壓縮)。

  • 內建批次處理功能,支援高流量文件匯入、平行執行與串流結果處理。

  • 強大的命令列介面 (CLI),適用於快速原型設計,具備解析器比較用的 TUI、互動式文件預覽及直接轉換為 Markdown 的功能。

  • 可擴展的架構,允許開發人員整合自訂解析器或處理特定的 PDF 附件提取需求。

  • 最適合開發資料匯入管線、研究自動化或文件管理代理的開發人員。

  • 要求 Python 3.12+,並利用 Pydantic v2 進行資料驗證與架構安全。

  • 提供基礎套件或擴展額外套件(如 [all], [llama], [unstructured_local])的安裝選項,以控制依賴項佔用空間。

  • 輸入主要是 PDF 檔案,支援將複雜版面轉換為結構化的 JSON 或 Markdown 格式。

  • 透過標準環境變數設定 API 金鑰,並支援透過 .env 檔案配置雲端服務憑證,簡化部署流程。

倉庫統計

Star 數
9
Fork 數
1
Open Issue 數
3
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月3日 下午04:07
在 GitHub 查看