papi
管理、搜索并从本地论文数据库中提取技术见解。适合开发者实作学术研究、验证代码与数学逻辑,以及为 AI 编程代理提供科学论文背景资料。
简介
Paperpipe 是一款专为开发者、研究人员及 AI 代理设计的学术研究转代码实现工具。它通过维护一个结构化的本地数据库,弥合了静态 PDF 论文与实际代码实现之间的鸿沟。此工具协助用户通过提取的公式、LaTeX 原始文件及针对编程实现优化的摘要来验证实现细节,避免 AI 产生幻觉。它是交叉比对数学定义、理解架构图以及追踪实现笔记的核心工具。
-
通过 CLI 高效管理本地论文数据库,支持 arXiv ID、URL 及本地文件导入。
-
自动提取并组织关键技术素材,包括数学公式、LaTeX 源代码以及用于实现的概要总结。
-
混合式搜索功能,结合快速的 ripgrep (rg) 字面匹配、BM25 排序搜索,以及通过 PaperQA2 或 LEANN 后端进行的语义检索 (RAG)。
-
与 AI 编程代理 (如 Claude Code 或 Gemini) 无缝集成,允许代理在编写代码时获取引用、页面特定内容及验证后的数学细节。
-
具备跨论文综合分析能力,可比较不同的研究方法、参数规模及方法论,协助进行复杂的实现决策。
-
通过元数据 (Metadata) 追踪与标签系统,有效管理大量实现导向的文献收藏。
-
优先使用 papi CLI 进行直接查询以降低延迟;仅在需要语义综合或跨论文推理时才调用 RAG 工具 (如 papi ask、leann_search 或 retrieve_chunks)。
-
数据库目录 ~/.paperpipe/ 包含重要的文件如 equations.md、source.tex 及 figures/,在调试逻辑或模型架构时应优先参阅。
-
使用 papi export 指令将特定论文内容导出至项目目录中,以便在 AI 代理会话中作为背景知识使用。
-
主要输入为论文 ID 或搜索关键词;主要输出为精确的技术规格、可引用的段落或针对编程实现问题的综合解答。
-
请确保安装了适当的后端依赖 (如 [all] 以支持完整 RAG 及图表提取),以发挥此助理的最佳性能。
仓库统计
- Star 数
- 9
- Fork 数
- 1
- Open Issue 数
- 5
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 20:18