paper-reproduce
提供論文復現的系統性方法論,支援數據清理、統計驗證、樣本篩選及自動化產出學術復現報告(Markdown 與 LaTeX)。
簡介
paper-reproduce 技能為學術研究結果的重現提供了一套嚴謹且分階段的實作框架。專為研究人員、數據科學家與學生設計,引導使用者完成整個復現工作流程,確保統計結果、變數定義與樣本結構與原始文獻相符。透過自動化的數據探索與驗證技術,此技能降低了實證研究的「黑箱」程度,協助使用者識別並記錄整合型數據集(harmonized datasets)與原始研究之間的偏差。
-
完整的管道支援:涵蓋從初步數據探索、變數映射到最終統計分析與結果比對的全過程。
-
嚴謹的變數識別:包含語義搜尋、值域驗證及跨變數交叉核對等多步驟技術,以精確對齊問卷數據與論文描述。
-
系統化樣本篩選:自動化處理樣本排除流程,確保分析樣本數與目標論文一致,並內建過程日誌以確保透明度。
-
高階統計分析:支援 OLS、穩健標準誤 (HC3)、交互作用項及分層分析,提供標準化 Beta 係數以確保結果的可比較性。
-
自動化文件產出:產生 Markdown 與 LaTeX/PDF 格式的專業學術報告,包含描述性統計表 (Table 1) 及回歸分析表。
-
優先數據驗證:在建立模型前,務必先行驗證變數值域與均值;未與文獻確認前,切勿假設變數映射是正確的。
-
偏差處理:整合型數據集與原始數據之間的差異是預料中的事;請使用提供的三級驗證標記(驗證、趨勢一致、未復現)來記錄這些差距。
-
輸入需求:需提供原始數據檔(Stata .dta, CSV, 或 SAS)以及參考文獻(PDF 或方法論說明)。
-
輸出結構:自動將腳本、分析日誌與生成的報告整理至標準化目錄結構中,確保復現過程本身的透明度與可重現性。
-
統計細節:注意標準誤估計、類別變數編碼以及子樣本標準化協議,以避免系統性偏差。
倉庫統計
- Star 數
- 703
- Fork 數
- 194
- Open Issue 數
- 6
- 主要語言
- TeX
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年5月1日 上午07:29