研究
paper-reproduce avatar

paper-reproduce

提供論文復現的系統性方法論,支援數據清理、統計驗證、樣本篩選及自動化產出學術復現報告(Markdown 與 LaTeX)。

簡介

paper-reproduce 技能為學術研究結果的重現提供了一套嚴謹且分階段的實作框架。專為研究人員、數據科學家與學生設計,引導使用者完成整個復現工作流程,確保統計結果、變數定義與樣本結構與原始文獻相符。透過自動化的數據探索與驗證技術,此技能降低了實證研究的「黑箱」程度,協助使用者識別並記錄整合型數據集(harmonized datasets)與原始研究之間的偏差。

  • 完整的管道支援:涵蓋從初步數據探索、變數映射到最終統計分析與結果比對的全過程。

  • 嚴謹的變數識別:包含語義搜尋、值域驗證及跨變數交叉核對等多步驟技術,以精確對齊問卷數據與論文描述。

  • 系統化樣本篩選:自動化處理樣本排除流程,確保分析樣本數與目標論文一致,並內建過程日誌以確保透明度。

  • 高階統計分析:支援 OLS、穩健標準誤 (HC3)、交互作用項及分層分析,提供標準化 Beta 係數以確保結果的可比較性。

  • 自動化文件產出:產生 Markdown 與 LaTeX/PDF 格式的專業學術報告,包含描述性統計表 (Table 1) 及回歸分析表。

  • 優先數據驗證:在建立模型前,務必先行驗證變數值域與均值;未與文獻確認前,切勿假設變數映射是正確的。

  • 偏差處理:整合型數據集與原始數據之間的差異是預料中的事;請使用提供的三級驗證標記(驗證、趨勢一致、未復現)來記錄這些差距。

  • 輸入需求:需提供原始數據檔(Stata .dta, CSV, 或 SAS)以及參考文獻(PDF 或方法論說明)。

  • 輸出結構:自動將腳本、分析日誌與生成的報告整理至標準化目錄結構中,確保復現過程本身的透明度與可重現性。

  • 統計細節:注意標準誤估計、類別變數編碼以及子樣本標準化協議,以避免系統性偏差。

倉庫統計

Star 數
703
Fork 數
194
Open Issue 數
6
主要語言
TeX
預設分支
main
同步狀態
閒置
最近同步時間
2026年5月1日 上午07:29
在 GitHub 查看