paper-reproduce

簡介

paper-reproduce 技能為學術研究結果的重現提供了一套嚴謹且分階段的實作框架。專為研究人員、數據科學家與學生設計，引導使用者完成整個復現工作流程，確保統計結果、變數定義與樣本結構與原始文獻相符。透過自動化的數據探索與驗證技術，此技能降低了實證研究的「黑箱」程度，協助使用者識別並記錄整合型數據集（harmonized datasets）與原始研究之間的偏差。

完整的管道支援：涵蓋從初步數據探索、變數映射到最終統計分析與結果比對的全過程。
嚴謹的變數識別：包含語義搜尋、值域驗證及跨變數交叉核對等多步驟技術，以精確對齊問卷數據與論文描述。
系統化樣本篩選：自動化處理樣本排除流程，確保分析樣本數與目標論文一致，並內建過程日誌以確保透明度。
高階統計分析：支援 OLS、穩健標準誤 (HC3)、交互作用項及分層分析，提供標準化 Beta 係數以確保結果的可比較性。
自動化文件產出：產生 Markdown 與 LaTeX/PDF 格式的專業學術報告，包含描述性統計表 (Table 1) 及回歸分析表。
優先數據驗證：在建立模型前，務必先行驗證變數值域與均值；未與文獻確認前，切勿假設變數映射是正確的。
偏差處理：整合型數據集與原始數據之間的差異是預料中的事；請使用提供的三級驗證標記（驗證、趨勢一致、未復現）來記錄這些差距。
輸入需求：需提供原始數據檔（Stata .dta, CSV, 或 SAS）以及參考文獻（PDF 或方法論說明）。
輸出結構：自動將腳本、分析日誌與生成的報告整理至標準化目錄結構中，確保復現過程本身的透明度與可重現性。
統計細節：注意標準誤估計、類別變數編碼以及子樣本標準化協議，以避免系統性偏差。

創業課程

網上課程

實體課程

簡介

倉庫統計