資料分析
pymc avatar

pymc

使用 PyMC 進行貝葉斯建模與機率編程。構建分層模型,執行 MCMC 採樣 (NUTS) 與變分推斷,並透過 LOO/WAIC 進行嚴謹的模型比較與後驗檢查。

簡介

PyMC 是一項專為貝葉斯建模而設計的技能,適用於需要執行機率編程與統計推斷的研究人員與數據科學家。此技能利用現代 PyMC 5.x API,幫助用戶構建、擬合與驗證複雜的統計模型。它特別適合需要不確定性量化、分層數據分析以及對測量誤差或缺失數據進行原則性處理的場景。透過與 ArviZ 的整合進行診斷可視化,確保模型不僅構建正確,且具備穩健性、收斂性與統計上的合理性。

  • 使用無迴轉採樣器 (NUTS) 與變分推斷 (ADVI) 執行高階貝葉斯推斷。

  • 構建複雜的分層與多層級模型,以處理群體間的變異。

  • 使用 LOO 交叉驗證與 WAIC 等資訊準則進行嚴謹的模型選擇與評估。

  • 實施先驗與後驗預測檢查,驗證模型假設並識別潛在的錯誤設定。

  • 透過分析 R-hat 收斂指標、有效樣本量 (ESS) 與發散轉折來診斷採樣性能。

  • 透過靈活的模型定義實現線性回歸、邏輯回歸與自定義機率結構。

  • 始終標準化連續預測變量,以提高 Hamiltonian Monte Carlo 採樣的效率。

  • 使用弱資訊先驗取代無資訊先驗,引導模型參數進入物理上合理的範圍。

  • 明確定義模型的坐標與維度,以增強代碼可讀性並促進複雜數據的索引。

  • 在遇到複雜後驗分佈或採樣發散時,調高 target_accept 參數 (0.9–0.99)。

  • 輸入通常為數值陣列或 pandas DataFrames;輸出為包含後驗軌跡、診斷資訊與匯總統計數據的 InferenceData 對象。

  • 確保足夠的調整樣本數與多個鏈,以保證 MCMC 鏈已完全探索參數空間。

倉庫統計

Star 數
19,798
Fork 數
2,209
Open Issue 數
41
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 下午04:08
在 GitHub 查看