資料分析
pymc
使用 PyMC 進行貝葉斯建模與機率編程。構建分層模型,執行 MCMC 採樣 (NUTS) 與變分推斷,並透過 LOO/WAIC 進行嚴謹的模型比較與後驗檢查。
簡介
PyMC 是一項專為貝葉斯建模而設計的技能,適用於需要執行機率編程與統計推斷的研究人員與數據科學家。此技能利用現代 PyMC 5.x API,幫助用戶構建、擬合與驗證複雜的統計模型。它特別適合需要不確定性量化、分層數據分析以及對測量誤差或缺失數據進行原則性處理的場景。透過與 ArviZ 的整合進行診斷可視化,確保模型不僅構建正確,且具備穩健性、收斂性與統計上的合理性。
-
使用無迴轉採樣器 (NUTS) 與變分推斷 (ADVI) 執行高階貝葉斯推斷。
-
構建複雜的分層與多層級模型,以處理群體間的變異。
-
使用 LOO 交叉驗證與 WAIC 等資訊準則進行嚴謹的模型選擇與評估。
-
實施先驗與後驗預測檢查,驗證模型假設並識別潛在的錯誤設定。
-
透過分析 R-hat 收斂指標、有效樣本量 (ESS) 與發散轉折來診斷採樣性能。
-
透過靈活的模型定義實現線性回歸、邏輯回歸與自定義機率結構。
-
始終標準化連續預測變量,以提高 Hamiltonian Monte Carlo 採樣的效率。
-
使用弱資訊先驗取代無資訊先驗,引導模型參數進入物理上合理的範圍。
-
明確定義模型的坐標與維度,以增強代碼可讀性並促進複雜數據的索引。
-
在遇到複雜後驗分佈或採樣發散時,調高 target_accept 參數 (0.9–0.99)。
-
輸入通常為數值陣列或 pandas DataFrames;輸出為包含後驗軌跡、診斷資訊與匯總統計數據的 InferenceData 對象。
-
確保足夠的調整樣本數與多個鏈,以保證 MCMC 鏈已完全探索參數空間。
倉庫統計
- Star 數
- 19,798
- Fork 數
- 2,209
- Open Issue 數
- 41
- 主要語言
- Python
- 預設分支
- main
- 同步狀態
- 閒置
- 最近同步時間
- 2026年4月30日 下午04:08