資料分析
statsmodels avatar

statsmodels

Python 統計建模與計量經濟學函式庫。執行 OLS、GLM、混合模型、ARIMA、診斷與推論,適用於嚴謹的科學分析。

簡介

Statsmodels 是一個強大的 Python 函式庫,專為嚴謹的統計建模、計量經濟學分析與時間序列預測而設計。它提供了一套完整的工具,用於參數估計、統計推論與診斷測試,對於需要精確控制模型結構與高保真輸出的研究人員、資料科學家與分析師而言,是不可或缺的工具。此技能協助將高階統計方法應用於複雜數據集,透過詳細的診斷與模型假設驗證確保結果準確。無論您是進行學術研究、財務預測還是工業資料分析,此技能都能運用專業級的統計技術產生具備行動價值的見解。

  • 廣泛的模型支援,包括 OLS(普通最小平方法)、WLS(加權最小平方法)、GLS(廣義最小平方法)與分位數迴歸。

  • 進階廣義線性模型 (GLM),提供多種分佈族群,如二項分佈、卜瓦松分佈、負二項分佈與伽瑪分佈。

  • 強大的時間序列分析工具,用於 ARIMA、SARIMAX、VAR 與波動率建模,並內建平穩性測試。

  • 全面的診斷套件,用於檢測異質變異數、自相關與殘差常態性。

  • 離散結果分析,包含二元、多項與順序模型。

  • 影響力統計與異常觀測值檢測,包含庫克距離 (Cook's distance) 與槓桿值分數。

  • 可直接用於發表的統計推論輸出,具備詳細的係數表、p 值與信賴區間。

  • 在擬合線性模型時務必透過加入常數項來準備數據,因為 Statsmodels 預設不會自動加入截距。

  • 使用 AIC(赤池資訊準則)與 BIC(貝氏資訊準則)等模型比較指標來優化模型選擇。

  • 輸入要求通常包含 Pandas DataFrames 或 NumPy 陣列,適用於解釋變數 (X) 與應變數 (y)。

  • 輸出以結果物件形式回傳,包含摘要統計、帶有預測區間的預測物件以及診斷指標。

  • 若需導引式選擇基本統計測試並產生簡化的 APA 風格報告,建議搭配「statistical-analysis」技能一同使用。

  • 本函式庫與 Matplotlib 高度相容,適用於視覺化模型診斷、殘差圖與自相關函數。

倉庫統計

Star 數
19,783
Fork 數
2,207
Open Issue 數
41
主要語言
Python
預設分支
main
同步狀態
閒置
最近同步時間
2026年4月30日 上午10:10
在 GitHub 查看