数据分析
statsmodels avatar

statsmodels

Python 统计建模与计量经济学函数库。执行 OLS、GLM、混合模型、ARIMA、诊断与推论,适用于严谨的科学分析。

简介

Statsmodels 是一个强大的 Python 函数库,专为严谨的统计建模、计量经济学分析与时间序列预测而设计。它提供了一套完整的工具,用于参数估计、统计推论与诊断测试,对于需要精确控制模型结构与高保真输出的研究人员、数据科学家与分析师而言,是不可或缺的工具。此技能协助将高阶统计方法应用于复杂数据集,透过详细的诊断与模型假设验证确保结果准确。无论您是进行学术研究、财务预测还是工业数据分析,此技能都能运用专业级的统计技术产生具备行动价值的见解。

  • 广泛的模型支持,包括 OLS(普通最小平方法)、WLS(加权最小平方法)、GLS(广义最小平方法)与分位数回归。

  • 进阶广义线性模型 (GLM),提供多种分布族群,如二项分布、卜瓦松分布、负二项分布与伽玛分布。

  • 强大的时间序列分析工具,用于 ARIMA、SARIMAX、VAR 与波动率建模,并内建平稳性测试。

  • 全面的诊断套件,用于检测异质变异数、自相关与残差常态性。

  • 离散结果分析,包含二元、多项与顺序模型。

  • 影响力统计与异常观测值检测,包含库克距离 (Cook's distance) 与杠杆值分数。

  • 可直接用于发表的统计推论输出,具备详细的系数表、p 值与信赖区间。

  • 在拟合线性模型时务必透过加入常数项来准备数据,因为 Statsmodels 预设不会自动加入截距。

  • 使用 AIC(赤池信息准则)与 BIC(贝氏信息准则)等模型比较指标来优化模型选择。

  • 输入要求通常包含 Pandas DataFrames 或 NumPy 阵列,适用于解释变量 (X) 与应变量 (y)。

  • 输出以结果物件形式回传,包含摘要统计、带有预测区间的预测物件以及诊断指标。

  • 若需导引式选择基本统计测试并产生简化的 APA 风格报告,建议搭配「statistical-analysis」技能一同使用。

  • 本函数库与 Matplotlib 高度相容,适用于视觉化模型诊断、残差图与自相关函数。

仓库统计

Star 数
19,783
Fork 数
2,207
Open Issue 数
41
主要语言
Python
默认分支
main
同步状态
空闲
最近同步时间
2026年4月30日 10:10
在 GitHub 查看