数据分析
data-visualization
使用 Python (matplotlib, seaborn, plotly) 创建专业数据可视化。包含图表选择指南、设计原则、无障碍标准及出版级图表的代码模板。
简介
此技能旨在帮助使用者利用 Python 强大的科学计算工具集(包括 matplotlib, seaborn 和 plotly)生成高质量且有效的数据可视化图表。它为数据科学家、分析师和工程师提供自动化的咨询服务,协助将复杂数据集转化为清晰、具洞察力且美观的图形,并遵循数据叙事与视觉传达的最佳实践。
-
智能图表选择:根据数据关系(如时间趋势、类别比较、分布、相关性或网络结构)自动建议最有效的图表类型。
-
专业代码模板:提供生产级的 Python 代码片段,涵盖标准样式设定,包括分辨率 (DPI)、字体大小、网格管理以及针对色盲友好的配色方案。
-
设计与无障碍强制规范:整合设计理论(如完形心理学与色彩理论),同时执行无障碍标准,确保图表具备包容性与可读性。
-
出版级图表输出:标准化制作适用于研究论文、高管报告与数据仪表板的图表,去除冗余视觉元素(Chart Junk),优化坐标轴标签与图例配置。
-
在为原始数据构思可视化方案或进行项目最终优化时使用此技能。
-
输入通常为 pandas 数据框或结构化数组数据;输出则为用于生成图表并保存为高质量图像格式(如 PNG、SVG、PDF)的代码。
-
实作限制:除非有明确必要,否则避免使用 3D 图表或易产生误导的双轴图表;专注于高信息密度的可视化技术,例如小多图(Small Multiples)与热图(Heatmap)。
-
使用者应提供受众背景(如技术同行评审或高管摘要),以便获取针对风格与复杂度的定制化建议。此技能涵盖从探索性数据分析 (EDA) 到成品等级视觉资产的广泛应用场景。
仓库统计
- Star 数
- 11,662
- Fork 数
- 1,359
- Open Issue 数
- 92
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月29日 14:21