数据分析
geospatial-analysis
使用 GeoPandas 进行地理空间数据分析,包含正确的坐标投影转换,以执行精确的距离计算、空间筛选与地理特征分析。
简介
geospatial-analysis 技能为处理地理数据提供了一个强大的框架,专为处理地球科学数据集的代理程序而设计,包括地震记录、板块边界和复杂的空间几何图形。此技能确保代理程序能避开常见错误,例如在未投影或投影错误的坐标系统上进行计算,这对于维护科学和工程任务的精确度至关重要。它适用于需要执行高保真空间操作的开发人员、数据科学家和自主代理程序。
- 透过将数据从地理坐标系统 (如 EPSG:4326/WGS84) 投影到基于公制的投影坐标系统 (如 EPSG:4087),执行精确的空间距离计算。
- 执行高效的空间筛选,例如使用 Shapely 几何图形和 GeoPandas 操作来判断点是否位于特定的多边形边界内。
- 利用进阶几何操作,包括 unary_union,以简化并合并复杂的特征集合,例如板块边界段。
- 处理多样化的数据输入,包括 GeoJSON 文件和包含经纬度的原始坐标数组,并将其转换为结构化的 GeoDataFrames。
- 透过在执行耗时的投影或空间连接操作之前先筛选数据集,来优化性能。
- 存取并操作几何元数据,以针对特定区域、代码或空间群集执行基于属性的筛选。
- 几何完整性的最佳实践:代理程序应优先将数据投影至目标公制坐标系统一次,而非在循环内重复转换,以保持运行速度与数据准确性。
- 此技能预期输入标准地理空间格式的数据,并产生分析结果,例如以米或公里为单位的距离度量,以及用于进一步处理的空间数据子集。
- 限制条件:严格要求有效的坐标元数据来定义初始坐标系统,并假定执行环境中已安装 GeoPandas 和 Shapely 等标准函数库。
仓库统计
- Star 数
- 1,084
- Fork 数
- 271
- Open Issue 数
- 38
- 主要语言
- PDDL
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年4月30日 08:02