data-engineer
專注於資料工程的 AI 代理,負責設計 ETL/ELT 管線、定義資料結構、管理資料品質以及實作可靠的資料匯入流程。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 130 個技能
專注於資料工程的 AI 代理,負責設計 ETL/ELT 管線、定義資料結構、管理資料品質以及實作可靠的資料匯入流程。
使用 DuckDB 讀取並分析任何資料檔案 (CSV, JSON, Parquet, Avro, Excel 等) 或遠端連結 (S3, HTTPS)。自動偵測檔案格式並進行資料概覽與分析。
專業 SQL 代理,涵蓋現代資料庫系統、查詢優化、HTAP 環境及資料架構模式。精通效能調校、模式設計與分析工作負載。
建立、管理與除錯 dlt (data load tool) 資料管線,將資料從 API、資料庫及自訂來源匯入 DuckDB、BigQuery 或 Snowflake 等目標。
使用 Great Expectations、dbt 測試與資料合約實作生產級資料品質驗證,確保資料管線的可靠性。
一個多範式 ETL 管線代理,支援批次與串流資料處理、自動結構推論以及可設定的 DAG 轉換,適用於異質資料來源。
優化 Apache Spark 作業,包含分區策略、記憶體管理、Shuffle 調整與數據傾斜處理,提升數據處理效能。
世界級資深資料工程技能,用於構建可擴展的資料管道、ETL/ELT 系統及現代化資料基礎架構,精通 Python、Spark、dbt 與 Kafka。
使用 Snowflake CLI 建立、修改及驗證 Snowflake 語意視圖。
將標準 PostgreSQL 資料表遷移至 TimescaleDB 超表,並優化分區、分塊與壓縮策略,以提升時間序列數據效能。
高性能 Python 與 Rust 記憶體內 DataFrame 函式庫。支援延遲計算、平行處理,並使用 Apache Arrow 引擎,適用於高效 ETL、數據處理及加速 pandas 工作流。
為事件溯源系統構建讀取模型與投影,適用於 CQRS、物化視圖及查詢效能優化。