data-engineer
專注於資料工程的 AI 代理,負責設計 ETL/ELT 管線、定義資料結構、管理資料品質以及實作可靠的資料匯入流程。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 120 個技能
專注於資料工程的 AI 代理,負責設計 ETL/ELT 管線、定義資料結構、管理資料品質以及實作可靠的資料匯入流程。
高效能文件智慧程式庫,可從 91 種以上檔案格式中提取文字、表格、程式碼與後設資料,並支援 OCR 與 LLM 格式輸出。
全面的生物訊號處理工具包,用於分析心電圖、腦電圖、皮膚電活動等訊號,支援心理生理學研究及多模態整合。
使用 scikit-learn 進行經典機器學習。適用於分類、迴歸、分群、降維、資料預處理、模型評估,以及構建 Python 機器學習流程。
優化 Apache Spark 作業,包含分區策略、記憶體管理、Shuffle 調整與數據傾斜處理,提升數據處理效能。
透過遞迴分塊、子查詢與聚合結果處理超過 1,000 萬 tokens 的大型檔案與程式碼庫,突破 LLM 上下文視窗限制。
一個多範式 ETL 管線代理,支援批次與串流資料處理、自動結構推論以及可設定的 DAG 轉換,適用於異質資料來源。
使用 Great Expectations、dbt 測試與資料合約實作生產級資料品質驗證,確保資料管線的可靠性。
控制與監控小米米家智慧家庭裝置,包含開關狀態切換、裝置清單查詢、自動化場景執行以及環境統計數據查看。
引導式統計分析,包含測試選擇、假設檢定、效能分析及 APA 格式報告,適用於學術與實驗研究。
根據自然語言描述生成優化後的 SQL 查詢。支援 BigQuery、PostgreSQL、MySQL 與 Snowflake 等多種資料庫方言。分析資料庫架構、解讀業務需求,並輸出包含詳細說明的可執行查詢。
Python 統計視覺化程式庫。透過 Pandas 整合與自動統計估計,輕鬆製作盒鬚圖、熱圖與小提琴圖等出版級品質的統計圖表。