data-engineer
专注于数据工程的 AI 代理,负责设计 ETL/ELT 管线、定义数据结构、管理数据质量以及实现可靠的数据导入流程。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 120 个技能
专注于数据工程的 AI 代理,负责设计 ETL/ELT 管线、定义数据结构、管理数据质量以及实现可靠的数据导入流程。
高性能文档智能库,可从 91 种以上文件格式中提取文本、表格、代码及元数据,支持 OCR 及 LLM 友好输出。
全面的生物信号处理工具包,用于分析心电图、脑电图、皮肤电活动等信号,支持心理生理学研究及多模态整合。
使用 scikit-learn 进行经典机器学习。适用于分类、回归、聚类、降维、数据预处理、模型评估,以及构建 Python 机器学习流程。
优化 Apache Spark 作业,包含分区策略、内存管理、Shuffle 调整与数据倾斜处理,提升数据处理效能。
通过递归分块、子查询与聚合结果处理超过 1,000 万 token 的大型文件和代码库,突破 LLM 上下文窗口限制。
一个多范式 ETL 流水线代理,支持批处理和流式数据处理、自动模式推断及基于 DAG 的可配置转换,适用于异构数据源。
使用 Great Expectations、dbt 测试与数据契约实现生产级数据质量验证,确保数据管道的可靠性。
控制与监控小米米家智能家居设备,包括开关状态切换、设备列表查询、自动化场景执行以及环境统计数据查看。
引导式统计分析,包含测试选择、假设检验、功效分析及 APA 格式报告,适用于学术与实验研究。
根据自然语言描述生成优化后的 SQL 查询。支持 BigQuery、PostgreSQL、MySQL 与 Snowflake 等多种数据库方言。分析数据库架构、解读业务需求,并输出包含详细说明的可执行查询。
Python 统计可视化程序库。通过 Pandas 整合与自动统计估计,轻松制作箱线图、热图与小提琴图等出版级品质的统计图表。