数据分析自动化工程开发
fiftyone-find-duplicates
使用计算机视觉相似度嵌入技术,在 FiftyOne 数据集中查找、查看并移除重复或高度相似的图像。
浏览: 7★ 26
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 129 个技能
使用计算机视觉相似度嵌入技术,在 FiftyOne 数据集中查找、查看并移除重复或高度相似的图像。
一套严格的四阶段方法论,强制要求在应用任何代码修复前,必须先进行系统性的根本原因分析。
全面的文献引用管理工具:搜索 Google Scholar 与 PubMed,从 DOI、PMID 或 arXiv 提取元数据,验证引用准确性,并生成格式正确的 BibTeX 条目。
专注于数据工程的 AI 代理,负责设计 ETL/ELT 管线、定义数据结构、管理数据质量以及实现可靠的数据导入流程。
使用 Great Expectations、dbt 测试与数据契约实现生产级数据质量验证,确保数据管道的可靠性。
一个多范式 ETL 流水线代理,支持批处理和流式数据处理、自动模式推断及基于 DAG 的可配置转换,适用于异构数据源。
高性能文档智能库,可从 91 种以上文件格式中提取文本、表格、代码及元数据,支持 OCR 及 LLM 友好输出。
提供 GA4 和 GSC 分析数据提取、缓存及处理的最佳实践模式,支持 MCP 服务器集成。
一个用于 Obsidian 知识库的内容管理代理,可识别草稿笔记、检测重复内容、更新过时信息,并提升文档质量,支持简体中文与英文内容。
根据产品代码手册将测试工程师的缺陷描述标准化,修正错别字、缩写错误与歧义,并执行站点验证。
用于质谱数据处理的 Python 工具包。支持质谱文件导入 (mzML, MGF, MSP)、元数据标准化、峰值过滤,以及代谢组学中的光谱相似度评分(余弦、修正余弦)计算。
AI 驱动的口播视频剪辑 Agent,提供语音转录、口误识别与网页版审核流程。