Extract structured data from unstructured files (PDF, PPTX, DOCX...)
使用 LlamaExtract 实现从 PDF、DOCX 和 PPTX 等非结构化文件中提取结构化数据的方案,并通过 Pydantic 定义数据架构。
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 130 个技能
使用 LlamaExtract 实现从 PDF、DOCX 和 PPTX 等非结构化文件中提取结构化数据的方案,并通过 Pydantic 定义数据架构。
高性能 Python 与 Rust 内存内 DataFrame 库。支持延迟计算、并行处理,并使用 Apache Arrow 引擎,适用于高效 ETL、数据处理及加速 pandas 工作流。
执行用户参与数据的同期群分析。识别留存趋势、功能采用率、流失模式,并透过定量数据分析生成可执行的研究建议。
一个多范式 ETL 流水线代理,支持批处理和流式数据处理、自动模式推断及基于 DAG 的可配置转换,适用于异构数据源。
通过程序化方式搜索、检索并管理您的 KUNGFU.SH 书签,以优化您的研究与知识管理工作流程。
为 Lofy AI 助理打造的求职自动化管理工具:追踪申请进度、定制简历、准备面试、管理后续跟进与分析求职数据。
自动化 Excel 报表生成工具,支持从 CSV、数据库或 Python 结构生成报告。具备图表绘制、样式自定义、模板填充与数据分析功能。
管理 SignalRoom 营销平台的 dlt 数据管道与 Temporal 工作流。支持同步 Everflow、Redtrack 与 S3 数据至 Postgres,并执行状态检查与调试。
为数据表格设计并实现专业、交互式的筛选用户界面,并能根据列数据类型自动调整。
HealthSim 跨产品数据持久化、SSN 实体关联及 DuckDB 数据库操作的基础设施。
使用 rclone 在本地存储与云端服务商(如 S3、Cloudflare R2、Backblaze B2、Google Drive 和 Dropbox)之间管理、同步与传输文件。
自动化 GitHub 问题分类,通过分析代码库验证技术主张,并针对无效问题提供专家级回应以进行关闭。