Extract structured data from unstructured files (PDF, PPTX, DOCX...)
使用 LlamaExtract 實作從 PDF、DOCX 與 PPTX 等非結構化檔案中擷取結構化資料的解決方案,並透過 Pydantic 定義資料架構。
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 130 個技能
使用 LlamaExtract 實作從 PDF、DOCX 與 PPTX 等非結構化檔案中擷取結構化資料的解決方案,並透過 Pydantic 定義資料架構。
高性能 Python 與 Rust 記憶體內 DataFrame 函式庫。支援延遲計算、平行處理,並使用 Apache Arrow 引擎,適用於高效 ETL、數據處理及加速 pandas 工作流。
執行使用者參與數據的世代分析。識別留存趨勢、功能採用率、流失模式,並透過定量數據分析生成可執行的研究建議。
一個多範式 ETL 管線代理,支援批次與串流資料處理、自動結構推論以及可設定的 DAG 轉換,適用於異質資料來源。
透過程式化方式搜尋、檢索並管理您的 KUNGFU.SH 書籤,以優化您的研究與知識管理工作流程。
為 Lofy AI 助理打造的求職自動化管理工具:追蹤申請進度、客製化履歷、準備面試、管理後續跟進與分析求職數據。
自動化 Excel 報表生成工具,支援從 CSV、資料庫或 Python 結構生成報告。具備圖表繪製、樣式自定義、模板填充與數據分析功能。
管理 SignalRoom 行銷平台的 dlt 資料管線與 Temporal 工作流。支援同步 Everflow、Redtrack 與 S3 資料至 Postgres,並執行狀態檢查與除錯。
為資料表格設計並實作專業、互動式的篩選使用者介面,並能根據欄位資料類型自動調整。
HealthSim 跨產品數據持久化、SSN 實體關聯及 DuckDB 資料庫操作的基礎設施。
使用 rclone 在本機儲存與雲端供應商(如 S3、Cloudflare R2、Backblaze B2、Google Drive 和 Dropbox)之間管理、同步與傳輸檔案。
自動化 GitHub 問題分類,透過分析程式碼庫驗證技術主張,並針對無效問題提供專家級的回應以進行關閉。