工程開發自動化
robot-perception
機器人感知系統設計、配置與優化,涵蓋攝影機、光達與感測器融合管線。包含相機校正、3D 重建與生產環境部署的最佳實踐。
瀏覽: 14★ 190
探索可重用的代理技能,查看實作細節,快速找到適合你工作流程的技能。
共找到 149 個技能
機器人感知系統設計、配置與優化,涵蓋攝影機、光達與感測器融合管線。包含相機校正、3D 重建與生產環境部署的最佳實踐。
使用 Google Gemini 處理與生成多媒體內容。支援音訊轉錄、影像辨識、影片分析、PDF 解析及 AI 圖像生成,具備超長上下文窗口,適用於複雜的多模態 AI 任務。
系統化的專案技術棧檢測、框架特定技能自動載入,以及針對 React + Go 等全端專案的多技術棧分析。
分析並識別代碼庫模式(命名、架構、測試),以確保開發過程中的一致性與標準執行。
實作 Google Gemini API 影像分析功能,包含圖片標註、物件偵測、圖像分割、視覺問答及多圖比較分析。
高效能文件智慧程式庫,可從 91 種以上檔案格式中提取文字、表格、程式碼與後設資料,並支援 OCR 與 LLM 格式輸出。
使用 Tesseract OCR 引擎從圖片中提取文字,支援多種語言、影像預處理以及多種輸出格式。
使用 BigCode Evaluation Harness 評估代碼生成模型。包含 HumanEval、MBPP 和 MultiPL-E 等基準測試,並提供多語言編碼模型的 pass@k 指標評估。
從支援 RTSP 和 ONVIF 的安全攝影機擷取快照、錄製短片並監控移動事件。
分析 AppWorld 任務失敗原因,提取具體的 API 模式並生成帶有實作程式碼範例的可執行劇本要點。
AI 食物熱量與營養計算器。透過視覺識別辨識餐點,自動計算卡路里及營養素,並結合內建營養資料庫提供健康建議。
自動檢測程式碼變更並建議文件更新。確保 README、API 規範與設定指南與您的實作保持同步。