工程开发自动化
robot-perception
机器人感知系统设计、配置与优化,涵盖摄像头、激光雷达与传感器融合管线。包含相机校准、3D 重建与生产环境部署的最佳实践。
浏览: 14★ 190
探索可复用的代理技能,查看实现细节,快速找到适合你工作流程的技能。
共找到 149 个技能
机器人感知系统设计、配置与优化,涵盖摄像头、激光雷达与传感器融合管线。包含相机校准、3D 重建与生产环境部署的最佳实践。
使用 Google Gemini 处理与生成多媒体内容。支持音频转录、图像识别、视频分析、PDF 解析及 AI 图像生成,具备超长上下文窗口,适用于复杂的多模态 AI 任务。
系统化的项目技术栈检测、框架特定技能自动加载,以及针对 React + Go 等全栈项目的多技术栈分析。
分析并识别代码库模式(命名、架构、测试),以确保开发过程中的一致性与标准执行。
实现 Google Gemini API 图像分析功能,包含图像描述、对象检测、图像分割、视觉问答及多图对比分析。
高性能文档智能库,可从 91 种以上文件格式中提取文本、表格、代码及元数据,支持 OCR 及 LLM 友好输出。
使用 Tesseract OCR 引擎从图片中提取文字,支持多种语言、图像预处理以及多种输出格式。
使用 BigCode Evaluation Harness 评估代码生成模型。涵盖 HumanEval、MBPP 和 MultiPL-E 等基准测试,提供多语言编码模型的 pass@k 指标评估。
从支持 RTSP 和 ONVIF 的安全摄像头获取快照、录制短片并监控移动事件。
分析 AppWorld 任务失败原因,提取具体的 API 模式并生成带有实现代码示例的可执行剧本要点。
AI 食物热量与营养计算器。通过视觉识别辨识餐点,自动计算卡路里及营养素,并结合内置营养数据库提供健康建议。
自动检测代码变更并建议文档更新。确保 README、API 规范与配置指南与您的实现保持同步。