Agent Communication Debugger
诊断并调试代理间 (A2A) 通讯问题,涵盖编排器路由、传输连接、代理状态及多代理系统日志分析。
简介
代理通讯调试器是一套专为维护多代理系统的开发者设计的综合诊断工具,特别适用于使用中心辐射式 (hub-and-spoke) 架构(如 A2A 通讯框架)的系统。本技能提供结构化、系统化的方法来排查代理无响应、消息丢失或路由逻辑错误等问题。它旨在协助软件工程师与系统架构师验证分布式代理组件(包括编排器、编码代理、测试代理)的健康状况,并确保 WebSocket 或基于 RAG 的存储层等底层传输机制正常运作。
-
对代理进程(编排器、编码器、测试器及 websocket_server)执行自动化健康检查,识别挂起或无响应的实例。
-
验证代理配置文件 (agent.json),检测语法错误、无效的能力定义或不正确的路由主题键。
-
通过筛选日志文件 (logs/*.log) 中的特定模式(如连接例外、JSON 解析错误、路由决策),定位问题根源。
-
验证传输层完整性,检查 WebSocket 端口 (8765) 以及消息存储板文件的访问权限与内容。
-
提供端到端消息传递验证脚本,确认编排器能正确接收并响应请求。
-
支持针对路由逻辑的深入调试,检查优先级关键字映射、代理发现日志以及编排器源代码中的备援机制。
-
简化环境配置验证,确认 OPENAI_API_KEY 及模型覆盖参数(如 ORCHESTRATOR_MODEL)是否正确设置。
-
前置需求包含 Python 3.10+ 环境以及对 a2a_communicating_agents/ 目录结构的访问权限。
-
当开发环境中出现“代理无响应”或“路由错误”时,本工具能显著提升排错效率。
-
请优先查阅 common_issues.md 以获取针对常见传输连接问题的解决方案。
-
在启动完整系统重启前,请务必确认所有环境变量已正确设置,因为错误的凭证常导致基于 LLM 的路由失败。
仓库统计
- Star 数
- 0
- Fork 数
- 0
- Open Issue 数
- 0
- 主要语言
- Python
- 默认分支
- main
- 同步状态
- 空闲
- 最近同步时间
- 2026年5月3日 23:46