DeepFlow Agent 故障排查指南:注册失败、协议解析、资源识别与配置方式
目录[*]1. 前言
[*]2. 部署问题排查
[*]3. 通用排查案例
[*]4. 其余常见问题
1. 前言
1.1 适用范围
本文档适用于 DeepFlow Agent v6.5 及以上版本。
1.2 运行权限及内核要求
确保环境满足运行权限及内核要求。
1.3 排查前检查
检查项要求版本Agent/Server 为 LTS 版本,且 Agent ≤ Server 版本部署方式主机进程部署 或 K8s Pod 部署工具已安装与 Server 同版本的 deepflow-ctl等待时间Agent 部署后等待 5 分钟以上再排查(初始化需要时间)网段Agent IP 在 Server 的 local_ip_ranges 网段内2. 部署问题排查
2.1 主机进程部署
主机进程部署通过 deepflow-agent 二进制直接运行在主机上,默认使用 38086 端口。
Agent 注册失败排查
按以下顺序检查:
[*]检查 Domain 与 Agent Group Config 配置
[*]检查 Server 网段配置
[*]检查主机名是否重名
[*]检查是否通过 LB 连接 Server
2.1.1 检查 Domain 与 Agent Group Config 配置
主机进程部署需要完成两个步骤:
[*]创建 Host Domain(类型为 agent_sync)
[*]创建 Agent Group Config(采集器组配置)
这两个步骤缺一不可。agent_sync 类型 Domain 只能创建一个,多了会导致注册异常。
排查步骤:
[*]检查 Host Domain 是否已创建:
# 确认列表中存在类型为 agent_sync 的 Domain
deepflow-ctl domain list
[*]检查 Agent Group Config 是否已创建:
deepflow-ctl agent-group-config list解决方案:
如果缺少 Host Domain:
unset DOMAIN_NAMEDOMAIN_NAME="legacy-host" # 修改为实际的 domain 名称cat
页:
[1]