小乔 发表于 2016-6-1 15:48:40

如何排查部分节点与时钟源不同步问题

本帖最后由 小乔 于 2016-6-1 15:50 编辑

问题描述
配置了远端时钟源后,出现部分节点(如VRM)无法与时钟源同步,报15.1002006告警,且根据告警指导无法解决,如下图所示:
http://support.huawei.com/enterprise/product/images/f219bf41e08341c9a23f3af81d464356


告警信息
出现部分节点上报15.1002006告警。

处理过程
原因分析:1、局点个别服务器出现此类问题,说明远端时钟源可正常提供时钟同步服务;2、通过告警指导,可以排查如下结果:1)问题节点ntp服务正常;2)问题节点到远端时钟源可达;3) 问题节点与ntp时钟源已通过时间强制同步,且确定时差在1min以内;4)配置单个NTP服务器仍存在该问题。 3、通过步骤1、2均排查均正常
    1)通过ntpq -c as命令查询,结果如下显示:http://support.huawei.com/enterprise/product/images/e03a31fe3cec43078ba37605ecd2033e在ntpq下执行as查看服务器概要信息,可以看到服务器的association ID(65240),可以看到与服务器的链接状态(reject)。    2)通过ntpq -c as命令查询,结果如下显示:http://support.huawei.com/enterprise/product/images/c70d0cc6c9534808b31bc351ecbd3642
执行rv命令根据服务器的association ID获取与服务器同步时间的详细信息。发现flash只为400。即TEST11 peer_dist peer distance exceeded。查询相关帮助说明和源代码发现,这个问题的原因是:与服务器的距离超过了距离门限。NTPD默认的距离门限为1.5秒。详细错误码可参考:
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flash
说明:http://support.huawei.com/enterprise/product/images/c39d6e7a05a14102972256d5b50c6c1f
第一列是与服务器通信状态,常见状态如下:*   :当前正在同步的服务器;+   :备选服务器;
空格 :服务器不可用(通常是ntp时钟源不可达或拒绝)
处理过程:**** Hidden Message *****

hugo_26 发表于 2020-2-6 14:42:23

dddddddddddddd
页: [1]
查看完整版本: 如何排查部分节点与时钟源不同步问题