近期经常有客户反馈无法使用微信登录站点,经过排查发现腾讯的开放平台的某个节点ip一个存在超时.ping命令检查发现网络层存在超时
本地ip: 118.145.19.19 【北京电信(bgp)】
api.weixin.qq.com: 121.51.90.217
当域名解析到CAP ip时(121.51.90.217) 会出现丢包。造成微信登录失败。我们的线路是北京bgp,出口为电信出口,正常情况下应该返回电信vip地址,但在测试过程中进程发现偶尔会解析为cap的121.51.90.217地址.
经过dig 和多次ping发现,偶尔解析为121.51.90.217时,加上本地dns缓存,业务就会在2分钟内出现异常.我们尝试使用公共dns,北京当地电信dns发现都会偶发性返回121.51.90.217地址.返回其他的ip都是正常的.
dns返回线路地址不同可能造成路由节点不同,但出现异常的实质是由于机房网络到域名ip之间路由异常造成的。经过路由跟踪,我们发现在某些节点出现高延迟超时的情况,机房反馈机房端网络已经是最优了,是否可以调整路由优化网络呢?或有其他的解决方案呢?
路由跟踪mtr:
[root@java_43 ~]# mtr -rn 121.51.90.217
Start: Mon Jun 21 16:44:11 2021
HOST: java_43 Loss% Snt Last Avg Best Wrst StDev
1.|-- 172.38.100.252 0.0% 10 0.2 0.4 0.2 1.5 0.3
2.|-- 118.145.19.2 0.0% 10 5.0 16.0 3.9 52.6 15.2
3.|-- 10.244.64.145 0.0% 10 0.4 0.7 0.4 1.5 0.0
4.|-- 10.244.246.101 0.0% 10 0.6 0.9 0.5 2.7 0.5
5.|-- 10.244.244.1 0.0% 10 1.1 4.3 1.1 28.5 8.5
6.|-- 10.244.200.33 0.0% 10 1.1 2.1 1.1 6.1 1.4
7.|-- 10.244.253.5 0.0% 10 1.2 1.7 1.2 3.6 0.9
8.|-- 1.202.252.21 0.0% 10 2.3 10.6 2.3 66.5 20.0
9.|-- 219.141.162.217 30.0% 10 2.7 5.4 2.7 10.8 3.4
10.|-- 36.112.241.85 0.0% 10 7.9 4.8 3.3 9.0 1.9
11.|-- 202.97.97.222 70.0% 10 28.0 27.4 26.8 28.0 0.0
12.|-- 101.95.218.214 80.0% 10 25.8 25.9 25.8 26.0 0.0
13.|-- 101.89.240.62 60.0% 10 29.1 27.3 26.2 29.1 1.2
14.|-- 101.227.217.30 0.0% 10 37.2 32.3 28.2 37.2 2.9
15.|-- ??? 100.0 10 0.0 0.0 0.0 0.0 0.0
16.|-- ??? 100.0 10 0.0 0.0 0.0 0.0 0.0
17.|-- ??? 100.0 10 0.0 0.0 0.0 0.0 0.0
18.|-- ??? 100.0 10 0.0 0.0 0.0 0.0 0.0
19.|-- 121.51.90.217 30.0% 10 28.1 28.2 28.1 28.4 0.0
源ip,目的ip:
本地ip: 118.145.19.19 【北京电信(bgp)】
api.weixin.qq.com: 121.51.90.217
帮忙调整路由,或提供其他可靠的方案,修改host终究不是好办法