阿里云服务器发生故障阿里云服务器崩溃今天

记一次解决阿里云服务器偶尔连接不上的问题（由tcp_tw_recycle参数引发的）

阿里云服务器偶尔连接不上的问题出现在我做了一些TCP优化之后，出现了公司内网偶尔会出现连接不上服务器的问题，但是切换其他的网络就可以正常连接。

为富阳等地区用户提供了全套网页设计制作服务，及富阳网站建设行业解决方案。主营业务为网站设计、做网站、富阳网站设计，以传统方式定制建设网站，并提供域名空间备案等一条龙服务，秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求，就会得到认可，从而选择与我们长期合作。这样，我们也可以走得更远！

1，登陆服务器查看资源使用top，vmstat等命令查看了一番发现服务器各项指标都没有异常。于是将问题转向了网络层。

2，本地使用ping服务器外网ip正常返回，无丢包，延迟也正常。

3，登录服务器查看tcp相关数据。

发现在卡顿时有大量tcp syn包被丢弃，数值一直在增长。

在查阅资料并结合实际情况后，发现该服务器同时启用了 tcp_timestamps和tcp_tw_recycle参数。

后想起，之前同事为改善time_wait连接数过多问题曾改过该内核参数。

解决办法是，关闭tcp_tw_recycle：

再观察，发现服务已正常，偶尔连接不上的现象消失。

我们先来man一下这两个参数(man tcp)：

cp_timestamp 是 RFC1323 定义的优化选项，主要用于 TCP 连接中 RTT(Round Trip Time) 的计算，开启 tcp_timestamp 有利于系统计算更加准确的 RTT，也就有利于 TCP 性能的提升。（默认开启）

关于tcp_timestamps详情请见：

开启tcp_tw_recycle会启用tcp time_wait的快速回收，这个参数不建议在NAT环境中启用，它会引起相关问题。

tcp_tw_recycle是依赖tcp_timestamps参数的，在一般网络环境中，可能不会有问题，但是在NAT环境中，问题就来了。比如我遇到的这个情况，办公室的外网地址只有一个，所有人访问后台都会通过路由器做SNAT将内网地址映射为公网IP，由于服务端和客户端都启用了tcp_timestamps，因此TCP头部中增加时间戳信息，而在服务器看来，同一客户端的时间戳必然是线性增长的，但是，由于我的客户端网络环境是NAT，因此每台主机的时间戳都是有差异的，在启用tcp_tw_recycle后，一旦有客户端断开连接，服务器可能就会丢弃那些时间戳较小的客户端的SYN包，这也就导致了网站访问极不稳定。

主机A SIP:P1 (时间戳T0) --- Server 主机A断开后

主机B SIP:P1 (时间戳T2) T2 T0 --- Server 丢弃

经过此次故障，告诫我们在处理线上问题时，不能盲目修改参数，一定要经过测试，确认无误后，再应用于生产环境。同时，也要加深对相关内核参数的认识和理解。

本文解决灵感来自于

win10远程连接阿里云window系统服务器时，不能连接，显示出现内部错误，

win10远程连接阿里云window系统服务器时，不能连接，显示出现内部错误是设置错误造成的，解决方法为：

1、登录进入，进入管理控制台，点击图中云服务器ECS。

2、找到需要远程连接的云服务器，进入服务器鼠标点击右侧远程连接选项。

3、弹出登录窗口，输入密码进行登录。

4、如若忘记密码，可回到服务器页面点击右侧密码-选择修改密码。

5、进入登录界面，可以直接用电脑在线连接服务器进行操作管理。

阿里云香港服务器坏了

阿里云香港服务器坏了是温度原因。2020年随着温度继续升高，受影响的阿里云香港服务器停机数量持续增加，客户业务开始受到影响，影响面扩大到香港可用区C的EBS、OSS、RDS等更多云服务，阿里云香港可用区C的故障。

网站名称：阿里云服务器发生故障阿里云服务器崩溃今天
链接分享：http://kswjz.com/article/ddeepjo.html

扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流

阿里云服务器发生故障阿里云服务器崩溃今天

记一次解决阿里云服务器偶尔连接不上的问题（由tcp_tw_recycle参数引发的）

win10远程连接阿里云window系统服务器时，不能连接，显示出现内部错误，

阿里云香港服务器坏了

扫二维码与项目经理沟通

其他资讯

行业动态

企业网站建设的重要性！

服务项目

网站建设

移动端/APP

微信/小程序

技术支持

其它服务

更多服务项目

联系吧在百度地图上找到我们

电话：13518219792

阿里云服务器发生故障 阿里云服务器崩溃今天

记一次解决阿里云服务器偶尔连接不上的问题（由tcp_tw_recycle参数引发的）

win10远程连接阿里云window系统服务器时，不能连接，显示出现内部错误，

阿里云香港服务器坏了

扫二维码与项目经理沟通

其他资讯

行业动态

企业网站建设的重要性！

服务项目

网站建设

移动端/APP

微信/小程序

技术支持

其它服务

更多服务项目

联系吧 在百度地图上找到我们

电话：13518219792

阿里云服务器发生故障阿里云服务器崩溃今天

联系吧在百度地图上找到我们