新闻公告使用手机扫一扫查看
< 返回

突发史上最大宕机,损失60亿!如何维护服务器?

2021-10-09 10:50 作者:admin 阅读量:608

 

近日,Facebook又宕机了。
 
旗下Facebook、Instagram、WhatsApp、Messenger等网站、应用都出现了响应服务器错误,有约一个小时的时间网站一直无法加载,也无法收发信息。
 

 

持续时间刷新了自2008年以来的最长宕机时长,全球35亿用户将近6个小时无法使用这些社交平台。
 
由于宕机来得猝不及防,规模之大,持续时间之久,不仅让Facebook的股价一度暴跌6% ,扎克伯格个人财富一日蒸发逾60亿美元,更是极大影响了用户的体验。
 

 

 
在网络上一片哀嚎之际,FB总部办公室也情况不妙。有FB员工透露,瘫痪期间,公司内部也“陷入一团乱”,办公电话和接收外部电子邮件都出现问题,员工甚至无法通过办公大楼和会议室的门禁系统。
 

Facebook全球宕机

原因扑朔迷离

 

遭遇恶意攻击?

有人认为 ,这次Facebook发生宕机是因为网站遭到大规模的恶意攻击,但这种说法缺乏证据。
 

DNS问题?

除了恶意攻击外,还有人发现Facebook 的边界网关协议路由(BPG)从服务中被撤回(“withdrawn from the internet”),能够确定DNS(域名解析系统)确实出现了问题。
 
也有人认为,如果仅仅是DNS有问题,一般3个小时内就能解决,不至于让整个系统奔溃一天。
 

官方正式回应

 
“脸书”的工程师错误地发出了一条指令,切断了“脸书”的数据中心“在全球范围内的所有网络连接”。

 

 

其实,宕机事故并不罕见,但宕机带来的一系列问题,却让人头疼,比如宕机会造成数据中心的业务中断,云端服务中断,进而导致用户无法正常访问应用程序。在严重的情况下,会给企业造成巨大经济损失。
 

如何减少服务器宕机?

 
就像是Facebook这样的大平台,遇到宕机问题也需要时间去解决,那么我们日常要如何做好服务器维护,减少宕机现象的发生呢

1.提高服务器性能,分散风险

在部署重要的应用程序时,要避免将所有程序放在同一个服务器上,可以考虑将不同应用部署在两个或两个以上的服务器,进行资料备份,以便遇到紧急状况随时切换。
 
想提高服务器的响应能力,可以采用小鸟云服务器,强悍硬件配置结合前沿处理技术,纯SSD架构搭载高速Sas3 SSD固态硬盘,快速响应,高达99.999%的数据持久性,轻松支撑业务负载。
 

2.及时发现服务器宕机,寻找原因


要及时发现宕机问题,例如,是否是应用程序导致内存溢出或者泄露;是否是进程过多或者不断创建,耗尽资源导致;是否是应用程序异常导致;是否是遭受黑客入侵攻击导致;是否是误操作导致等等。服务器宕机时,为了避免造成不必要的损失,要尽早通知服务商解决相关问题。

3.提高代码部署频率,快速响应

公司可以根据需求进行部署,适时提高代码部署频率能够更快对出问题的云服务器快速作出响应。
 

4.提高人员意识,做好管理

联系我们
返回顶部