< 返回
突发史上最大宕机,损失60亿!如何维护服务器?
2021-10-09 10:50
作者:admin
阅读量:608
旗下Facebook、Instagram、WhatsApp、Messenger等网站、应用都出现了响应服务器错误,有约一个小时的时间网站一直无法加载,也无法收发信息。
持续时间刷新了自2008年以来的最长宕机时长,全球35亿用户将近6个小时无法使用这些社交平台。
由于宕机来得猝不及防,规模之大,持续时间之久,不仅让Facebook的股价一度暴跌6% ,扎克伯格个人财富一日蒸发逾60亿美元,更是极大影响了用户的体验。
在网络上一片哀嚎之际,FB总部办公室也情况不妙。有FB员工透露,瘫痪期间,公司内部也“陷入一团乱”,办公电话和接收外部电子邮件都出现问题,员工甚至无法通过办公大楼和会议室的门禁系统。
有人认为 ,这次Facebook发生宕机是因为网站遭到大规模的恶意攻击,但这种说法缺乏证据。
除了恶意攻击外,还有人发现Facebook 的边界网关协议路由(BPG)从服务中被撤回(“withdrawn from the internet”),能够确定DNS(域名解析系统)确实出现了问题。
也有人认为,如果仅仅是DNS有问题,一般3个小时内就能解决,不至于让整个系统奔溃一天。
“脸书”的工程师错误地发出了一条指令,切断了“脸书”的数据中心“在全球范围内的所有网络连接”。
其实,宕机事故并不罕见,但宕机带来的一系列问题,却让人头疼,比如宕机会造成数据中心的业务中断,云端服务中断,进而导致用户无法正常访问应用程序。在严重的情况下,会给企业造成巨大经济损失。
就像是Facebook这样的大平台,遇到宕机问题也需要时间去解决,那么我们日常要如何做好服务器维护,减少宕机现象的发生呢?
在部署重要的应用程序时,要避免将所有程序放在同一个服务器上,可以考虑将不同应用部署在两个或两个以上的服务器,进行资料备份,以便遇到紧急状况随时切换。
想提高服务器的响应能力,可以采用小鸟云服务器,强悍硬件配置结合前沿处理技术,纯SSD架构搭载高速Sas3 SSD固态硬盘,快速响应,高达99.999%的数据持久性,轻松支撑业务负载。
要及时发现宕机问题,例如,是否是应用程序导致内存溢出或者泄露;是否是进程过多或者不断创建,耗尽资源导致;是否是应用程序异常导致;是否是遭受黑客入侵攻击导致;是否是误操作导致等等。服务器宕机时,为了避免造成不必要的损失,要尽早通知服务商解决相关问题。
公司可以根据需求进行部署,适时提高代码部署频率能够更快对出问题的云服务器快速作出响应。