热线电话:+86-020-39199006
Language : 中文版
致力于高品质电源产品的推广与技术服务!

新闻中心

今年数据中心宕机的教训:侧重于基础知识

* 来源: * 作者: * 发表时间: 2020-01-04 0:42:13 * 浏览: 5
尽管对数据中心正常运行时间的新威胁在2018年继续存在,但已知原因导致我们今年看到的大多数数据中心停机。即使对数据中心正常运行时间的新威胁在2018年继续存在,但已知原因已导致我们今年看到的大多数数据中心中断。今年数据中心电源中断的经验教训根据UptimeInstitute今年夏天发布的调查结果,近一个过去一年中,有三分之二的数据中心发生了故障,而去年则为25%。但是,这种增长并不是由于某些致命的新恶意软件引起的。相反,停机的前三位原因是停电(33%),网络故障(30%)和IT或软件错误(28%)。最重要的是,80%的数据中心经理表示,他们最近的停机是可以预防的。无法阻止雷击(例如9月摧毁了圣安东尼奥市Microsoft Azure数据中心的雷击)或零日恶意软件攻击。但是,通过适当的规划和数据中心设计,由于意外的天气事件,攻击,定期的人为错误或未打补丁的系统而造成的中断可以最大程度地减少影响。同样,在中断之后使数据中心快速启动并运行同样重要。根据信息技术情报咨询公司今年的报告,平均每小时的停机时间将使数据中心运营商损失260,000美元,而五分钟的停机时间仅花费2,600美元。基础架构冗余仍然有效。在最基本的级别上,需要备份数据中心系统。备份电源和冷却系统,备份数据,甚至备份整个数据中心。备份工作。据Uptime称,去年有22%的具有2N架构用于冷却和供电的数据中心(换句话说,是一个完全冗余的镜像系统)发生了故障。与选择低成本,非完全冗余的N + 1方法的用户相比,这减少了三分之一的停机时间,并且33%的用户报告了断电。完整的数据中心备份可提供更高的可靠性。据Uptime称,有40%的数据中心经理表示他们在两个或多个站点之间复制工作负载和数据。 SSH Communications Security首席技术官马克·罗西(Marc Rossi)表示:“如果只有一个数据中心,并且遭受雷击,那就很麻烦。” “您应该拥有一个物理上隔离且不依赖于相同能源的辅助数据中心。”他补充说,没有任何一个数据中心能够免受该问题的困扰,这是微软在9月份在美国提到的。南方数据中心。他说:“存在第二种设置,并且故障转移是立即的。”备份无论采用何种备份系统,计划和测试都是关键。 Rossi补充说,规划需要考虑当今数据中心的复杂性,因为这些问题可能引发其他问题。他以物理维护期间最近的GitHub故障为例。他说:“他们在数分钟内解决了物理问题,但数据需要24小时才能正确同步。”数据中心经理需要确定潜在的问题区域,然后在事情发生时准备好工具和流程。罗西说:“专注于建立流程和建立为失败做准备所需的心态。”加强中心不仅是数据中心经理应从最近与恶意软件相关的停机中学习的经验教训之一。即,仅具有坚固的周边是不够的。今年,医疗保健公司,政府机构,教育机构和主要制造商受到打击,尽管在去年破纪录的违规事件发生后,每个人都应该保持高度戒备。显然,维护防御措施以防止恶意软件首先进入至关重要。但是,数据中心经理必须做好准备,以确保其外围防御失败并具有二级保护。这些措施包括恶意流量检测机制,网络防御(例如分段),权限访问和通信方法。位于以色列的网络安全公司GuardiCore的产品管理总监格尔·伊格尔·利夫茨(Gel Igel Liftz)表示,这些措施有助于防止恶意软件在进入网络后扩散。网络,或者至少放慢速度,使安全团队有机会做出响应。 AnnaWannaCry特别利用了服务器消息块传输协议中的漏洞。他说,数据中心应采取更多措施以减少横向通信。 “在过去的一年中,在许多WannaCy勒索软件案例中,造成广泛攻击的主要原因是这些蠕虫病毒会在数据中心立足,它们很容易传播。” Lifts说。 “实际上,服务器之间的SMB通信完全没有必要。如果将其阻止,攻击的传播和对数据中心的破坏可能会大大减少,并且在早期的早期阶段就可以检测到攻击造成了如此大量的危害。 “从今年的违规事件中得到的重要教训并不是数据中心经理必须防范的新威胁。他们需要回归基础。 UptimeInstitute研究执行总监安迪·劳伦斯(Andy Lawrence)在6月的报告中写道,几乎所有数据中心的中断都是由于规划和投资决策不力,再加上流程不佳或无法遵循流程。 “ Uptime Institute报告或研究的几乎所有故障都是以前发生的,并且通常已得到充分记录。”雷电袭击和新恶意软件可能成为所有头条新闻,但就韧性而言,它仍然是最重要的基础知识。