2025-08-13 14:49:29

为下一次全球技术故障做准备

  

  在网络安全公司CrowdStrike上周五的软件更新导致全球约850万台电脑宕机后,科技行业的领导者们正竞相让Windows系统重新上线,专家们向《首席信息官杂志》(CIO Journal)分享了他们为下一次重大信息技术故障做准备的心得。

  Gartner副总裁尼尔·麦克唐纳(Neil MacDonald)表示,IT领导者应该让供应商在开发、发布质量和保证方面达到“非常高的标准”,并与CrowdStrike等IT系统深度集成。

  他说:“任何安全供应商都有责任在推出更新之前对所有版本的Windows进行广泛的回归测试。”

  这包括要求现有的供应商解释他们是如何编写软件的,他们做了什么测试,以及客户是否可以选择多快推出更新。

  IT自动化和安全公司Infoblox的首席信息官Amy Farrow说:“像这样的事件提醒我们CIO社区的所有人,通过优先考虑部署、测试程序和实践等护栏来确保可用性、可靠性和安全性的重要性。”

  一些首席信息官说,虽然自动接受软件更新已经成为一种常态,也是一种推荐的安全做法,但CrowdStrike的宕机提醒我们要暂停一下。

  “我们仍然应该对软件包、升级和新功能进行全面测试,”软件开发平台制造商JFrog的现场首席信息安全官保罗·戴维斯(Paul Davis)说。虽然测试每一个更新是不可行的,特别是对于多达数百个软件供应商,戴维斯说,他认为根据潜在的严重性和大小来测试软件补丁是一个优先事项。

  自动化,甚至可能是基于人工智能的IT工具,都可以提供帮助。

  人工智能和量子公司SandboxAQ的首席执行官杰克?希达里(Jack Hidary)表示:“人类不太擅长在数千行代码中发现错误。”“我们需要经过训练的人工智能来寻找新软件更新与现有软件堆栈之间的相互依存关系。”

  导致Windows电脑无法使用的事故类似于导致系统离线的自然灾害,Gartner的麦克唐纳说。这就是为什么企业应该考虑自然灾害恢复计划,以保持其运营的弹性。

  星座研究公司(Constellation Research)的网络安全分析师齐拉格·梅塔(Chirag Mehta)表示,一种方法是建立一个“洁净室”,即一个与其他系统隔离的环境,用来让关键系统重新上线。

  Mehta说,企业还应该举行桌面演习来模拟风险情景,包括IT中断和潜在的网络威胁。

  安全公司Qrator Labs的首席商务官维克多?齐姆津(Victor Zyamzin)表示,定期备份数据的公司受CrowdStrike中断的影响可能较小。他说:“对公司的另一个建议是,我们几十年来一直在说,你应该应用一些备份程序,运行并定期测试。”

  MacDonald表示,对于任何对公司运营有重大影响的供应商,公司都可以审查他们的合同,寻找表明供应商必须提供可靠和稳定软件的条款。

  他说:“在这种情况下,你可能会有一个优势,那就是如果更新导致宕机,合同中是否有条款可以涵盖这一点?”

  麦克唐纳补充说,如果不这样做,科技公司的领导者可以争取在续签时以折扣作为一种补偿。

  海恩斯布恩律师事务所(Haynes Boone)专注于网络保险的合伙人彼得?哈尔普林(Peter Halprin)表示,此次宕机还突显出保险在为企业提供抵御网络风险的底线保护方面的重要性。

  Halprin说,这种保险范围可以包括对商业收入损失的保护,例如与中断相关的损失,无论是由被保险公司还是服务提供商造成的。

  CrowdStrike的更新只影响运行微软Windows系统的设备,这引发了企业是否应该依赖Windows电脑的新问题。

  CrowdStrike通过访问内核在Windows设备上运行,内核是操作系统中包含计算机核心功能的部分。梅塔说,这与苹果的Mac操作系统和Linux不同,它们不允许相同级别的访问。

  一些企业已经改用chromebook,这是由alphabet旗下的谷歌(Google)开发的运行Chrome操作系统的简单笔记本电脑。梅赫塔说:“并非所有这些都需要更深入地了解事物。”“你在笔记本电脑上做什么需要Windows操作系统?”

  写信给贝尔林:[email protected]