微软和 Meta 与谷歌一起使用人工智能来帮助运行他们的数据中心

凯尔威格斯 来源:凯尔威格斯
导读 数据中心驱动着数十亿人每天使用的应用程序、网站和服务,对于构建和维护这些数据中心的工作人员来说可能是危险的地方。工作人员有时必须在数据中心通电时维修其电气设备。他们可能会

机架中的服务器

数据中心驱动着数十亿人每天使用的应用程序、网站和服务,对于构建和维护这些数据中心的工作人员来说可能是危险的地方。工作人员有时必须在数据中心通电时维修其电气设备。他们可能会接触到氯等化学物质,氯被用作通过计算机和服务器的液体冷却系统循环的水的消毒剂。2015 年 6 月,在北卡罗来纳州梅登的一家 Apple 数据中心发生氯气泄漏后,五人不得不被送往医院。

数据中心比以前更安全。但为了寻找前瞻性解决方案,一些科技巨头表示,他们正在探索如何应用人工智能来预防安全问题。例如,微软正在开发一种人工智能系统,该系统可以分析来自各种来源的数据,并为数据中心建设和运营团队生成警报,以“预防或减轻安全事件的影响”。一个互补但相关的系统也在开发中,试图检测和预测对数据中心建设计划的影响。

“这些举措都处于早期测试阶段,预计将在今年晚些时候开始扩展到我们的生产环境,”微软发言人通过电子邮件告诉 TechCrunch。

Meta 还声称正在研究人工智能如何预测其数据中心将如何在可能导致不安全工作环境的“极端环境条件”下运行。该公司表示,它一直在开发物理模型来模拟极端条件,并将这些数据引入负责优化服务器功耗、冷却和气流的 AI 模型。

Meta 发言人告诉 TechCrunch:“我们的数据中心拥有大量运营数据,在某些区域,服务器、机架和数据大厅中内置传感器的频率很高。”“每台服务器和网络设备承担不同的工作负载,将消耗不同的电量,产生不同的热量,并在数据中心产生不同数量的气流。我们的 [基础设施] 团队从每台服务器收集所有数据,然后开发 AI 模型,该模型可以在数据中心分配我们的服务器和机架,并将工作负载发送到这些服务器以优化 [for] 性能和效率。”

当然,除了安全之外,公司还有其他动机来确保数据中心保持在最佳状态。停电代价高昂——而且越来越频繁。根据 IT 咨询公司 IT Uptime Institute 2020 年的一项调查,三分之一的数据中心所有者和运营商承认在过去 12 个月中经历了一次重大中断。六分之一的人声称他们的停电损失超过 100 万美元,高于 2019 年的十分之一。

Meta 在全球运营着 20 多个数据中心,其中包括德克萨斯州和密苏里州的新项目,估计总成本为 16 亿美元。与此同时,微软管理着 200 多个数据中心,并表示在可预见的未来,它每年将建设 50 到 100 个新数据中心。

人工智能还承诺在通常不为人知的数据中心中寻找能源节省机会,从而节省成本,这对企业来说是另一个吸引人的方面。2018 年,谷歌声称其DeepMind 附属公司开发的人工智能系统与其数据中心的历史能源使用量相比,平均能够节省 30% 的能源。

当联系到 DeepMind 发表评论时,DeepMind 表示,除了最初的公告之外,它没有任何更新可以分享。IBM 和亚马逊没有回应询问。但 Meta 和微软都表示,他们现在正在使用 AI 进行类似的能量调整。

微软于 2021 年底推出了人工智能“异常检测方法”,使用来自电气和机械设备的遥测数据来衡量和缓解数据中心内的异常电力和用水事件。该公司还使用基于人工智能的方法来识别和修复数据中心电表的问题,并确定放置服务器的理想位置,以最大限度地减少电力、网络和冷却能力的浪费。

Meta 方面表示,它一直在利用强化学习来减少为了冷却目的而泵入数据中心的空气量。(在高层次上,强化学习是一种通过反复试验来学习解决问题的人工智能系统。)公司的大多数数据中心都使用室外空气和蒸发冷却系统,因此优化气流是重中之重。

减少环境足迹是能量调节人工智能系统的额外好处。根据环境调查局的一份报告,数据中心消耗了全球约 1% 的电力需求,并贡献了 2020 年所有二氧化碳排放量的 0.3% 。而典型的数据中心每天使用 300 万到 500 万加仑的水,相当于一个 30,000 到 50,000 人的城市的用水量。

微软此前曾表示,它计划到 2025 年使其所有数据中心都使用 100% 可再生能源运行。Meta 声称在 2020 年实现了这一壮举。

标签:

免责声明:本文由用户上传,如有侵权请联系本网删除!