行业趋势 2026-03-25
算力时代:可靠备用电力如何赋能AI基础设施
算力已成为现代经济的决定性资源。正如石油驱动了工业时代,算力如今驱动着AI时代,而支撑它的基础设施已具有战略重要性。在这一基础设施的根基之下,存在着一种常被忽视直到失效才被关注的资源:可靠的电力。
AI训练工作负载是有史以来功耗最高的计算应用之一。单次大型语言模型训练运行可能在数周的连续运行中消耗数兆瓦时的电力。当此类工作负载因停电而中断时,后果远不止临时停机。未完成的训练运行可能损坏模型状态,导致数天或数周的计算工作损失和重大经济成本。因此,AI基础设施运营商将电力可靠性不视为运营问题,而是核心设计参数。
备用电力系统在AI基础设施中发挥三项基本功能。第一,在市电停电期间提供持续电力,确保训练和推理工作负载不间断运行。第二,在长时间停电发生时支持有序关机程序,保护昂贵的GPU和加速器硬件免受突然断电造成的损坏。第三,在配备现场发电的设施中,备用系统可参与削峰填谷和需求响应计划,降低运营成本。
AI设施对备用电力的技术要求非常严格。发电机组必须能够在10至30秒内启动并达到满载,需要坚固的启动系统和优化的发动机配置。自动转换开关的操作切换时间必须在100毫秒或更短,以防止对UPS系统的干扰。电力调节设备必须处理服务器电源产生的高谐波含量,特别是在部分负载条件下。
对于设备供应商而言,这些要求意味着需要严格的工程设计和测试。SPM的方法包括在出货前对每台发电机组进行满载测试,标准化采用先断后合逻辑的CB级ATS以确保安全,以及经验证作为完整单元的集成电力系统包。随着算力时代继续展开,AI基础设施运营商与电力设备供应商之间的伙伴关系只会越来越重要。