2026年6月,IDC与Gartner联合发布的最新季度报告勾勒了一幅全球AI算力竞赛的壮阔图景——2026年全球AI服务器出货量预计将达到980万台,较2025年的680万台同比增长44%。这组数据意味着AI算力基础设施的建设正在进入一个前所未有的加速期。其中用于大模型训练与推理的高端GPU/NPU服务器占比从2025年的37%跃升至超过50%,标志着"算力饥渴"已经从实验室蔓延到了生产环境。
2026年的全球AI服务器市场呈现出几个鲜明的特征。首先是"头部集中"效应——排名前五的厂商(英伟达、华为、超微电脑、戴尔和联想)占据了约80%的市场份额。英伟达仍然在训练服务器市场占据主导地位,但在推理服务器市场,华为昇腾和其他国产服务器厂商的份额正在快速提升。
第二个特征是"定制化"趋势的加速——越来越多的互联网大厂和云服务商选择定制开发的AI服务器而非标准产品。定制服务器可以针对特定的模型架构、应用场景和能效要求进行优化,在总体拥有成本方面可能比标准产品节省20%至30%。据Gartner估算,2026年定制AI服务器的占比将达到25%,2027年将进一步提升至35%。
报告提出了一个重要概念——"T级吞吐分水岭"。所谓T级吞吐,指的是AI服务器在处理大规模模型推理时的吞吐量达到每秒1万亿次操作(1 TeraOps)以上。达到这一水平的AI服务器被认为是进入了"高效率时代",而未达到的服务器则在处理前沿AI模型时力不从心。
980万台AI服务器消耗的算力到底去了哪里?报告对算力的消费结构进行了深入分析。在训练端,2026年全球前十大AI大模型训练项目消耗的算力约占全球训练算力总量的35%。其中,训练一个千亿参数模型所需的算力约为5000至10000 PetaFLOPs-day。在推理端,算力消耗的分布更加广泛——约40%用于在线推理服务(如ChatGPT、搜索引擎、推荐系统)、约35%用于企业级推理应用(如智能客服、代码补全、文档分析)和约25%用于科学计算和边缘推理。
在980万台的全球出货量中,中国市场预计将贡献约280万台(约28.6%)。中国AI算力市场呈现出独特的"双轨制"格局——一部分企业和机构使用进口高端GPU(英伟达H100/B100),另一部分则转向国产AI芯片方案。2026年上半年,纯国产AI服务器的出货占比已从2025年的约25%提升至约40%,增速明显快于进口服务器。
报告最后指出,AI算力竞争正在从"规模竞争"走向"效率竞争"。仅仅拥有更多的GPU或NPU已经不足以建立竞争优势,真正的胜负手在于"单位算力的产出效率"——同样花费1美元电费,谁的AI模型训练得更快、推理得更多、精度更高。据测算,在训练效率方面,通过优化的软件栈和架构设计,最佳实践与行业平均水平之间的差距可达到3倍以上。
报告最后强调,AI算力竞争正在从"规模竞争"走向"效率竞争"。仅仅拥有更多的GPU或NPU已经不足以建立竞争优势,真正的胜负手在于"单位算力的产出效率"——同样花费1美元电费,谁的AI模型训练得更快、推理得更多、精度更高。据测算,在训练效率方面,通过优化的软件栈和架构设计,最佳实践与行业平均水平之间的差距可达到3倍以上。这意味着在算力投资总额相近的情况下,效率更高的企业可以获得3倍以上的AI能力优势。因此,算力效率优化——包括模型架构优化、推理加速技术和训练流程自动化——将成为2026年下半年至2027年AI基础设施领域的核心竞争赛道。