全球AI算力军备竞赛进入T级吞吐分水岭：980万台服务器改变产业格局-AI资讯-广州文趣文化传播有限公司

全部 AI大厂大模型 AI智能体 AI绘画 AI视频 AI音乐 AI硬件泛AI领域

0:00

定时

2026年6月，IDC与Gartner联合发布的最新季度报告勾勒了一幅全球AI算力竞赛的壮阔图景——2026年全球AI服务器出货量预计将达到980万台，较2025年的680万台同比增长44%。这组数据意味着AI算力基础设施的建设正在进入一个前所未有的加速期。其中用于大模型训练与推理的高端GPU/NPU服务器占比从2025年的37%跃升至超过50%，标志着"算力饥渴"已经从实验室蔓延到了生产环境。

全球AI算力市场概况

2026年的全球AI服务器市场呈现出几个鲜明的特征。首先是"头部集中"效应——排名前五的厂商（英伟达、华为、超微电脑、戴尔和联想）占据了约80%的市场份额。英伟达仍然在训练服务器市场占据主导地位，但在推理服务器市场，华为昇腾和其他国产服务器厂商的份额正在快速提升。

第二个特征是"定制化"趋势的加速——越来越多的互联网大厂和云服务商选择定制开发的AI服务器而非标准产品。定制服务器可以针对特定的模型架构、应用场景和能效要求进行优化，在总体拥有成本方面可能比标准产品节省20%至30%。据Gartner估算，2026年定制AI服务器的占比将达到25%，2027年将进一步提升至35%。

T级吞吐：AI服务器的新基准

报告提出了一个重要概念——"T级吞吐分水岭"。所谓T级吞吐，指的是AI服务器在处理大规模模型推理时的吞吐量达到每秒1万亿次操作（1 TeraOps）以上。达到这一水平的AI服务器被认为是进入了"高效率时代"，而未达到的服务器则在处理前沿AI模型时力不从心。

算力消耗的去向分析

980万台AI服务器消耗的算力到底去了哪里？报告对算力的消费结构进行了深入分析。在训练端，2026年全球前十大AI大模型训练项目消耗的算力约占全球训练算力总量的35%。其中，训练一个千亿参数模型所需的算力约为5000至10000 PetaFLOPs-day。在推理端，算力消耗的分布更加广泛——约40%用于在线推理服务（如ChatGPT、搜索引擎、推荐系统）、约35%用于企业级推理应用（如智能客服、代码补全、文档分析）和约25%用于科学计算和边缘推理。

中国AI算力市场的独特格局

在980万台的全球出货量中，中国市场预计将贡献约280万台（约28.6%）。中国AI算力市场呈现出独特的"双轨制"格局——一部分企业和机构使用进口高端GPU（英伟达H100/B100），另一部分则转向国产AI芯片方案。2026年上半年，纯国产AI服务器的出货占比已从2025年的约25%提升至约40%，增速明显快于进口服务器。

算力效率竞争将成为新战场

报告最后指出，AI算力竞争正在从"规模竞争"走向"效率竞争"。仅仅拥有更多的GPU或NPU已经不足以建立竞争优势，真正的胜负手在于"单位算力的产出效率"——同样花费1美元电费，谁的AI模型训练得更快、推理得更多、精度更高。据测算，在训练效率方面，通过优化的软件栈和架构设计，最佳实践与行业平均水平之间的差距可达到3倍以上。

报告最后强调，AI算力竞争正在从"规模竞争"走向"效率竞争"。仅仅拥有更多的GPU或NPU已经不足以建立竞争优势，真正的胜负手在于"单位算力的产出效率"——同样花费1美元电费，谁的AI模型训练得更快、推理得更多、精度更高。据测算，在训练效率方面，通过优化的软件栈和架构设计，最佳实践与行业平均水平之间的差距可达到3倍以上。这意味着在算力投资总额相近的情况下，效率更高的企业可以获得3倍以上的AI能力优势。因此，算力效率优化——包括模型架构优化、推理加速技术和训练流程自动化——将成为2026年下半年至2027年AI基础设施领域的核心竞争赛道。

来源：IDC、Gartner、搜狐科技发布时间：2026-06-28

←字节跳动与天数智芯洽谈采购5万颗AI芯片，国产推理加速替代英伟达

2026南京软件大会开幕：AI引领软件产业数智化变革划定新起跑线→