RISC-V冲入服务器CPU核心赛场,玄铁C950定义高性能标杆
导语:RISC-V比Arm到底好在哪?
作者|包永刚
七年前,RISC-V能否进入高性能计算仍充满争议,今天这一问题正在被重新回答。
2026年,达摩院在2026年玄铁生态大会发布新一代旗舰CPU IP——C950,再次突破RISC-V性能的天花板,在SPECint2006基准测试中突破70分,这款全球最强RISC-V CPU,具备与x86和Arm在服务器CPU主赛场竞争的能力。
从C930跨过服务器CPU性能的门槛,到C950进入主流服务器CPU性能区间,RISC-V不仅回应了曾经的质疑,也开始真正进入高性能CPU主赛场。
中国工程院院士倪光南在玄铁生态大会演讲中说:“RISC-V诞生十五年来走出了一条令人惊叹的高速发展之路,正从‘备选’迅速地走向‘主流’。”
突破RISC-V的性能天花板只是起点,在补齐通用计算能力之后,RISC-V试图以可定制化能力迎接AI Agent的时代机遇,在标准化计算之外打开增量空间。
达摩院的新品恰逢其时,玄铁C950的处理器首次原生支持Qwen3-235B-A22B与DeepSeek V3-671B这样的千亿参数大模型。
“想要把IP变成落地的产品,最重要的是生态的繁荣。”达摩院首席科学家孟建熠强调生态的重要性,也试着回答RISC-V相比Arm的优势到底在哪的灵魂拷问。
答案的核心并不复杂,想要在存量市场做替代,就需要更高的性价比,想要抓住增量市场,就要充分发挥RISC-V可定制化的优势,满足包括AI Agent在内应用的需求。
这意味着当性能上限被抬高之后,RISC-V的核心问题转变为:如何让生态飞轮转起来?
首次原生支持千亿参数模型,RISC-V冲入高性能CPU主赛场
RISC-V突破性能天花板的进程,并非一条上升的直线。
从2019年推出SPECint2006 7分/GHz的玄铁C910,到2025年推出能够对标Arm N2 的SPECint2006 15分/GH的玄铁C930,间隔了6年时间。
“我们推出玄铁C910就是要把RISC-V往高性能的方向牵引,那时候我们就想做服务器,可是非常艰难,因为RISC-V没有高端软件生态。”孟建熠说,“我们不得不花几年先把端侧的软件生态做起来。”
RISC-V在端侧的软件生态逐步完善之后,玄铁团就带着RISC-V冲向了服务器CPU这个金字塔尖的市场。并且,从玄铁C930跨过服务器CPU门槛,到玄铁C950的性能进入主流服务器市场,仅间隔了一年时间。
“从立项到具备商业化能力,我们花了两年时间打磨玄铁C950。对我们来说这是一个不小的挑战。”孟建熠感触很深,“要推出有竞争力的高性能RISC-V IP,性能、功耗、面积的优化本身就是挑战,玄铁的研发团队花了很大的精力,同时为了满足服务器对高稳定性和高可靠性的要求,在RISC-V还没有可靠性标准时,我们面临着更大挑战。”
克服重重困难之后,从玄铁C910到玄铁C950,玄铁完成了RISC-V在高性能市场从验证可能性到进入主赛场的跨越,也树立了高性能的标杆。
玄铁C950采用8指令译码、16级流水线、超1000条指令乱序窗口,在5nm制程下的单核性能超过22/GHz,最高主频达3.2GHz,在SPECint2006基准测试中总分突破70分。这意味着,在传统由x86和Arm主导的高性能CPU市场中(如英特尔至强6、AMD Zen5、Arm NeoverseV2),RISC-V首次拥有了可以正面对标的产品。
经过软硬件协同优化,在MySQL、Redis、Nginx等服务器经典工作负载下,玄铁C950各性能指标跻身行业第一梯队,发挥RISC-V的定制化优势,软硬件协同优化后,云存储、云网络性能更能提升30%以上。
从基准测试到真实负载表现,RISC-V高性能处理器在达摩院玄铁的持续投入下,终于坐上了高性能CPU的主桌,也撞上个人AI和物理AI的时代机遇。
在AI训练主导的时代,CPU的价值被GPU弱化。但如今进入AI Agent时代,GPU之王英伟达GTC 2026推出为AI优化的CPU,宣告了CPU不再是GPU配角,而是AI Agent时代重新定义的核心组件。
在Agent负载中,CPU不仅承担调度角色,还需要处理通用计算与加速计算的融合,这对架构提出了新的要求,这正是C950设计的核心方向。
凭借AI原生的Vector加速引擎和Matrix加速引擎,玄铁C950的单核FP4算力突破 8TFLOP,加上配置4096-bit超大位宽Tensor Cache,通用高性能算力与AI算力融合,强力提升矩阵算力兑付率,在业界首次基于RISC-V顺利运行Qwen3-235B-A22B与DeepSeek V3-671B大模型,首Token延迟分别为3.4s和1.7s,输出速度分别为34 Tokens/s和18 Tokens/s。
在RISC-V架构上首次原生支持千亿参数模型,拥有不影响使用体验的性能,这一结果最重要的意义不在于性能本身,而在于RISC-V开始具备承载主流大模型推理负载的能力边界。
“玄铁C950支持千亿参数大模型,对于需要本地低成本部署的场景和可以而言是一种选择,合作伙伴进一步优化之后可以达到更高性能。”孟建熠指出。
除了推出面向AI Agent的RISC-V性能标杆玄铁C950,达摩院在玄铁生态大会上还推出了高能效CPU IP玄铁C925,单核性能超过12/GHz,能效比大幅提升,面积大幅减少。
去年发布的玄铁C930的性能在过去一年也被进一步优化,从发布时的单核性能超过15/GHz提升到17/GHz,C925、C925、C950分别代表极致性能、全面均衡与超高能效,是玄铁面向服务器及AI市场的三张牌。
孟建熠向雷峰网(公众号:雷峰网)透露,服务器高性能系列的CPU计划按照每两年一代的节奏更新。
如果再加上玄铁已经发布的C系列、E系列、R系,达摩院已经拥有覆盖从嵌入式到MCU、从端侧到云端,3个系列15款 CPU IP,是为数不多拥有完整RISC-V全家桶IP的公司,2026玄铁生态大会上近50个应用也展示着玄铁产品的丰富程度。
要将完整的CPU IP产品组合转化为最终落地的产品和商业上的成功,生态成为关键。
RISC-V生态飞轮转起来的硬实力和软动力
“生态建设有两个关键,第一个是有足够好的产品能让客户使用,第二就是做好基础软件生态,给最终应用有创新的基础。”孟建熠认为,“要让RISC-V的生态飞轮飞起来,需要有足够多有竞争力的通用RISC-V芯片,至少得有上百颗这样的芯片,RISC-V的飞轮才能飞起来。”
一旦有竞争力的芯片、基础软件生态、应用形成一个正向循环的飞轮,RISC-V的生态就会像滚雪球一样加速繁荣,达摩院已经运行起了这样硬实力+软动力的循环。
2019年推出玄铁C910后,玄铁团队花了大量的精力和资源去做各种操作系统的适配,包括Android、openKylin、openEuler、OpenAnolis等超过十个操作系统和6500+中间件,为C910支撑RISC-V笔记本电脑的稳定运行,以及让欧洲云服务商Scaleway对外提供云实力提供了保障。
这一阶段的核心意义在于,让RISC-V从能运行走向可使用,为后续高性能计算打下基础,玄铁C920也是关键一环。
玄铁的一个合作伙伴基于玄铁C920推出了64核的服务器,使用这一服务器,某巨头公司在向RISC-V移植软件的过程中,发现运行大型软件性能还是不够,于是推着玄铁团队再次突破RISC-V的性能瓶颈,C9
