阿里达摩院发布玄铁最高性能处理器,DeepSeek开启开源算力架构新纪元?

文章正文
发布时间:2025-03-03 14:04

在 DeepSeek 这一开源模型火爆 " 出圈 " 的同时,RISC-V 这一 " 开源指令集架构 " 也迎来了全新发展机会。

" 这一新平衡点对 RISC-V 而言,我认为是一个非常好的机会。" 阿里巴巴达摩院资深技术专家李春强向《每日经济新闻》记者表示,DeepSeek 在 MoE(混合专家模型)上的创新,让算力需求得到了明显下降," 使得整个芯片设计,包括计算能力、存储容量、芯片间的互联通信以及存储带宽等有一个新的平衡点 "。

2 月 28 日,在阿里巴巴达摩院举办的 2025 玄铁 RISC-V 生态大会上,达摩院宣布玄铁最高性能处理器 C930 即将在 3 月开启交付。C930 通用算力性能达到 SPECint2006(SPEC 组织推出的一种评估软件)基准测试 15/GHz(吉赫兹),面向服务器级高性能应用场景。

此外,C930 搭载 512 bits RVV1.0 和 8 TOPS Matrix 双引擎,将通用高性能算力与 AI(人工智能)算力原生结合,并开放 DSA(特定领域架构)扩展接口以支持更多特性要求。

《每日经济新闻》记者了解到,目前,玄铁团队推动了超过 30% 的 RISC-V 高性能处理器落地应用,加速 RISC-V 在各个高端领域的渗透。中国工程院院士倪光南对此表示,这种务实的投入和创新,正是 RISC-V 生态健康发展的重要驱动力。

锚定 " 高性能 +AI",玄铁最高性能处理器登场

2010 年,加州大学伯克利分校的科研团队在调研了 x86(英特尔公司开发的一种复杂指令集架构),ARM(英国 ARM 公司设计的一种精简指令集架构)等现有指令集后,设计、研发了 RISC-V 指令集,并宣布对外开源。

一位芯片从业者在接受《每日经济新闻》记者采访时表示,RISC-V 在成本上有优势,很灵活、可塑性强," 比较适合轻量级的项目,大工程上用得较少,因为大工程需要成熟的模块 "。

作为国内最早涉足 RISC-V 的技术团队之一,达摩院的玄铁团队宣布其首款服务器级处理器 C930 即将在 3 月开启交付。

据介绍,C930 通用算力性能达到 SPECint2006 基准测试 15/GHz,面向服务器级高性能应用场景。倪光南在会上指出,要真正进入数据中心和高性能计算市场,RISC-V 以 SPECint2006 软件测试,必须跑出超过 15 分的高性能标准。

此外,C930 搭载 512 bits RVV1.0 和 8 TOPS Matrix 双引擎,将通用高性能算力与 AI 算力原生结合,并开放 DSA 扩展接口以支持更多特性要求。

同时,达摩院披露了 C908X、R908A、XL200 等玄铁处理器家族新成员的研发计划,向 AI 加速、车载、高速互联等方向持续演进。具体而言,C908X 定位为玄铁首款 AI 专用处理器,支持 4096 bits 超长数据位宽 RVV1.0 矢量扩展;R908A 面向车规级芯片的高可靠需求;XL200 则将提供更大规模、更高性能的多簇一致性互联。

配合玄铁处理器的能力拓展,达摩院基于三套主流操作系统(Linux、Android、RTOS)推出了三套玄铁 SDK(软件开发工具包),将多年来积淀的玄铁软件能力全面整合,以更完整、便捷、稳定的方式向行业输出。其中,玄铁 Linux SDK 提供包括 Hypervisor(虚拟机监视器)虚拟化、CoVE 安全框架(基于机密虚拟化环境的安全架构)、玄铁 AI 框架、高性能算子库在内的丰富子系统,助力 RISC-V 在高性能和 AI 场景的开发。

" 我们很早就看到了 RISC-V 在嵌入式物联网方向有比较好的基础,以及国际对于 RISC-V 高性能的标准规范、RVA23 组件都越来越成熟,所以我们早就在高性能和 AI 方向上做了更多的技术储备。" 谈及 C930 的发布,李春强表示,在软件生态和芯片维度上,玄铁团队都在与业内伙伴合作联动," 我们还是会持续在高性能和 AI 方面做更多的事情 "。

DeepSeek 开启开源算力架构新纪元?

DeepSeek 的出现给全球算力格局带来了新的可能性,通过 MoE(混合专家模型)架构的创新让激活参数比大幅下降,使得同等效果的大模型所需的算力明显下降。

"DeepSeek 出来之前,大模型在算力方面的需求量是极其大的,全世界真正能运行 671B 这种参数模型的处理器,大家可以看到的只有英伟达。" 阿里云无影事业部总裁张献涛向《每日经济新闻》记者表示,DeepSeek 的出现给了更多芯片机会,"671B 的模型,在处理每个问题时,被调用激活的专家模型参数仅约 37B,算力需求起码降低到原来的约二十分之一 "。

那么,AI 时代中,什么样的算力架构才是最为适配的?

大会现场,瑞士苏黎世联邦理工学院教授 Luca Benini 通过视频连线表示,RISC-V 正是 AI 时代所需要的开源架构。

知合计算 CEO(首席执行官)孟建熠在接受采访时谈及,大模型对于每一个算力架构都是机会," 不是说只对 RISC-V 有机会,今天就看谁能够在这个架构里面演进得最快,我认为 X86、ARM 也在演进⋯⋯但是 RISC-V 可以做得更快,我觉得 RISC-V 就是在‘快’上面有更好的优势 "。

同时,中国科学院软件所 RISC-V 行业生态负责人郭松柳介绍称,基于玄铁 C920 处理器的 AI PC 概念机已经跑通 Llama、Qwen、DeepSeek 等开源模型,打通从开源硬件架构到开源操作系统、再到开源 AI 模型的 " 开源 AI 全链路 ",单位计算能耗降低 30%。

"AI 软件栈仍在高速演进,RISC-V 作为三大主流指令集架构中最灵活、最开放的一个,无疑最适合 AI 时代的技术创新节奏。" 他表示。

在接受《每日经济新闻》记者采访时,郭松柳表示,这一概念机可以跑一个 7B 的 DeepSeek 的大模型,可以用来做编程助手,同时还具备多模态能力,例如实现文生图、图像修改等," 未来,生态伙伴也可以将它作为参考设计来进行裁剪或面向领域内做定制,我认为这是未来 RISC-V 面向高性能落地的机遇 "。

同时,他也指出,RISC-V 和 AI 的结合目前仍有问题存在," 各个厂商和企业所做的芯片、系统,虽然有一个统一的规范和标准,但是大家的拓展指令和芯片的实现还有很多的不同。在这种情况下,技术软件应该去发挥更大的作用,向一个主线去收敛,未来让应用软件的开发者和系统的搭建者能够更加方便,节省大家的软件和系统研发的成本 "。