发布日期:2026-04-01 19:01 点击次数:83

12月20日,摩尔线程首届MUSA开采者大会(简称:MDC 2025)在北京开幕,中国工程院院士、清华大学计议机系汲引郑纬民发表《中国主权的AI计议引擎构建考虑,以国产GPU为代表的自主可控旅途不雅察》主旨演讲。
他说,以前很长一段时候,作念芯片是全球化单干的,有东说念主作念架构考虑,有东说念主作念成就制造,有东说念主作念代工,有东说念主作念封装,各个国度、各个地区进行全球单干,当今则讲主权AI。主权AI以前是学术征询,当今酿成每个国度必须回话的实践问题。本日,他共享了5个点本体。
第一,主权AI有三大支柱:算力自主、算法自立、生态自立。这三个方面互为前提,相互拘谨,共同组成主权AI的系统工程框架。
算力自主,这是物理层的安全底座,它有三个条件:一是芯片考虑智商要自主;二是制造与供应链风险要可控;三是系统与集群托福智商要强。
算法自立,针对GPU来说,能作念大模子适配,能作念大模子磨真金不怕火,能让模子优化。
生态自立,某种流程上比前两个更蹙迫,即要从“能跑”到“欢跃用”。不是说芯片跑一个软件就不错,要以开采者为主,生态厂家要作念,用芯片的东说念主更蹙迫。
第二,构建AI+3D+HPC架构。物理AI与宇宙模子需要什么样的芯片,不错分三个方面本体:支抓AI,作念3D,作念HPC。作念GPU一定要得志这三件事情,需要完满图形活水线,还有张量计议中枢支抓AI,OD体育(中国)高精度浮点单位支抓HPC。
他说,摩尔线程的国产全功能GPU是代表性案例,将这三个方面蚁集在一块,一个芯片就能完成,“AI+3D+HPC”一体化系统集成,包括AI开动的新一代渲染平台,宇宙模子的3D数据基础法度,以及宇宙模子/数字孪生、工业仿真+AI优化、视频生成与及时交互等愚弄场景。
第三,从单卡到万卡集群。国产的万卡乃至十万卡系统,非凡难,不是说把十万个卡放在一块通上电就行了,要作念到可用、好用非凡难。
“为什么要十万卡系统呢?”郑纬民回话说,因为算力是基石。作念模子磨真金不怕火,作念许多事情需要大算力,需要万卡、十万卡系统,这是必选项。作念万卡、十万卡有几件事情很难:互联网罗与拓扑,要可靠性与运维,斗鱼体育app中国官网下载十万卡连在一块,平均一个小时要出一次错,十万个卡内部有一个卡一个小时、两个小时要出错,统共系统弗成停驻来,出错了怎么连接磨真金不怕火下去?能耗与供电散热,十万卡是一个大火炉,电要供得上,散热作念得好。国产集群第一步要作念到能用,以后作念到好用。
第四,开采者与类CUDA生态。真确决定主权AI成败的,在于是否有糟践多的开采者欢跃恒久在这套栈上写代码。开采者是生态的中枢,不是厂家,厂家需要与开采者一块奋力把生态作念好。
郑纬民说,国产平台需要措置的问题:迁徙本钱太高,蓝本全球基于英伟达的法度,怎么迁徙到国产的;器具链不太老到,要把它用老到;社区也要作念得好,倡导是从“能用”到“好用”到“欢跃用”,开采者体验好,用户就心爱用。能用了,这是第一步。第二步他欢跃用,这件事情很蹙迫。摩尔线程MUSA便是同样于CUDA生态的国产施行。
“开源非凡蹙迫,咱们要尽可能开源,许多东说念主用了以后建议问题反映给你,让更多的学生、开采者低本钱使用。”郑纬民说,后CUDA时间,模子使用者依然是“使用开源技俩”,而不是“使用CUDA”。生态自立的一个实践旅途,是让国产平台成为开源改革的一个遴荐,要拥抱开源。
郑纬民举两个例子,清华大学团队作念了两件事,一个是作念了Mooncake,它是在推理中以KVCache为中心的大模子推理架构,能使硬件省许多,况且是开源的。第二个例子是KTransformers。当今大无数推理系统都有许多卡,把CPU和GPU搀杂用,一块卡、一块CPU把DeepSeek满血版装上,亦然开源的。
第五,产业协同,从碎屑化走向协力。刻下,面对内卷与碎屑化问题,比如不同的厂家提供不同的接口,要作念不同的适配。要闪开采者责任量减少,不同芯片、不同系统最佳是一套东西,产业定约与软硬件协同考虑非凡蹙迫。
郑纬民说,要息争一心,措置愚弄不及与生态薄弱的问题;产业界要息争起来,愚弄也要息争起来。生态问题不是一个厂家的问题,开采者要证据很大作用,一齐奋力措置这个问题。全功能GPU筑牢算力长城,国产生态领土百花皆放。聚力攻坚冲破工夫壁垒,联袂同业共赴星辰大海!
南边+记者 郜小平斗鱼体育app(中国)官网下载
可提现游戏平台
Copyright © 1998-2026 斗鱼体育app中国官网下载™版权所有
技术支持:® RSS地图 HTML地图