H20重返中国市场在即,燧原和沐曦同日发布新一代AI芯片
7月27日的世界人工智能大会(WAIC)上,燧原科技和沐曦这两家头部国产AI芯片厂商首发各自新一代的主力AI芯片。
燧原科技新发布的L600芯片历时两年半开发,采用训推一体的架构,亦即可用于大模型训练和推理。L600配备144GB的存储容量,存储带宽为3.6TB/s,支持DeepSeek模型在训练过程中使用的FP8(8位浮点数)低精度——低精度可提升训练速度和降低计算成本。
L600是燧原科技第四代芯片,上一代产品为2024年6月量产的S60推理芯片,面向大语言模型、多模态大模型、搜索广告推荐、传统AI模型等场景。在S60的基础上,燧原科技还推出DeepSeek一体机,可运行满血版、蒸馏版不同尺寸的模型。
南都记者了解到,S60芯片目前已出货7万颗,在国产卡落地规模上进入前列,且覆盖到国内五大智算集群。其中,2024年12月,燧原科技在甘肃庆阳建成万卡推理集群,使用了10016张S60算力卡。
燧原科技创始人兼首席运营官张亚林介绍,公司的算力已支持腾讯诸多的互联网应用场景,并通过智算集群支撑腾讯产业生态客户的业务拓展。
天眼查显示,腾讯自2018年以来参与了燧原科技6轮融资,是其重要产业投资方。
WAIC2025的燧原科技展厅。图:杨柳
沐曦新推出的曦云C600延续了训推一体的方案,具备多精度的混合算力,同样支持FP8精度。C600采用HBM3e显存(第五代高带宽内存),数据存储容量从上一代C500的64GB提升至144GB。值得一提的是,HBM3e是当前市场上较先进的高带宽内存产品,仅次于最新的HBM4,英伟达旗下H100等芯片也搭载HBM3e。
沐曦联合创始人、首席技术官彭莉称,曦云C600实现芯片研发制造全技术流程的国产自主可控。但她同时表示:“如何打造基于国产供应链的可持续供给,是公司面临的挑战。”
招股书显示,C600项目于2024年2月立项,投资总额约13.7亿元。2024年10月,C600交付流片(芯片设计完成后、规模化制造前的关键环节),并于2025年5月完成回片,预计今年第四季度小批次量产。2025年4月,沐曦已启动了下一代的C700系列研发,投资总额约20.4亿元,预计2026年第二季度开始进入流片测试阶段。
WAIC2025沐曦展厅内展示的曦云C600 GPU芯片。图:杨柳
目前,沐曦的产品结构涵盖三大类别:训推一体的曦云C系列、面向传统人工智能场景的推理GPU曦思N系列、用于图形渲染的曦彩G系列。曦云C系列是其中的主力产品。根据沐曦的招股书,2024年度和2025年前三月,曦云的C500芯片的收入占比分别高达97.28%和 97.87%。南都记者了解到,沐曦正在基于C500系列建设万卡集群。
招股书显示,截至今年3月,沐曦的GPU产品累计销量超过2.5万颗。上海证券交易所官网显示,沐曦的IPO进程已于7月19日进入受理后的问询阶段。
采写:南都N视频记者 杨柳 王子黎 樊文扬 发自上海
1、成都这场火炬传递到底藏了多少故事?,成都这场火炬传递到底藏了多少故事啊
2、暑期档票房突破50亿元,《侏罗纪世界:重生》《长安的荔枝》带热大盘
3、印度吓坏了,雅江水电站我只能说这么多了,雅江水电站具体位置