ACL 2025:半数作者来自中国,DeepSeek 与北大杨耀东团队获最佳论文
2025年7月27日至8月1日,第63届 ACL(计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会论文接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。
本届 ACL 共评选出4篇最佳论文。DeepSeek 与北大杨耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。
其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。
北大杨耀东团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)
1、A股午评:沪指半日跌0.68%,创业板指涨0.43%,辅助生殖、CPO概念走强,水产概念走弱
2、可以从感情上理解对日本的仇恨,但是从现实角度来看,大家对日本的仇恨主要在哪里
3、字少事大!东大传来好消息,美国围堵计划大溃败...,美国东北大学治安情况