- 48小时新闻排行
- 7天新闻排行
| 《科创板日报》13日讯,DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。 该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。论文提出条件记忆(conditional memory),通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时,DeepSeek开源相关记忆模块Engram。 |
加拿大 1 小时前
大温学校活动期间出事 水上乐园12人伤 有人重伤需直升机送院
温哥华 1 小时前
财经 1 小时前
美媒:美伊已经以电子方式签署谅解备忘录 特朗普、万斯与伊朗议长已签署
国际 1 小时前
科技 1 小时前

关注获得及时、准确、全方位的新闻消息
