- 48小时新闻排行
- 7天新闻排行
|
深度求索创始人梁文锋。(取材自微博) 由DeepSeek团队研发、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,近日荣登国际权威期刊“自然”(Nature)封面。这是全球首个经过同行评审的主流大语言模型,填补了业内空白。 香港中通社报导,“自然”评价“目前几乎所有主流大模型尚未经过独立同行评审,这一空白终于被DeepSeek打破”,相较今年1月发布的初版论文,新论文披露了更多模型训练细节,并正面回应了模型发布初期质疑。 据报导,DeepSeek-R1采用创新的大规模推理模型训练方法,包含人类监督下的深入训练阶段,以优化推理过程。梁文锋团队表示,该模型通过强化学习而非依赖人类示例来开发推理步骤,显著降低了训练成本和复杂性。模型在接触优质问题解决案例后,会生成推理模板,通过解决问题获得奖励,从而提升学习效果。 分析指,DeepSeek-R1的突破源于其独特训练方法。研究显示,该模型在推理任务中表现出色,尤其在复杂问题解决方面展现了高效性和准确性。这不仅推动了AI技术发展,也为开源AI社区提供了宝贵参考。论文的发表标志著DeepSeek在全球AI领域的领先地位。 DeepSeek由梁文锋于2023年在中国杭州创立,团队成员来自顶尖高校及国际机构。梁文锋,1985年出生于广东湛江,是幻方量化及DeepSeek创始人。去年12月,其团队发布大模型“DeepSeek-V3”,展现了持续创新能力。今年4月,梁文锋入选美国“时代”周刊“2025年全球最具影响力100人”榜单。
AI新创企业DeepSeek团队完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际期刊“自然”(Nature)的封面。(取材自“ 是说芯语”) |
加拿大 1 小时前
大温学校活动期间出事 水上乐园12人伤 有人重伤需直升机送院
温哥华 1 小时前
财经 1 小时前
美媒:美伊已经以电子方式签署谅解备忘录 特朗普、万斯与伊朗议长已签署
国际 2 小时前
科技 2 小时前

关注获得及时、准确、全方位的新闻消息
