- 48小时新闻排行
- 7天新闻排行
![]() 中国AI新创深度求索(DeepSeek)24日宣布,全新系列模型DeepSeek-V4的预览版本正式上线,并同步开源。(路透) 就在OpenAI发布GPT-5.5几个小时后,中国AI新创深度求索(DeepSeek)24日宣布,全新系列模型DeepSeek-V4的预览版本正式上线,并同步开源。最新模型具有能力处理长达百万字的超长上下文,在Agent能力、世界知识和推理性能上均实现中国国内与开源领域的领先。陆媒研判,新模型使用的是华为升腾晶片。这距离DeepSeek去年1月的大版本更新已时隔15个月。 上海第一财经报导,V4模型按大小分为Pro和Flash两个版本,其中,Pro版参数为1.6兆,启动参数490亿,预训练资料量33兆;Flash版参数为2840亿,启动参数130亿,预训练资料量32兆。 DeepSeek表示,Pro版本主打高性能,在Agentic Coding(智能体编程)评测中已达到目前全球开源模型的最优水平,也已成为公司内部开发的首选工具;在数学、STEM及竞赛型代码评估中,其表现已能与目前全球顶级闭源模型比肩。 Pro和Flash两个版本的上下文都是1M(百万),均同时支持“非思考模式”与“思考模式”。“从现在开始,一百万上下文将是 DeepSeek 所有官方服务的标配。”DeepSeek表示,V4开创了一种全新的注意力机制,在token维度进行压缩,结合DeepSeek Sparse Attention(DSA,深度求索稀疏注意力机制,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。 从价格看,DeepSeek指出,V4-Pro每百万tokens输入是1元(人民币,单位下同,约新台币4.62元),输出是12元,V4-Flash每百万tokens输入是0.2元,输出是2元。有评论认为,价格仍相当普惠。 报导指出,业界一直在关注DeepSeek-V4是否会使用中国国产算力,从推文来看确实是与华为升腾合作。DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年升腾950超节点批量上市后,Pro的价格会大幅下调。 相比前代模型, V4-Pro 的Agent能力显著增强。在Agentic Coding(代理驱动的程式撰写)评测中,V4-Pro达到当前开源模型最佳水平。 在推理上,官方在论文中表示,总体约落后前沿闭源模型3至6个月。Pro‑Max(Max表示最大推理能力模式)推理扩展后在标准推理基准上优于OpenAI的GPT‑5.2、Gemini‑3.0‑Pro,略逊于GPT‑5.4、Gemini‑3.1‑Pro。 |
加拿大 昨天 20:59
大温学校活动期间出事 水上乐园12人伤 有人重伤需直升机送院
温哥华 昨天 20:58
财经 昨天 20:57
美媒:美伊已经以电子方式签署谅解备忘录 特朗普、万斯与伊朗议长已签署
国际 昨天 20:49
科技 昨天 20:47

关注获得及时、准确、全方位的新闻消息
