加拿大新闻网 首页 新闻 科技 查看内容

时隔1年多...DeepSeek发布V4新模型 百万上下文成标配

加新网CACnews.ca| 2026-4-24 09:58 |来自: 世界日报

中国AI新创深度求索(DeepSeek)24日宣布,全新系列模型DeepSeek-V4的预览版本正式上线,并同步开源。(路透)

就在OpenAI发布GPT-5.5几个小时后,中国AI新创深度求索(DeepSeek)24日宣布,全新系列模型DeepSeek-V4的预览版本正式上线,并同步开源。最新模型具有能力处理长达百万字的超长上下文,在Agent能力、世界知识和推理性能上均实现中国国内与开源领域的领先。陆媒研判,新模型使用的是华为升腾晶片。这距离DeepSeek去年1月的大版本更新已时隔15个月。

上海第一财经报导,V4模型按大小分为Pro和Flash两个版本,其中,Pro版参数为1.6兆,启动参数490亿,预训练资料量33兆;Flash版参数为2840亿,启动参数130亿,预训练资料量32兆。

DeepSeek表示,Pro版本主打高性能,在Agentic Coding(智能体编程)评测中已达到目前全球开源模型的最优水平,也已成为公司内部开发的首选工具;在数学、STEM及竞赛型代码评估中,其表现已能与目前全球顶级闭源模型比肩。

Pro和Flash两个版本的上下文都是1M(百万),均同时支持“非思考模式”与“思考模式”。“从现在开始,一百万上下文将是 DeepSeek 所有官方服务的标配。”DeepSeek表示,V4开创了一种全新的注意力机制,在token维度进行压缩,结合DeepSeek Sparse Attention(DSA,深度求索稀疏注意力机制,实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。

从价格看,DeepSeek指出,V4-Pro每百万tokens输入是1元(人民币,单位下同,约新台币4.62元),输出是12元,V4-Flash每百万tokens输入是0.2元,输出是2元。有评论认为,价格仍相当普惠。

报导指出,业界一直在关注DeepSeek-V4是否会使用中国国产算力,从推文来看确实是与华为升腾合作。DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年升腾950超节点批量上市后,Pro的价格会大幅下调。

相比前代模型, V4-Pro 的Agent能力显著增强。在Agentic Coding(代理驱动的程式撰写)评测中,V4-Pro达到当前开源模型最佳水平。

在推理上,官方在论文中表示,总体约落后前沿闭源模型3至6个月。Pro‑Max(Max表示最大推理能力模式)推理扩展后在标准推理基准上优于OpenAI的GPT‑5.2、Gemini‑3.0‑Pro,略逊于GPT‑5.4、Gemini‑3.1‑Pro。

免责声明:本网转载的文章仅为传播更多信息之目的,本网未独立核实其内容真实性,文章也不代表本网立场。如文章侵犯了你的权利,请联系我们修改或删除。本网提供的内容,包括并不限于财经、房产类信息,仅供参考,不构成投资建议;本网内容,包括并不限于健康、保健信息,亦非专业意见、医疗建议,请另行咨询专业意见。本网联系邮箱:contact@cacnews.ca

最新评论

今日推荐

全球石油储备正迅速耗尽 中国囤油量为“最大谜团”

国际 昨天 20:57

身家万亿的马斯克“蜗居”曝光 还住在37平小屋

科技 昨天 20:52

黄大炜猝逝过程太离奇 母亲和弟弟要追查真相

娱乐 昨天 20:49

火箭“烧煤”成现实 中国煤炭产业转型打开价值新空间

科技 昨天 20:48

国际足联翻车?世界杯前8场比赛竟无一准时开球!

体育 昨天 20:33

  • 48小时新闻排行
  • 7天新闻排行

今日焦点

旗下公众号

关注获得及时、准确、全方位的新闻消息

Copyright © 2012-2020 CACnews.ca All Rights Reserved 版权所有

返回顶部