加拿大新闻网 首页 新闻 科技 查看内容

网友:中国大模型何时达到Fable级别?马斯克回复了

加新网CACnews.ca| 2026-6-19 09:56 |来自: 华尔街见闻

围绕Anthropic前沿模型遭出口管制下架,一场关于中国大模型追赶时间表的公开辩论正在X平台上演,多方观点的交锋折射出AI行业格局加速重塑的现实。

在智谱AI发布GLM-5.2后,6月18日,一名X用户向独立研究员、AI 开发博主Teortaxes提问"中国大模型何时达到Fable级别"。

Teortaxes给出了7个月的时间差判断,马斯克随即回复"可能(2027年)第一季度",智谱AI CEO唐杰则直接表态"不需要那么久"。

马斯克随后补充,在基准测试上追赶相对容易,但以"真实实用性"衡量,明年Q1也已经相当出色。

这场对话的背景是GLM-5.2在关键编程基准FrontierSWE上取得74.4分,仅落后Anthropic顶级闭源模型Opus 4.8约1个百分点,并超过GPT-5.5。

华尔街见闻此前提及,美国商务部对Anthropic旗下Fable 5和Mythos5实施出口管制,要求向任何外国人提供访问权限前须取得政府许可证,Anthropic随即关闭两款模型的全球访问权限。

技术追赶与AI成本两股力量同步作用,正在重塑全球AI竞争格局。正如zerohedge所指出的,当"10%的智能差距"可能对应"90%的成本优势"时,逾5万亿美元的资本配置是否存在错配,将成为市场持续追问的核心命题。

时间表之争:从7个月到"不需要那么久"

争论的起点来自Teortaxes对GLM-5.2性能位置的判断。

他认为,GLM-5.2整体能力处于Opus 4.7至4.8区间,他表示Opus的视觉能力本身较弱,综合考虑视觉能力后中国大模型差距大致为7个月。

他的推算逻辑是,Mythos模型于2026年2月初达到Preview状态(即≥Opus 4.8的功能水平),以此类推,中国模型达到完整"Fable"级别的时间窗口约在2026年11月至12月。

马斯克的判断则更为保守,仅以"Probably Q1"回应,对应2027年一季度。

但他随后补充了一个重要分层:在基准测试层面,追赶进展或许确实令人印象深刻;而以"真实实用性"衡量,即便到Q1也已相当不易。

他点名Anthropic的优势正在于专注于提升真实智能,这种能力不显现在基准分数上,但直接反映在营收上。

对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水平的时间差可能短于7个月。

谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国的人工智能模型在能力上可能“只差几个月”就能赶上海外。

唐杰的回复则更为简短直接:"won't take that long"——不需要那么久。这一表态隐含了智谱对自身迭代速度的信心,但并未给出具体时间节点。

AI研究机构Proximal评价称,GLM-5.2是"第一个真正缩小了Anthropic/OpenAI与其他模型提供商之间巨大技术鸿沟的模型"。

GLM-5.2的技术坐标:逼近闭源前沿,差距仍存

围绕这场时间表讨论,GLM-5.2的技术指标是核心依据。

6月15日,智谱宣布正式上线并开源新一代旗舰大模型GLM-5.2。在全球百万用户参与盲测的前端开发评估系统Code Arena上,该模型位列全球可用模型第一位。

与以往主打即时问答能力的模型不同,GLM-5.2主攻“长程任务”——让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。

根据发布数据,GLM-5.2参数规模为753B,配备1M token稳定上下文窗口,采用MIT协议完全开源。

在长程编程基准FrontierSWE上,GLM-5.2得分74.4,Opus 4.8为75.1,差距约1个百分点,同时超过GPT-5.5的72.6以及Opus 4.7。

在PostTrainBench(测试Agent训练小模型能力)上,GLM-5.2以34.3分排名第二,仅次于Opus 4.8的37.2,高于GPT-5.5的28.4。

差距仍然存在。在最高难度的SWE-Marathon基准上,GLM-5.2得分13.0,而Opus 4.8为26.0,落差明显。

三个基准加在一起,传递的信息是:在中等复杂度的长程任务上,GLM-5.2 已经进入了与顶级闭源模型同台竞争的区间;在最极端复杂度的任务上,它仍然落后,但在开源阵营里独占鳌头。

Anthropic模型下架,开源替代逻辑加速成立

驱动这场讨论的另一重要背景,是Anthropic旗下Fable 5和Mythos 5的突然下线。

华尔街见闻提及,Anthropic事件暴露出闭源商业模型在可获得性上的脆弱性,并为开源阵营带来了超越技术层面的战略价值。

在GLM-5.2发布的同时,智谱AI CEO唐杰在X平台发表声明:

在前沿模型被无故切断访问的时刻,我们更加确信一件事:科学应当是全球的。通往AGI的道路绝不能由高墙围困。

这一时机选择将开源从技术路线提升至技术主权的叙事层面。该条推文在24小时内获得超过88万次浏览和252条回复。

东方证券认为,开源模型具备开放权重、自主可控、可本地部署等特征,使其成为规避地缘政治风险、保障业务连续性的更优选择。

由于国内模型性能领先、多数开源、API调用成本较低,中国模型已在OpenRouter等Token分发平台上占据领先位置。叠加Anthropic两款模型下架,国产模型API调用量有望进一步提升。

但从中长期逻辑看,成本下降与访问门槛降低,可能推动词元消耗量和算力需求同步扩张。对投资者而言,开源模型份额提升与算力需求高增,正在成为AI产业链重估的核心变量。

免责声明:本网转载的文章仅为传播更多信息之目的,本网未独立核实其内容真实性,文章也不代表本网立场。如文章侵犯了你的权利,请联系我们修改或删除。本网提供的内容,包括并不限于财经、房产类信息,仅供参考,不构成投资建议;本网内容,包括并不限于健康、保健信息,亦非专业意见、医疗建议,请另行咨询专业意见。本网联系邮箱:contact@cacnews.ca

最新评论

今日推荐

彻底乱了!世界杯赛后爆发大规模冲突,比起6比0更惨的是断腿重伤

体育 半小时前

加拿大球员目睹队友受伤吓哭!对卡塔尔痛下杀手,补时阶段也破门

体育 半小时前

1男4妻,严禁外嫁!北高加索的“子宫暗战”,有多疯狂?

博览 1 小时前

这位74岁老人靠一个“小众赛道”年入1.1亿美元

财经 1 小时前

  • 48小时新闻排行
  • 7天新闻排行

今日焦点

旗下公众号

关注获得及时、准确、全方位的新闻消息

Copyright © 2012-2020 CACnews.ca All Rights Reserved 版权所有

返回顶部