shopify analytics ecommerce
tracking

加拿大新闻网 首页 新闻 科技 查看内容

成本低廉 中国AI初创DeepSeek震撼矽谷

加新网CACnews.ca| 2025-1-27 11:10 |来自: 世界日报

中国AI新创公司DeepSeek先后发布两款大模型,由于成本低廉,性能与OpenAI相当,中媒指此举引发矽谷震惊,甚至引发Meta内部焦虑。(DeepSeek官网)

中国AI新创公司“深度求索”(DeepSeek)近期先后发布“DeepSeek-V3”和“DeepSeek-R1”两款大模型,由于成本低廉,性能与OpenAI相当,让矽谷震惊,甚至引发Meta内部的恐慌。分析认为,总部位于杭州的DeepSeek可能将改写AI大模型领域的游戏规则。

财联社报导,甚至有投资者将辉达上周五重挫3.12%的原因指向DeepSeek的一夜爆火。德国“世界报”知名市场评论员Holger Zschaepitz表示:“中国的DeepSeek可能代表对美国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的人工智慧模型,并且无需使用尖端晶片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。”

据报导,DeepSeek仅用2048片H800显示卡 (GPU)、耗时两个月,就训练出了一个6710亿参数的DeepSeek-V3。相较于Meta训练参数量4050亿的Llama 3,用了1万6384片更强的H100显示卡,花了54天。DeepSeek的训练效率提升了11倍。

中媒“每日经济新闻”26日报导称,在特朗普总统宣布5000亿美元的“星际之门”(Stargate)发展人工智慧基础建设计划之际,DeepSeek以极低的价格建立了突破性的AI模型,且未使用尖端晶片,让人们质疑,AI行业数千亿美元资本的巨额投入,是否真为最有效的方法?

报导回顾,去年12月27日,DeepSeek推出开源模型“DeepSeek-V3”。AI系统排名网站“聊天机器人竞技场”(Chatbot Arena)显示,“DeepSeek-V3”在所有模型中排名第七,在开源模型排第一。且“DeepSeek-V3”是全球前十中,性价比最高的模型。

不到一个月,今年1月20日,DeepSeek再推出“DeepSeek-R1”,24日“DeepSeek-R1”在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型、OpenAI推出的o1并列。同时,测评机构“Artificial-Analysis”对“DeepSeek-R1”的初始基准测试结果也显示,“DeepSeek-R1”在AI分析质量指数中取得第二高分,价格则是o1的约30分之1。

“每日经济新闻”称,24日一篇发布在匿名平台teamblind上的文章疯传,一位自称是Meta员工称,Meta内部因为DeepSeek模型进入恐慌模式,该文员工写道,“DeepSeek-V3”在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是,一家“仅用550万美元训练预算的中国公司”就做到了这一点。

该匿名文指,工程师正争分夺秒分析DeepSeek,试图复制其中的一切可能技术。另外,“DeepSeek-R1”的出现,也让情况更加严峻。

然而,美国人工智慧数据基础设施新创公司Scale AI执行长Alexandr Wang最近接受CNBC采访时爆料,DeepSeek拥有大约五万个辉达最先进的H100 GPU,并指“但是很明显他们不能说出来,因为这违反了美国所实施的出口管制,我相信他们拥有比外界想像的更多,他们未来会被晶片管制,和出口管制所限制”。

免责声明:本网转载的文章仅为传播更多信息之目的,本网未独立核实其内容真实性,文章也不代表本网立场。如文章侵犯了你的权利,请联系我们修改或删除。本网提供的内容,包括并不限于财经、房产类信息,仅供参考,不构成投资建议;本网内容,包括并不限于健康、保健信息,亦非专业意见、医疗建议,请另行咨询专业意见。本网联系邮箱:contact@cacnews.ca

最新评论

今日推荐

日本现无差别杀人!杀害女高的凶手:谁都行 我想分尸

国际 昨天 21:04

东北三省,十年人口变化:少了一个“哈尔滨”

中国 昨天 20:29

波音飞机降落跑道,一个轮胎在旁飞奔

国际 昨天 20:25

万斯秀幽默被批无知,带妻儿进教堂手忙脚乱

美国 昨天 20:24

  • 48小时新闻排行
  • 7天新闻排行

今日焦点

旗下公众号

关注获得及时、准确、全方位的新闻消息

Copyright © 2012-2020 CACnews.ca All Rights Reserved 版权所有

返回顶部