- 48小时新闻排行
- 7天新闻排行
新创公司DeepSeek走红。(路透) DeepSeek(深度求索)训练成本低廉,表现不亚于美国最优秀的大型AI语言模型,对于美国晶片管制是否有效限制中国AI发展,科技业界议论纷纷。 路透等媒体报导,自DeepSeek-V3推出以来,这款AI应用程式在美国用户中人气激增。从编写复杂的程式到解决困难的计算,DeepSeek的能力不逊于竞争对手,令业内人士感到惊讶。 分析师长期以来认为,美国在生产高功率晶片方面的关键优势,以及限制中国取得相关技术的能力,将确保美国在AI竞赛中占据优势地位。 然而,DeepSeek表示,训练一款新模型的成本为560万美元,相比之下,美国AI开发商Anthropic执行长阿莫戴去年曾表示,打造一个AI模型需要花费1亿至10亿美元。DeepSeek在一份技术报告中表示,他们仅用2000多颗辉达晶片来训练其V3模型。相比之下,训练类似规模的模型通常需要数万颗晶片。 美国政府试图阻止最先进辉达产品进入中国,尽管DeepSeek上述花费遭质疑,但据悉其使用的晶片性能不及最先进辉达产品,加上相对低廉的训练成本,已引发美科技业高层质疑科技出口管制有效性。 加州大学柏克莱分校电脑科学教授伊恩.斯托伊卡(Ion Stoica)指出,限制条件和资源匮乏往往会激发创新,目前的情况似乎就是如此。特朗普总统的亲密顾问、创投家安德立森形容这是“AI的史普尼克时刻”。史普尼克时刻意指苏联抢先美国发射“史普尼克一号”人造卫星的事件,象征冷战时期太空竞赛的起点。 台湾AI专家、iKala创办人程世嘉分析指,最重要的一点是DeepSeek把使用最先进AI的成本整整降低了两个数量级,也就是百分之一,这也是让矽谷各家Big Tech如此震惊的原因,让他们自我怀疑,在开发先进的AI路上,自己的团队效能是否出了问题。 程世嘉在脸书贴文表示,DeepSeek是完全开源的,奠基于其他所有的AI技术之上,可以确定的是,美国的Big Tech自然也很快会基于DeepSeek公开的技术加速AI迭代,这场仗还会继续打下去。他表示,令一些人难堪的是,DeepSeek把手上所有的AI技术、程式码、甚至连模型权重都公开了,彻底接手了OpenAI原本应该做的所有事情。 程世嘉指出,DeepSeek近期的发展,对于美国政府来说肯定是一个相当震惊的事件,因为这无疑是直接打了美国政府对中国科技封锁和禁运策略的一个大巴掌,未来美国政府将更加严查Nvidia和相关AI晶片产业链的公司,确保这些公司按照美国的围堵政策来走。 但他不认为Nvidia的AI晶片销售短期内会受到影响,因为当AI可以如此普及通用而且成本低的时候,只会更增加全世界的需求。主要原因是AI是所谓的通用型技术,什么是通用型技术呢?除了是人人都用得到之外,还必须具备三个特征:又快、又好、又便宜。 |
中国 6 小时前
美国 6 小时前
美国 6 小时前
国际 6 小时前
美国 6 小时前
科技 6 小时前
美国 6 小时前
国际 6 小时前
关注获得及时、准确、全方位的新闻消息