马斯克尴尬了,20万显卡堆的Grok3,1天就被Deepseek打败了?

前两天,马斯克旗下的AI公司xAI,发布了其最新的AI大模型,也就是Grok3,以发布会上,马斯克称其是全球最聪明的AI。

而从各种测试对比来看,Grok3,也确实很厉害,比OpenAI、Deepseek的得分更高。

而Grok3,马斯克是主打一个大力出奇迹,那就是堆了20万张H100显卡,堪称是全球算力最强的大模型。

今日霍州(www.jrhz.info)©️

马斯克的Grok3推出,似乎也证明了,规模定律(Scaling Law)仍然有效,堆算力依然是AI大模型的必由之路。

不过,让马斯克尴尬的事出现了,堆了20万显卡的Grok3,仅1天,Deepseek就又搞出新东西了,那就是NSA。

『DeepSeek』在『社交平台』X上发布了一篇关于NSA的纯技术论文报告。

今日霍州(www.jrhz.info)©️

按照Deepseek的说法,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。

NSA和『DeepSeek』的一惯风格相似,那就是低成本高效,通过对现代硬件的优化设计,NSA可以降低预训练的成本,且不牺牲性能,且NSA的表现可可媲美甚至超越全注意力模型。

也就是说,完全不需要像Grok3这样,堆20万张显卡,NSA依然可以采用低成本的方式,实现对其它AI模型的超越。

今日霍州(www.jrhz.info)©️

可见,目前在AI上,Deepseek主打一个四两拨千斤,而Grok、Openai们,则主打大力出奇迹,努力的堆显卡。

本来美国那边的AI公司认为,限制中国的AI卡,不让你们获得先进的AI『芯片』,那么就肯定打不过我们的AI模型,不曾想,中国的AI模型,不需要堆显卡,也能实现更强的性能,更好的体验,这就真的让美国的这些企业们懵圈了,更重要的是,这也打破了美国的所谓算力垄断,整个AI『芯片』格局,都可能重构。

特别声明:[马斯克尴尬了,20万显卡堆的Grok3,1天就被Deepseek打败了?] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

太平年》楚国夫人下线!惨遭轮奸虐杀悬尸上尺度(太平年楚国夫人被羞辱)

可以看出,罗漩对于角色的理解和诠释非常到位,她能够深刻地体会到丁氏的内心世界,也能够将这种情感传递给观众。 反思历史,重温人性虽然《太平年》中的暴力场面引发了一些争议,但不可否认的是,该剧通过楚国夫人的悲剧命…

《<strong>太平年</strong>》楚国夫人下线!惨遭轮奸虐杀悬尸上尺度(太平年楚国夫人被羞辱)

纪实星二代王骁:40岁才走红娶初恋生一女,是母亲王馥荔的骄傲

终于,王骁拿到了电视剧《血缘》中的角色,第一次在戏中有了自己的名字和台词。激动的他与母亲分享这个好消息,母亲在为他高兴的同时,也向他提出了一个约定:如果三年内你没有得到观众的认可,你就得承认自己不适合,回家…

纪实星二代王骁:40岁才走红娶初恋生一女,是母亲王馥荔的骄傲

聚焦传统技艺的创新呈现 《非YI般的好东西》开播(聚焦传统技艺的成语)

臭豆腐不再只是“味道刺客”,反成让人上头的珠宝;湘绣不再只是“长辈审美”,反成Z世代抢着穿的顶流潮品,在综艺节目《非YI般的好东西》中,故宫博物院第六任院长单霁翔与『设计师』贾伟,联手召集国内30位『设计师』,对湖…

聚焦传统技艺的创新呈现 《<strong>非YI般的好东西</strong>》开播(聚焦传统技艺的成语)

MR在精准农业中的潜力与应用(精准农业所应用的技术主要是)

例如,在无人驾驶拖拉机或播种机的操作中,MR技术能够提供虚拟路径规划和实时指导,使设备能够根据预设的路线和田间状况进行精准操作。在作物喷洒和病虫害检测过程中,MR系统可以将无人机的影像信息与农田的地理数据、…

MR在精准农业中的潜力与应用(精准农业所应用的技术主要是)

商业核聚变破冰!上海“人造太阳”实现1337秒运行(商业化核聚变)

上海某可控核聚变企业宣布,其高温超导托卡马克装置&quot;洪荒70&quot;实现1337秒稳态等离子体运行,创下商业公司新纪录。在2025年11月启动的本轮实验中,该装置先后完成120秒、335秒的阶段性目标,最终突破1

商业核聚变破冰!上海“人造太阳”实现1337秒运行(商业化核聚变)