马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……

人工智能领域的激烈竞争中,科技巨头马斯克再次引发轰动。近日,他与xAI团队在一场备受瞩目的直播中正式发布了最新版本Grok-3,并宣称这是"地球上最聪明的AI"。然而,这一雄心勃勃的宣言很快遭遇了现实的考验。

马斯克声称Grok-3在数学、科学和编程的基准测试中已经超越了所有主流模型。这一说法似乎得到了一定的支持,因为AI确实在处理复杂数学问题时展现出了令人惊叹的能力。然而,当面对看似简单的常识性问题时,AI却暴露出了令人意外的弱点。

最具代表性的是"9.11与9.9哪个大"这个问题。这个看似简单的比较,却成为了检验AI常识判断能力的试金石。令人意外的是,包括Grok-3在内的多个主流AI模型都在这个问题上栽了跟头。这一现象引发了人们对AI真实智能水平的质疑:为什么能解决复杂数学题的AI,却无法正确比较两个简单的数字大小?

尽管遭遇挫折,马斯克对Grok-3的未来仍然充满信心。他预测,Grok-3将在未来三年内实现"诺贝尔奖级别的突破",甚至可能用于SpaceX的火星任务计算。这种自信并非空穴来风,背后有着强大的技术支撑。

马斯克透露,Grok-3的训练使用了远超此前版本的算力和大量合成数据。特别值得一提的是,xAI自建的Colossus超级计算机为Grok-3提供了强大的计算能力,这台由10万个『英伟达』H100 GPU驱动的超级计算机,提供了2亿个GPU小时的计算能力,比Grok-2使用的算力多了十多倍。

马斯克表示,这种强大的计算能力使Grok-3能够更好地减少AI幻觉,通过检查数据并实现逻辑一致性来优化表现。然而,"9.11与9.9"问题的失误似乎暗示,单纯依靠计算力的提升可能并不足以解决AI在常识推理方面的根本问题。

尽管Grok-3在某些方面表现出色,但其在常识性判断上的失误无疑给马斯克和xAI团队敲响了警钟。

特别声明:[马斯克野心勃勃,但Grok3翻车了,回答9.11比9.9大……] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

“一人公司”的风吹到了深圳 借力AI兴起

只要有一个创意、一项技术,再借助AI智能体,你就能独自运营一家公司,成为“超级个体”。近年来,“一人公司”悄然兴起,成为AI时代的创业新范式,越来越多的创业者投身其中。以深圳为代表的创新型城市正抢抓这一新风口,构建人工智能创新创业新生态

“一人公司”的风吹到了深圳 借力AI兴起

吹哨子的蛋糕吹吹卷玩具能带来什么样的生日聚会氛围感?(吹哨子吹哨子)

近年来,个性化生日派对愈发流行。如何营造独特的氛围感成为焦点。 吹哨子的蛋糕吹吹卷玩具凭借其独特的创意和互动性,在生日派对中脱颖而出,尤其受女生喜爱。 它们不仅为聚会增添趣味,还能成为绝佳的拍照道具,记录难忘瞬间。本文深入剖析其独特之处,助

吹哨子的蛋糕吹吹卷玩具能带来什么样的生日聚会氛围感?(吹哨子吹哨子)

39岁热依扎强行扮嫩!表情僵硬太尴尬(热依扎a)

记得前几天的造型有些过于成熟,甚至有些刻意,而这一次,发尾微翘的设计让整体造型轻盈了许多,向上、向外,像是注入了更多的活力。她的长相和身材也很出众,尤其是在与其他人对比时,显得格外突出。《骄阳似我》最近也在持…

39岁热依扎强行扮嫩!表情僵硬太尴尬(热依扎a)

孟广美成干瘪老太太,她现身香港参加活动,身高缩水侧颜看脸好小(孟广美怎么走出被骗的阴影)

我忍不住翻出她年轻时的动图,再与现在的照片作对比,确实岁月无情,胶原蛋白已经悄然离去,但她的站姿依然挺拔,肩膀宽展,背脊依旧笔直,眼神里没有任何躲闪。有些人说她是依靠丈夫翻身的,但她自己却先给丈夫打了个…

孟广美成干瘪老太太,她现身香港参加活动,身高缩水侧颜看脸好小(孟广美怎么走出被骗的阴影)

陈星旭:打破霸总标签,展现多元魅力(陈星旭被打)

特别是在新剧《突然的喜欢》中,他再次挑战霸总角色,引发了一系列思考:当霸总这个标签变得如此固定,演员该如何突破这道固有框架,避免让观众感到审美疲劳,甚至通过个性化的表现将这一标签转化为自己独特的戏路呢? 回到…

陈星旭:打破霸总标签,展现多元魅力(陈星旭被打)