AI界最新共识:语言,不是模型的母语,数学空间才是!它该闭嘴了

大模型也许不该说话了。这是AI界一个正在成型的新共识:语言,正成为阻碍推理能力释放的瓶颈。

传统的『大语言模型』,从GPT到Claude,从Bard到Deepseek,都是靠“说话”来推理的。问它一个数学题,它会列出“思考过程”;让它分析伦理难题,它也会“条理清晰”地给你一个逻辑铺陈。但这些文字,其实是代价高昂的赘余表达。

语言不是模型的母语,数学空间才是。模型“脑中”的信息,永远以向量存在。这个空间叫做latent space,潜空间。无论是GPT还是Gemini,它们的所有计算过程都是向量到向量的变换。每一个词,都是被转换成数值后才能“被理解”。

但模型不能一直待在这个空间。它必须定期“翻译”成一个个词语——也就是我们看到的回答过程。这一步不只是信息损失严重,而且计算成本极高,尤其是面对复杂推理任务,转换频率越高,效率越低。

今日霍州(www.jrhz.info)©️

现在,有人打破这个常规。

去年,Meta实习生Shibo Hao搞了一个新模型,叫Coconut。这个模型的核心创新在于:它拒绝频繁从潜空间跳出来说话。

传统模型的“思考”是一串词,Coconut直接把“思考”锁定在数学空间里,一直不说话,直到最后才输出结果。它绕开了“文字思维”,保留了更丰富的内部信息,更像是人类的直觉式推理。

效果很惊人。在逻辑推理测试中,它和GPT-2版本一样精准(98.8%),但只用了十分之一的词。在多选任务中,它更少语言、更高准确率。关键是:同样的底座模型,Coconut不换架构、不加参数,仅仅绕开语言,就做得更好。

更极端的是另一组人。

马里兰大学的Tom Goldstein团队,干脆连固定层数都不要了。他们做了一个循环结构,让模型自己决定思考几次。模型可以在潜空间中反复循环,不断迭代,直到认为“我想明白了”,才出来说话。

更离谱的是,模型自己学会了“简单问题快出结果,复杂问题多想几轮”。没有人教它怎么判断,它在潜空间中自己形成了“难度感知”。

特别声明:[AI界最新共识:语言,不是模型的母语,数学空间才是!它该闭嘴了] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

日本 昭和 电动鼓风机 EC-H07HT-L213(昭和电工株式会社中国)

特色 它是一种紧凑型,适合多用途使用,设计便于组装成工业设备和设备。产品规格…

日本 昭和 电动鼓风机 EC-H07HT-L213(昭和电工株式会社中国)

皇冠新材全贴合、固曲屏与折叠屏OCA,助力OLED高性能贴合(皇冠胶粘有限公司怎么样)

针对这一快速增长的市场需求,皇冠新材推出了OLED显示模组贴合OCA解决方案,覆盖全贴合OCA、固曲屏OCA及折叠OCA等应用场景,助力OLED显示模组高质量发展。依托公司强大的产品研发实力和专业的项目管理…

皇冠新材全贴合、固曲屏与折叠屏OCA,助力OLED高性能贴合(皇冠胶粘有限公司怎么样)

败光两任亿万家产,为还债拍三级片,如今62岁坦言后悔嫁给钟镇涛(败光亿万家产)

从每月花费数百万,到负债2.5亿却坚持不破,到凭借电影提名金像奖,再到如今直播带货单场破亿,她的生命轨迹似乎像是一条反转的弯路。她现在的生活,在纽约安定下来,孩子也长大,她依旧在小红书和淘宝两头跑,每一…

败光两任亿万家产,为还债拍三级片,如今62岁坦言后悔嫁给钟镇涛(败光亿万家产)

放弃铁饭碗、踩过无数坑,冯提莫的起落,道尽网红的宿命与清醒(放弃铁饭碗19岁到北京完整版)

冯提莫的起伏,永远都不是偶然,它更像是网红时代最真实、最赤裸的生存样本。直到甲状腺癌两次找上门,停播接近一年,冯提莫才真正面对了生死之间的抉择,也深刻感受到了这个行业的残酷——你不仅要拼才艺,还要承受健康的压…

放弃铁饭碗、踩过无数坑,冯提莫的起落,道尽网红的宿命与清醒(放弃铁饭碗19岁到北京完整版)

网友偶遇52岁贾静雯,她把小9岁老公熬成同龄人,修杰楷左手吃饭(网友偶遇52岁『贾乃亮』视频)

在街头偶遇的贾静雯,一身『打扮』简约又不失时尚感,棕色棒球帽、黑色皮夹克、蓝色牛仔裤👖,脚踩棕色休闲鞋,肩背一个深色手提包👜,右手还拿着手机,造型显得既年轻又活力十足,根本看不出她已经52岁了。尽管贾静雯和修杰…

网友偶遇52岁贾静雯,她把小9岁老公熬成同龄人,修杰楷左手吃饭(网友偶遇52岁『贾乃亮』视频)