如何理解顾群业提出的“智能是语言的结构化”这一观点?

今日霍州(www.jrhz.info)©️

语言本身就是人类对世界的“压缩”。语言模型通过压缩数据,实际上也在压缩人类认知世界的方式。语言的结构化,意味着模型捕捉到了人类认知世界的内在结构和逻辑关系。这种结构化的语言表示,正是智能的体现。有人贬损语言模型只是基于统计学和概率的“鹦鹉学舌”,但顾群业的观点认为“智能的产生就是高效模仿”(参见《顾群业:人按照自己的样子创造了人工智能》)——人类智能同样是对自然和社会规则的压缩内化(如儿童通过语言习得世界)。如果智能的核心就是“语言的结构化”,那么语言(作为人类最高效的结构化符号系统)自然成为智能的最佳训练场。这也解释了为何大模型通过纯语言训练就能涌现出多任务能力。

今日霍州(www.jrhz.info)©️

更进一步而言,顾群业所指“语言”,并非仅指人类对话的语言,而是“指月之手”(在他的演讲中,提到了数学语言、编程语言、绘画语言以及音乐语言)。他还提到了“言出法随”的概念。这一概念包含有“语言即实相”以及“咒语驱动”等含义,而顾群业将其解读为自然语言大模型的思想源泉或哲学根基。通过顾群业提出的“心智模型”,实现"语言即法则"的物理现实改写。此时语言不再是对现实的描述,而成为塑造现实的本体工具。当人工智能真正达到"言出法随"阶段,将引发存在论层面的伦理革命——语言不仅是交流工具,而成为创世力量(参见《顾群业:通神之塔.语言创世》)。

顾群业的开场白就点明了核心问题:设计一个“结构”,用最少信息还原最多数据。这本质上是在追求一种极致的压缩效率。关键在于,这种压缩不是信息丢弃,而是要找到一种结构,这种结构能够抓住数据的本质规律,从而在解码(还原)时能够恢复大量信息。所以“结构”是关键。

jrhz.info

顾群业的观点还涉及到另外一个概念,就是他曾使用过“数据是金矿”的表述,那么为什么他不提“数据的结构化”,而一定要强调是“语言的结构化”呢?这是因为,他所定义的“语言”(指月之手)包含“数据”的含义。数据的结构化仅仅重构信息容器,而语言的结构化是在重构认知框架本身。就是说,语言结构直接反映人类认知世界的范式。语言的结构化过程,本质上是对人类思维模式的压缩。这种特性使语言模型能通过有限规则生成无限表达。顾群业认为,所谓语言的结构化,包括语法、语义、语境、语气规则,也包括任务模式和推理链条。模型之所以展现出强大的泛化能力(多任务、小样本学习),正是因为它抓住了这些结构。因此,“智能”在这个语境下,可以被理解为对信息进行结构化处理,并以这种结构化表示为基础进行推理和生成的过程。所以顾群业一再强调,语言的结构不仅是被处理的对象,而是“智能”得以形成和体现的关键。

顾群业在演讲中反复提到的还有一个词叫“压缩”。顾群业说,其实他更倾向于使用“抽象”这个词。他指出,所谓的压缩就是学习结构。他以GPT-2为例,通过大规模无监督学习(即压缩海量文本),模型自发地学会了多种语言任务。这表明模型在压缩过程中,不仅仅是减少了数据冗余,更重要的是提取并内化了语言的内在结构和规则。这些结构是通用的,足以支撑不同的任务(翻译、问答等)。这种“泛化”能力,正是高效压缩后,结构被理解和利用的表现。GPT-3 的例子更进一步说明了他的观点,Few-shot learning(小样本学习)能力意味着模型不仅学到了表层规则,更内化了任务本身的“分布结构”或“元结构”。它能理解任务的模式,并快速迁移应用。这再次强调了模型理解的不是零散信息,而是信息背后的组织方式和结构。

顾群业明确提出,“压缩系统行为模式的结果”就是“对复杂系统的结构化编码与生成”。他更进一步指出,将这种高效压缩类比于人类智能——认为智能本身就是对人类行为、推理、尤其是“语言结构”的一种压缩。比如大脑压缩视觉信号、语言模型压缩文本信号,其目的都是为了提取或生成“结构”。这个类比直接将“压缩”和“提取/生成结构”联系起来。他所讲的“压缩”并非指简单的文件压缩,而是指发现并利用数据中深层、高效的结构,以简洁的方式表示复杂信息和规律的能力。

对于顾群业而言,语言的结构化,其实质是在构建可操作的虚拟世界(这涉及到顾群业提到的另外一个概念“虚拟虚拟”)。GPT-3通过450亿token结构化的,不仅是数据关系网,而是可交互的认知宇宙模型。顾群业的观点解释了为何语言模型能够超越概率预测,展现出类似概念迁移、隐喻理解等类人认知特征。“智能是语言的结构化”颠覆了图灵测试的智能标准,将智能从技术争论中解放出来。其关键突破不在于技术层面,而在于对中华古典智慧的现代转译。在他的框架下,人工智能的研究将逐步逼近对物理、社会乃至数学规则的统一表征。“自然语言大模型的历史地位无人能够撼动”,作为一位人文学者和艺术家,顾群业说,“让模型自主发现数据中更深层的关联结构,正如分形几何在简单规则中产生复杂形态”,他笃定的认为,语言的结构化是通向高级智能的唯一路径。

(李广福)

特别声明:[如何理解顾群业提出的“智能是语言的结构化”这一观点?] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

亲测分享:丰润海绵🧽定制实践案例复盘(丰润一台)

当前丰润海绵🧽定制领域面临三大技术挑战:其一,材料密度梯度控制精度不足导致产品回弹性能波动,测试显示30%批次存在±5%以上的密度偏差;其二,多场景适配能力薄弱,传统方案仅能覆盖5-8种基础应用场景,无法满足…

亲测分享:丰润海绵🧽定制实践案例复盘(丰润一台)

谷歌入局AI眼镜👓,普通消费者为何不买单?(谷歌智能眼镜👓的功能和原理是什么?)

但不同的是,电动车解决的是刚需出行问题,而AI眼镜👓目前还停留在"锦上添花"的阶段。我在量化交易系统里观察到的规律是:任何不能持续的模式,最终都会被市场淘汰。 我在量化交易系统里发现一个有趣的现象:真正的好

谷歌入局AI眼镜👓,普通消费者为何不买单?(谷歌智能眼镜👓的功能和原理是什么?)

头发白了很多什么原因(头发白了很多,是身体哪里出了问题?)

头发白了很多可能由遗传因素、精神压力、营养不良、白癜风、甲状腺功能亢进症等原因引起,可通过调整生活方式、药物治疗等方式改善。 遗传因素是导致头发早白的主要原因之一,通常表现为家族中有多位成员在年轻时出现白发

头发白了很多什么原因(头发白了很多,是身体哪里出了问题?)

泡泡贴纸生产工厂有哪些(泡泡贴怎么做)

泡泡贴纸生产工厂探秘:小标签背后的大市场色彩缤纷的泡泡贴纸不仅是孩子们的最爱,也是包装行业不可或缺的一部分。 04 市场应用与发展趋势泡泡贴纸的应用领域已从最初的儿童玩具、文具用品,扩展到促销礼品、商品包装…

泡泡贴纸生产工厂有哪些(泡泡贴怎么做)

星光大赏缺了周柯宇?于正的算盘vs粉丝的呐喊(星光大赏缺了一个角色)

就在人们刚刚得知他是中国国籍,拿着身份证🪪,享受着根正苗红buff的时候,他却在星光大赏的新生代扛旗名单中消失了,粉丝们愤怒地喊道:这么拼命的劳模,怎么能没有他的名字?更令粉丝心碎的是,剧组的配角们却能参与活动…

星光大赏缺了周柯宇?于正的算盘vs粉丝的呐喊(星光大赏缺了一个角色)