紫牛热点|南航领衔团队低成本训练4小时,『DeepSeek』数学能力暴涨

AI『大语言模型』虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型『DeepSeek』的7B小版本和Qwen2.5-14B进行推理指导,它们的数学推理能力就开始暴涨,甚至成功构造出困扰全世界数学家的关键反例。

今日霍州(www.jrhz.info)©️

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者,联合南通大学的嵇天博,以及牛津大学的两位研究者共同完成。研究聚焦于提升『大语言模型』(LLM)解决复杂数学问题的能力,其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题,涉及有理函数的多项式表示,其首个反例直到1927年才被发现,至今仍是一个重要的数学难题,在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法,仅用2张A100显卡训练4小时的『DeepSeek』的7B小模型,不仅在准确率上超越671B参数的『DeepSeek』-V3,响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练,经过优化的模型自主构建出一个全新多项式,成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索,而AI仅用数小时就实现了创造性突破。研究者预言,AI『大语言模型』离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻记者 宋世锋

校对 盛媛媛

特别声明:[紫牛热点|南航领衔团队低成本训练4小时,『DeepSeek』数学能力暴涨] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

乐道L60限定款——马到成功(乐道官方)

乐道L60限定款——马到成功(乐道官方)

盐系轻酷『穿搭』适配所有场景,日常通勤皆可穿,低调又有记忆点(盐系男生『穿搭』)

早上八点挤进电梯,西装外套🧥没扣扣子,内搭是米白肌理棉T恤👕,袖口随意挽到小臂中段,露出一截手腕和一块表盘素净的旧钢表——没人盯着你打量,但三秒后,你已从背景板里浮出来。它不帮你成为别人眼中的焦点,但它确保——当…

盐系轻酷『穿搭』适配所有场景,日常通勤皆可穿,低调又有记忆点(盐系男生『穿搭』)

5段婚姻8个女人一个没留住,68岁和痴呆老母为伴,张黎后悔吗?(五个婚姻真相)

在事业上,他是精益求精的导演,凭借一部部经典作品书写着国产剧的辉煌,成为行业的标杆人物,赢得了观众的尊敬;在情感上,他是不断追寻却屡屡失意的旅人,五段婚姻,八段情感,终究未能收获长久的幸福,留下了种种争议。有…

5段婚姻8个女人一个没留住,68岁和痴呆老母为伴,张黎后悔吗?(五个婚姻真相)

星河文化小艺人集结哈尔滨!和世喜一起解锁极地研学之旅!(小星河艺术)

这场跨越冰雪与温暖的创作之旅,不仅让小朋友们在银装素裹的极地场景中完成镜头表现,更以沉浸式研学的形式,解锁了与企鹅、北极熊等极地动物的亲密接触,实现了艺术实践与自然科普的双向成长。 据悉,此次联合广告近期已正…

星河文化小艺人集结哈尔滨!和世喜一起解锁极地研学之旅!(小星河艺术)

汪希玥穿14000元羽绒服,在朝阳公园溜冰,又白又瘦,越长越像大S(汪希玥穿14000元羽绒服溜冰)

这一次,他们在继母马筱梅和祖母张兰的陪同下,走进了这座曾与母亲有着深厚联系的城市。一个轨道是由祖母张兰代表的纵向情感锚点,血缘维系着这份情感纽带,日常陪伴为孩子们的成长提供了稳固的基石;而另一个轨道则是继母马…

汪希玥穿14000元羽绒服,在朝阳公园溜冰,又白又瘦,越长越像大S(汪希玥穿14000元羽绒服溜冰)