OpenAI杀疯了!内部神秘模型首次斩获信息学奥赛IOI 2025金牌🥇,碾压98%人类选手

刚刚,OpenAI研究员Sheryl Hsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌🥇

这是AI首次在该领域达到金牌🥇水平,并且在所有AI参赛者中排名第一

在与全球330名顶尖人类选手的同场竞技中,这套AI系统的成绩超越了其中98%的选手,仅有5位人类天才的得分比它更高

纯靠推理:无网络、无RAG,与人类公平对决

Sheryl Hsu在推文中特别强调,OpenAI的AI系统是在完全模拟人类选手的环境下进行比赛的:

完全断网:无法访问『互联网』,杜绝了一切开卷考试的可能性

无RAG(检索增强生成):无法调用外部知识库,所有解题逻辑必须由模型内生生成

同等限制:和人类选手一样,只有5小时的比赛时间和50次代码提交机会

基础工具:只能使用一个基础的终端工具

这样保证了AI不靠海量信息检索作弊,而是像一个真正的人类选手一样,在封闭、高压的环境下,纯粹依靠自身的逻辑推理和问题解决能力来编写代码、解决复杂算法问题

通用模型,而非特长生

OpenAI透露,他们使用的是一个通用推理模型的集成系统(ensemble),并没有针对IOI竞赛进行任何专门的训练或微调

团队唯一的人工干预仅仅在于:

1. 从模型生成的多个解法中,选择最优的那个进行提交

2. 将模型与IOI的提交API进行连接

除此以外,所有的解题过程全部由AI自主完成

一年从差点青铜到稳拿金牌🥇

Sheryl Hsu提到,去年的IOI竞赛,OpenAI也曾尝试过,但结果并不理想,最终与一枚铜牌🥉擦肩而过,仅排在49%分位。并且,去年的方案还动用了大量手工定制的测试时策略

而仅仅一年之后,OpenAI就实现了从49%分位到98%分位的大逆转,从差点青铜一跃成为金牌🥇王者

GPT-5塌房,下一代模型什么时候发布?

最近几周,OpenAI这个神秘的内部推理系统模型可谓是捷报频传,在多个世界顶级智力竞赛中展现了强大实力:

AtCoder世界总决赛: 取得第二名

IMO2025(国际数学奥林匹克):宣称取得金牌🥇

IOI2025(国际信息学奥林匹克): 斩获金牌🥇

那么这个内部推理系统是什么?下半年OpenAI还有真正的大招?

特别声明:[OpenAI杀疯了!内部神秘模型首次斩获信息学奥赛IOI 2025金牌🥇,碾压98%人类选手] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

倪萍:时隔3年重返家乡台,《2026山东春晚》上表演拿手戏脱口秀(倪萍终于走)

1月24日上午10点35分,山东卫视正式发布了这一消息,并附带了一个短短23秒的视频,展示了倪萍在晚会录制现场与观众的互动。时光荏苒,倪萍的主持风格早已深深植根于观众心中,而如今她不仅是主持人,也开始涉足脱口…

倪萍:时隔3年重返家乡台,《<strong>2026山东春晚</strong>》上表演拿手戏脱口秀(倪萍终于走)

打不过LOEWE,纪梵希快成混的最差的『奢侈品』牌了(打不过by)

CELINE、LOEWE以及纪梵希在财报中均被简单带过,2025年三个品牌的创意总监都发布了首个时装系列,从后续的市场反响看,并无哪个品牌有格外亮眼的表现。 目前LVMH给到纪梵希的配置是横跨时尚和美妆领域…

打不过LOEWE,纪梵希快成混的最差的『奢侈品』牌了(打不过by)

慢性胆囊炎的特征(慢性胆囊炎病症)

慢性胆囊炎是一种胆囊壁长期发炎的疾病,主要表现为右上腹疼痛、消化不良和黄疸。治疗包括药物治疗、饮食调整和必要时的手术干预。 慢性胆囊炎的主要特征是右上腹持续性或间歇性疼痛,这种疼痛有时会放射到肩背部

慢性胆囊炎的特征(慢性胆囊炎病症)

2026年旅行必备!孕妇出行如何挑选一次性马桶坐垫?(旅行必备书籍)

孕妇出门在外如厕是件麻烦事,普通公共马桶卫生隐患多。2026年推荐一款全覆盖设计的旅行马桶垫,不仅有效阻隔细菌和污渍,还特别针对孕期特殊需求做了贴心改进。本文为你详细剖析挑选要点,助您轻松享受洁净如厕体验。

2026年旅行必备!孕妇出行如何挑选一次性马桶坐垫?(旅行必备书籍)

韩国女星酒驾后想要复出,却遭网友抵制,面对镜头痛哭流泪(韩国女星酒驾被抓)

最近一次直播里,Lizzy对着镜头哭到停不下来,反复念叨“活着也行,不活也行”,看得人心里发紧。“酒驾艺人凭什么复出”“别再出现在镜头前”这类评论刷屏,五年过去了,大家的火气一点没消。也有不少粉丝默默留言,“…

韩国女星酒驾后想要复出,却遭网友抵制,面对镜头痛哭流泪(韩国女星酒驾被抓)