可独立工作7小时以上!OpenAI升级Codex代理,首份ChatGPT使用研究显示52%为女性♀️(可以独立工作的职业)

文丨丁灵波

许久没有大动作的OpenAI,今天迎来了一波产品更新,将其AI编码代理Codex正式升级到GPT-5版本。

该公司表示,新模型GPT-5-Codex的“思考”时间比之前的模型更加动态,完成一项编码任务所需的时间可从几秒到七个小时不等,因此,它既擅长快速的交互式会话,也能够独立完成冗长复杂的任务,其代码审查功能还可以在产品发布之前发现关键错误。

Codex可以在涉及开发的任何平台运行——终端或IDE、网页、GitHub甚至ChatGPT iOS应用。

OpenAI官方表示,GPT-5-Codex在SWE-bench Verified上的表现优于GPT-5,实现了大型成熟存储库的代码重构任务性能的新基准。

强化AI编码市场竞争

此次更新是OpenAI努力提升Codex在AI编码代理市场竞争力的一部分,其竞争对手都实力不俗,例如Claude Code、Anysphere的Cursor和微软的GitHub Copilot、谷歌的Jules等等。

由于用户需求旺盛,AI编码工具市场正在变得更加拥挤也开始加速洗牌。Cursor披露的年度经常性收入(ARR)在2025年初超过了5亿美元💵,而类似的代码编辑器Windsurf则遭遇了一场混乱的收购,导致其团队被谷歌和Cognition两家公司瓜分。

在国内,通义灵码、文心快码、腾讯CodeBuddy、字节跳动的Trae等等,深度适配各自的技术生态,逐步形成了与国际工具差异化的竞争力。

GPT‑5-Codex是GPT‑5的一个全新改进版本,专门针对代理软件工程进行了深度优化,聚焦解决更多实际工程任务,例如从头构建完整开发项目、添加功能和测试、调试、执行大规模重构以及进行代码审查。

GPT‑5-Codex会根据任务的复杂程度,更动态地调整其思考时间。

该模型结合了编码代理的两项基本技能:在交互式会话中与开发者配对,以及在较长的任务上持续、独立地执行。这意味着Codex在处理小型、定义明确的请求或与它聊天时会感觉更敏捷,并且在处理大型重构等复杂任务时也能工作更长时间。

在测试中,GPT‑5-Codex能够独立处理大型复杂任务超过7小时,不断迭代实现,修复测试错误,并最终交付成功的实现。

在OpenAI员工内部评估中,对于按模型生成的token(包括隐藏推理和最终输出)排序的后10%的用户轮次,GPT-5-Codex使用的token量比GPT-5少93.7%,但对于前10%的用户轮次,GPT-5-Codex的思考时间也更长,其推理、编辑和测试代码以及迭代的时间是GPT-5的两倍。

Sam Altman发帖透露,GPT‑5-Codex一上线就被开发者热捧,已经占据了Codex流量的约40%,今天某个时候应该会占到大多数。

比人类程序员审查还“严谨”

为了使Codex成为更好的AI程序员搭档,OpenAI还针对Codex CLI和Codex IDE等进行了扩展改进。

Codex CLI命令行界面:CLI现已围绕Agentic工作流重新构建,允许开发者直接附加线框图或屏幕截图等图像、共享上下文,并使用内置待办事项列表跟踪进度,还包含网页搜索和MCP等用于连接外部系统的工具,从而整体上提高了工具使用准确性;

Codex IDE扩展:该扩展可在VS Code、Cursor及类似分支中使用,使开发人员能够预览本地更改并在编辑器中使用Codex编辑代码;

Codex云环境:OpenAI在幕后改进了部署基础设施,将平均完成时间缩短了90%;

以及包含经过训练的代码审查功能,用于发现关键缺陷,在GitHub代码库中启用Codex后,它会随着拉取请求的进展自动审查、标记问题,甚至在同一审查线程内实施建议的修复方案,开发者还可以请求专门的审查,例如检查安全漏洞,官方称,即使是严谨的人工审查人员也未必总是能做到这种程度的细致工作。

女性♀️用户过半,七成使用与工作无关

除了技术产品的更新,OpenAI今天还推出了迄今为止最大规模的消费者ChatGPT使用情况研究,这项研究是美国国家经济研究局(NBER)的一份调研论文,由OpenAI经济研究团队和哈佛大学经济学家戴维·戴明共同撰写。

ChatGPT现在每周有超7亿活跃用户,该研究基于150万次对话进行了大规模隐私保护分析,追踪了自ChatGPT三年前推出以来消费者使用情况的变化,这是迄今为止发布的关于消费者实际使用ChatGPT的最全面研究。

截至2025年中,ChatGPT的早期性别差距已大幅缩小。ChatGPT于2022年底推出时,每周活跃的用户中约80%是男性♂️,到2025年7月,女性♀️命名用户比例已上升至一半以上(52.4%),而且,全球成年用户覆盖率已达到约10%。

ChatGPT的经济影响力已渗透工作和个人生活,尽管人们都在谈论AI可能会彻底改变职场,但数据显示仅约30%的用户使用与工作相关,约70%与工作无关。

从地域来看,ChatGPT在中低收入国家尤其增长迅速,截至2025年5月,ChatGPT在最低收入国家的采用增长率是最高收入国家的4倍以上。

其中,“实用指导”(Practical Guidance)、“信息查询”(Seeking Information)和 “内容创作”(Writing)是三大最常见应用场景,合计占所有对话的近80%。

越来越多的人将ChatGPT用作信息搜索引擎,2024年6月,约有14%的ChatGPT对话被标记为与“信息查询”相关,到2025年6月,这一数字上升至24.4%。

使用模式也分为从“询问”、“执行”和“表达”三个方面,大约一半的消息(49%)是询问,执行占使用量的40%,表达占使用量的11%,通常涉及个人反思、知识探索和娱乐,ChatGPT有助于提高用户判断力和生产力,尤其是在知识密集型工作中。

这份用户研究凸显了ChatGPT的双重角色,它既是生产力工具,也是用户日常生活中的高频AI助手,也见证了AI在人们的工作和日常生活中产生越来越重要的实际经济价值。

-END-

如果您有什么想说的,欢迎在评论区留言讨论!

投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。

【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——

添加头部科技晶总微信!Toptech007!

特别声明:[可独立工作7小时以上!OpenAI升级Codex代理,首份ChatGPT使用研究显示52%为女性♀️(可以独立工作的职业)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

小米九号平衡车坏了要怎么买维修配件?轮胎、挡泥板这些都能单独更换吗?(小米九号平衡车plus)

小米九号平衡车损坏后该如何高效找到合适的维修配件?轮胎、挡泥板、轮盖、前灯、尾灯、腿杆、充电器、踏板这些配件都可以单独购买,且更换简单。本篇文章深入分析了各种维修配件的适用场景和购买注意事项,同时给出了如何评估性价比、选择优质配件、确保安全

小米九号平衡车坏了要怎么买维修配件?轮胎、挡泥板这些都能单独更换吗?(小米九号平衡车plus)

28-38模具配件中的铜套铝套塑料套怎么选?2026最新解析(模具配件大全名称)

28-38尺寸模具配件中,铜套、铝套、塑料套各有优劣,如何根据预算和需求挑选合适配件?本文为你详细分析不同材质特性和应用场景,助您精准选型,节省投入,提升生产效率。了解滚珠导套、导柱保持架等相关配件的关键点和避坑指南。

28-38模具配件中的铜套铝套塑料套怎么选?2026最新解析(模具配件大全名称)

劳力士手表表盘变色怎么办?详解与维修建议(劳力士手表表盘刻度如何安装的)

以下内容将从表盘变色可能的原因、风险评估、是否需要维修与更换、官方维修流程、费用与时效、使用与保养建议等方面进行系统说明,帮助您以理性、专业的视角正确处理劳力士表盘变色问题。检测完成后,会向您反馈: 表盘…

劳力士手表表盘变色怎么办?详解与维修建议(劳力士手表表盘刻度如何安装的)

质变科技推出首个多模态记忆平台MemoryLake(质变之后是什么)

钛媒体App 2月6日消息,,推动AI从“数据为中心”转向“记忆为中心”。该平台集成大模型、记忆引擎及多模态存储系统,解决企业AI应用中多模态融合难、决策不可靠等痛点,已服务15个行业超1.5万家企业。据悉,…

质变科技推出首个多模态记忆平台MemoryLake(质变之后是什么)

一直放屁而且很臭怎么回事(爱放屁怎么回事)

持续放屁且气味难闻可能与饮食结构、胃肠功能紊乱、肠道菌群失衡、慢性肠炎、肠易激综合征等因素有关。改善方法包括调整饮食、补充益生菌和药物治疗等。 摄入过多高蛋白或富含硫化物的食物如鸡蛋、洋葱、西蓝花时,肠道分解会产生硫化氢等气体导致异味

一直放屁而且很臭怎么回事(爱放屁怎么回事)