地表最强编程 AI:Claude 4 系列登场,自动写代码 7小时刷新纪录

5 月 23 日消息,Anthropic 公司在北京时间今天(5 月 23 日) 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。

今日霍州(www.jrhz.info)©️

Claude Opus 4:复杂推理与软件开发的巅峰之作

援引博文介绍,Claude Opus 4 被定位为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。

测试数据显示,该模型在 SWE-bench 基准测试(评估模型解决真实 GitHub 问题的能力)中准确率达到 72.5%;在 TerminalBench 测试(在多步骤终端代码生成任务中验证模型表现)中准确率为 43.2%。

更令人瞩目的是,Opus 4 在软件环境中展现出强大的自主行为,得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,据 Rakuten 测试数据,可连续进行近 7 小时的代码生成和任务执行,刷新 AI 世界纪录,远超前代 Claude 3 Opus(不到 1 小时)。

今日霍州(www.jrhz.info)©️

Anthropic 声称,其 AI 模型不是为了消除工作岗位,而是一种将日常工作自动化的工具。不过 marktechpost 媒体认为,Claude 4 系列问世后,将改变 AI 的使用方式,让 AI 从完成单一任务的辅助工具,转换为具备更强、更广泛功能的“AI 同事”,可以自动工作几乎一个完整的工作班次。

Claude Sonnet 4:平衡性能与成本的通用选择

Claude Sonnet 4 取代了前代 Claude 3.5 Sonnet,以更稳定的架构提升速度与质量,同时未显著增加计算成本。该模型针对中规模部署优化,适合需要在成本与性能间权衡的场景。

尽管推理能力不及 Opus 4,但 Sonnet 4 继承了许多架构升级,支持多文件代码导航、中间工具使用和结构化文本处理,延迟表现更佳。它成为 Claude.ai免费用户的默认模型,并通过 API 提供服务,适用于轻量开发工具、用户助手和分析流程。

技术亮点与部署方式

两款模型均具备混合推理能力,提供“快速模式”(Fast Mode)用于低延迟的简短对话任务,以及“扩展思考模式”(Extended Thinking Mode)用于需要深度推理和多轮代理行为的复杂任务。

这种双模式策略让用户能根据任务复杂度灵活分配计算资源。此外,Claude Opus 4 和 Sonnet 4 可通过 Anthropic 的 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 等多个云平台访问,支持从自主代理到代码分析等多种企业应用场景。

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

特别声明:[地表最强编程 AI:Claude 4 系列登场,自动写代码 7小时刷新纪录] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

米兰男装周街拍合集:模特们的简单随性风,藏着四季时尚巧思(2021米兰『时装周』男装秀场)

秋冬趋势:质感与意式经典 而 FW26 的 “沉稳感” 也在街拍中有所体现:Zegna风格的深色系大衣、Ralph Lauren回归秀场的经典cashmere 外套🧥,模特们用深棕、墨绿、黑色等暗色调单品,…

米兰男装周街拍合集:模特们的简单随性风,藏着四季时尚巧思(2021米兰『时装周』男装秀场)

如懿传》的宫斗中,除了如懿出类拔萃,其实还有一位狠角色(如懿传的太后是谁演的)

就如同《如懿传》中的宫斗,那些身着华丽服饰、心机深沉的嫔妃们,心思缜密,一场又一场生死博弈,为了权力与宠爱,争斗得你死我活。凭借聪慧机智和深沉的谋略,青樱不仅在乾隆继位的第二年便被册封为娴妃,更在宫廷斗争的每…

《<strong>如懿传</strong>》的宫斗中,除了如懿出类拔萃,其实还有一位狠角色(如懿传的太后是谁演的)

原来他们是夫妻,曾同班同学,演50多部戏不红,如今52岁火遍全国(原来她们才是主角🎭️最新章节)

2000年他凭话剧奖拿奖那晚,抱着奖杯🏆️挤地铁,箱子太大被乘客骂了,他一句话也没说,只是在心里想:总算能给媳妇买条新床单了。 我在刷到这一段采访时,突然明白了大家为何会集体破防。反正明天早上七点,他照旧会去…

原来他们是夫妻,曾同班同学,演50多部戏不红,如今52岁火遍全国(原来她们才是主角🎭️最新章节)

赵樱子回应总上热搜“不那么会讲能上这么多热搜吗?”,还让网友称呼她“博嫂”(赵樱子现在在干嘛)

1月31日,随着她参与的综艺《主咖和Ta的朋友们》播出,这位常年住在热搜边上的女星,又一次用高情商(或者说高“怼”商)回应,成功将话题变成了自己的主场。结果被赵樱子一句反问轻松怼回:“『直播间』要不那么会讲能上这…

赵樱子回应总上热搜“不那么会讲能上这么多热搜吗?”,还让网友称呼她“博嫂”(赵樱子现在在干嘛)

小沃EIite5全预混冷凝炉真的适合2026年的家庭采暖吗?(小沃科技小沃科技)

小沃EIite5全预混冷凝炉以其智能恒温和高效节能性能,备受市场关注。它能否真正满足您对家庭采暖与生活热水的需求呢?本文深入解析其核心技术、适用场景及性价比,助您轻松选购。

小沃EIite5全预混冷凝炉真的适合2026年的家庭采暖吗?(小沃科技小沃科技)