首页科技快讯 Claude4.5刚刚发布，能连肝30多个小时，史上最卷AI 诞生

Claude4.5刚刚发布，能连肝30多个小时，史上最卷AI 诞生

来源：晰数塔互联网快讯时间：2025年09月30日 06:57

本文来自微信公众号：APPSO （ID：appsolution），作者：发现明日产品的，原文标题：《Claude 4.5 刚刚发布，能连肝 30 多个小时，史上最卷 AI 诞生》

论卷编程，还得看Claude。

就在刚刚，Anthropic正式发布Claude Sonnet 4.5。

先说Claude Sonnet 4.5交出的成绩单，在考察真实编程水平的SWE-bench Verified测试里，Claude Sonnet 4.5直接登顶业界第一。

更离谱的是，它能连续专注干活超过30小时。

好好好，AI取代人类的优势又+1了。

比如让它写个类似Slack或Teams的聊天应用，它能一口气敲出大约1.1万行代码。相比之下，之前的Claude Opus 4和Codex，最多也就能独立工作七小时。

用Anthropic的话来说，Claude Sonnet 4.5现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学，各项能力都狠狠提升了一波。

比方说，在OSWorld这个专门测试真实计算机任务的基准里，它拿下了61.4%的成绩，直接第一。要知道，四个月前Sonnet 4还以42.2%的成绩遥遥领先，这才多久性能就又往上抬了一大截。

而Anthropic的Claude Chrome插件甚至能直接在浏览器里自己导航网站、填表格、处理任务，像个真人在操作似的。推理、金融这些测评项目上也都更强了，各项指标都在往上涨。

有了这么强的能力，Anthropic这次自然不会只发个模型就完事。

具体来看：

Claude Code加了「检查点」功能，能随时保存进度，想回退到之前某个状态一键搞定

终端界面翻新，还发布了原生VS Code插件

Claude API增加了上下文编辑功能和记忆工具

代码执行和文件创建现在直接整合到对话里

甚至，Anthropic把自己内部用来搭建Claude Code的底层基础设施也开放出来了，叫Claude Agent SDK。

智能体怎么在长时间任务里管理记忆、怎么设计权限系统让自主性和用户控制找到平衡点、怎么让多个子智能体配合着完成目标，这些都是构建和设计AI智能体的棘手问题。

而借助Claude Agent SDK，现在你也能拿去构建自己的产品。

今天起，开发者还可以通过Claude API调用claude-sonnet-4-5。定价还是跟Claude Sonnet 4一样，每百万tokens$3/$15，价格没变能力更强。

网友@vasumanmoza体验完直接发帖：

「Claude 4.5 Sonnet刚在一次调用里重构了我整个代码库，25次工具调用，新增3000多行代码，生成了12个全新文件。它把所有东西都模块化了，拆掉了巨石式结构，清理了意大利面条式代码。结果完全跑不通，但天啊真的很优雅。」这评价，属于又爱又恨那种。

Cursor表示，在Claude Sonnet 4.5上看到了最前沿的编程性能，尤其处理长周期任务时提升明显。这也再次说明为什么很多Cursor用户会选Claude来解决最复杂的问题。

知名测评博主Dan Shipper则表示，新版Sonnet 4.5在使用体验上响应速度更快，可控性更强，也更稳定。

性能强是一方面，安全性也得跟上。

据介绍，Claude Sonnet 4.5也是Anthropic到目前为止对齐度最高的前沿模型。

靠着Claude更强的能力加上完善的安全训练，Anthropic在模型行为上取得了显著改进，减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外，Anthropic在防御提示注入攻击和减少内容误判这块也有了重大突破。

比较让我感兴趣的是，Anthropic还在Claude Sonnet 4.5发布的同时推出了个临时研究预览功能，叫「Imagine with Claude」。

在这个功能里，Claude会实时生成软件，所有功能不是预设的，所有代码也不是提前写好的。你看到的一切都是Claude跟你互动时当场创造和调整出来的。

不过，「Imagine with Claude」接下来五天内只会对Max订阅用户开放。

附上传送门claude.ai/imagine。

毫无疑问，今年的AI赛道依旧是卷编程的一年。

目前Anthropic估值已经到了1830亿美元，8月还实现了年化营收50亿美元，但这其中相当一部分增长靠着来自编程软件的普及。问题是，老对手OpenAI和Google Gemini也在疯狂推类似工具抢程序员用户。

甚至一周之后就是OpenAI年度开发者大会，Anthropic这个时候抢先发布Claude Sonnet 4.5，时间卡得够精准，明摆着就是要给对手上一波压力。

此外，Anthropic联合创始人兼首席科学官Jared Kaplan还表示，更先进的Opus模型，预计今年晚些时候推出：「Anthropic在大小模型的使用上都能占优势。」

不过有一说一，Anthropic自己眼下也有麻烦要解决。

过去两个月，Claude系列模型刚经历了一场「降智」风波。用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑，连付费的Max用户都没能幸免。

虽然Anthropic后来紧急回滚了Opus 4.1更新，还承认了两个独立Bug，声明「绝非为省成本故意降智」，但由于没提供补偿或退款，GitHub和X等平台上还是出现了退订潮，不少用户直接转投Codex。

这次Claude Sonnet 4.5的发布，显然就是Anthropic想用实打实的性能提升来挽回流失的用户。至于能不能成功，就看接下来几周的实际表现了。

欢迎加入APPSO AI社群，一起畅聊AI产品，获取#AI有用功，解锁更多AI新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️邮件标题「姓名+岗位名称」（请随简历附上项目/作品或相关链接）

Claude4.5刚刚发布，能连肝30多个小时，史上最卷AI 诞生

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包

Claude4.5刚刚发布，能连肝30多个小时，史上最卷AI 诞生

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化 愿掏数十亿腰包

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包