除了OpenAI,Anthropic也在稍早时间推出新版Claude Opus 4.6模型,标榜提升写程序的能力,同时也是Opus等级模型首度在测试版中提供100万 token的超长上下文窗口,规划更周密,能更长时间执行代理任务,在多项评测中,都达到业界最先进水平。 Claude Pro 以上订阅用户现在就能使用了。

Claude Opus 4.6 两大升级:长任务更稳、1M token 上下文首度导入
Claude Opus 4.6 跟前一代 Claude Opus 4.5 的差别,主要在「长任务质量」与「大上下文的稳定度」部分,意味着能提供更好的规划、更久地维持代理式任务、在更大代码库更可靠、以及更强的程式码审查与除错。
关于「1M token 的上下文视窗」,很多人可能对 token 没什么概念,你可以把它看成一次能读进与记住的内容量,因此内容量变大后,AI 就更能在同一个对话里同时掌握多份文件、长报告、或更大的程式码专案脉络。
Anthropic 表示,他们发现到 Opus 4.6 会自动把注意力集中在最困难的部分,并快速处理比较简单的部分,如果碰到模糊问题,判断也更加成熟,并能在长时间工作下维持高效率。
Opus 4.6 也能应用在各种日常工作上,例如:财务分析、研究,以及使用或制作文件、试算表与简报,搭配 Cowork 更能自主完成你指定的工作。
再来看评分数。
在GDPval-AA(衡量金融、法律等具经济价值知识工作的评测)中,Opus 4.6的表现比OpenAI的GPT-5.2高出约144 Elo点,也比前代Claude Opus 4.5高出190点:
在 Humanity’s Last Exam(跨领域复杂推理测验)中也领先所有前沿模型:
在Vending-Bench 2测试中,Opus 4.6能长时间维持专注度,并比Opus 4.5多赚取3,050.53美元:
下图是更多测试成绩,许多方面都比 Opus 4.5 还要强,尤其是 Agentic search 和 Novel problem-solving:
图片来源:Claude
Anthropic 也同步推出 Claude in PowerPoint,安装后即可在 PowerPoint 侧边栏直接使用 Claude。
过去用户本来就能让Claude生成一份简报文件,但如果要编辑,还是需要手动导入PowerPoint,作有点麻烦,随着Claude in PowerPoint推出,用户就能直接在PowerPoint里完成生成和编辑,并在制作过程中持续获得Claude的帮助。
微信扫一扫
