Claude 4登场：Anthropic发布全新AI编程模型

旧金山 — 人工智能公司Anthropic近日正式发布其最新一代AI模型——Claude 4，该系列包括Claude Opus 4和Claude Sonnet 4两款模型。Anthropic宣称，Claude Opus 4是目前全球最强大的编程模型，在代码生成、优化和调试等复杂任务上表现卓越，而Claude Sonnet 4则在编程和推理能力上实现了显著提升，更适合日常应用。

Claude 4的核心功能与优势

Claude 4系列模型在多个方面实现了技术突破，旨在提升AI在编程领域的实用性和效率：

代码生成与优化： Claude Opus 4在SWE-bench和Terminal-bench等行业基准测试中取得了领先成绩，能够生成高质量的代码，极大地提升开发效率。
长任务处理： Claude Opus 4能够持续处理复杂的长时间任务，连续工作数小时，这对于需要长时间运行的工作流至关重要。
代码编辑与调试： Claude Sonnet 4在代码编辑和调试方面表现出色，能够精确修改多个文件中的代码，减少人工干预。
高级推理能力： Claude Opus 4能够解决其他模型无法完成的复杂问题，展现出强大的推理能力。
多模态能力： Claude 4在编码、推理、多模态和代理任务等方面均表现出色，适应更广泛的应用场景。
工具使用与扩展思维： Claude 4能够利用网络搜索等工具进行扩展思维，提高响应质量，并能并行使用工具，提升任务处理效率。
本地文件访问与记忆能力： 开发者可以授予Claude 4本地文件访问权限，使其能够提取并保存关键信息，提升任务连贯性和性能。
减少捷径行为： Claude 4在执行任务时，减少了使用捷径或漏洞的行为，提高了任务的可靠性。
记忆能力提升： Claude Opus 4能够创建和维护“记忆文件”存储关键信息，提升长期任务的意识和连贯性。
思考总结： Claude 4引入思考总结功能，压缩冗长的思考过程，仅在约5%的情况下需要使用，提高了效率。

测试表现

Claude 4在多项基准测试中表现出色，进一步证明了其在编程领域的领先地位：

Claude Opus 4：
- SWE-bench：得分72.5%，显著领先其他模型。
- Terminal-bench：得分43.2%，表现优异。
Claude Sonnet 4：
- SWE-bench：实现72.7%的出色编码效率。

产品定价与订阅计划

Anthropic为Claude 4系列模型提供了灵活的定价和订阅计划：

Claude Opus 4： 每百万Token输入为15美元，每百万Token输出为75美元。
Claude Sonnet 4： 每百万Token输入为3美元，每百万Token输出为15美元。
订阅计划： 订阅Pro、Max、Team 和 Enterprise 计划的用户，可以体验 Claude Opus 4 和 Claude Sonnet 4 的访问权限和扩展思维，其中Sonnet 4 面向免费用户开放。

应用场景

Claude 4系列模型在多个领域具有广泛的应用前景：