Anthropic 发布了 Claude Opus 4.6 版本,新增了自适应思维功能、输出令牌数量翻倍(128K)、用于处理长对话的全新压缩 API 以及数据驻留控制。此外,该版本还正式推出了工作量参数和细粒度工具流式传输功能。
- 适应性思维模式
- 最大输出代币数量为 128K(高于之前的 64K)
- 努力参数 GA 与新
max等级 - 用于服务器端上下文摘要的压缩 API(测试版)
- 细粒度工具流式遗传算法
- 通过数据驻留控制
inference_geo
什么是新的
自适应思维模式
新的
thinking: {type: "adaptive"}
模式允许克劳德根据问题自行决定何时思考以及思考多少。默认情况下
high
在努力程度较高的情况下,克劳德几乎总是会思考。在努力程度较低的情况下,对于较简单的问题,它可能会跳过思考。这取代了之前的……
budget_tokens
该方法现已弃用。
回复
=
client.messages.create(
模型
=
"claude-opus-4-6"
,
最大令牌数
=
16000
,
思维
=
{
“类型”
:
“适应性”
},
消息
=
[{
“角色”
:
“用户”
,
“内容”
:
“解决这个复杂的问题……”
}])
适应性思维还能自动实现交错思维,从而无需……
interleaved-thinking-2025-05-14
测试版标题。
128K 输出令牌
Opus 4.6 支持最多 128K 个输出令牌,是之前 64K 限制的两倍。这使得系统能够提供更长的思考时间和更详细的响应。对于包含大量令牌的请求,SDK 需要使用流式传输。
max_tokens
用于避免 HTTP 超时的值。
努力参数 GA
努力参数不再需要 beta 标题。一个新的
max
投入程度越高,Opus 4.6 的性能就越强。结合适应性思维,可以实现性价比的权衡。
压缩 API(测试版)
新增的服务器端上下文摘要功能支持长时间对话。当上下文接近窗口限制时,API 会自动摘要对话的前面部分,而不是直接截断。
细粒度工具流遗传算法
现在所有型号和平台都已普遍提供精细化工具流式传输功能,无需 beta 版标头。
数据驻留控制
新的
inference_geo
该参数允许您指定模型推理的运行位置——
"global"
(默认)或
"us"
仅限美国地区的推理功能在 Opus 4.6 及更新型号上的价格为 1.1 倍。
重大变化
预填充物移除: Opus 4.6 不支持预填充助手消息。使用预填充助手消息的请求会返回 400 错误。请改用结构化输出或系统提示指令。
output_format
更名:
这
output_format
参数已移至
output_config.format
旧参数仍然有效,但已被弃用。
# 前回复
=
client.messages.create(
输出格式
=
{
“类型”
:
"json_schema"
,
“模式”
:{
...
}},
...)# 后回复
=
client.messages.create(
输出配置
=
{
“格式”
:{
“类型”
:
"json_schema"
,
“模式”
:{
...
}}},
...)
弃用
thinking: {type: "enabled", budget_tokens: N}——改用适应性思维interleaved-thinking-2025-05-14测试版标题——自适应思维不再需要。output_format- 使用output_config.format
参考





