- Input:
max_tokens
:The maximum length of the final response after the CoT output is completed, defaulting to 4K, with a maximum of 8K. Note that the CoT output can reach up to 32K tokens, and the parameter to control the CoT length (reasoning_effort
) will be available soon.
- Output:
reasoning_content
:The content of the CoT,which is at the same level ascontent
in the output structure. See API Example for detailscontent
The content of the final answer
官方文档中提到思维链的输出会使用特定的 reasoning_content 字段输出,而不是直接在 content 中通过 <think></think> 标签来包裹。这样做的好处是客户端更容易获取到思维链内容,而不用进行正则匹配处理。还有利于在多轮对话内容中,思维链的内容不会被带入到下一轮对话中,避免对大模型的输出产生影响。
目前 DataPipe 已经兼容了 reasoning_content 输出思维链的方式,由于特定渠道的 R1 模型不够稳定,所以我们接入了多个渠道提供商,有的服务商还没有采用官方的 reasoning_content 方式输出,所以在对话的时候可能还会存在 <think> 标签包裹的思维链展示,但理论上后续都会升级成 reasoning_content 字段方式。
欢迎体验稳定的 DeepSeek-Reasoner(DeepSeek-R1) 大模型。
发表回复