星火深度推理http接口文档

星火深度推理http接口文档

名称 类型 是否必传 描述 传参示例 model string 是 取值范围:
spark-x
spark-x
(历史“x1”传参指向X1.5模型)

科大讯飞 星火 教程

user string 否 用户的唯一id,表示一个用户,user_ messages array 是 输入数组 messages.role string 是 对话角色:user:表示用户
assistant:表示大模型
tool:工具结果的回传时使用

messages.content string 是 角色对应的文本内容 temperature float 否 核采样阈值 取值范围(0, 2] 默认值1.2 top_p int 否 生成过程中核采样方法概率阈值,例如,取值为0.8时,仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值越大,生成的随机性越高;取值越低,生成的确定性越高。 取值范围(0, 1] 默认值0.95 top_k int 否 从k个中随机选择一个(非等概率) 取值范围[1, 6] 默认值6 presence_penalty float 否 重复词的惩罚值 取值范围[0,3] 默认2.01 frequency_penalty float 否 频率惩罚值 取值范围[0,1] 默认0.001 stream bool 否 是否流式返回结果。默认是false 表示非流式。 如果使用流式,服务端使用SSE的方式推送结果,客户端自己适配处理结果。 keep_alive bool 否 是否开启非流式请求保活。默认是false 表示不开启。 如果开启,服务端会定时发送空行,直至所有结果返回。需要客户端自己处理空行。 max_tokens int 否 大模型输出信息的token上限:
X2取值范围[1,] 默认值(128K)
X1.5取值范围[1,65535] 默认值65535


tool_choice string or object 否 5种模式(前3种是string,后两种是object):
auto:默认该值,模型自主决策是否调用工具;
none:不允许模型调用工具;
required:要求调用一个至多个工具
force模式:控制模型强制调用某个工具
allowed_tools模式:控制模型可以调用的工具范围




示例:
force模式:
“tool_choice”:
allowed_tools模式:
“tool_choice”: ,{“type”:”function”,”name”:”search_docs”}]}



tools array 否 模型可能会调用的 tool 的列表 tools.type string 否 web_search和function 不可同时传
取值范围:
web_search :控制搜索开关以及搜索模式
function:用于FunctionCall方法注册



tools.web_search object 否 enable 开关表示是否开启搜索功能
search_mode开启搜索时支持选择搜索模式deep or normal
deep模式搜索内容更丰富 token使用量更高
默认为normal模式


{“type”:”web_search”,”web_search”:{“enable”:true,”search_mode”:”deep/normal”}} tools.function object 否 FunctionCall功能:用于方法命中和变量抽取场景 示例: tools.function.name string 否 function工具名称 tools.function.description string 否 function工具的功能描述,该描述影响模型的调用准确率 tools.function.parameters object 否 function工具所需要的参数,参数名称自定义,比如上面示例中的‘location’ {“location”:{“type”:”string”,”description”:”城市或县区,比如北京市、杭州市、余杭区等。”}} tools.function.parameters.required array 否 必须要返回的字段 “required”:[“location”] thinking object 否 用于控制深度思考模式 http请求示例:
“thinking”: {“type”:”enabled”}

兼容OpenAI SDK 示例:
extra_body=



thinking.type string 否 默认为enabled(开启思考)
支持以下3种模式切换:
enabled:强制开启深度思考能⼒
disabled:强制关闭深度思考能⼒
auto:模型⾃⾏判断是否进⾏深度思考




版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/281341.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月14日 下午4:44
下一篇 2026年3月14日 下午4:45


相关推荐

关注全栈程序员社区公众号