| model |
string |
是 |
取值范围: spark-x |
spark-x (历史“x1”传参指向X1.5模型) |
科大讯飞 星火 教程
| user |
string |
否 |
用户的唯一id,表示一个用户,user_ |
|
| messages |
array |
是 |
输入数组 |
|
| messages.role |
string |
是 |
对话角色:user:表示用户 assistant:表示大模型 tool:工具结果的回传时使用 |
|
| messages.content |
string |
是 |
角色对应的文本内容 |
|
| temperature |
float |
否 |
核采样阈值 取值范围(0, 2] 默认值1.2 |
|
| top_p |
int |
否 |
生成过程中核采样方法概率阈值,例如,取值为0.8时,仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值越大,生成的随机性越高;取值越低,生成的确定性越高。 取值范围(0, 1] 默认值0.95 |
|
| top_k |
int |
否 |
从k个中随机选择一个(非等概率) 取值范围[1, 6] 默认值6 |
|
| presence_penalty |
float |
否 |
重复词的惩罚值 取值范围[0,3] 默认2.01 |
|
| frequency_penalty |
float |
否 |
频率惩罚值 取值范围[0,1] 默认0.001 |
|
| stream |
bool |
否 |
是否流式返回结果。默认是false 表示非流式。 如果使用流式,服务端使用SSE的方式推送结果,客户端自己适配处理结果。 |
|
| keep_alive |
bool |
否 |
是否开启非流式请求保活。默认是false 表示不开启。 如果开启,服务端会定时发送空行,直至所有结果返回。需要客户端自己处理空行。 |
|
| max_tokens |
int |
否 |
大模型输出信息的token上限: X2取值范围[1,] 默认值(128K) X1.5取值范围[1,65535] 默认值65535
|
|
| tool_choice |
string or object |
否 |
5种模式(前3种是string,后两种是object): auto:默认该值,模型自主决策是否调用工具; none:不允许模型调用工具; required:要求调用一个至多个工具 force模式:控制模型强制调用某个工具 allowed_tools模式:控制模型可以调用的工具范围 |
示例: force模式: “tool_choice”: allowed_tools模式: “tool_choice”: ,{“type”:”function”,”name”:”search_docs”}]} |
| tools |
array |
否 |
模型可能会调用的 tool 的列表 |
|
| tools.type |
string |
否 |
web_search和function 不可同时传 取值范围: web_search :控制搜索开关以及搜索模式 function:用于FunctionCall方法注册
|
|
| tools.web_search |
object |
否 |
enable 开关表示是否开启搜索功能 search_mode开启搜索时支持选择搜索模式deep or normal deep模式搜索内容更丰富 token使用量更高 默认为normal模式 |
{“type”:”web_search”,”web_search”:{“enable”:true,”search_mode”:”deep/normal”}} |
| tools.function |
object |
否 |
FunctionCall功能:用于方法命中和变量抽取场景 |
示例: |
| tools.function.name |
string |
否 |
function工具名称 |
|
| tools.function.description |
string |
否 |
function工具的功能描述,该描述影响模型的调用准确率 |
|
| tools.function.parameters |
object |
否 |
function工具所需要的参数,参数名称自定义,比如上面示例中的‘location’ |
{“location”:{“type”:”string”,”description”:”城市或县区,比如北京市、杭州市、余杭区等。”}} |
| tools.function.parameters.required |
array |
否 |
必须要返回的字段 |
“required”:[“location”] |
| thinking |
object |
否 |
用于控制深度思考模式 |
http请求示例: “thinking”: {“type”:”enabled”}
兼容OpenAI SDK 示例: extra_body= |
| thinking.type |
string |
否 |
默认为enabled(开启思考) 支持以下3种模式切换: enabled:强制开启深度思考能⼒ disabled:强制关闭深度思考能⼒ auto:模型⾃⾏判断是否进⾏深度思考
|
|
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/281341.html原文链接:https://javaforall.net