Browser-use 详细介绍&使用文档

Browser-use 详细介绍&使用文档

参数名称
类型
默认值
说明
task str
(必传) 代理需要执行的任务描述。
llm BaseChatModel (LangChain Model)
(必传) 主语言模型,执行对话和工具调用。
controller object (Controller 实例) 默认Controller 自定义函数/工具调用的注册表。可参考“Custom Functions”。
use_vision bool True 是否启用视觉能力(截图+分析)。如模型支持图像输入,可显著提高网页理解;也会产生额外 token 成本。
save_conversation_path str
若指定,则会将对话历史保存在该路径下,用于调试或审计。
system_prompt_class type (自定义 System Prompt 类) 默认Prompt 类 自定义系统提示词逻辑,参考“System Prompt”定制化说明。
browser Browser (Browser-use 实例)
重用已创建的 Browser 实例;若不提供,则 Agent 每次 run() 时会自动创建并关闭新的浏览器。
browser_context BrowserContext (Playwright 实例)
使用已有的浏览器上下文 (Context)。适合需要维护持久会话 (cookies/localStorage) 的场景。
max_steps int 100 允许 Agent 执行的最大步骤数,防止死循环或无限操作。
planner_llm BaseChatModel
不启用 Planner 规划用语言模型,与主 LLM 分开;可用较小/便宜模型处理高层策略。
use_vision_for_planner bool True Planner 是否能使用视觉功能(若主 LLM 已开启视觉,这里可独立关闭以节省资源)。
planner_interval int 1 Planner 模型执行间隔。即每多少步调用一次 Planner 作重新规划。
message_context str
额外的任务/上下文信息,辅助 gpt 教程 LLM 更好理解或执行任务。
initial_actions list[dict]
初始化时要执行的动作列表(无需经 LLM 调用),格式为 {action_name: {…}}。
max_actions_per_step int 10 每个步骤里可执行的最大动作数,用于控制 Agent 过度频繁操作。
max_failures int 3 允许 Agent 失败的最大次数,超过则停止任务。
retry_delay int (秒) 10 当遇到限流 (rate limit) 或可重试的错误时,等待多少秒后再次尝试。
generate_gif bool 或 str (路径) False 是否录制浏览器过程生成 GIF。为 True 时自动生成随机文件名;为字符串时将 GIF 存储到该路径。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:Ai探索者,转载请注明出处:https://javaforall.net/239261.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 上午9:40
下一篇 2026年3月16日 上午9:40


相关推荐

关注全栈程序员社区公众号