Browser-use 详细介绍&使用文档

参数名称
类型
默认值
说明
task str
无（必传）代理需要执行的任务描述。
llm BaseChatModel (LangChain Model)
无（必传）主语言模型，执行对话和工具调用。
controller object (Controller 实例) 默认Controller 自定义函数/工具调用的注册表。可参考“Custom Functions”。
use_vision bool True 是否启用视觉能力（截图+分析）。如模型支持图像输入，可显著提高网页理解；也会产生额外 token 成本。
save_conversation_path str
无若指定，则会将对话历史保存在该路径下，用于调试或审计。
system_prompt_class type (自定义 System Prompt 类) 默认Prompt 类自定义系统提示词逻辑，参考“System Prompt”定制化说明。
browser Browser (Browser-use 实例)
无重用已创建的 Browser 实例；若不提供，则 Agent 每次 run() 时会自动创建并关闭新的浏览器。
browser_context BrowserContext (Playwright 实例)
无使用已有的浏览器上下文 (Context)。适合需要维护持久会话 (cookies/localStorage) 的场景。
max_steps int 100 允许 Agent 执行的最大步骤数，防止死循环或无限操作。
planner_llm BaseChatModel
不启用 Planner 规划用语言模型，与主 LLM 分开；可用较小/便宜模型处理高层策略。
use_vision_for_planner bool True Planner 是否能使用视觉功能（若主 LLM 已开启视觉，这里可独立关闭以节省资源）。
planner_interval int 1 Planner 模型执行间隔。即每多少步调用一次 Planner 作重新规划。
message_context str
无额外的任务/上下文信息，辅助 gpt 教程 LLM 更好理解或执行任务。
initial_actions list[dict]
无初始化时要执行的动作列表（无需经 LLM 调用），格式为 {action_name: {…}}。
max_actions_per_step int 10 每个步骤里可执行的最大动作数，用于控制 Agent 过度频繁操作。
max_failures int 3 允许 Agent 失败的最大次数，超过则停止任务。
retry_delay int (秒) 10 当遇到限流 (rate limit) 或可重试的错误时，等待多少秒后再次尝试。
generate_gif bool 或 str (路径) False 是否录制浏览器过程生成 GIF。为 True 时自动生成随机文件名；为字符串时将 GIF 存储到该路径。

发布者：Ai探索者，转载请注明出处：https://javaforall.net/239261.html原文链接：https://javaforall.net

Browser-use 详细介绍&使用文档

关于作者

Ai探索者网站注册用户

Browser-use 详细介绍&使用文档

关于作者

Ai探索者网站注册用户

相关推荐

配置元数据库(可选)

OpenAI GPT-5.1 正式发布 – 更温柔智能的升级详解

ChatGPT 怎麼用？5 分鐘上手的新手中文教學！

智谱旗舰 GLM-5 实测：对比 Opus 4.6 和 GPT-5.3-Codex

Cursor2.0重磅升级，自研模型 Composer 上线！实测效果超越Claude4.5和gpt-5-codex！这把最强AI IDE稳了！

最新版本AutoGPT简要介绍与本地部署教程