使用 browser-369IT编程

admin管理员组
文章数量:1037775

使用 browser

引言

在数字化时代，网页信息填写和录入是许多业务流程中的重要环节，例如注册账户、提交在线表单或更新个人信息。这些任务往往耗时且容易出错，而自动化工具的引入可以显著提高效率并减少人为失误。GitHub 上的 browser-use/web-ui 项目为这一需求提供了一个创新且实用的解决方案。

事实上，browser-use 已经提供了一个通用的浏览器自动化工具，但 browser-use/web-ui 更进一步，提供了一个基于 Gradio 构建的 Web 用户界面，并支持多种大型语言模型（LLM），包括 Google、OpenAI、Azure OpenAI、Anthropic、DeepSeek 和 Ollama 等。它允许用户在浏览器中运行 AI 代理，自动完成网页交互任务。该工具的独特功能包括支持自定义浏览器（无需重复登录网站）、高清屏幕录制以及持久化浏览器会话，非常适合需要高效处理网页任务的用户。

本文将详细介绍如何通过本地安装（使用 pip）和 Docker 安装两种方式使用 browser-use/web-ui，并提供完整的操作流程。

效果展示

使用过程

以下是使用 browser-use/web-ui 的两种主要安装和运行方式：本地安装（pip） 和 Docker 安装。请根据您的需求选择适合的方法。

Docker 安装

1. 克隆仓库

与本地安装相同，克隆项目仓库：

代码语言：bash复制

git clone .git
cd web-ui

2. 创建并配置环境文件

复制并编辑环境文件：

Windows (Command Prompt)：

代码语言：cmd复制

copy .env.example .env

macOS/Linux/Windows (PowerShell)：

代码语言：bash复制

cp .env.example .env

编辑 .env 文件，添加 API 密钥，例如：

代码语言：ini复制

OPENAI_API_KEY=your_openai_key
VNC_PASSWORD=your_vnc_password  # 可选，设置 VNC 密码

3. 运行 Docker

根据需求选择运行模式：

默认模式（任务后关闭浏览器）：

代码语言：bash复制

docker compose up --build

持久化模式（任务间保持浏览器打开）：

代码语言：bash复制

CHROME_PERSISTENT_SESSION=true docker compose up --build

4. 访问应用程序

Web 界面：打开浏览器，访问 http://localhost:7788。
VNC 查看器（观察浏览器交互）：访问 http://localhost:6080/vnc.html，输入 VNC 密码（默认“youvncpassword”，或 .env 中设置的密码）。

5. 容器管理（可选）

后台运行：

代码语言：bash复制

docker compose up -d

查看日志：

代码语言：bash复制

docker compose logs -f

停止容器：

代码语言：bash复制

docker compose down

本地安装（使用 pip）

克隆仓库

首先，打开终端并运行以下命令，克隆项目仓库到本地：

代码语言：bash复制

git clone .git
cd web-ui

设置 Python 环境

建议使用 Python 3.11，并通过 uv 工具创建虚拟环境。执行以下命令：

代码语言：bash复制

uv venv --python 3.11

激活虚拟环境：

Windows (Command Prompt)：

代码语言：cmd复制

.venv\Scripts\activate

Windows (PowerShell)：

代码语言：powershell复制

.\.venv\Scripts\Activate.ps1

macOS/Linux：

代码语言：bash复制

source .venv/bin/activate

安装依赖

安装项目所需的 Python 包和 Playwright：

代码语言：bash复制

uv pip install -r requirements.txt
playwright install

配置环境

复制示例环境文件并编辑，添加您的 API 密钥和其他配置：

Windows (Command Prompt)：

代码语言：cmd复制

copy .env.example .env

macOS/Linux/Windows (PowerShell)：

代码语言：bash复制

cp .env.example .env

使用文本编辑器打开 .env 文件，填写必要信息，例如：

代码语言：ini复制

OPENAI_API_KEY=your_openai_key
CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"  # Windows 示例
CHROME_USER_DATA="C:\Users\YourUsername\AppData\Local\Google\Chrome\User Data"  # Windows 示例

运行 Web UI

启动应用程序：

代码语言：bash复制

python webui.py --ip 127.0.0.1 --port 7788

访问 Web UI

打开浏览器，导航到 http://127.0.0.1:7788，即可使用 Web 界面。

使用自定义浏览器（可选）

如果需要使用自己的浏览器（如已登录账户的 Chrome），在 .env 文件中设置：

Windows：

代码语言：ini复制

CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\YourUsername\AppData\Local\Google\Chrome\User Data"

macOS：

代码语言：ini复制

CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
CHROME_USER_DATA="/Users/YourUsername/Library/Application Support/Google/Chrome"

关闭所有 Chrome 窗口，在非 Chrome 浏览器（如 Firefox）中打开 Web UI，并在界面中勾选“Use Own Browser”选项。

保持浏览器打开（可选）

若希望在 AI 任务间保持浏览器窗口打开，可在 .env 中设置：

代码语言：ini复制

CHROME_PERSISTENT_SESSION=true

使用 VNC 访问浏览器可以连接 5901 端口，而使用 Web UI 访问浏览器可以连接 6080 端口。

结论

browser-use/web-ui 是一个功能强大且灵活的工具，能够有效自动化网页信息填写和录入任务。通过支持多种大型语言模型和自定义浏览器配置，它可以无缝集成到现有工作流程中。无论是选择本地安装（pip）还是 Docker 部署，用户都能通过简单的步骤快速上手，显著提升工作效率并减少错误。对于需要频繁处理网页交互的用户来说，这款工具无疑是一个值得尝试的解决方案。

问题解决

旧版本 docker compose 升级

代码语言：bash复制

sudo mkdir -p /etc/apt/keyrings
curl -fsSL  | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg

echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg]  $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

sudo apt update
sudo apt install docker-compose-plugin

docker compose version

参考

browser-use/web-ui GitHub 仓库
项目文档

使用 browser

引言

本文将详细介绍如何通过本地安装（使用 pip）和 Docker 安装两种方式使用 browser-use/web-ui，并提供完整的操作流程。

效果展示

使用过程

以下是使用 browser-use/web-ui 的两种主要安装和运行方式：本地安装（pip） 和 Docker 安装。请根据您的需求选择适合的方法。

Docker 安装

1. 克隆仓库

与本地安装相同，克隆项目仓库：

代码语言：bash复制

git clone .git
cd web-ui

2. 创建并配置环境文件

复制并编辑环境文件：

Windows (Command Prompt)：

代码语言：cmd复制

copy .env.example .env

macOS/Linux/Windows (PowerShell)：

代码语言：bash复制

cp .env.example .env

编辑 .env 文件，添加 API 密钥，例如：

代码语言：ini复制

OPENAI_API_KEY=your_openai_key
VNC_PASSWORD=your_vnc_password  # 可选，设置 VNC 密码

3. 运行 Docker

根据需求选择运行模式：

默认模式（任务后关闭浏览器）：

代码语言：bash复制

docker compose up --build

持久化模式（任务间保持浏览器打开）：

代码语言：bash复制

CHROME_PERSISTENT_SESSION=true docker compose up --build

4. 访问应用程序

Web 界面：打开浏览器，访问 http://localhost:7788。
VNC 查看器（观察浏览器交互）：访问 http://localhost:6080/vnc.html，输入 VNC 密码（默认“youvncpassword”，或 .env 中设置的密码）。

5. 容器管理（可选）

后台运行：

代码语言：bash复制

docker compose up -d

查看日志：

代码语言：bash复制

docker compose logs -f

停止容器：

代码语言：bash复制

docker compose down

本地安装（使用 pip）

克隆仓库

首先，打开终端并运行以下命令，克隆项目仓库到本地：

代码语言：bash复制

git clone .git
cd web-ui

设置 Python 环境

建议使用 Python 3.11，并通过 uv 工具创建虚拟环境。执行以下命令：

代码语言：bash复制

uv venv --python 3.11

激活虚拟环境：

Windows (Command Prompt)：

代码语言：cmd复制

.venv\Scripts\activate

Windows (PowerShell)：

代码语言：powershell复制

.\.venv\Scripts\Activate.ps1

macOS/Linux：

代码语言：bash复制

source .venv/bin/activate

安装依赖

安装项目所需的 Python 包和 Playwright：

代码语言：bash复制

uv pip install -r requirements.txt
playwright install

配置环境

复制示例环境文件并编辑，添加您的 API 密钥和其他配置：

Windows (Command Prompt)：

代码语言：cmd复制

copy .env.example .env

macOS/Linux/Windows (PowerShell)：

代码语言：bash复制

cp .env.example .env

使用文本编辑器打开 .env 文件，填写必要信息，例如：

代码语言：ini复制

OPENAI_API_KEY=your_openai_key
CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"  # Windows 示例
CHROME_USER_DATA="C:\Users\YourUsername\AppData\Local\Google\Chrome\User Data"  # Windows 示例

运行 Web UI

启动应用程序：

代码语言：bash复制

python webui.py --ip 127.0.0.1 --port 7788

访问 Web UI

打开浏览器，导航到 http://127.0.0.1:7788，即可使用 Web 界面。

使用自定义浏览器（可选）

如果需要使用自己的浏览器（如已登录账户的 Chrome），在 .env 文件中设置：

Windows：

代码语言：ini复制

CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\YourUsername\AppData\Local\Google\Chrome\User Data"

macOS：

代码语言：ini复制

CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
CHROME_USER_DATA="/Users/YourUsername/Library/Application Support/Google/Chrome"

关闭所有 Chrome 窗口，在非 Chrome 浏览器（如 Firefox）中打开 Web UI，并在界面中勾选“Use Own Browser”选项。

保持浏览器打开（可选）

若希望在 AI 任务间保持浏览器窗口打开，可在 .env 中设置：

代码语言：ini复制

CHROME_PERSISTENT_SESSION=true

使用 VNC 访问浏览器可以连接 5901 端口，而使用 Web UI 访问浏览器可以连接 6080 端口。

结论

问题解决

旧版本 docker compose 升级

代码语言：bash复制

sudo mkdir -p /etc/apt/keyrings
curl -fsSL  | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg

echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg]  $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

sudo apt update
sudo apt install docker-compose-plugin

docker compose version

参考

browser-use/web-ui GitHub 仓库
项目文档

本文标签：使用 browser

版权声明：本文标题：使用 browser 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748321635a2285272.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

使用 browser

使用 browser

引言

效果展示

使用过程

Docker 安装

1. 克隆仓库

2. 创建并配置环境文件

3. 运行 Docker

4. 访问应用程序

5. 容器管理（可选）

本地安装（使用 pip）

克隆仓库

设置 Python 环境

安装依赖

配置环境

运行 Web UI

访问 Web UI

使用自定义浏览器（可选）

保持浏览器打开（可选）

结论

问题解决

旧版本 docker compose 升级

参考

使用 browser

引言

效果展示

使用过程

Docker 安装

1. 克隆仓库

2. 创建并配置环境文件

3. 运行 Docker

4. 访问应用程序

5. 容器管理（可选）

本地安装（使用 pip）

克隆仓库

设置 Python 环境

安装依赖

配置环境

运行 Web UI

访问 Web UI

使用自定义浏览器（可选）

保持浏览器打开（可选）

结论

问题解决

旧版本 docker compose 升级

参考

更多相关文章

使用 browser

发表评论

推荐文章

傻瓜式复制AI提示词模板，手把手教你用AI搞定复杂Git操作

基于责任链与策略模式的轻量级PHP日志库设计

OpenAI Agents SDK 中文文档 中文教程 （3）

使用Yarn创建Grafana模板的完整指南

23.Harmonyos Next仿uv

热门文章

AutoDev Next：IDE 即 AI 编程服务，构建多端粪围编程

Avalonia UI 项目控件如何在亮色和暗色主题时使用不同的颜色？

如何用Flask构建API

[c语言日寄MAX]深度解析：大小端字节序

磁力搜索引擎一键获取你想要的资源：项目核心功能场景

服务器发送事件（SSE）在现代Web开发中的关键作用

MySQL从入门到精通：看这篇就够了

arXiv科研神器：Mistral OCR、Claude 3.7合体实现论文速读

一种去中心化动态博弈系统的思考

Go语言学习系列——运算符——【坚果派

最新文章

LLM学习笔记：如何理解LLM中的Transformer架构

o3 deep research: 智能体的应用和演进

从开发者视角洞见未来，找到自己的破局之道：Deepseek和Manus如何助力破局？

嵌入式Linux：阻塞式IO与非阻塞式IO

STM32如何精准控制步进电机？

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

How to vary WooCommerce product prices based on order dates

OpenAI Agents SDK 中文文档中文教程（3）

For a menu custom link (without a link) a "#" is appended. Can this just be blank, i.e. NO link?

multisite - Hook into 'admin_url' but only on Mysites admin bar menu