Browser Use Server

一个基于Python脚本的浏览器自动化MCP服务器，支持网页截图、HTML获取、JavaScript执行和控制台日志收集等功能，可与Cline工具集成使用。

浏览器自动化开发者工具 #浏览器自动化 #网页操作 #MCP服务远程 .Python

评分 : 2.5分

下载量 : 6.3K

更新时间 : 2025-04-23

打开站点

🚀 浏览器使用服务器

这是一个用于网页浏览器自动化操作的MCP（Middleware Communication Protocol）服务器。它支持网页截图、HTML获取、JavaScript执行以及控制台日志获取等多种功能，还能通过命令进行多步骤操作，极大提升了网页自动化操作的效率和灵活性。

🚀 快速开始

本服务器可用于网页浏览器自动化操作，支持多种强大功能。你可以按照以下步骤进行安装和使用。

✨ 主要特性

1. 截图

参数：
- url：必填项，目标网页的URL。
- full：可选项，默认为false，若设置为true则捕获完整页面截图。
- steps：可选项，以逗号分隔的操作步骤或指令。

2. 获取HTML

参数：
- url：必填项，目标网页的URL。
- steps：可选项，以逗号分隔的操作步骤或指令。

3. 执行JavaScript

参数：
- url：必填项，目标网页的URL。
- script：必填项，需要执行的JavaScript代码。
- steps：可选项，以逗号分隔的操作步骤或指令。

4. 获取控制台日志

参数：
- url：必填项，目标网页的URL。
- steps：可选项，以逗号分隔的操作步骤或指令。

📦 安装指南

前置条件

安装Xvfb（用于无头浏览器环境）：
```
sudo apt-get install xvfb
```

安装Miniconda 或 Anaconda，并创建Conda环境：

conda create -n browser-use python=3.8
conda activate browser-use

通过Smithy安装

克隆仓库：

git clone https://github.com/browser-use/server.git
cd server

安装依赖项并构建服务器：
```
npm install
npm run build
```

📚 详细文档

MCP配置

{
  "browser-use": {
    "llm-providers": [
      "glhf", // 使用 deepseek-ai/DeepSeek-V3 模型
      "ollama", // 使用 qwen2.5:32b-instruct-q4_K_M 模型，上下文长度为32k
      "groq", // 使用 deepseek-r1-distill-llama-70b 模型
      "openai", // 使用 gpt-4o-mini 模型
      "openrouter", // 使用 deepseek/deepseek-chat 模型
      "github", // 使用 gpt-4o-mini 模型
      "deepseek", // 使用 deepseek-chat 模型
      "gemini" // 使用 gemini-2.0-flash-exp 模型
    ],
    "vision-support": false, // 默认禁用视觉功能，启用可提升性能；设置为 true 开启视觉支持
    "use-xvfb": true // 自动检测并使用 Xvfb 运行环境变量 RUNNING_UNDER_XVFB
  }
}

配置选项

LLM 提供商：支持多种大型语言模型，具体包括：
- glhf：使用 deepseek-ai/DeepSeek-V3 模型
- ollama：使用 qwen2.5:32b-instruct-q4_K_M 模型，上下文长度为32k
- groq：使用 deepseek-r1-distill-llama-70b 模型
- openai：使用 gpt-4o-mini 模型
- openrouter：使用 deepseek/deepseek-chat 模型
- github：使用 gpt-4o-mini 模型
- deepseek：使用 deepseek-chat 模型
- gemini：使用 gemini-2.0-flash-exp 模型

💻 使用示例

服务器运行

npm start

示例用法

示例1：网页元素修改

将页面上的文字颜色改为红色：
browser.use.steps(
  "打开浏览器",
  "访问网址 http://example.com",
  "找到所有段落元素并设置颜色为红色"
)

调试工具

npm run debug

🔧 技术细节

服务器会在控制台输出详细的错误信息，便于排查问题。

📄 许可证

MIT License

使用场景

网页自动化测试
数据抓取与分析
动态网页交互操作
多步骤任务执行

screenshot

获取网页截图。

参数

url : string*

描述

要访问的URL。

参数

steps : string*

描述

页面加载后执行的逗号分隔操作或描述步骤。

get_html

获取网页的HTML内容。

参数

url : string*

描述

要访问的URL。

参数

steps : string*

描述

页面加载后执行的逗号分隔操作或描述步骤。

execute_js

在网页上执行JavaScript代码。

参数

url : string*

描述

要访问的URL。

参数

script : string*

描述

要在网页上执行的JavaScript代码。

参数

steps : string*

描述

页面加载后执行的逗号分隔操作或描述步骤。

get_console_logs

获取网页控制台日志。

参数

url : string*

描述

要访问的URL。

参数

steps : string*

描述

页面加载后执行的逗号分隔操作或描述步骤。

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

TypeScript

45.7K

5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

智启未来，您的人工智能解决方案智库

Browser Use Server

工具列表

内容详情

替代品

安装

🚀 浏览器使用服务器

🚀 快速开始

✨ 主要特性

1. 截图

2. 获取HTML

3. 执行JavaScript

4. 获取控制台日志

📦 安装指南

前置条件

通过Smithy安装

📚 详细文档

MCP配置

配置选项

💻 使用示例

服务器运行

示例用法

示例1：网页元素修改

调试工具

🔧 技术细节

📄 许可证

使用场景

替代品