MCP Browser Use
M

MCP Browser Use

基于MCP协议的AI驱动浏览器自动化服务器,支持多模型交互与视觉分析,提供网页操作与会话保持功能
2分
6.1K

什么是Browser-Use MCP Server?

Browser-Use MCP Server是一个基于Model Context Protocol (MCP)的智能浏览器自动化服务器。它允许用户通过自然语言指令控制浏览器操作,如网页导航、表单填写和元素交互,无需编写代码。

如何使用Browser-Use MCP Server?

安装后,您可以通过Claude Desktop等客户端连接服务器,发送自然语言指令来控制浏览器。服务器支持多种AI模型提供商,可根据需要配置。

适用场景

适合自动化网页测试、数据采集、重复性网页操作、无障碍浏览辅助等场景。特别适合需要智能理解和执行复杂网页任务的场景。

主要功能

MCP协议集成
完整实现Model Context Protocol,支持AI代理与浏览器的智能交互
浏览器自动化
支持网页导航、表单填写、元素点击等常见浏览器操作
视觉理解
通过截图分析实现基于视觉的网页元素识别和交互
多模型支持
支持OpenAI、Anthropic、Azure、DeepSeek等多种AI模型提供商
会话持久化
可保持浏览器会话状态,支持长时间任务执行
优势
无需编程知识,使用自然语言控制浏览器
支持多种主流AI模型,可根据需求灵活切换
可视化交互能力,能理解网页布局和内容
会话保持功能,适合多步骤复杂任务
局限性
需要稳定的网络连接和API访问权限
复杂网页可能需要更精确的指令
部分高级功能需要特定浏览器配置

如何使用

安装准备
确保已安装Python 3.11+和Chrome/Chromium浏览器
配置环境变量
设置API密钥和浏览器参数,如OPENAI_API_KEY等
启动服务器
通过uv工具运行服务器
连接客户端
在Claude Desktop等客户端中配置连接参数

使用案例

网页数据收集
自动收集指定网页上的特定数据
表单自动填写
自动填写网页表单并提交
多步骤操作
执行需要多个步骤的网页任务

常见问题

为什么我的浏览器无法启动?
如何切换AI模型提供商?
服务器支持哪些浏览器?
如何启用视觉功能?

相关资源

官方文档
Browser-Use项目的完整文档
GitHub仓库
项目源代码和问题追踪
MCP协议说明
Model Context Protocol的官方说明
示例配置
各种环境下的配置示例

安装

复制以下命令到你的Client进行配置
"mcpServers": {
    "browser-use": {
      "command": "uvx",
      "args": [
        "mcp-server-browser-use",
      ],
      "env": {
        "OPENROUTER_API_KEY": "",
        "OPENROUTER_ENDPOINT": "https://openrouter.ai/api/v1",
        "OPENAI_ENDPOINT": "https://api.openai.com/v1",
        "OPENAI_API_KEY": "",
        "ANTHROPIC_ENDPOINT": "https://api.anthropic.com",
        "ANTHROPIC_API_KEY": "",
        "GOOGLE_API_KEY": "",
        "AZURE_OPENAI_ENDPOINT": "",
        "AZURE_OPENAI_API_KEY": "",
        "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
        "DEEPSEEK_API_KEY": "",
        "MISTRAL_API_KEY": "",
        "MISTRAL_ENDPOINT": "https://api.mistral.ai/v1",
        "OLLAMA_ENDPOINT": "http://localhost:11434",
        "ANONYMIZED_TELEMETRY": "true",
        "BROWSER_USE_LOGGING_LEVEL": "info",
        "CHROME_PATH": "",
        "CHROME_USER_DATA": "",
        "CHROME_DEBUGGING_PORT": "9222",
        "CHROME_DEBUGGING_HOST": "localhost",
        "CHROME_PERSISTENT_SESSION": "false",
        "BROWSER_HEADLESS": "false",
        "BROWSER_DISABLE_SECURITY": "false",
        "BROWSER_WINDOW_WIDTH": "1280",
        "BROWSER_WINDOW_HEIGHT": "720",
        "BROWSER_TRACE_PATH": "trace.json",
        "BROWSER_RECORDING_PATH": "recording.mp4",
        "RESOLUTION": "1920x1080x24",
        "RESOLUTION_WIDTH": "1920",
        "RESOLUTION_HEIGHT": "1080",
        "VNC_PASSWORD": "youvncpassword",
        "MCP_MODEL_PROVIDER": "anthropic",
        "MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
        "MCP_TEMPERATURE": "0.3",
        "MCP_MAX_STEPS": "30",
        "MCP_USE_VISION": "true",
        "MCP_MAX_ACTIONS_PER_STEP": "5",
        "MCP_TOOL_CALL_IN_CONTENT": "true"
    }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

K
Klavis
Klavis AI是一个开源项目,提供在Slack、Discord和Web平台上简单易用的MCP(模型上下文协议)服务,包括报告生成、YouTube工具、文档转换等多种功能,支持非技术用户和开发者使用AI工作流。
TypeScript
8.2K
5分
D
Devtools Debugger MCP
Node.js调试器MCP服务器,提供基于Chrome DevTools协议的完整调试功能,包括断点设置、单步执行、变量检查和表达式评估等
TypeScript
6.4K
4分
M
Mcpjungle
MCPJungle是一个自托管的MCP网关,用于集中管理和代理多个MCP服务器,为AI代理提供统一的工具访问接口。
Go
0
4.5分
N
Nexus
Nexus是一个AI工具聚合网关,支持连接多个MCP服务器和LLM提供商,通过统一端点提供工具搜索、执行和模型路由功能,支持安全认证和速率限制。
Rust
0
4分
Z
Zen MCP Server
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
Python
18.9K
5分
O
Opendia
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
JavaScript
11.9K
5分
N
Notte Browser
已认证
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
21.6K
4.5分
B
Bing Search MCP
一个用于集成微软Bing搜索API的MCP服务器,支持网页、新闻和图片搜索功能,为AI助手提供网络搜索能力。
Python
20.3K
4分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
58.1K
4.3分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
56.9K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
97.4K
5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
40.2K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
25.5K
4.8分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
46.6K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
38.0K
4.5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
72.1K
4.7分
AIBase
智启未来,您的人工智能解决方案智库