MCP Browser Use
M

MCP Browser Use

基于MCP协议的AI驱动浏览器自动化服务器,支持多模型交互与视觉分析,提供网页操作与会话保持功能
2分
5.8K

什么是Browser-Use MCP Server?

Browser-Use MCP Server是一个基于Model Context Protocol (MCP)的智能浏览器自动化服务器。它允许用户通过自然语言指令控制浏览器操作,如网页导航、表单填写和元素交互,无需编写代码。

如何使用Browser-Use MCP Server?

安装后,您可以通过Claude Desktop等客户端连接服务器,发送自然语言指令来控制浏览器。服务器支持多种AI模型提供商,可根据需要配置。

适用场景

适合自动化网页测试、数据采集、重复性网页操作、无障碍浏览辅助等场景。特别适合需要智能理解和执行复杂网页任务的场景。

主要功能

MCP协议集成
完整实现Model Context Protocol,支持AI代理与浏览器的智能交互
浏览器自动化
支持网页导航、表单填写、元素点击等常见浏览器操作
视觉理解
通过截图分析实现基于视觉的网页元素识别和交互
多模型支持
支持OpenAI、Anthropic、Azure、DeepSeek等多种AI模型提供商
会话持久化
可保持浏览器会话状态,支持长时间任务执行
优势
无需编程知识,使用自然语言控制浏览器
支持多种主流AI模型,可根据需求灵活切换
可视化交互能力,能理解网页布局和内容
会话保持功能,适合多步骤复杂任务
局限性
需要稳定的网络连接和API访问权限
复杂网页可能需要更精确的指令
部分高级功能需要特定浏览器配置

如何使用

安装准备
确保已安装Python 3.11+和Chrome/Chromium浏览器
配置环境变量
设置API密钥和浏览器参数,如OPENAI_API_KEY等
启动服务器
通过uv工具运行服务器
连接客户端
在Claude Desktop等客户端中配置连接参数

使用案例

网页数据收集
自动收集指定网页上的特定数据
表单自动填写
自动填写网页表单并提交
多步骤操作
执行需要多个步骤的网页任务

常见问题

为什么我的浏览器无法启动?
如何切换AI模型提供商?
服务器支持哪些浏览器?
如何启用视觉功能?

相关资源

官方文档
Browser-Use项目的完整文档
GitHub仓库
项目源代码和问题追踪
MCP协议说明
Model Context Protocol的官方说明
示例配置
各种环境下的配置示例

安装

复制以下命令到你的Client进行配置
"mcpServers": {
    "browser-use": {
      "command": "uvx",
      "args": [
        "mcp-server-browser-use",
      ],
      "env": {
        "OPENROUTER_API_KEY": "",
        "OPENROUTER_ENDPOINT": "https://openrouter.ai/api/v1",
        "OPENAI_ENDPOINT": "https://api.openai.com/v1",
        "OPENAI_API_KEY": "",
        "ANTHROPIC_ENDPOINT": "https://api.anthropic.com",
        "ANTHROPIC_API_KEY": "",
        "GOOGLE_API_KEY": "",
        "AZURE_OPENAI_ENDPOINT": "",
        "AZURE_OPENAI_API_KEY": "",
        "DEEPSEEK_ENDPOINT": "https://api.deepseek.com",
        "DEEPSEEK_API_KEY": "",
        "MISTRAL_API_KEY": "",
        "MISTRAL_ENDPOINT": "https://api.mistral.ai/v1",
        "OLLAMA_ENDPOINT": "http://localhost:11434",
        "ANONYMIZED_TELEMETRY": "true",
        "BROWSER_USE_LOGGING_LEVEL": "info",
        "CHROME_PATH": "",
        "CHROME_USER_DATA": "",
        "CHROME_DEBUGGING_PORT": "9222",
        "CHROME_DEBUGGING_HOST": "localhost",
        "CHROME_PERSISTENT_SESSION": "false",
        "BROWSER_HEADLESS": "false",
        "BROWSER_DISABLE_SECURITY": "false",
        "BROWSER_WINDOW_WIDTH": "1280",
        "BROWSER_WINDOW_HEIGHT": "720",
        "BROWSER_TRACE_PATH": "trace.json",
        "BROWSER_RECORDING_PATH": "recording.mp4",
        "RESOLUTION": "1920x1080x24",
        "RESOLUTION_WIDTH": "1920",
        "RESOLUTION_HEIGHT": "1080",
        "VNC_PASSWORD": "youvncpassword",
        "MCP_MODEL_PROVIDER": "anthropic",
        "MCP_MODEL_NAME": "claude-3-5-sonnet-20241022",
        "MCP_TEMPERATURE": "0.3",
        "MCP_MAX_STEPS": "30",
        "MCP_USE_VISION": "true",
        "MCP_MAX_ACTIONS_PER_STEP": "5",
        "MCP_TOOL_CALL_IN_CONTENT": "true"
    }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

Z
Zen MCP Server
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
Python
13.7K
5分
O
Opendia
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
JavaScript
10.5K
5分
N
Notte Browser
已认证
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
19.4K
4.5分
B
Bing Search MCP
一个用于集成微软Bing搜索API的MCP服务器,支持网页、新闻和图片搜索功能,为AI助手提供网络搜索能力。
Python
19.1K
4分
C
Cloudflare
Changesets是一个用于管理多包或单包仓库版本和发布的构建工具。
TypeScript
12.1K
5分
E
Eino
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Go
19.3K
5分
M
Modelcontextprotocol
已认证
该项目是一个集成Sonar API的MCP服务器实现,为Claude提供实时网络搜索能力。包含系统架构、工具配置、Docker部署及多平台集成指南。
TypeScript
13.4K
5分
S
Serena
Serena是一个强大的开源编码代理工具包,能够将LLM转化为可直接在代码库上工作的全功能代理。它提供类似IDE的语义代码检索和编辑工具,支持多种编程语言,并可通过MCP协议或Agno框架与多种LLM集成。
Python
21.5K
5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
63.7K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
44.1K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
38.7K
4.3分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
30.9K
4.5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
45.9K
4.7分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
20.6K
4.8分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
35.2K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
31.5K
5分
AIbase
智启未来,您的人工智能解决方案智库