Webscout MCP

WebScout MCP是一个基于Model Context Protocol的Web应用逆向工程工具，专注于聊天界面和流式API的自动化分析，提供浏览器自动化、网络流量捕获和智能模式检测功能

浏览器自动化开发者工具 #网络分析 #浏览器自动化 #API发现 .JavaScript

评分 : 2.5分

下载量 : 7.5K

更新时间 : 2025-10-09

打开站点

什么是 WebScout MCP?

WebScout MCP 是一个基于 Model Context Protocol (MCP) 的智能服务器，专门设计用于自动化分析网页应用。它能够模拟真实用户行为，捕获网络请求，发现隐藏的API端点，特别擅长分析聊天应用和流式数据传输接口。

如何使用 WebScout MCP?

通过简单的配置将 WebScout MCP 集成到您的 MCP 客户端中，然后使用提供的工具集来分析目标网站。您可以自动导航、填写表单、点击按钮，同时监控所有网络活动，发现API端点和数据流模式。

适用场景

WebScout MCP 特别适用于：API集成开发、网页应用逆向工程、聊天机器人开发、流式数据处理、自动化测试和质量保证等场景。

主要功能

自动化逆向工程

一键分析网页应用，自动发现流式端点，智能检测SSE、WebSocket、分块传输等多种数据流格式

交互式浏览器自动化

完整的会话管理，支持登录表单、OAuth流程和多因素认证，提供逐步导航和用户交互模拟

高级网络监控

实时捕获网络流量，支持过滤和配置，完整监控HTTP请求、响应和WebSocket帧

开发者友好工具

提供14个专用工具，支持无头或有界面模式，具有强大的错误处理和跨平台兼容性

优势

自动化程度高，减少手动分析工作量

支持多种流式数据传输格式检测

完整的浏览器交互模拟能力

详细的网络请求和响应捕获

开发者友好的结构化数据输出

局限性

需要安装浏览器依赖和Node.js环境

可能被网站的防爬虫机制检测

对复杂JavaScript应用的分析可能有限

网络条件可能影响分析结果

如何使用

环境准备

确保系统已安装 Node.js 18+ 和 npm，然后安装必要的浏览器依赖

安装 WebScout MCP

通过 npm 安装 WebScout MCP 包，或直接使用 npx 运行

配置 MCP 客户端

在您的 MCP 客户端配置文件中添加 WebScout MCP 服务器配置

开始分析

使用提供的工具开始分析目标网站，如 reverse_engineer_chat 工具

使用案例

聊天应用API发现

分析一个在线聊天应用的API端点，发现其流式传输机制

用户登录流程分析

自动化登录流程并捕获登录过程中的网络请求

实时数据流监控

监控网页应用的实时数据更新机制

常见问题

WebScout MCP 是否支持需要认证的网站？

这个工具会被网站的反爬虫机制检测到吗？

支持哪些类型的流式数据传输？

如何解决 'Browser not found' 错误？

可以同时分析多个网站吗？

🚀 🔍 WebScout MCP

WebScout MCP 是一款强大的模型上下文协议（MCP）服务器，专为逆向工程 Web 应用程序而设计，尤其适用于聊天界面和流式 API。它提供了全面的浏览器自动化工具，可用于发现、分析和捕获复杂 Web 应用程序的网络流量。

🚀 快速开始

WebScout MCP 能帮助你对 Web 应用进行逆向工程，下面将介绍它的安装、使用方法以及关键特性。

✨ 主要特性

🤖 自动化逆向工程

一键分析：自动导航到 Web 应用程序并捕获流式端点
智能模式检测：可高级检测 SSE、WebSocket、分块传输和自定义流式格式
网络流量捕获：在 CDP 级别全面监控所有 HTTP 请求、响应和 WebSocket 帧
结构化数据输出：输出包含 URL、请求负载和响应模式的清晰解析数据

🔐 交互式浏览器自动化

会话管理：具有 cookie 和身份验证状态管理的持久浏览器会话
身份验证支持：处理登录表单、OAuth 流程和多因素身份验证
逐步导航：点击按钮、填写表单并浏览复杂的多页界面
可视化反馈：随时截取屏幕截图以了解页面状态和 UI 元素

🎯 高级网络监控

实时捕获：通过可配置的捕获窗口实时监控流式响应
灵活过滤：捕获所有流量或按 POST 请求、流式响应或 URL 模式进行过滤
WebSocket 支持：全面捕获 WebSocket 帧、消息和连接详细信息
内存管理：可配置捕获限制，以防止长时间会话期间出现内存问题

🛠️ 开发者友好工具

14 种专业工具：提供用于 Web 抓取、测试和 API 发现的综合工具包
无头或可见模式：可在无头模式下进行自动化操作，或在可见模式下进行调试
错误处理：强大的错误处理功能，提供详细的错误消息和恢复选项
跨平台：在 macOS、Linux 和 Windows 上具有一致的行为

📋 可用工具

核心逆向工程

reverse_engineer_chat - 自动分析聊天界面并发现流式端点
start_network_capture - 开始全面的网络流量监控
stop_network_capture - 停止捕获并检索所有收集的数据
get_network_capture_status - 检查捕获会话状态和统计信息
clear_network_capture - 清除捕获的数据，而不停止捕获会话

交互式浏览器控制

initialize_session - 创建一个新的浏览器会话以进行交互式操作
close_session - 清理浏览器资源并结束会话
navigate_to_url - 在会话中导航到不同的 URL
switch_tab - 在打开的浏览器标签之间切换

用户交互模拟

click_element - 点击按钮、链接或任何交互式元素
fill_form - 填写表单字段，并可选择自动提交
wait_for_element - 等待动态元素出现后再继续操作

可视化检查

take_screenshot - 捕获视口、整页或特定元素的屏幕截图
get_current_page_info - 检索全面的页面信息和标签详细信息

📦 安装指南

前提条件

Node.js 18+ - 支持 ES 模块和现代 JavaScript 特性所需
npm - 用于依赖项安装的包管理器

快速设置

# 克隆仓库
git clone https://github.com/pyscout/webscout-mcp
cd webscout-mcp

# 安装依赖项
npm install

# 安装 Playwright 浏览器以进行自动化操作
npx playwright install

💻 使用示例

基础用法

基本聊天界面分析

// 初始化会话并分析聊天界面
const session = await initializeSession("https://chat.example.com");
const analysis = await reverseEngineerChat("https://chat.example.com", "Hello", 8000);

console.log("找到的端点数量:", analysis.length);
await closeSession(session.sessionId);

高级用法

交互式登录流程

// 处理登录并导航到受保护的内容
const session = await initializeSession("https://app.example.com/login");

await fillForm(session.sessionId, [
  { selector: 'input[name="email"]', value: "user@example.com" },
  { selector: 'input[name="password"]', value: "password123" }
], 'button[type="submit"]');

await waitForElement(session.sessionId, ".dashboard", 10000);
const screenshot = await takeScreenshot(session.sessionId);

await closeSession(session.sessionId);

网络流量捕获

// 监控页面上的所有网络活动
const session = await initializeSession("https://api.example.com");

await startNetworkCapture(session.sessionId, {
  capturePostOnly: false,
  captureStreaming: true,
  maxCaptures: 100
});

// 执行产生网络流量的操作
await navigateToUrl(session.sessionId, "https://api.example.com/data");

const captureData = await stopNetworkCapture(session.sessionId);
console.log("捕获的请求数量:", captureData.data.requests.length);

await closeSession(session.sessionId);

📚 详细文档

🏗️ 架构概述

┌─────────────────┐    ┌──────────────────┐    ┌─────────────────┐
│ 聊天界面        │───▶│ 浏览器自动化     │───▶│ 网络捕获        │
│  (目标 URL)     │    │   (Playwright)    │    │  (CDP + 路由)   │
└─────────────────┘    └──────────────────┘    └─────────────────┘
         │                       │                       │
         ▼                       ▼                       ▼
┌─────────────────┐    ┌──────────────────┐    ┌─────────────────┐
│ 消息输入检测    │    │  DOM 交互        │    │ 请求/响应分析  │
│                 │    │    (自动填充)    │    │                 │
└─────────────────┘    └──────────────────┘    └─────────────────┘
                                                       │
                                                       ▼
                                            ┌─────────────────┐
                                            │ 结构化数据输出  │
                                            │  (JSON 格式)    │
                                            └─────────────────┘

工作流程

浏览器启动：在无头 Playwright 浏览器中打开目标 URL
网络设置：建立 Chrome DevTools 协议（CDP）会话和路由拦截
界面检测：自动定位聊天输入元素（文本区域、可编辑内容等）
消息注入：发送测试消息以触发流式响应
流量捕获：在指定的时间窗口内监控网络请求/响应
模式分析：识别捕获数据中的流式模式
数据处理：将捕获的数据整理成清晰的 JSON 格式

流式检测模式

系统可检测多种流式响应格式：

服务器发送事件（SSE）：data: {"content": "..."}
OpenAI 风格的块：data: {"choices": [{"delta": {"content": "..."}}]}
事件流：event: message\ndata: {...}
JSON 流式传输：包含 token、delta、content 字段的对象
自定义格式：f:{...}、0:"..."、e:{...} 模式
WebSocket 消息：包含流式数据的二进制/文本帧
分块响应：Transfer-encoding: chunked 且包含流式内容

📁 项目结构

webscout-mcp/
├── src/
│   ├── index.js                 # 主 MCP 服务器实现
│   └── tools/                   # 专业工具模块
│       ├── reverseEngineer.js   # 工具导出和协调
│       ├── reverseEngineerChat.js # 自动聊天分析
│       ├── sessionManagement.js # 浏览器会话生命周期管理
│       ├── visualInspection.js  # 屏幕截图和页面信息
│       ├── interaction.js       # 点击和表单填充
│       ├── navigation.js        # URL 导航和标签切换
│       └── networkCapture.js    # 网络流量监控
│   └── utilities/               # 共享实用函数
│       ├── browser.js           # 浏览器自动化实用工具
│       └── network.js           # 网络模式检测
├── package.json                 # 依赖项和脚本
├── mcp-config.json              # MCP 客户端配置示例
└── README.md                    # 本说明文档

🔧 配置

环境变量

变量	描述	默认值
`NODE_ENV`	环境模式	`development`
`DEBUG`	启用调试日志记录	`false`

MCP 配置

更新你的 MCP 客户端配置文件：

{
  "mcpServers": {
    "webscout-mcp": {
      "command": "npx",
      "args": ["-y", "webscout-mcp"],
      "env": {
        "NODE_ENV": "production"
      }
    }
  }
}

或者对于 VS Code MCP 配置（mcp.json）：

{
  "servers": {
    "webscout-mcp": {
      "command": "npx",
      "args": ["-y", "webscout-mcp"],
      "type": "stdio"
    }
  }
}

贡献代码

分叉仓库
创建功能分支：git checkout -b feature-name
进行更改并添加测试
运行测试：npm test
提交拉取请求

开发指南

遵循 ES6+ 语法和现代 JavaScript 实践
为新函数添加 JSDoc 注释
使用多个聊天界面测试你的更改
为新功能更新文档
确保代码通过所有测试

📄 许可证

本项目采用 ISC 许可证 - 详情请参阅 LICENSE 文件。

🙏 致谢

基于 Model Context Protocol SDK 构建
借助 Playwright 实现浏览器自动化
受更好的 Web API 发现和测试工具需求的启发

⚠️ 重要提示

⚠️ 重要提示

道德使用：本工具仅用于 API 分析和集成目的。请始终遵守网站的服务条款和 robots.txt 文件。

速率限制：某些聊天界面可能有速率限制或验证码，这可能会干扰分析。

浏览器依赖：Playwright 需要安装浏览器二进制文件才能进行自动化操作。

网络条件：结果可能因网络速度和目标网站性能而异。

💡 使用建议

若遇到问题或有疑问，可按以下步骤解决：

查看故障排除部分。

查看 GitHub 上现有的问题。

创建一个新的问题并提供详细信息。

🐛 故障排除

常见问题

“未找到浏览器”错误

# 安装 Playwright 浏览器
npx playwright install

“连接超时”错误

增加 captureWindowMs 参数
检查网络连接
验证目标 URL 是否可访问

“未找到流式端点”

尝试不同的测试消息
增加捕获窗口时间
验证聊天界面是否需要身份验证

MCP 连接问题

验证 mcp-config.json 中的绝对路径
确保安装了 Node.js 18+
检查 MCP 客户端日志以获取详细错误信息

WebScout MCP - 你进行 Web 应用程序逆向工程和 API 发现的智能伙伴。

为开发者、安全研究人员和 API 爱好者用心打造 ❤️

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

TypeScript

106.0K

4.7分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

智启未来，您的人工智能解决方案智库

Webscout MCP

概述

安装

内容详情

替代品

什么是 WebScout MCP?

如何使用 WebScout MCP?

适用场景

主要功能

如何使用

使用案例

常见问题

相关资源

安装

🚀 🔍 WebScout MCP

🚀 快速开始

✨ 主要特性

🤖 自动化逆向工程

🔐 交互式浏览器自动化

🎯 高级网络监控

🛠️ 开发者友好工具

📋 可用工具

核心逆向工程

交互式浏览器控制

用户交互模拟

可视化检查

📦 安装指南

前提条件

快速设置

💻 使用示例

基础用法

基本聊天界面分析

高级用法

交互式登录流程

网络流量捕获

📚 详细文档

🏗️ 架构概述

工作流程

流式检测模式

📁 项目结构

🔧 配置

环境变量

MCP 配置

贡献代码

开发指南

📄 许可证

🙏 致谢

⚠️ 重要提示

🐛 故障排除

常见问题

“未找到浏览器”错误

“连接超时”错误

“未找到流式端点”

MCP 连接问题

替代品