Search Stack
S

Search Stack

Search Stack 是一个专为 AI Agent 设计的 Web 搜索与抓取中间层,提供统一的多引擎搜索、反爬渲染、Cookie 管理和正文提取 API,旨在解决 AI 在访问网页时遇到的额度限制、反爬拦截和登录态缺失等问题。
2.5分
0

什么是 Search Stack?

Search Stack 是一个专门为 AI Agent 设计的 Web 搜索和内容抓取中间层服务。它解决了 AI 在访问网页时遇到的各种问题:搜索引擎限制、反爬虫拦截、需要登录的网站无法访问等。通过统一的 API 接口,AI Agent 可以轻松搜索网页、抓取全文内容,即使面对复杂的反爬机制和登录要求也能应对。

如何使用 Search Stack?

Search Stack 提供两种主要使用方式:1) 作为原生插件集成到 OpenClaw 等 AI 平台中,AI 可以直接调用搜索和抓取工具;2) 通过 MCP Server 模式供各种支持 MCP 协议的 AI 使用。部署后,AI 可以通过简单的 API 调用完成网页搜索、内容抓取、Cookie 管理等操作。

适用场景

Search Stack 特别适合以下场景: • AI 需要搜索最新信息进行知识更新 • 需要抓取需要登录才能访问的内容(如知乎、小红书) • 目标网站有复杂的反爬虫机制(如 Cloudflare) • 需要同时使用多个搜索引擎并自动选择最佳结果 • 团队中多个 AI Agent 需要共享搜索和抓取能力

主要功能

多引擎智能切换
自动在 Tavily、Serper、SearXNG 三个搜索引擎间切换,单个引擎故障不影响服务。SearXNG 完全免费无限量,确保服务高可用。
智能反反爬虫
内置 Browserless 无头 Chrome,启用 Stealth 模式绕过 Cloudflare 等反爬检测。支持 JavaScript 渲染页面抓取。
Cookie 动态管理
提供完整的 Cookie 管理 API,支持手动粘贴和远程浏览器登录两种方式获取 Cookie。Cookie 自动注入到抓取请求中。
远程浏览器登录(Cookie Catcher)
通过 Web UI 远程操控 Chrome 完成复杂登录流程(如 OAuth、二维码扫码),一键保存 Cookie。支持鼠标、键盘、触屏操作。
智能登录检测
多维度检测页面是否需要登录:HTTP 状态码、文本关键词、页面标题、HTML 结构等。自动引导用户提供 Cookie。
精准正文提取
结合 trafilatura、BeautifulSoup、readability 三个引擎,精准提取网页正文,去除广告、导航等无关内容。
SSRF 安全防护
内置私网 IP 黑名单,拒绝访问内网地址,防止 AI 被诱导访问内部系统。
智能缓存
Redis 缓存搜索结果和网页内容,15 分钟 TTL。重复查询可在 13ms 内返回,大幅提升响应速度。
MCP Server 支持
提供 stdio 模式的 MCP Server,可通过 mcporter 注册,供 OpenClaw 等支持 MCP 的 AI 平台使用。
社交媒体 API 集成
可选集成 TikHub 社交媒体 API,支持抖音、TikTok、微博等 803 个社交平台的内容获取。
HTTP/SOCKS5 代理支持
支持通过代理访问被墙网站(如 YouTube)或使用固定 IP 应对反爬。
优势
中文搜索质量优秀:相比 Brave Search,中文结果更丰富(掘金、知乎、什么值得买等)
高可用性:三引擎自动 fallback,单点故障不影响服务
功能全面:搜索+抓取一体,支持 Cookie 注入、反爬绕过、登录检测
成本优势:SearXNG 完全免费无限量,大幅降低 API 成本
部署灵活:支持本地部署和异地部署,多机共享
响应快速:Redis 缓存使重复查询响应时间低至 13ms
安全性高:内置 SSRF 防护、API 鉴权、限流机制
局限性
部署复杂度:需要 Docker 环境,配置步骤较多
资源消耗:Browserless Chrome 每个会话占用约 400-500MB 内存
Chrome 代理限制:带认证的 HTTP/SOCKS5 代理在 Chrome 渲染中无法使用
学习曲线:Cookie 管理和远程登录需要一定学习成本
维护需求:需要定期更新 Cookie 和监控服务状态

如何使用

环境准备
确保系统已安装 Docker 和 Docker Compose。获取可选的搜索引擎 API Key(Tavily、Serper)。
克隆项目与配置
克隆项目仓库,复制环境变量模板并配置必要的密钥。特别要注意配置 SearXNG 的 JSON API 支持。
启动服务
使用 Docker Compose 启动所有服务,等待容器健康状态就绪。
集成到 AI 平台
根据使用的 AI 平台选择集成方式:原生插件(推荐)或 MCP Server。配置插件并创建 Skill 文件。
测试与验证
通过 API 调用测试搜索和抓取功能,验证集成是否成功。

使用案例

搜索技术文章并获取全文
AI 需要了解最新的 Docker 最佳实践,搜索相关文章并直接获取完整内容进行分析。
抓取需要登录的知乎专栏
用户想了解某知乎专栏的付费文章内容,但需要登录才能查看完整文章。
绕过反爬获取商品信息
需要从某电商网站获取商品价格信息,但该网站有严格的反爬机制。
多源信息对比研究
研究某个技术话题,需要从多个来源获取信息进行对比分析。

常见问题

SearXNG 搜索返回 403 或空结果怎么办?
AI 不使用 search-stack,还在用内置的 Brave 搜索怎么办?
Threads/Instagram 等 SPA 网站抓取失败怎么办?
Browserless Chrome 超时或崩溃怎么办?
如何获取需要登录网站的 Cookie?
SKILL.md 更新后 AI 行为没变化怎么办?
支持异地部署吗?OpenClaw 和 Search Stack 在不同机器
Chrome 渲染不支持带认证的代理怎么办?

相关资源

GitHub 仓库
Search Stack 项目源代码和最新文档
OpenClaw 官网
OpenClaw AI 平台官方网站
Tavily API
Tavily 搜索引擎 API 服务
Serper API
Serper (Google) 搜索引擎 API
SearXNG 文档
SearXNG 元搜索引擎官方文档
TikHub API
TikHub 社交媒体 API 平台
Model Context Protocol
MCP 协议官方规范

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "search-stack": {
      "command": "/home/your_user/.bun/bin/bun",
      "args": ["run", "/opt/search-stack/proxy/mcp-server.ts"],
      "keepAlive": true,
      "env": {
        "SEARCH_STACK_URL": "http://127.0.0.1:17080",
        "SEARCH_STACK_API_KEY": "your_proxy_api_key",
        "TIKHUB_API_KEY": "your_tikhub_key"
      }
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

A
Airweave
Airweave是一个开源的人工智能代理和RAG系统的上下文检索层,它连接并同步各种应用程序、工具和数据库的数据,通过统一的搜索接口为AI代理提供相关、实时、多源的上下文信息。
Python
7.0K
5分
V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.6K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库