MCP Jina Supabase Rag
什么是MCP Jina Supabase RAG?
这是一个专门为文档检索设计的智能工具。它能够自动发现和爬取文档网站(如技术文档、产品手册等),提取其中的文本内容,然后进行智能分割并生成向量表示,最后存储到Supabase数据库中。当您需要查找特定信息时,它可以通过语义搜索快速找到相关内容。如何使用MCP Jina Supabase RAG?
使用过程分为三个主要步骤:首先配置必要的API密钥和数据库连接;然后通过简单的命令或工具界面指定要爬取的文档网站;最后就可以通过自然语言查询来搜索文档内容。整个过程自动化程度高,无需编写复杂代码。适用场景
最适合需要快速建立文档知识库的场景,比如:技术团队需要索引多个产品的文档、教育机构要整理教学资料、企业需要建立内部知识库、或者个人想要整理自己的学习笔记和参考资料。主要功能
智能URL发现
优先使用网站的sitemap.xml文件快速发现所有页面,如果没有sitemap则自动进行递归爬取,确保不遗漏重要内容。
混合内容提取
结合Jina AI的高速API和Crawl4AI的浏览器自动化技术,既能快速处理大量页面,又能应对复杂的动态网页。
多项目管理
支持同时管理多个文档项目,每个项目的索引完全隔离,便于组织不同类型的文档资源。
智能文本分割
自动将长文档分割成适合检索的片段,保持语义完整性,提高搜索准确率。
向量语义搜索
使用OpenAI的嵌入技术将文本转换为向量,实现基于语义相似度的智能搜索,而不仅仅是关键词匹配。
优势
速度快:优先使用sitemap和Jina AI API,大幅提升索引速度
成本低:开源免费,只需要基础的API密钥费用
易用性好:简单的命令行界面,无需复杂配置
质量高:智能内容提取和分割,保证检索质量
扩展性强:基于Supabase,易于集成到现有系统
局限性
需要API密钥:依赖OpenAI和Jina AI的API服务
网络依赖:需要稳定的网络连接进行爬取
动态内容限制:对JavaScript渲染的复杂页面支持有限
存储成本:大量文档需要足够的Supabase存储空间
学习曲线:需要基本的命令行操作知识
如何使用
环境准备
安装Python 3.12+,注册Supabase、OpenAI和Jina AI账号并获取API密钥。
数据库设置
在Supabase中运行提供的SQL脚本创建必要的表和向量扩展。
启动MCP服务器
启动MCP服务器以便Claude或其他客户端连接使用。
配置客户端
在Claude Desktop或Cursor中配置MCP服务器连接。
开始使用
通过命令行工具或客户端界面开始爬取和搜索文档。
使用案例
建立技术文档知识库
为开发团队建立统一的技术文档搜索系统,包含多个开源项目的文档。
产品文档整理
为公司产品文档建立智能搜索系统,方便客户支持团队快速查找解决方案。
个人学习资料库
整理个人学习过程中收集的各种教程和参考资料,建立个人知识库。
常见问题
我需要付费使用这个工具吗?
可以爬取需要登录的网站吗?
数据存储在哪里?安全吗?
支持哪些类型的文档网站?
如何更新已索引的文档?
可以导出索引的数据吗?
相关资源
GitHub仓库
源代码和最新版本
Supabase官方文档
学习如何使用Supabase数据库
OpenAI API文档
了解OpenAI嵌入API的使用
Jina AI官网
获取Jina AI API密钥和学习使用方法
MCP协议文档
了解Model Context Protocol的工作原理

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
67.4K
4.3分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
62.2K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
116.2K
5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
52.6K
4.8分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
26.9K
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
42.3K
4.5分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
85.1K
4.7分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
45.7K
5分




