Rag Duckdb With MCP
R

Rag Duckdb With MCP

一个基于Python的文档处理与检索增强生成(RAG)服务器,使用DuckDB数据库存储嵌入向量,支持多种文件格式处理并提供Web界面和API接口。
2.5分
5.6K

什么是MCP服务器?

MCP服务器是一个集成了文档处理、文本分割、嵌入生成以及向量数据库的系统,旨在为用户提供高效、智能的文档检索与分析能力。它支持多种文件类型,并可以通过API或图形界面进行交互。

如何使用MCP服务器?

用户可以通过上传文件或目录,将文档处理成可搜索的片段。然后,可以使用自然语言查询来查找相关内容。同时,MCP服务器也提供了丰富的API接口供开发者调用。

适用场景

MCP服务器适用于需要快速检索文档内容的场景,如企业知识库管理、技术文档查询、代码检索等。它特别适合需要对大量文本数据进行语义搜索的用户。

主要功能

多格式支持
支持多种文件类型,包括文本、代码、PDF、JSON、YAML等,确保用户可以轻松处理各种文档。
智能分块
根据文件类型自动选择合适的文本分割策略,确保每个片段都能保留上下文信息。
嵌入生成
使用先进的嵌入模型将文本转换为向量表示,便于后续的语义相似性搜索。
高效搜索
基于DuckDB的向量相似性搜索功能,实现快速且准确的文档检索。
API接口
提供RESTful API,允许开发者以编程方式与MCP服务器交互。
Web界面
提供直观的网页界面,让用户无需编程即可上传文件、搜索文档。
优势
支持多种文件格式,适用范围广
提供高效的语义搜索功能,提升检索准确性
易于使用,提供图形界面和API两种交互方式
支持目录上传和文件过滤,提高处理效率
局限性
不支持二进制文件(如图片、视频)
对于非常大的文件可能会出现内存问题
目前仅支持单用户模式,不支持多用户权限管理
部分高级功能(如图谱检索)尚未实现

如何使用

安装与启动
使用Docker容器化部署MCP服务器,确保所有依赖项已正确安装。
上传文件
通过网页界面或API上传文件,支持单个文件或整个目录。
处理文档
点击“开始处理”按钮,系统会自动提取文本、分块并生成嵌入。
执行搜索
在搜索栏输入自然语言查询,系统会返回最相关的文档片段。

使用案例

技术文档查询
用户上传了一个包含多个Python脚本的目录,并希望找到有关如何处理JSON数据的示例代码。
代码片段检索
用户想查找某个特定函数的实现,例如在Java中如何实现排序算法。

常见问题

MCP服务器支持哪些文件格式?
如果文件太大怎么办?
如何访问API?
是否支持中文搜索?
MCP服务器是否支持多用户?

相关资源

官方文档
详细说明MCP服务器的功能和使用方法。
GitHub仓库
项目源码和开发指南。
教程视频
演示MCP服务器的使用方法和功能。

安装

复制以下命令到你的Client进行配置
注意:您的密钥属于敏感信息,请勿与任何人分享。
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
56.8K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
58.0K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
96.3K
5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
45.5K
4.8分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
24.5K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
40.2K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
71.9K
4.7分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
38.9K
4.5分
AIBase
智启未来,您的人工智能解决方案智库