Document MCP
D

Document MCP

MCP文档索引器是一个基于Python的本地文档索引与搜索服务器,利用LanceDB向量数据库和本地LLM(通过Ollama)实现实时监控、多格式文档处理和语义搜索,并通过模型上下文协议(MCP)为Claude等AI助手提供工具。
2.5分
7.0K

什么是MCP文档索引器?

MCP文档索引器是一个智能文档管理工具,它能够自动监控您指定的文件夹,当您添加或修改文档时,它会自动提取文档内容、生成摘要,并建立可搜索的索引。您可以使用自然语言(如中文或英文)来搜索您的文档,就像在互联网上搜索一样方便。

如何使用MCP文档索引器?

安装配置后,索引器会在后台自动运行,监控您的文档文件夹。当您需要查找文档时,只需在Claude聊天界面中输入搜索查询,如'查找关于机器学习的文档',系统就会返回相关的文档列表和内容摘要。

适用场景

适合研究人员、学生、写作者、律师、医生等需要管理大量文档的专业人士。特别适合处理研究论文、技术文档、个人笔记、合同文件等需要频繁查找的文档集合。

主要功能

自动文档监控
实时监控指定文件夹,自动检测新文档或修改过的文档,无需手动操作即可保持索引最新。
多格式支持
支持PDF、Word文档(docx/doc)、纯文本、Markdown和RTF等多种常见文档格式。
完全本地处理
所有文档处理都在您的电脑上完成,使用本地AI模型,确保文档内容不会上传到任何外部服务器,保护隐私安全。
语义搜索
不仅搜索关键词,还能理解查询的语义含义,找到相关但可能不包含完全相同词汇的文档。
智能摘要
自动为每个文档生成简洁的摘要,帮助您快速了解文档内容,无需打开每个文件查看。
Claude桌面集成
直接集成到Claude桌面应用中,在聊天界面中即可搜索您的文档,无需切换应用。
优势
完全隐私保护:所有处理都在本地完成,文档内容不会离开您的电脑
离线可用:不需要互联网连接即可搜索文档
智能搜索:支持自然语言查询,理解语义而不仅仅是关键词
自动更新:后台自动监控文件夹变化,索引始终保持最新
资源友好:专为标准笔记本电脑优化,不会过度消耗系统资源
局限性
需要初始设置:需要安装Python和相关依赖
依赖本地AI模型:需要下载AI模型文件(约几百MB到几GB)
处理大文件可能较慢:非常大的文档(超过100MB)处理时间较长
仅支持特定格式:目前不支持图片、音频、视频等非文本文件
需要Claude桌面应用:主要设计为与Claude桌面应用配合使用

如何使用

安装前置软件
首先需要安装Python 3.9或更高版本,以及uv包管理器和Ollama(本地AI运行环境)。
下载AI模型
使用Ollama下载一个适合您电脑性能的AI模型,较小的模型适合普通笔记本电脑。
安装文档索引器
克隆项目仓库并使用uv安装依赖包。
配置监控文件夹
创建配置文件,指定您想要监控的文档文件夹路径。
集成到Claude桌面
修改Claude桌面的配置文件,添加文档索引器作为MCP服务器。
启动并使用
启动索引器,它将在后台运行。在Claude聊天中即可开始搜索您的文档。

使用案例

学术研究
研究生需要查找之前阅读过的论文中关于特定实验方法的部分。
法律文档管理
律师需要快速查找合同模板或特定条款的案例。
个人知识库
写作者需要从自己的笔记和草稿中寻找灵感或之前写过的内容。
技术文档检索
程序员需要查找之前写过的代码文档或技术方案。

常见问题

我的文档会被上传到互联网吗?
需要多大的硬盘空间?
支持中文文档吗?
索引大量文档会很慢吗?
可以在多台电脑上使用吗?
如果Ollama服务停止运行会怎样?
如何添加新的监控文件夹?
支持哪些文件格式?

相关资源

GitHub项目主页
源代码、问题反馈和最新更新
Ollama官方网站
下载Ollama和了解更多关于本地AI模型的信息
Model Context Protocol文档
了解MCP协议的技术细节
Python官方网站
下载Python编程语言
Claude桌面应用
下载Claude桌面应用程序

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "doc-indexer": {
      "command": "uv",
      "args": [
        "run",
        "--directory",
        "/path/to/mcp-doc-indexer",
        "python",
        "-m",
        "src.main"
      ],
      "env": {
        "WATCH_FOLDERS": "/Users/me/Documents,/Users/me/Research",
        "LANCEDB_PATH": "/Users/me/.mcp-doc-index",
        "LLM_MODEL": "llama3.2:3b"
      }
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

A
Airweave
Airweave是一个开源的人工智能代理和RAG系统的上下文检索层,它连接并同步各种应用程序、工具和数据库的数据,通过统一的搜索接口为AI代理提供相关、实时、多源的上下文信息。
Python
7.0K
5分
V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
H
Haiku.rag
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
Python
9.1K
5分
C
Claude Context
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
TypeScript
17.5K
5分
A
Acemcp
Acemcp是一个代码库索引和语义搜索的MCP服务器,支持自动增量索引、多编码文件处理、.gitignore集成和Web管理界面,帮助开发者快速搜索和理解代码上下文。
Python
18.0K
5分
M
MCP
微软官方MCP服务器,为AI助手提供最新微软技术文档的搜索和获取功能
15.0K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库