Pdf MCP
P

Pdf MCP

一个基于Python的MCP服务器,提供PDF文档的读取、搜索和内容提取功能,支持分页阅读、全文搜索和图像提取,并采用SQLite缓存实现持久化存储。
2.5分
5.6K

什么是PDF-MCP?

PDF-MCP是一个Model Context Protocol (MCP)服务器,专门用于处理PDF文档。它允许AI助手(如Claude、Copilot等)直接访问和操作PDF文件,包括读取内容、搜索关键词、提取图片和获取文档信息。通过智能缓存机制,即使服务器重启也能保持已处理文档的缓存,提高重复访问效率。

如何使用PDF-MCP?

PDF-MCP作为后台服务运行,需要与支持MCP协议的AI客户端配合使用。安装后,在客户端配置文件中添加服务器配置,重启客户端即可使用。AI助手会自动识别可用的PDF工具,用户可以通过自然语言指令操作PDF文档。

适用场景

PDF-MCP特别适合处理长文档分析、研究报告阅读、合同审查、学术论文摘要、多文档信息提取等场景。当需要从PDF中快速获取特定信息而不想手动翻阅时,这个工具能显著提高效率。

主要功能

智能分页阅读
支持按页码范围读取PDF内容,避免一次性加载大文档导致上下文溢出。可以指定单页、多页或连续页面范围。
全文搜索
在PDF文档中搜索关键词或短语,快速定位相关内容所在的页面,无需手动翻阅整个文档。
图片提取
从PDF中提取嵌入的图片,并以base64编码的PNG格式返回,方便AI助手分析和描述图片内容。
文档信息获取
获取PDF的元数据,包括页数、文件大小、创建日期、作者、标题等信息,以及预估的token数量。
目录解析
自动解析PDF的目录结构,显示章节标题和对应的页码,帮助快速导航到感兴趣的部分。
URL支持
不仅支持本地PDF文件,还可以直接从HTTP/HTTPS URL加载远程PDF文档,无需先下载到本地。
SQLite持久缓存
使用SQLite数据库缓存已处理的PDF内容,缓存数据在服务器重启后仍然保留,显著提高重复访问速度。
多客户端支持
兼容Claude Desktop、VS Code Copilot、Codex CLI、Kiro等多种支持MCP协议的AI客户端。
优势
处理大文档更高效:分页读取避免上下文限制,智能搜索快速定位信息
性能优化:SQLite缓存减少重复解析,提高响应速度
使用简单:通过自然语言指令即可操作,无需学习复杂命令
跨会话持久性:缓存数据在服务器重启后仍然有效
多功能集成:8个专用工具覆盖PDF处理的常见需求
局限性
需要客户端支持:必须使用支持MCP协议的AI助手
扫描版PDF支持有限:对图片型PDF的文字识别能力取决于原始文档质量
复杂表格处理:对复杂格式的表格提取可能不够完美
内存限制:极大文件(数百MB)可能受系统内存限制
需要配置:初次使用需要在客户端进行简单配置

如何使用

安装PDF-MCP
通过Python包管理器pip安装PDF-MCP服务器
配置AI客户端
根据使用的AI客户端(Claude、VS Code等),在配置文件中添加PDF-MCP服务器配置
重启客户端
重启AI客户端以加载PDF-MCP服务器
开始使用
在AI助手中通过自然语言指令操作PDF文档

使用案例

年度报告分析
分析公司年度报告,提取关键财务数据和风险因素
学术论文研究
快速浏览多篇学术论文,提取研究方法和结论
合同审查
审查合同文档中的关键条款和潜在风险
图片资料整理
从产品手册中提取所有产品图片和说明

常见问题

PDF-MCP支持哪些AI客户端?
能处理多大的PDF文件?
缓存数据存储在哪里?
如何处理扫描版PDF?
如何清除缓存?
支持中文PDF吗?

相关资源

GitHub仓库
PDF-MCP的源代码、问题跟踪和最新版本
PyPI项目页面
Python包索引上的项目页面,包含版本历史和下载统计
MCP协议文档
Model Context Protocol官方文档和规范
如何构建PDF-MCP
开发者博客文章,介绍PDF-MCP的设计思路和实现细节
MCP服务器安全指南
关于MCP服务器安全最佳实践的深度文章

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "pdf-mcp": {
      "command": "pdf-mcp"
    }
  }
}

{
  "mcpServers": {
    "pdf-mcp": {
      "command": "pdf-mcp",
      "args": [],
      "disabled": false
    }
  }
}

{
  "mcpServers": {
    "pdf-mcp": {
      "command": "uvx",
      "args": ["pdf-mcp"]
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.6K
5分
F
Finlab Ai
FinLab AI是一个金融量化分析平台,通过AI技术帮助用户发现投资策略中的超额收益(alpha)。它提供丰富的数据集、回测框架和策略示例,支持自动化安装与集成到主流AI编程助手。
5.5K
4分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库