入门攻略
MCP提交
探索
Website To Pdf MCP
一个将网页转换为PDF或Markdown格式的MCP服务,支持认证访问和链接遍历功能
2分
0
2025-04-28 14:20:37
概述
内容详情
替代品
什么是网站转PDF/Markdown MCP服务器?
这是一个可以抓取网页(包括需要认证的页面)并将其转换为PDF或Markdown文档的服务器。它还可以遍历网页上的链接,并将多个页面合并到一个文件中。如何使用网站转PDF/Markdown MCP服务器?
通过简单的HTTP请求,您可以将目标网页转换为PDF或Markdown文档。您也可以指定最大页面数量来限制遍历范围。适用场景
适用于需要快速保存网页内容作为离线文档、分享网页内容或批量处理网页链接的情况。主要功能
网页转PDF支持将单个网页直接转换为PDF文件。
网页转Markdown支持将单个网页转换为Markdown格式。
链接遍历自动遍历目标网页中的链接,并生成包含多页内容的PDF或Markdown文件。
支持认证可以通过用户名和密码进行身份验证。
自定义选项支持自定义PDF页面格式、背景渲染、边距等高级选项。
优势与局限性
优势
支持多种输出格式(PDF、Markdown)。
能够处理带认证的网页。
可配置的最大页面限制提高了灵活性。
支持多语言Markdown输出。
开源且易于部署。
局限性
对动态加载的内容可能无法完全解析。
某些复杂的网页结构可能导致输出不完整。
需要稳定的网络连接以保证高效运行。
如何使用
克隆项目仓库在本地计算机上克隆此项目的Git仓库。
安装依赖进入项目目录后安装所需的Node.js模块。
配置环境变量复制示例环境变量文件并根据需求调整配置。
启动服务器使用npm启动服务。
使用案例
将example.com转换为PDF通过API接口将example.com转换为PDF文档。
将example.com转换为Markdown将example.com转换为Markdown文档。
获取example.com的所有链接获取example.com网页中的所有链接。
常见问题
1
是否支持自定义PDF样式?是的,您可以自定义PDF页面格式、边距和其他样式选项。
2
如何解决认证失败的问题?确保提供的用户名和密码正确,并检查网页的认证机制是否兼容。
3
是否支持多语言Markdown输出?是的,Markdown输出支持多种语言编码。
4
遍历链接时如何限制最大页面数?通过设置maxPages参数控制遍历的最大页面数。
相关资源
GitHub仓库项目源码和文档。
Turndown库文档Markdown转换工具的官方文档。
Puppeteer文档用于生成PDF的浏览器自动化工具。
精选MCP服务推荐

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
208
4.3分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
2,954
5分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
6,098
4.5分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
1,426
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
88
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
322
4.5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
362
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
4,852
4.7分