Markdown MCP
M

Markdown MCP

一个基于Playwright的MCP服务器,能够从网页中智能提取纯净的Markdown内容,自动过滤导航栏、页脚等非核心元素,支持图片和链接保留,适用于文档、博客和技术文章等内容抓取。
2分
7.2K

什么是Markdown MCP服务器?

Markdown MCP服务器是一个智能工具,专门用于从网页中提取核心内容并转换为易于阅读的Markdown格式。它能够智能识别网页的主要文章区域,自动移除导航菜单、侧边栏、页脚、广告等干扰元素,只保留您真正关心的内容。

如何使用Markdown MCP服务器?

您可以通过Claude Desktop或Gemini CLI等AI助手使用这个工具。只需告诉AI助手您想要提取的网页链接,工具就会自动获取网页内容并转换为干净的Markdown格式。您还可以选择是否包含图片和链接,以适应不同的使用需求。

适用场景

这个工具特别适合需要收集和整理网页信息的场景,比如:研究资料收集、技术文档整理、新闻文章保存、学习笔记制作、内容分析等。无论是技术文档、博客文章、新闻报导还是产品页面,都能获得干净的内容提取。

主要功能

智能内容提取
自动识别网页的主要内容区域,智能过滤导航栏、页脚、侧边栏、广告等非核心内容
干净的Markdown输出
生成结构清晰的Markdown文档,保留标题、段落、列表、代码块、表格等格式
图片和链接支持
可选择是否包含图片引用和超链接,适应不同的使用场景
动态内容处理
能够处理JavaScript生成的动态内容,支持现代网页框架
多客户端支持
支持Claude Desktop和Gemini CLI等多种AI助手,提供优化的配置文件
强大的错误处理
内置多种容错机制,当主要提取方法失败时自动尝试备用方案
优势
🎯 智能识别核心内容,自动过滤干扰元素
⚡ 处理速度快,通常5-15秒完成提取
🔄 支持动态内容和JavaScript网站
🎨 输出格式美观,保留原文结构
🔧 配置灵活,可定制图片和链接包含选项
🛡️ 安全可靠,每次请求使用独立浏览器环境
局限性
需要Node.js环境支持
首次使用需要安装浏览器组件
某些特殊网站可能需要手动配置选择器
无法处理需要登录的私有内容
内存占用相对较高(约50-100MB)

如何使用

环境准备
确保您的计算机已安装Node.js(版本18或更高)。如果没有安装,请先访问Node.js官网下载安装。
下载和安装
获取Markdown MCP服务器文件,安装必要的依赖包和浏览器组件。
配置AI助手
根据您使用的AI助手(Claude Desktop或Gemini CLI),添加MCP服务器配置。
开始使用
重启AI助手,现在您可以通过自然语言指令让助手提取网页内容了。

使用案例

技术文档整理
将Confluent Flink技术文档转换为干净的Markdown格式,便于离线阅读和学习。
新闻文章收集
从新闻网站提取文章内容,保存为干净的文本格式用于研究分析。
博客内容备份
将喜欢的博客文章转换为Markdown格式,建立个人知识库。
产品页面分析
提取竞品网站的产品特性描述,用于市场分析。

常见问题

这个工具是免费的吗?
需要编程知识才能使用吗?
支持哪些网站?
提取的内容准确吗?
会保存我的浏览历史或数据吗?
遇到网站无法提取怎么办?
可以批量提取多个网页吗?
支持中文网站吗?

相关资源

Node.js官方网站
下载和安装Node.js运行环境
Playwright文档
了解底层浏览器自动化技术
Model Context Protocol规范
MCP协议官方文档
Claude Desktop
下载Claude Desktop客户端
Gemini CLI
Google Gemini命令行工具
GitHub仓库
获取最新代码和提交问题

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "markdown-mcp": {
      "command": "node",
      "args": ["/Users/yourusername/path/to/markdown-mcp/markdown-mcp.js"],
      "env": {}
    }
  }
}

{
  "mcpServers": {
    "markdown-mcp": {
      "command": "node",
      "args": ["C:\\Users\\YourUsername\\path\\to\\markdown-mcp\\markdown-mcp.js"],
      "env": {}
    }
  }
}

{
  "mcpServers": {
    "markdown-mcp": {
      "command": "node",
      "args": ["/home/yourusername/path/to/markdown-mcp/markdown-mcp.js"],
      "env": {}
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

R
Rsdoctor
Rsdoctor 是一款专为 Rspack 生态系统打造的构建分析工具,全面兼容 webpack,提供可视化构建分析、多维度性能诊断及智能优化建议,帮助开发者提升构建效率与工程质量。
TypeScript
8.9K
5分
N
Next Devtools MCP
Next.js开发工具MCP服务器,为Claude、Cursor等AI编程助手提供Next.js开发工具和实用程序,包括运行时诊断、开发自动化和文档访问功能。
TypeScript
8.5K
5分
T
Testkube
Testkube是一个面向云原生应用的测试编排与执行框架,提供统一平台来定义、运行和分析测试,支持现有测试工具和Kubernetes基础设施。
Go
5.2K
5分
M
MCP Windbg
一个MCP服务器,将AI模型与WinDbg/CDB集成,用于分析Windows崩溃转储文件和进行远程调试,支持自然语言交互执行调试命令。
Python
9.8K
5分
R
Runno
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
TypeScript
7.6K
5分
P
Praisonai
PraisonAI是一个生产就绪的多AI智能体框架,具有自反思功能,旨在创建AI智能体来自动化解决从简单任务到复杂挑战的各种问题。它通过将PraisonAI智能体、AG2和CrewAI集成到一个低代码解决方案中,简化了多智能体LLM系统的构建和管理,强调简单性、定制化和有效的人机协作。
Python
7.3K
5分
N
Netdata
Netdata是一个开源实时基础设施监控平台,提供每秒级指标收集、可视化、机器学习驱动的异常检测和自动化告警,无需复杂配置即可实现全栈监控。
Go
9.7K
5分
M
MCP Server
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
TypeScript
8.8K
4分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
68.7K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
133.2K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
76.9K
4.3分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
50.8K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
45.6K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
30.6K
4.8分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
59.0K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
95.4K
4.7分
AIBase
智启未来,您的人工智能解决方案智库