内容提取

# 内容提取

M
Markdown Web Crawl
一个基于Python的MCP网络爬虫项目,用于提取并保存网站内容为Markdown文件,支持批量处理和多线程配置。
Python
10.3K
2.5分
D
Deep Web Research Server
MCP深度网络研究服务器是一个基于Node.js的高级网络研究工具,提供智能搜索队列、增强内容提取和深度研究功能,可与Claude桌面应用集成实现实时信息获取。
TypeScript
10.6K
2分
R
Readability (Fetch & Parse)
一个基于Python的MCP服务器,使用Mozilla Readability算法提取网页内容并转换为优化的Markdown格式。
Python
16.9K
2.5分
L
Local Web Search
一个基于MCP协议的本地网页搜索服务器,提供网页内容搜索和提取功能。
TypeScript
9.8K
2.5分
D
Duckduckgo Search
一个为Claude Code设计的DuckDuckGo搜索插件,提供网页搜索、结果详情获取、相关搜索建议等功能,支持高级过滤和内容探索。
Python
13.5K
2.5分
A
Apappascs Tavily Search MCP Server
一个集成Tavily搜索API的MCP服务器实现,为LLM提供优化的搜索能力,支持网页搜索、内容提取、域名过滤等功能。
TypeScript
5.7K
2分
S
Search MCP Server
一个强大的MCP服务器,提供网页搜索和相似内容查找功能,专为Claude Desktop设计。
Python
9.1K
2.5分
M
MCP Webresearch
一个为Claude设计的网页研究MCP服务器,集成谷歌搜索和网页内容提取功能。
TypeScript
10.1K
2分
M
Mendableai Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供网页抓取、爬取、搜索、内容提取等功能,支持云API和自托管实例。
TypeScript
15.5K
2.5分
W
Web Research
一个为Claude设计的网页研究服务,集成谷歌搜索和内容提取功能
TypeScript
9.7K
2.5分
C
Crawl4ai MCP Server
Crawl4AI MCP Server是一个基于MCP协议的智能信息获取服务器,为AI系统提供多引擎搜索和优化的网页内容提取功能,将网页转换为适合LLM处理的格式。
Python
14.1K
2.5分
M
MCP Server Rag Web Browser
为RAG Web Browser Actor实现的MCP服务器,支持AI代理进行网页搜索和内容提取。
TypeScript
11.4K
3分
M
Mult Fetch MCP Server
基于MCP协议的网页内容获取与处理工具
TypeScript
6.4K
2.5分
X
Xfetch MCP
XFetch MCP Server是一个增强型网页内容获取服务,专为LLM设计,能够突破Cloudflare等安全防护,支持JavaScript渲染和精准内容提取,并提供Markdown转换功能。
Python
8.4K
2分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.9K
5分
W
Web Research Server R54
一个为Claude设计的网页研究MCP服务器,提供谷歌搜索、网页内容提取、研究会话跟踪和截图功能,帮助用户实时获取网络信息进行研究。
TypeScript
8.4K
2分
P
Puremd MCP
pure.md的MCP服务器为AI客户端提供网页内容转换为Markdown的服务
TypeScript
10.1K
2.5分
W
Web Fetch
一个提供网页内容抓取和格式转换的MCP服务器
TypeScript
10.0K
2.5分
M
MCP Webresearch
一个为Claude设计的网页研究MCP服务器,提供实时网络信息检索功能
TypeScript
13.3K
3.5分
M
MCP Getweb
MCP-GetWeb是一个提供网页搜索和内容提取功能的协议服务器,支持DuckDuckGo、Google、Felo AI等多种搜索引擎,并能抓取URL内容、提取元数据和转换为Markdown格式。
Rust
0
2.5分
D
Dy Xhs MCP Server
抖音和小红书内容提取MCP服务器,支持从抖音和小红书分享链接提取视频、图片和文本内容,提供无水印视频获取、AI语音识别、文案提取等功能。
Python
5.7K
2分
Y
Youtube Ultimate Toolkit MCP
一个功能强大的YouTube内容访问MCP服务器,提供视频转录、元数据、评论、截图和音频剪辑的完整访问能力,支持Claude桌面版和网页版。
TypeScript
6.9K
2.5分
P
Pdf MCP
一个基于Python的MCP服务器,提供PDF文档的读取、搜索和内容提取功能,支持分页阅读、全文搜索和图像提取,并采用SQLite缓存实现持久化存储。
Python
5.6K
2.5分
L
Light Research MCP
一个轻量级的MCP服务器工具,为LLM提供高效网络内容搜索和提取功能,支持DuckDuckGo搜索、GitHub代码搜索和网页内容清洗,优化LLM输入。
TypeScript
7.4K
2.5分
D
Ddg Search
DuckDuckGo Search MCP 是一个基于 DuckDuckGo 的快速、隐私友好的模型上下文协议(MCP)服务器,提供网页搜索和URL内容提取功能,兼容多种AI提供商。
JavaScript
11.8K
2.5分
W
WEB SCRAPING MCP
一个基于crawl4ai库的MCP服务器,提供网页抓取和智能内容提取功能,支持AI代理通过自然语言指令与网页交互。
Python
9.8K
2.5分
Y
Youtube Mcp(model Context Protcol) Server
YouTube MCP服务器是一个工具,用于从YouTube视频中获取和提取字幕,使AI语言模型能够访问和处理视频内容。
Python
9.5K
2.5分
V
Video Digest
MCP Video Digest是一个视频内容处理服务,支持从多个平台提取音频并转换为文本,提供多种转录服务选择。
Python
10.0K
2.5分
I
Ireader MCP
iReader MCP是一个提供互联网内容读取和提取工具的MCP服务器,支持网页、YouTube视频、推特线程和PDF文件的文本提取。
JavaScript
8.4K
2分
M
MCP Pdf Extraction Server
PDF内容提取服务
Python
13.2K
2.5分

精选MCP服务推荐

F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.9K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.8K
4.3分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
75.9K
4.5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.8K
4.7分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
56.4K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
32.1K
4.8分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.8K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.3K
4.5分
AIBase
智启未来,您的人工智能解决方案智库