内容提取

# 内容提取

J
Jmh108 MCP Server Readability Python
基于Python的MCP服务器,使用Mozilla Readability算法提取网页内容并转换为优化的Markdown格式,适用于LLM处理。
Python
7.3K
2分
D
Ddg Search
DuckDuckGo Search MCP 是一个基于 DuckDuckGo 的快速、隐私友好的模型上下文协议(MCP)服务器,提供网页搜索和URL内容提取功能,兼容多种AI提供商。
JavaScript
10.2K
2.5分
D
Duckduckgo Search
一个为Claude Code设计的DuckDuckGo搜索插件,提供网页搜索、结果详情获取、相关搜索建议等功能,支持高级过滤和内容探索。
Python
10.2K
2.5分
S
Spiral Writer
Spiral MCP服务器为Spiral API提供标准化接口,支持文本生成、文件处理和网页内容提取功能。
Python
5.9K
2.5分
M
MCP Webresearch
一个为Claude设计的网页研究MCP服务器,集成谷歌搜索和网页内容提取功能。
TypeScript
6.6K
2分
R
Rednote MCP
RedNote MCP是一个用于搜索小红书内容的工具,提供智能内容提取、自动登录管理和并行处理功能,支持获取笔记标题、内容、作者信息、互动数据和图片等结构化数据。
TypeScript
9.0K
2分
I
Ireader MCP
iReader MCP是一个提供互联网内容读取和提取工具的MCP服务器,支持网页、YouTube视频、推特线程和PDF文件的文本提取。
JavaScript
6.4K
2分
G
Google Search (via Chrome)
一个通过Chrome浏览器实现Google搜索和网页内容提取的MCP工具,与Claude集成增强搜索能力
TypeScript
5.5K
2.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
96.6K
5分
O
Olostep Olostep MCP Server
Olostep MCP Server是一个集成网页抓取、内容提取和搜索功能的协议服务器,支持谷歌搜索结构化数据获取、网页内容标记化提取及网站URL发现等功能。
TypeScript
6.7K
2分
F
Fetch
Fetch MCP是一个提供网页内容抓取功能的服务器,支持获取HTML、JSON、纯文本和Markdown格式的内容。
TypeScript
6.7K
2.5分
M
MCP Duckduckresearch
一个结合DuckDuckGo搜索、网页内容提取和截图功能的MCP服务,支持程序化访问网络内容。
TypeScript
5.7K
2分
W
Web Research
一个为Claude设计的网页研究服务,集成谷歌搜索和内容提取功能
TypeScript
7.4K
2.5分
C
Crawl4ai MCP Server
Crawl4AI MCP Server是一个基于MCP协议的智能信息获取服务器,为AI系统提供多引擎搜索和优化的网页内容提取功能,将网页转换为适合LLM处理的格式。
Python
12.1K
2.5分
U
Usescraper MCP Server
一个基于TypeScript的MCP服务器,提供网页内容抓取功能
TypeScript
4.8K
2.5分
W
Websearch Tools
WebSearch是一个基于Python和Firecrawl API的高级网页搜索与内容提取工具,提供智能搜索、内容抓取、网站爬取等功能,支持MCP协议集成。
Python
8.2K
2.5分
T
Tavily MCP
Tavily MCP服务器是一个基于Model Context Protocol(MCP)的开源工具,为AI助手如Claude提供实时网络搜索和网页内容提取功能。
TypeScript
9.5K
0分
P
Playwright Scraper
一个基于Playwright的网页内容抓取并转换为Markdown的MCP服务
Python
15.7K
2.5分
W
Websearch Tools
一个基于Python和Firecrawl API的高级网络搜索与内容提取工具,提供网页搜索、内容抓取、网站爬取等功能,支持MCP协议集成。
Python
5.8K
2分
F
Firecrawl MCP Server 00a
Firecrawl MCP Server是一个集成Firecrawl网页抓取功能的模型上下文协议服务器,支持爬取、搜索、提取和批量处理网页内容,具有自动重试、速率限制和信用监控等功能。
TypeScript
6.6K
2分
M
MCP Google Search
一个基于Google自定义搜索API的MCP服务器,提供网页搜索和内容提取功能。
TypeScript
7.8K
2分
M
Mcma123 Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取功能的模型上下文协议服务器,提供网页抓取、爬取、搜索、内容提取和批量处理等功能,支持云API和自托管实例。
TypeScript
7.7K
2分
R
Readability (Fetch & Parse)
一个基于Python的MCP服务器,使用Mozilla Readability算法提取网页内容并转换为优化的Markdown格式。
Python
16.2K
2.5分
D
Deep Web Research
MCP深度网络研究服务器是一个基于Node.js的高级网络研究工具,提供智能搜索队列、增强内容提取和深度研究能力,可将实时信息整合到Claude中。
TypeScript
9.5K
2.5分
T
Tavily MCP Sse
基于FastAPI的Tavily API服务端,提供搜索和内容提取功能,支持API密钥认证和SSE MCP服务。
Python
9.7K
2分
M
MCP Server Rag Web Browser
为RAG Web Browser Actor实现的MCP服务器,支持AI代理进行网页搜索和内容提取。
TypeScript
10.2K
3分
M
MCP Pdf Extraction Server
PDF内容提取服务
Python
9.9K
2.5分
O
Olostep
Olostep MCP Server是一个集成了Olostep服务的MCP服务器实现,提供网页内容提取、搜索引擎结果获取和网站URL发现等功能,支持多国家请求路由和JavaScript渲染等待。
TypeScript
8.4K
2分
C
Content Core
Content Core是一个AI驱动的多功能内容提取与处理平台,支持从网页、文档、音视频等各类来源提取内容,并提供智能清理、摘要生成等功能,支持命令行、Python库、MCP服务等多种集成方式。
Python
5.1K
2.5分
J
Jina MCP
Jina AI提供的远程MCP服务器,通过多种API工具实现网页内容提取、网页搜索、学术搜索、图像搜索、文本和图像去重等功能。
TypeScript
4.3K
2分

精选MCP服务推荐

D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
57.0K
4.3分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
56.9K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
96.6K
5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
45.5K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
40.2K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
39.0K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
25.5K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
72.8K
4.7分
AIBase
智启未来,您的人工智能解决方案智库