数据提取

# 数据提取

G
Google News Trends MCP
一个从Google新闻和趋势RSS端点获取数据,并可选择通过LLM/NLP处理的MCP服务器项目
Python
6.6K
2.5分
S
Scrapegraph MCP
ScrapeGraph MCP服务器是一个生产就绪的模型上下文协议服务器,提供与ScrapeGraph AI API的无缝集成,使语言模型能够利用先进的AI驱动的网页抓取功能。
Python
8.7K
2.5分
M
MCP Server Box
MCP Server Box是一个Python项目,通过Box API实现文件搜索、文本提取、AI查询和数据提取等功能,整合了box-sdk-gen库,提供了一套与Box文件和文件夹交互的工具集。
Python
10.4K
2.5分
S
Scrapi
ScrAPI MCP服务器是一个基于ScrAPI服务的网页抓取工具,提供HTML和Markdown两种格式的网页内容提取功能。
TypeScript
16.6K
2.5分
B
Browser Automation Server
一个基于MCP协议的浏览器自动化服务,提供网页导航、截图、元素交互、表单填写和数据提取等功能。
TypeScript
10.5K
2分
E
Excelreadmcp
ExcelReadMCP是一个专门用于读取Excel文件的MCP协议服务器,提供读取、搜索和获取工作簿信息等功能,支持在Cursor和GitHub Copilot等客户端中使用
Python
17.3K
2分
M
Mcpdatafetchserver
MCP数据获取服务器是一个安全、沙盒化的服务器,通过模型控制协议(MCP)获取网页内容并提取数据,不执行JavaScript。
Python
8.2K
2.5分
F
Firecrawl
一个基于Firecrawl API的网站数据抓取和结构化提取服务
JavaScript
9.4K
2分
D
Data Extractor
一个MCP协议服务器,用于从TypeScript/JavaScript源代码中提取嵌入式数据(如i18n翻译或键值配置)和SVG组件,生成结构化JSON配置文件和独立SVG文件。
JavaScript
9.7K
2.5分
H
Hyperbrowser
Hyperbrowser的MCP服务器提供网页抓取、结构化数据提取和浏览器代理工具。
TypeScript
12.1K
3.5分
B
Browserbase
Browserbase MCP Server是一个基于Model Context Protocol(MCP)的开源项目,提供云浏览器自动化服务,支持网页交互、数据提取和JavaScript执行等功能。
TypeScript
14.7K
0分
L
Ldoce MCP Server
一个基于Node.js和TypeScript的MCP服务器,从Longman词典提取单词数据并返回JSON格式结果。
TypeScript
6.2K
2分
S
Scrapi MCP
ScrAPI MCP服务器是一个基于ScrAPI技术的网页抓取服务,提供HTML和Markdown两种格式的网页内容提取功能,支持本地部署和云端访问。
TypeScript
10.0K
2.5分
M
MCP Ethical Hacking
该项目是一个用于教育目的的MCP工具包,展示社交平台内容分析技术及其安全风险,包含Reddit和LinkedIn的数据提取与分析工具。
Python
9.1K
2.5分
S
Scrapezy
Scrapezy MCP服务器是一个为AI模型提供从网站提取结构化数据的服务,支持通过Claude等工具进行数据抓取。
TypeScript
9.5K
2.5分
M
MCP Searxng 1g0
mcp-searxng是一个为AI代理设计的MCP服务器示例,通过SearXNG开源元搜索引擎实现外部信息搜索功能。项目展示了如何集成SearXNG和微软的markdownify工具,将网页内容转换为Markdown格式文本,并通过SSE协议与MCP客户端通信。
Python
12.1K
2.5分
F
Firecrawl
Firecrawl是一个API服务,能够将任何网站爬取并转换为干净的Markdown或结构化数据,支持高级爬取、数据提取和LLM-ready格式转换。
TypeScript
10.3K
2分
C
Crawl4ai MCP
Crawl4AI是一个基于MCP架构的智能网络爬虫服务器,结合Claude AI模型提供网站内容分析与处理功能,支持可定制的爬取深度和AI处理任务,适用于研究、内容创作、数据分析等多种场景。
JavaScript
14.1K
2.5分
F
File Ai MCP
fileAI MCP服务器提供端到端的文件处理解决方案,包括OCR、文档分类和结构化数据提取,支持AI模型集成和异步处理。
6.6K
2分
A
Amazon Order History Csv Download MCP
亚马逊订单历史CSV下载MCP服务器,支持跨16个地区站点自动化导出订单、商品、物流和交易数据,适用于AI助手集成和数据分析
TypeScript
6.6K
2分
E
Excel Search MCP
一个用于搜索和读取本地Excel文件的MCP服务器,支持文件搜索、数据提取和文本搜索功能
Python
8.9K
2.5分
W
Welcometextgenerator
一个基于MCP协议的自动化欢迎文本生成服务器,用于从自由文本中提取结构化员工信息,并根据模块化模板系统生成专业的新员工欢迎文本。
TypeScript
5.6K
2分
D
Data MCP Server
Data MCP Server是一个提供网页抓取、结构化数据提取和爬取功能的工具集,同时支持多种浏览器代理工具如OpenAI CUA和Claude Computer Use。
TypeScript
6.3K
2分
C
Custom Context MCP
提供基于JSON模板的文本结构化提取服务
TypeScript
10.6K
2.5分
S
Scraper.is
Scraper.is MCP是一个基于模型上下文协议(MCP)的网页抓取工具集成包,允许AI助手通过MCP协议抓取网页内容,支持多种格式输出和实时进度更新。
TypeScript
9.1K
2分
M
MCP Server Firecrawl
Firecrawl MCP Server是一个基于Firecrawl API的网络爬虫和数据提取服务,提供网页抓取、内容搜索、站点爬取和结构化数据提取功能。
TypeScript
9.0K
2.5分
F
Figma Design System
Figma MCP服务器是一个连接Figma API的模型上下文协议服务,允许AI工具和LLM访问并处理Figma设计。
TypeScript
9.4K
2.5分
M
Msparihar MCP Server Firecrawl
Firecrawl MCP服务器是一个基于Firecrawl API的网络爬虫服务,提供网页抓取、内容搜索、站点爬取和结构化数据提取功能,支持多种配置选项和输出格式。
TypeScript
9.6K
2分
E
Edgardamasceno Dev Ldoce MCP Server
这是一个基于Node.js和TypeScript的MCP服务器,从Longman词典网页提取单词信息并返回结构化JSON数据,供AI代理使用。
TypeScript
9.6K
2分
M
Mcphackathon
该项目通过Unstructured API构建了一个MCP服务器,用于处理研究论文数据,提取关键信息并转换为结构化JSON格式,帮助研究人员快速获取文献信息,减少文献综述时间。
Python
10.4K
2.5分

精选MCP服务推荐

D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
93.4K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
172.7K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
80.7K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
35.8K
4.8分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
68.2K
5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
72.4K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
115.0K
4.7分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
52.8K
4.5分
AIBase
智启未来,您的人工智能解决方案智库