Spark Sql MCP Server
S

Spark Sql MCP Server

一个MCP服务器,允许AI助手通过Thrift/HiveServer2协议查询Spark SQL集群,支持多种认证方式,提供只读查询和模式发现功能。
2分
0

什么是Spark SQL MCP Server?

Spark SQL MCP Server是一个连接AI助手(如Claude)与Spark SQL集群的桥梁。它允许您通过自然语言对话来查询数据库、查看表结构、执行数据分析,而无需编写复杂的SQL语句或使用专业工具。

如何使用Spark SQL MCP Server?

使用非常简单:1) 配置连接信息(主机、端口、认证方式),2) 在Claude中启用MCP服务器,3) 通过自然语言提问即可查询数据。系统会自动将您的问题转换为SQL查询并返回结果。

适用场景

适合数据分析师、业务人员、产品经理等需要快速查询数据但不想学习复杂SQL语法的用户。特别适用于:快速数据探索、日常报表生成、数据验证、跨表关联查询等场景。

主要功能

SQL查询执行
执行只读SQL查询,支持SELECT、SHOW、DESCRIBE、EXPLAIN和WITH语句,自动为无限制查询添加LIMIT子句以确保安全
架构发现
自动发现和列出所有可用的数据库、数据表,并显示表结构(字段名、数据类型)
多种认证方式
支持NONE、LDAP、NOSASL、CUSTOM和Kerberos等多种认证方式,适应不同的安全环境
广泛兼容性
兼容Apache Spark、AWS EMR、Hive、Impala、Presto等HiveServer2兼容系统,开箱即用
安全保护
强制执行只读操作,防止数据修改;自动清理错误信息,不暴露内部细节;安全处理凭证信息
优势
无需SQL专业知识:通过自然语言即可查询数据
快速集成:几分钟内即可完成配置并开始使用
跨平台兼容:支持多种大数据平台和云服务
安全可靠:只读操作,自动限制查询结果大小
开发友好:提供本地Docker测试环境,便于开发和调试
局限性
无TLS/SSL支持:Thrift连接未加密,建议通过SSH隧道保护数据传输
无查询超时控制:依赖Spark集群级别的超时配置
权限控制有限:所有查询使用配置用户的权限执行
默认无认证:生产环境需要显式配置认证方式
仅支持只读操作:无法执行数据写入或结构修改

如何使用

安装服务器
通过pip安装Spark SQL MCP Server,或使用uvx直接运行
配置环境变量
设置连接Spark集群所需的环境变量,包括主机地址、端口、数据库和认证方式
配置Claude
将服务器配置添加到Claude的MCP设置中,支持全局配置或项目级配置
开始查询
在Claude中通过自然语言提问,系统会自动转换为SQL查询并返回结果

使用案例

数据探索与发现
当您需要了解数据仓库中有哪些数据可用时,可以快速浏览数据库和表结构
表结构查看
在编写查询前,需要了解表的字段结构和数据类型
业务数据查询
业务人员需要快速获取特定时间段或条件下的业务数据
数据验证与检查
验证数据质量,检查数据完整性或异常值

常见问题

这个服务器支持哪些大数据平台?
我需要有SQL知识才能使用吗?
如何保证数据安全?
连接AWS EMR集群需要注意什么?
查询结果有限制吗?
如何测试本地开发环境?

相关资源

GitHub仓库
项目源代码、问题跟踪和贡献指南
Model Context Protocol官网
MCP协议官方文档和规范
Apache Spark文档
Spark SQL官方编程指南
AWS EMR文档
Amazon EMR管理和使用指南

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "spark-sql": {
      "command": "uvx",
      "args": ["spark-sql-mcp-server"],
      "env": {
        "SPARK_HOST": "your-emr-master-node.amazonaws.com",
        "SPARK_PORT": "10000",
        "SPARK_AUTH": "NONE"
      }
    }
  }
}

{
  "mcpServers": {
    "spark-sql": {
      "command": "uvx",
      "args": ["spark-sql-mcp-server"],
      "env": {
        "SPARK_HOST": "your-emr-master-node.amazonaws.com",
        "SPARK_PORT": "10000"
      }
    }
  }
}

{
  "mcpServers": {
    "spark-sql": {
      "command": "uvx",
      "args": ["spark-sql-mcp-server"],
      "env": {
        "SPARK_HOST": "localhost",
        "SPARK_PORT": "10000",
        "SPARK_AUTH": "NONE"
      }
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.6K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
A
Apify MCP Server
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
TypeScript
7.5K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库