Forge MCP Server
F

Forge MCP Server

Forge MCP服务器是一个通过32个并行AI代理将PyTorch模型自动优化为高性能CUDA/Triton内核的工具,可将推理速度提升高达14倍,支持多种MCP兼容的AI编程助手。
2.5分
6.1K

什么是Forge MCP Server?

Forge MCP Server是一个连接AI编程助手与GPU优化服务的桥梁。它允许您通过Claude、Cursor、VS Code等AI助手,将PyTorch代码自动转换为经过优化的高性能GPU内核。服务使用32个并行AI代理在真实数据中心GPU上测试和优化代码,确保获得最佳性能。

如何使用Forge MCP Server?

使用Forge非常简单:1) 在您的AI助手中安装Forge MCP Server;2) 通过浏览器一键登录认证;3) 提交PyTorch代码或描述您需要的操作;4) 等待Forge优化并返回高性能内核代码。整个过程完全自动化,无需手动编写CUDA代码。

适用场景

Forge最适合以下场景:需要加速自定义PyTorch操作、优化现有GPU内核性能、从零生成新的高性能内核、将研究代码转换为生产级性能、在多种GPU架构上获得最佳性能。特别适合深度学习研究人员、AI工程师和需要高性能推理的开发者。

主要功能

自动代码优化
提交PyTorch代码,自动转换为优化的Triton或CUDA内核,与torch.compile(max-autotune)基准对比,确保性能提升。
智能内核生成
通过自然语言描述操作需求,自动生成高性能GPU内核代码,支持多种数据格式和GPU架构。
32并行AI代理优化
使用32个Coder+Judge代理对并行探索不同优化策略,包括张量核心利用、内存合并、共享内存平铺和内核融合。
真实GPU基准测试
所有内核都在真实数据中心GPU上编译、测试正确性并分析性能,支持B200、H200、H100、A100等多种GPU。
智能检测与建议
自动识别代码中的优化机会,如自定义操作、注意力机制、融合操作等,并提供优化建议。
一键浏览器认证
无需管理API密钥,通过OAuth 2.0 PKCE流程在浏览器中安全登录,令牌自动刷新。
优势
高达14倍性能提升,超越torch.compile(max-autotune)
支持多种主流AI编程助手(Claude、Cursor、VS Code等)
在真实数据中心GPU上测试,结果可靠
100%数值正确性保证
快速结果返回(分钟级别而非小时)
无需CUDA编程经验即可获得高性能内核
按使用量付费,成本透明
免费试用1个内核优化
局限性
需要网络连接访问优化服务
每个优化消耗1个积分(成功优化才收费)
最大代码输入限制为500KB
仅支持PyTorch代码优化
需要现代GPU支持(T4及以上)

如何使用

安装Forge MCP Server
根据您使用的AI助手,在配置文件中添加Forge MCP Server。例如在Claude Desktop中编辑claude_desktop_config.json文件。
认证登录
在AI助手中调用forge_auth工具,系统会自动打开浏览器完成登录。只需登录一次,令牌会自动刷新。
提交代码优化
当AI助手检测到可优化的PyTorch代码时,会自动调用forge_optimize工具。您也可以手动描述需要优化的操作。
获取优化结果
等待优化完成(通常几分钟),系统会返回优化后的内核代码、性能提升数据和集成建议。
集成优化代码
将返回的优化内核代码集成到您的项目中,替换原有的PyTorch实现,享受性能提升。

使用案例

优化自定义注意力机制
研究人员开发了新的注意力变体,但PyTorch实现速度较慢。使用Forge自动优化为高性能Triton内核。
生成融合归一化层
需要将LayerNorm、GELU激活和Dropout融合为单个高效内核以减少内存访问。
加速现有模型推理
生产环境中的模型推理速度不达标,需要优化关键计算瓶颈。

常见问题

Forge优化需要多长时间?
优化失败会收费吗?
支持哪些GPU?
如何保证优化后代码的正确性?
可以优化多大的代码?
如何购买积分?
支持本地部署吗?
优化后的代码有授权限制吗?

相关资源

官方文档
Forge服务的详细技术文档和基准测试结果
GitHub仓库
Forge MCP Server的源代码和问题跟踪
MCP协议官网
Model Context Protocol官方文档和规范
RightNow AI控制台
购买积分、查看使用统计和管理账户
NVIDIA Inception项目
RightNow AI是NVIDIA Inception项目成员

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "forge": {
      "command": "npx",
      "args": ["-y", "@rightnow/forge-mcp-server"]
    }
  }
}

{
  "mcpServers": {
    "forge": {
      "command": "cmd",
      "args": ["/c", "npx", "-y", "@rightnow/forge-mcp-server"]
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.6K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
A
Apify MCP Server
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
TypeScript
7.5K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库