Native Devtools MCP
N

Native Devtools MCP

native-devtools-mcp 是一个跨平台的 MCP 服务器,为 AI 代理提供对 macOS、Windows 和 Android 系统的自动化控制能力,包括屏幕截图、OCR 文字识别、模拟点击输入、窗口管理以及 Android 设备控制。
2.5分
6.2K

什么是Native DevTools MCP?

Native DevTools MCP是一个让AI助手(如Claude、Cursor等)能够直接与您的电脑和安卓设备交互的工具。它就像一个数字助手,可以: • 查看屏幕内容(截图和文字识别) • 点击屏幕上的按钮和链接 • 输入文字 • 管理应用程序窗口 • 控制安卓手机/平板 当浏览器自动化不够用时,它可以处理桌面应用、系统对话框、Electron应用等场景。

如何使用Native DevTools MCP?

使用非常简单: 1. 安装工具(一行命令) 2. 运行设置向导(自动配置权限) 3. 重启您的AI助手(如Claude Desktop) 4. 开始使用AI助手控制您的设备 工具会在本地运行,所有截图和操作都保留在您的设备上,确保隐私安全。

适用场景

最适合以下情况: • 自动化重复的桌面操作 • 测试桌面应用程序 • 控制安卓设备进行自动化 • 处理无法通过浏览器访问的应用 • 辅助视觉障碍用户操作电脑 • 机器人流程自动化(RPA)

主要功能

视觉识别
捕捉屏幕截图并进行文字识别(OCR),让AI能够'看到'屏幕上的内容。可以截取整个屏幕、特定窗口或区域。
输入控制
模拟鼠标点击、拖动、滚动和键盘输入。支持全局坐标和窗口相对位置操作。
窗口管理
列出打开的窗口,查找应用程序,并将它们带到前台聚焦。
模板匹配
通过图像模板查找非文本UI元素(如图标、形状),返回精确的点击坐标。
安卓设备支持
通过ADB连接安卓设备,进行截图、输入模拟、UI元素搜索和应用管理。
悬停跟踪
实时跟踪光标在UI元素上的悬停状态,帮助AI观察用户导航模式(仅限macOS)。
本地运行
100%本地执行,截图和输入数据从不发送到外部服务器,确保隐私安全。
优势
跨平台支持:macOS、Windows、Android全平台兼容
无需编码:通过自然语言与AI交互即可控制设备
隐私安全:所有操作在本地完成,数据不外传
灵活强大:支持视觉识别和结构化的两种交互方式
易于集成:与Claude Desktop、Cursor等主流AI工具无缝集成
局限性
需要权限:需要授予屏幕录制和辅助功能权限
学习曲线:需要了解基本的命令和交互模式
平台限制:某些高级功能可能因操作系统而异
性能依赖:复杂操作可能受设备性能影响
应用兼容性:某些应用可能限制自动化访问

如何使用

安装工具
打开终端(macOS/Linux)或命令提示符(Windows),运行以下命令:
运行设置向导
运行设置命令,工具会自动检查权限并配置您的AI客户端:
授予必要权限
根据提示前往系统设置,授予屏幕录制和辅助功能权限。这是工具正常运行所必需的。
重启AI客户端
重启您的Claude Desktop、Cursor或其他MCP客户端,使配置生效。
开始使用
在AI助手中,您现在可以要求它控制您的设备了。例如:'请帮我打开计算器并计算123+456'。

使用案例

自动化邮件发送
让AI助手帮您打开邮件客户端,撰写并发送一封邮件
文件整理
自动化整理下载文件夹中的文件
安卓应用测试
在安卓设备上自动化测试应用程序
数据录入自动化
将Excel数据录入到桌面应用程序中

常见问题

这个工具安全吗?会不会窃取我的隐私?
为什么需要屏幕录制和辅助功能权限?
支持哪些AI客户端?
工具运行时我可以正常使用电脑吗?
安卓设备需要什么条件?
遇到问题如何获取帮助?

相关资源

官方GitHub仓库
源代码、问题反馈和最新版本
详细使用指南
为AI助手优化的技术参考文档
示例和教程
实际使用案例和分步教程
安全审计文档
详细的安全审计和权限说明
MCP协议文档
Model Context Protocol官方规范

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "native-devtools": {
      "command": "/Applications/NativeDevtools.app/Contents/MacOS/native-devtools-mcp"
    }
  }
}

{
  "mcpServers": {
    "native-devtools": {
      "command": "npx",
      "args": ["-y", "native-devtools-mcp"]
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.6K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
A
Apify MCP Server
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
TypeScript
7.5K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库