入门攻略
MCP提交
探索
Computer Control
概述
安装
内容详情
替代品
什么是计算机控制MCP?
计算机控制MCP是一个基于MCP协议的服务器,允许用户远程控制计算机的鼠标、键盘,并执行OCR等操作。它可以帮助您自动化任务或远程管理设备。如何使用计算机控制MCP?
只需安装服务器并运行,即可通过MCP客户端连接并使用其功能。支持Windows系统,未来可能扩展到其他平台。适用场景
适用于需要远程控制计算机、自动化办公任务、OCR文本提取等场景。例如:远程协助、测试自动化等。主要功能
鼠标控制支持移动鼠标光标、点击屏幕上的指定位置以及拖放操作。
键盘输入允许在当前光标位置输入文本或按下特定键盘键。
屏幕捕获可以截取整个屏幕或特定窗口的截图,并可选择保存至下载目录。
OCR文本提取利用光学字符识别技术从截图中提取文本。
窗口管理列出所有打开的窗口并激活指定窗口。
优势与局限性
优势
跨平台兼容性(目前支持Windows)
零外部依赖,易于部署
强大的功能组合,满足多种需求
局限性
仅限于Windows系统,未来计划支持更多操作系统
性能受硬件影响较大,尤其是OCR操作
如何使用
安装MCP服务器通过pip安装服务器,或者直接克隆GitHub仓库并运行。
启动服务器运行命令启动MCP服务器。
连接客户端并使用功能通过MCP客户端连接到服务器,并调用所需功能。
使用案例
示例1:截屏并提取文本对某个窗口进行截图,并使用OCR提取其中的文字。
示例2:远程控制鼠标通过MCP客户端发送指令,让远程计算机移动鼠标并点击。
常见问题
1
该工具是否支持Linux/MacOS?目前仅支持Windows系统,但我们正在规划对其他操作系统的支持。
2
如何确保OCR准确率?可以通过调整OCR引擎的阈值参数来优化识别精度。
3
能否批量执行多个命令?可以,只需依次调用相关函数即可。
相关资源
GitHub仓库项目源码及文档
Discord社区用户交流和支持
API参考文档详细的API接口说明
精选MCP服务推荐

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
212
4.3分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
2,956
5分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
6,102
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
88
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
323
4.5分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
1,429
5分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
364
4.8分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
4,853
4.7分