Xiaozhi Autoglm MCP
X

Xiaozhi Autoglm MCP

基于Open-AutoGLM构建的安卓设备自动化MCP服务,通过ADB连接手机并调用视觉模型,可接入小智AI实现智能控制。
2.5分
10.4K

什么是小智AutoGLM MCP服务?

小智AutoGLM MCP服务是一个智能安卓设备自动化工具,它允许你通过自然语言指令控制安卓手机或平板电脑。该服务基于先进的视觉语言模型,能够理解屏幕内容并执行相应的操作,如点击、滑动、输入文字等。

如何使用小智AutoGLM MCP服务?

使用本服务需要准备一台安卓设备(手机或模拟器),通过USB连接到电脑,并完成ADB和ADB Keyboard的配置。配置完成后,启动MCP服务,即可通过小智AI或私有化部署的小智服务器发送指令来控制设备。

适用场景

本服务特别适合需要自动化操作安卓设备的场景,例如:自动化测试、批量执行重复任务、远程设备控制、为视力障碍用户提供辅助操作等。

主要功能

安卓设备自动化控制
通过ADB连接,实现对安卓设备的点击、滑动、输入等基础操作的自动化执行。
视觉语言模型驱动
集成ChatGLM等视觉语言大模型,能够理解屏幕截图内容,将自然语言指令转化为具体的设备操作步骤。
MCP协议接入
遵循Model Context Protocol标准,可以轻松接入小智AI平台或私有化部署的小智服务器,实现远程调用。
跨平台支持
提供Linux/macOS和Windows系统的启动脚本,方便在不同操作系统上部署和运行。
优势
智能化操作:无需编写复杂脚本,用自然语言即可控制设备。
易于集成:通过标准MCP协议,可快速接入现有AI助手生态。
开源可定制:基于Open-AutoGLM开源项目构建,可根据需求进行二次开发。
支持真实设备与模拟器:既可用于真机测试,也可用于模拟器自动化。
局限性
依赖外部模型:视觉理解能力依赖于ChatGLM等第三方API,可能需要付费且受网络影响。
配置步骤较多:需要安装ADB、配置设备开发者选项、安装输入法等,对新手有一定门槛。
仅支持安卓:目前仅支持Android 7.0及以上版本的设备,不支持iOS或其他系统。
需要USB连接:大部分操作需要通过USB数据线连接设备,限制了完全的无线远程控制。

如何使用

环境准备:安装ADB工具
从Android开发者官网下载ADB工具包,解压到本地目录,并将该目录添加到系统的环境变量PATH中,以便在终端中可以直接使用adb命令。
设备准备:启用开发者选项
在安卓设备上,进入‘设置 > 关于手机’,连续点击‘版本号’7次以上,直到提示‘您已处于开发者模式’。然后返回设置,进入新出现的‘开发者选项’,开启‘USB调试’功能。
安装ADB Keyboard输入法
在安卓设备上安装ADB Keyboard APK文件。安装后,进入‘设置 > 系统 > 语言和输入法 > 虚拟键盘’,启用‘ADB Keyboard’输入法。这是实现自动化文本输入的关键。
连接设备并验证
使用USB数据线将安卓设备连接到电脑。在电脑终端运行 `adb devices` 命令,如果看到设备序列号并显示‘device’,则表示连接成功。
安装Python依赖
创建一个Python虚拟环境,并使用pip安装项目所需的所有依赖库。
配置服务参数
复制配置文件模板,并根据你的小智MCP服务接入点地址和智谱AI的API密钥(如果使用ChatGLM模型)来修改配置文件。
启动MCP服务
根据你的操作系统,运行对应的启动脚本,启动MCP服务。服务启动后,会等待来自小智AI的指令。

使用案例

案例一:自动化发送微信消息
你想让助手帮你给朋友发一条微信消息。你只需要告诉助手“给李四发微信说‘项目会议改到下午3点’”。
案例二:信息查询与记录
你想查询手机屏幕上显示的某条信息(如快递单号、验证码)并记录下来。
案例三:自动化应用操作流程
你需要每天在某个应用中执行固定的签到、领取奖励等操作。

常见问题

连接设备时,`adb devices` 命令没有显示任何设备,怎么办?
安装ADB Keyboard后,无法输入中文或输入法不生效?
服务运行时提示视觉模型API调用失败或余额不足?
可以同时控制多台安卓设备吗?
支持无线连接(Wi-Fi调试)吗?

相关资源

Open-AutoGLM 开源项目
本项目所基于的安卓自动化开源框架,包含更多技术细节和底层实现。
Android Platform Tools (ADB) 官方下载
Android Debug Bridge (ADB) 命令行工具的官方下载页面。
ADB Keyboard 项目页面
用于实现ADB文本输入的安卓输入法应用源码和APK下载。
小智AI官网
可以接入本MCP服务的AI助手平台。
智谱AI开放平台
提供ChatGLM等视觉语言模型的API服务,用于本项目的屏幕内容理解。

安装

复制以下命令到你的Client进行配置
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
7.7K
5分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
A
Apify MCP Server
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
TypeScript
7.5K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
150.9K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.6K
4.5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
32.0K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.8K
4.7分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.4K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.2K
4.5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.7K
4.8分
AIBase
智启未来,您的人工智能解决方案智库