Xiaozhi Autoglm MCP
什么是小智AutoGLM MCP服务?
小智AutoGLM MCP服务是一个智能安卓设备自动化工具,它允许你通过自然语言指令控制安卓手机或平板电脑。该服务基于先进的视觉语言模型,能够理解屏幕内容并执行相应的操作,如点击、滑动、输入文字等。如何使用小智AutoGLM MCP服务?
使用本服务需要准备一台安卓设备(手机或模拟器),通过USB连接到电脑,并完成ADB和ADB Keyboard的配置。配置完成后,启动MCP服务,即可通过小智AI或私有化部署的小智服务器发送指令来控制设备。适用场景
本服务特别适合需要自动化操作安卓设备的场景,例如:自动化测试、批量执行重复任务、远程设备控制、为视力障碍用户提供辅助操作等。主要功能
安卓设备自动化控制
通过ADB连接,实现对安卓设备的点击、滑动、输入等基础操作的自动化执行。
视觉语言模型驱动
集成ChatGLM等视觉语言大模型,能够理解屏幕截图内容,将自然语言指令转化为具体的设备操作步骤。
MCP协议接入
遵循Model Context Protocol标准,可以轻松接入小智AI平台或私有化部署的小智服务器,实现远程调用。
跨平台支持
提供Linux/macOS和Windows系统的启动脚本,方便在不同操作系统上部署和运行。
优势
智能化操作:无需编写复杂脚本,用自然语言即可控制设备。
易于集成:通过标准MCP协议,可快速接入现有AI助手生态。
开源可定制:基于Open-AutoGLM开源项目构建,可根据需求进行二次开发。
支持真实设备与模拟器:既可用于真机测试,也可用于模拟器自动化。
局限性
依赖外部模型:视觉理解能力依赖于ChatGLM等第三方API,可能需要付费且受网络影响。
配置步骤较多:需要安装ADB、配置设备开发者选项、安装输入法等,对新手有一定门槛。
仅支持安卓:目前仅支持Android 7.0及以上版本的设备,不支持iOS或其他系统。
需要USB连接:大部分操作需要通过USB数据线连接设备,限制了完全的无线远程控制。
如何使用
环境准备:安装ADB工具
从Android开发者官网下载ADB工具包,解压到本地目录,并将该目录添加到系统的环境变量PATH中,以便在终端中可以直接使用adb命令。
设备准备:启用开发者选项
在安卓设备上,进入‘设置 > 关于手机’,连续点击‘版本号’7次以上,直到提示‘您已处于开发者模式’。然后返回设置,进入新出现的‘开发者选项’,开启‘USB调试’功能。
安装ADB Keyboard输入法
在安卓设备上安装ADB Keyboard APK文件。安装后,进入‘设置 > 系统 > 语言和输入法 > 虚拟键盘’,启用‘ADB Keyboard’输入法。这是实现自动化文本输入的关键。
连接设备并验证
使用USB数据线将安卓设备连接到电脑。在电脑终端运行 `adb devices` 命令,如果看到设备序列号并显示‘device’,则表示连接成功。
安装Python依赖
创建一个Python虚拟环境,并使用pip安装项目所需的所有依赖库。
配置服务参数
复制配置文件模板,并根据你的小智MCP服务接入点地址和智谱AI的API密钥(如果使用ChatGLM模型)来修改配置文件。
启动MCP服务
根据你的操作系统,运行对应的启动脚本,启动MCP服务。服务启动后,会等待来自小智AI的指令。
使用案例
案例一:自动化发送微信消息
你想让助手帮你给朋友发一条微信消息。你只需要告诉助手“给李四发微信说‘项目会议改到下午3点’”。
案例二:信息查询与记录
你想查询手机屏幕上显示的某条信息(如快递单号、验证码)并记录下来。
案例三:自动化应用操作流程
你需要每天在某个应用中执行固定的签到、领取奖励等操作。
常见问题
连接设备时,`adb devices` 命令没有显示任何设备,怎么办?
安装ADB Keyboard后,无法输入中文或输入法不生效?
服务运行时提示视觉模型API调用失败或余额不足?
可以同时控制多台安卓设备吗?
支持无线连接(Wi-Fi调试)吗?
相关资源
Open-AutoGLM 开源项目
本项目所基于的安卓自动化开源框架,包含更多技术细节和底层实现。
Android Platform Tools (ADB) 官方下载
Android Debug Bridge (ADB) 命令行工具的官方下载页面。
ADB Keyboard 项目页面
用于实现ADB文本输入的安卓输入法应用源码和APK下载。
小智AI官网
可以接入本MCP服务的AI助手平台。
智谱AI开放平台
提供ChatGLM等视觉语言模型的API服务,用于本项目的屏幕内容理解。

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
76.8K
4.3分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
69.6K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
133.0K
5分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
46.6K
4.5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
30.5K
4.8分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
59.0K
4.8分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
50.8K
5分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
96.1K
4.7分
