mcp-audio - 符合AIO-2030标准MCP插件，支持多音频格式API调用实现语音转文字

探索

MCP Audio

mcp-audio是一个符合AIO-2030标准的MCP插件，提供语音转文字功能，支持多种音频格式和API调用方式。

语音处理开发者工具 #语音识别 #音频处理 #AI插件 #JSON-RPC .Python

评分 : 2.5分

下载量 : 9.2K

更新时间 : 2025-07-24

打开站点

什么是MCP-Audio？

MCP-Audio 是一个符合 AIO-2030 标准的 MCP 插件，用于将音频文件（如 .wav 或 .mp3）转换为文本。它通过 SiliconFlow 的语音识别 API 实现语音到文字的转换。

如何使用MCP-Audio？

用户可以通过上传音频文件或使用 Base64 编码的音频数据来调用该服务。同时，它支持 AIO 协议，可以与其他 AI 工具无缝集成。

适用场景

适用于需要语音识别的场景，如语音助手、会议记录、客服录音分析等。

主要功能

多格式支持

支持 .wav 和 .mp3 音频文件的语音识别。

AIO 协议兼容

遵循 AIO-2030 标准，可与 AIO 生态系统中的其他工具无缝集成。

Base64 支持

支持 Base64 编码的音频数据输入，方便在不同平台间传输。

安全配置管理

通过 .env 文件管理 API 密钥，确保密钥安全。

优势

易于集成到 AIO 生态系统中

支持多种音频格式和输入方式

提供清晰的 JSON-RPC 输出格式

支持 Docker 容器化部署

局限性

仅支持特定的语音识别 API（SiliconFlow）

需要额外的环境配置（如 .env 文件）

不支持实时语音流处理

如何使用

克隆项目

从 GitHub 上克隆 MCP-Audio 项目并进入目录。

安装依赖

创建虚拟环境并安装所需的 Python 包。

配置环境变量

复制 .env.example 文件并设置正确的 API 密钥和 URL。

启动服务器

运行 MCP 服务器以开始接收音频请求。

测试服务

使用提供的测试脚本验证服务是否正常工作。

使用案例

会议记录生成

将会议录音上传至 MCP-Audio 服务，自动生成会议纪要。

语音助手交互

用户通过语音输入指令，MCP-Audio 将语音转换为文字后供后续处理。

常见问题

MCP-Audio 是否支持实时语音识别？

如何获取 API 密钥？

MCP-Audio 是否支持中文语音识别？

相关资源

GitHub 项目仓库

查看完整代码和项目文档。

AIO-2030 规范文档

了解 AIO-2030 标准及其 API 调用规范。

SiliconFlow 文档

了解 SiliconFlow 语音识别 API 的详细说明。

Firecrawl MCP Server

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

TypeScript

190.7K

5分

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

Python

63.6K

4.5分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

智启未来，您的人工智能解决方案智库

MCP Audio

概述

内容详情

替代品

什么是MCP-Audio？

如何使用MCP-Audio？

适用场景

主要功能

如何使用

使用案例

常见问题

相关资源

安装

🚀 MCP-Audio插件

🚀 快速开始

本地环境搭建

1. 克隆并安装依赖

2. 添加.env文件

3. 启动MCP服务器

4. 使用Docker

4.1 构建并运行容器

✨ 主要特性

📚 详细文档

API概述

POST /api/v1/mcp/voice_model

POST /api/v1/mcp/tools.call (AIO协议)

GET /api/v1/mcp/help

测试工具

Base64语音测试

健康检查

MCP注册（到AIO端点容器）

替代品