MCP Audio
什么是MCP-Audio?
MCP-Audio 是一个符合 AIO-2030 标准的 MCP 插件,用于将音频文件(如 .wav 或 .mp3)转换为文本。它通过 SiliconFlow 的语音识别 API 实现语音到文字的转换。如何使用MCP-Audio?
用户可以通过上传音频文件或使用 Base64 编码的音频数据来调用该服务。同时,它支持 AIO 协议,可以与其他 AI 工具无缝集成。适用场景
适用于需要语音识别的场景,如语音助手、会议记录、客服录音分析等。主要功能
多格式支持
支持 .wav 和 .mp3 音频文件的语音识别。
AIO 协议兼容
遵循 AIO-2030 标准,可与 AIO 生态系统中的其他工具无缝集成。
Base64 支持
支持 Base64 编码的音频数据输入,方便在不同平台间传输。
安全配置管理
通过 .env 文件管理 API 密钥,确保密钥安全。
优势
易于集成到 AIO 生态系统中
支持多种音频格式和输入方式
提供清晰的 JSON-RPC 输出格式
支持 Docker 容器化部署
局限性
仅支持特定的语音识别 API(SiliconFlow)
需要额外的环境配置(如 .env 文件)
不支持实时语音流处理
如何使用
克隆项目
从 GitHub 上克隆 MCP-Audio 项目并进入目录。
安装依赖
创建虚拟环境并安装所需的 Python 包。
配置环境变量
复制 .env.example 文件并设置正确的 API 密钥和 URL。
启动服务器
运行 MCP 服务器以开始接收音频请求。
测试服务
使用提供的测试脚本验证服务是否正常工作。
使用案例
会议记录生成
将会议录音上传至 MCP-Audio 服务,自动生成会议纪要。
语音助手交互
用户通过语音输入指令,MCP-Audio 将语音转换为文字后供后续处理。
常见问题
MCP-Audio 是否支持实时语音识别?
如何获取 API 密钥?
MCP-Audio 是否支持中文语音识别?
相关资源
GitHub 项目仓库
查看完整代码和项目文档。
AIO-2030 规范文档
了解 AIO-2030 标准及其 API 调用规范。
SiliconFlow 文档
了解 SiliconFlow 语音识别 API 的详细说明。

Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
58.1K
4.3分

Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
56.9K
4.5分

Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
97.4K
5分

Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
40.2K
5分

Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
25.5K
4.8分

Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
46.6K
4.8分

Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
38.0K
4.5分

Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
72.1K
4.7分
