Audio Transcriber (OpenAI Whisper)

Audio Transcriber (OpenAI Whisper)

一个基于OpenAI API的音频转文字MCP服务器，提供音频转录功能并支持多种配置选项。

语音处理开发者工具 #音频转录 #OpenAI #MCP服务 #语音识别本地 .TypeScript

评分 : 2.5分

下载量 : 11.7K

更新时间 : 2025-04-28

什么是Audio Transcriber MCP Server?

这是一个基于OpenAI语音识别技术的服务器，能够将上传的音频文件自动转换为文字转录。它作为Model Context Protocol (MCP)服务器运行，可以轻松集成到您的AI应用中。

如何使用Audio Transcriber MCP Server?

您只需要将音频文件发送到服务器，它就会返回文字转录结果。支持多种音频格式，并可选择保存转录结果到文件。

适用场景

适用于会议记录、采访转录、播客内容转换、语音备忘录转文字等多种需要将音频转换为文字的场景。

主要功能

音频转录

使用OpenAI先进的语音识别技术将音频内容准确转换为文字

多语言支持

支持多种语言的转录，通过指定ISO-639-1语言代码(如'en','es')

保存选项

可选择将转录结果保存为文本文件

优势

基于OpenAI技术，转录准确率高

支持多种音频格式

简单易用的API接口

可扩展性强，易于集成

局限性

需要OpenAI API密钥

依赖网络连接

长音频文件可能需要较长时间处理

如何使用

安装服务器

克隆仓库并安装依赖

配置环境

设置OpenAI API密钥和其他可选参数

启动服务器

构建并启动MCP服务器

使用案例

转录英语会议录音

将英语会议录音转换为文字记录

保存西班牙语采访转录

转录西班牙语采访并保存结果到文件

常见问题

需要什么样的音频格式?

如何处理长音频文件?

如何获取OpenAI API密钥?

相关资源

GitHub仓库

项目源代码

OpenAI API文档

OpenAI API官方文档

MCP协议说明

Model Context Protocol官方文档

Firecrawl MCP Server

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

Duckduckgo MCP Server

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Figma Context MCP

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

Minimax MCP Server

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

AIBase

智启未来，您的人工智能解决方案智库

© 2026AIBase 备案号：闽ICP备08105208号-24