Speech MCP
S

Speech MCP

Speech MCP是为Goose设计的语音交互扩展,提供实时语音识别、高质量文本转语音、多语言支持和现代化音频可视化界面,支持多角色对话生成和音频转录功能。
2.5分
8.6K

什么是Speech MCP?

Speech MCP是一个为Goose设计的语音交互扩展,通过语音输入和输出实现更自然的人机对话体验。

如何使用Speech MCP?

启动Goose后,只需说“让我们用语音交流”即可开始语音对话。

适用场景

适用于需要快速响应、多语言支持或复杂语音处理的应用场景。

主要功能

语音输入
实时捕捉用户的语音输入并转化为文本。
语音输出
将Goose生成的文本转换为高质量语音。
多角色叙事
支持多角色对话的语音合成,适合讲故事或制作音频剧。
音频转录
从音频或视频文件中提取语音并生成文本。
优势
支持多种语言和语音风格。
本地化处理,无需联网。
用户界面友好且直观。
局限性
首次运行时需要下载模型文件(约523KB/语音)。
对硬件性能有一定要求。

如何使用

安装依赖
确保已安装PortAudio(不同操作系统安装方法见文档)。
启动Goose
在Goose中启用Speech MCP扩展。
开始语音对话
直接说话与Goose交互。

使用案例

简单语音输入
用户可以直接说话让Goose回应。
多角色叙事
生成一段包含多个角色的对话音频。

常见问题

为什么第一次使用时需要下载模型?
如何更改默认语音设置?

相关资源

Speech MCP官方文档
详细的安装指南和技术支持。
Kokoro TTS GitHub
了解更多关于Kokoro TTS的信息。

安装

复制以下命令到你的Client进行配置
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

Z
Zen MCP Server
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
Python
13.8K
5分
O
Opendia
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
JavaScript
9.5K
5分
N
Notte Browser
已认证
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
20.5K
4.5分
B
Bing Search MCP
一个用于集成微软Bing搜索API的MCP服务器,支持网页、新闻和图片搜索功能,为AI助手提供网络搜索能力。
Python
18.1K
4分
C
Cloudflare
Changesets是一个用于管理多包或单包仓库版本和发布的构建工具。
TypeScript
12.1K
5分
E
Eino
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Go
18.3K
5分
M
Modelcontextprotocol
已认证
该项目是一个集成Sonar API的MCP服务器实现,为Claude提供实时网络搜索能力。包含系统架构、工具配置、Docker部署及多平台集成指南。
TypeScript
13.4K
5分
S
Serena
Serena是一个强大的开源编码代理工具包,能够将LLM转化为可直接在代码库上工作的全功能代理。它提供类似IDE的语义代码检索和编辑工具,支持多种编程语言,并可通过MCP协议或Agno框架与多种LLM集成。
Python
22.6K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
44.2K
4.5分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
64.1K
5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
39.9K
4.3分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
20.7K
4.8分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
46.1K
4.7分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
30.6K
5分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
31.0K
4.5分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
35.7K
4.8分
AIbase
智启未来,您的人工智能解决方案智库