Markdownify MCP 服务器(UTF-8 增强版)
简介
Markdownify MCP Server 是一个用于将各种文件格式转换为 Markdown 的工具。本项目是基于原始作者 Zach Caceres 的工作,并在此基础上进行了 UTF-8 支持的增强优化。
主要改进
-
UTF-8 全面支持
- 完全兼容 UTF-8 编码,确保在处理多语言文档时不会出现乱码问题。
- 修复了原始版本中对中文等非英文字符的支持缺陷。
-
文件格式兼容性提升
- 支持将 DOCX、PDF、PPTX 和 XLSX 格式的 Office 文档转换为 Markdown。
- 增加了对 YouTube 视频直接链接的解析支持,可提取视频文字内容。
-
性能优化
- 通过优化底层处理逻辑,提升了文件转换效率。
- 改善了内存管理机制,降低了高负载情况下的资源消耗。
功能特点
核心功能
-
文档格式转换
python convert_utf8.py "document.docx"
python convert_utf8.py "document.pdf"
python convert_utf8.py "presentation.pptx"
python convert_utf8.py "spreadsheet.xlsx"
-
YouTube 视频处理
python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"
-
批量处理支持
其他功能
-
环境变量配置
支持通过环境变量自定义输出目录和工具路径:
export UV_PATH="/custom/path/to/uv"
export MARKDOWN_OUTPUT_DIR="/custom/output/path"
-
调试模式
通过设置环境变量可启用详细日志输出:
export DEBUG=true
python convert_utf8.py "your_file.docx"
快速上手
安装说明
-
克隆项目仓库:
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git
cd markdownify-mcp-utf8
-
安装依赖项:
-
启动服务器:
python server.py
使用示例
命令行使用
-
将网页转换为 Markdown:
python convert_utf8.py "https://example.com"
-
转换本地文件:
python convert_utf8.py "path/to/your/file.docx"
桌面应用集成
在桌面应用程序中集成本服务器,可将以下配置添加到你的服务器配置文件中:
{
"mcpServers": {
"markdownify": {
"command": "node",
"args": [
"{ABSOLUTE_PATH}/dist/index.js"
],
"env": {
"UV_PATH": "/path/to/uv"
}
}
}
}
故障排除
常见问题
-
编码问题
- 如出现字符编码错误,请确保
PYTHONIOENCODING
环境变量已设置为 utf-8
。
- Windows 用户需运行
chcp 65001
启用 UTF-8 支持。
-
权限问题
- 确认拥有足够的文件读写权限。
- 在 Windows 系统中,可能需要以管理员身份运行命令。
项目贡献
欢迎提交修复和新功能!在发起 Pull Request 前,请:
- 遵循项目的代码规范
- 添加必要的测试用例和文档
- 更新相关部分的 documentation
联系方式
如需反馈或帮助,可通过以下方式联系:
- 项目地址:GitHub
- 邮箱:your.email@example.com