MongTap

探索

Mongtap

MongTap是一个基于MCP协议的MongoDB兼容服务器，通过统计建模技术生成模拟数据，无需实际存储，为LLM提供数据库操作功能

数据库开发者工具 #MongoDB模拟 #统计建模 #MCP服务 #数据生成 .JavaScript

评分 : 2.5分

下载量 : 8.4K

更新时间 : 2025-09-25

打开站点

什么是MongTap?

MongTap是一个创新的Model Context Protocol (MCP)服务器，它使用统计建模技术来模拟MongoDB数据库功能。与传统数据库不同，MongTap不存储实际数据，而是通过学习数据模式来动态生成符合统计规律的文档。

如何使用MongTap?

通过Claude Desktop等支持MCP的LLM工具，您可以使用自然语言命令来创建数据模型、启动MongoDB服务器、生成测试数据等。所有操作都通过对话界面完成，无需编写复杂代码。

适用场景

MongTap特别适合开发测试、原型设计、演示环境和教育培训等场景，您需要快速生成大量符合特定模式的测试数据，但不需要永久存储这些数据。

主要功能

MongoDB完全兼容

支持完整的MongoDB Wire Protocol，可与任何MongoDB驱动程序和工具无缝集成

统计建模技术

使用DataFlood技术从样本数据或描述中学习模式，生成符合统计规律的逼真数据

自然语言交互

通过简单的对话即可创建数据模型、生成数据和管理数据库服务器

零数据存储

数据按需生成，不占用存储空间，保护隐私且提升性能

高性能生成

每秒可生成20,000+个文档，满足大规模测试需求

生成控制

通过$seed和$entropy参数精确控制数据生成的随机性和可重复性

优势

无需安装MongoDB，开箱即用

保护隐私，数据仅在本地生成

快速创建逼真的测试数据

支持自然语言操作，降低技术门槛

可同时运行多个数据库实例

局限性

不适合生产环境数据存储

生成数据基于统计模式，可能不完全准确

需要Claude Desktop或其他MCP客户端

复杂查询性能可能受限

如何使用

安装配置

克隆仓库并安装依赖，配置Claude Desktop的MCP服务器设置

Claude配置

在Claude Desktop配置文件中添加MongTap服务器路径

创建数据模型

通过对话描述或提供样本数据来训练统计模型

启动服务器

启动MongoDB兼容服务器，准备接收客户端连接

生成数据

使用自然语言命令生成所需数量和类型的测试数据

使用案例

电商网站开发测试

为电商应用快速生成产品目录、用户数据和订单记录，进行功能测试

用户管理系统原型

快速构建用户管理系统的前端原型，使用生成的用户数据进行界面测试

数据分析演示

为数据分析工具创建演示数据集，展示各种统计图表和洞察

API接口测试

为REST API后端生成测试数据，验证接口的正确性和性能

常见问题

MongTap是否需要安装MongoDB?

生成的数据是否会永久保存?

如何确保生成数据的准确性?

支持哪些MongoDB客户端?

可以同时运行多个数据库实例吗?

生成数据的性能如何?

🚀 MongTap - 面向大语言模型的MongoDB MCP服务器

MongTap是一个模型上下文协议（MCP）服务器，它通过统计建模提供与MongoDB兼容的数据库功能。它允许像Claude这样的大语言模型使用自然语言创建、查询和管理数据库，而无需实际存储数据。

Demo视频链接（YouTube）：

作者：SmallMinds LLC Co

仓库地址：github.com/smallmindsco/MongTap
官网：smallminds.co
联系方式：andrew@smallminds.co

✨ 主要特性

🚀 MongoDB有线协议 - 与MongoDB驱动程序和工具完全兼容
🧠 统计建模 - 使用DataFlood技术即时生成逼真的数据
🔧 MCP集成 - 与Claude Desktop和其他支持MCP的大语言模型无缝协作
📊 自然语言 - 根据描述或样本数据训练模型
⚡ 高性能 - 每秒可生成20,000多个文档
🎯 零存储 - 数据通过统计方式生成，无需存储

📚 详细文档

生成控制参数 - 使用$seed和$entropy控制文档生成
MCPB安装指南 - MCPB捆绑包安装指南

📦 安装指南

前提条件

Node.js 20+
Claude Desktop（用于MCP集成）
无需安装MongoDB！

快速开始

克隆仓库：

git clone https://github.com/smallmindsco/MongTap.git
cd MongTap

安装依赖（最少依赖）：

npm install

测试安装：

node src/mcp/index.js

启动MongoDB服务器（可选）：

node start-mongodb-server.js

Claude Desktop配置

要在Claude Desktop中使用MongTap，需要将其配置为MCP服务器。

1. 定位Claude Desktop配置文件

找到Claude Desktop的配置文件：

macOS：~/Library/Application Support/Claude/claude_desktop_config.json
Windows：%APPDATA%\Claude\claude_desktop_config.json
Linux：~/.config/Claude/claude_desktop_config.json

2. 将MongTap添加到配置文件

编辑配置文件，并将MongTap添加到mcpServers部分：

{
  "mcpServers": {
    "mongtap": {
      "command": "node",
      "args": [
        "/absolute/path/to/MongTap/src/mcp/index.js"
      ],
      "env": {
        "NODE_ENV": "production",
        "LOG_LEVEL": "info"
      }
    }
  }
}

重要提示：请将/absolute/path/to/MongTap替换为MongTap的实际安装路径。

3. 重启Claude Desktop

保存配置文件后，重启Claude Desktop使更改生效。

💻 使用示例

快速参考

工具	用途	主要特性
`generateDataModel`	创建统计模型	基于样本或描述
`startMongoServer`	启动MongoDB服务器	支持完整的有线协议
`stopMongoServer`	停止服务器实例	干净关机
`listActiveServers`	查看正在运行的服务器	监控所有实例
`queryModel`	生成文档	使用$seed和$entropy控制
`trainModel`	改进模型	增量学习
`listModels`	查看可用模型	本地模型清单
`getModelInfo`	获取模型详情	架构和统计信息

MCP工具参考

1. generateDataModel

描述：根据样本文档或文本描述创建用于数据生成的统计模型。参数：

name（必需）：模型名称
description（可选）：数据结构的自然语言描述
samples（可选）：用于训练模型的样本文档数组

示例：

generateDataModel({
  name: "users",
  description: "包含姓名、电子邮件、年龄和注册日期的用户资料"
})
// 或者使用样本
generateDataModel({
  name: "products",
  samples: [
    { name: "笔记本电脑", price: 999, category: "电子产品" },
    { name: "办公桌", price: 299, category: "家具" }
  ]
})

2. startMongoServer

描述：启动一个本地的、与MongoDB兼容的服务器，该服务器从统计模型生成数据。参数：

port（可选）：监听端口（0表示自动分配，默认值：27017）
database（可选）：默认数据库名称（默认值："mcp"）

示例：

startMongoServer({ port: 27017, database: "myapp" })
// 返回：{ port: 27017, status: "running" }

3. stopMongoServer

描述：根据端口号停止正在运行的、与MongoDB兼容的服务器实例。参数：

port（必需）：要停止的服务器端口

示例：

stopMongoServer({ port: 27017 })
// 返回：{ success: true, message: "服务器已停止" }

4. listActiveServers

描述：获取所有当前正在运行的、与MongoDB兼容的服务器实例列表。参数：无

示例：

listActiveServers()
// 返回：{ count: 2, servers: [
//   { port: 27017, database: "test", status: "running", uptime: 3600 },
//   { port: 27018, database: "dev", status: "running", uptime: 1800 }
// ]}

5. queryModel

描述：从统计模型生成文档，并可选择使用查询过滤器和生成控制参数。参数：

model（必需）：要查询的模型名称
query（可选）：MongoDB风格的查询，包含特殊参数：
- $seed：用于可重复生成的数字
- $entropy：0 - 1之间的数字，用于控制随机程度
count（可选）：要生成的文档数量（默认值：10）

示例：

queryModel({
  model: "users",
  query: { age: { $gte: 18 }, $seed: 42, $entropy: 0.3 },
  count: 5
})
// 返回5个始终一致生成的成年用户，随机性较低

6. trainModel

描述：使用额外的样本文档更新现有的统计模型，以提高生成质量。参数：

model（必需）：要训练的模型名称
documents（必需）：用于训练的文档数组

示例：

trainModel({
  model: "products",
  documents: [
    { name: "鼠标", price: 29, category: "电子产品" },
    { name: "椅子", price: 199, category: "家具" }
  ]
})
// 返回：{ success: true, samplesAdded: 2, totalSamples: 4 }

7. listModels

描述：获取本地存储的所有可用统计模型列表。参数：无

示例：

listModels()
// 返回：["users", "products", "orders", "inventory"]

8. getModelInfo

描述：检索特定统计模型的详细架构和统计信息。参数：

model（必需）：模型名称

示例：

getModelInfo({ model: "users" })
// 返回：{
//   name: "users",
//   schema: { type: "object", properties: { ... } },
//   sampleCount: 100,
//   lastUpdated: "2025-01-15T10:30:00Z",
//   fields: ["name", "email", "age", "signupDate"]
// }

MCP提示

MongTap包含针对常见数据库场景的预构建提示：

1. create_ecommerce_db

描述：创建一个包含产品、客户和订单的完整电子商务数据库。用法：要求Claude “使用create_ecommerce_db提示” 即可立即设置完整的电子商务数据库结构。

2. create_user_profile

描述：创建一个包含身份验证和偏好设置的用户资料模型。用法：非常适合快速设置用户管理系统。

3. analyze_model

描述：分析现有模型并提供其结构的见解。用法：了解统计模型中的模式和分布。

4. generation_control

描述：了解如何使用$seed和$entropy参数进行受控生成。用法：获取有关可重复和受控数据生成的详细信息。

MCP资源

MongTap提供用于监控的只读资源：

1. models://list

描述：所有训练过的DataFlood模型列表
类型：application/json
返回：模型名称和元数据数组

2. servers://status

描述：所有MongoDB服务器的状态
类型：application/json
返回：服务器端口、数据库和连接计数

3. models://{name}/schema

描述：获取特定模型的JSON架构
类型：application/json
返回：完整的JSON Schema定义

4. models://{name}/sample

描述：从模型获取样本数据
类型：application/json
返回：样本文档数组

5. docs://generation-control

描述：$seed和$entropy查询参数的文档
类型：text/markdown
返回：详细的使用指南

与Claude的示例对话

根据描述创建数据模型

你：创建一个包含姓名、电子邮件、年龄和注册日期的用户资料数据模型。
Claude：我将使用MongTap为你创建一个用户资料模型。
[使用generateDataModel工具]
我已创建了一个具有以下结构的用户资料模型：
- 姓名（字符串）
- 电子邮件（字符串，电子邮件格式）
- 年龄（整数，0 - 120）
- 注册日期（字符串，日期时间格式）
该模型现在可以生成逼真的用户数据。

启动MongoDB服务器

你：在端口27017上为我的应用程序启动一个MongoDB服务器。
Claude：我将为你启动一个MongoDB服务器。
[使用startMongoServer工具]
MongoDB服务器已成功启动：
- 端口：27017
- 数据库：test
- 连接字符串：mongodb://localhost:27017/test
你现在可以使用任何MongoDB客户端或驱动程序连接到该服务器。
该服务器支持通过查询中的$seed和$entropy参数进行高级生成控制。

生成样本数据

你：从我们创建的模型中生成100个用户资料。
Claude：我将为你生成100个用户资料。
[使用queryModel工具]
已生成100个用户资料。以下是一个示例：
1. { 姓名: "John Smith", 电子邮件: "john.smith@example.com", 年龄: 28, 注册日期: "2024-01-15T10:30:00Z" }
2. { 姓名: "Jane Doe", 电子邮件: "jane.doe@example.com", 年龄: 34, 注册日期: "2024-02-20T14:45:00Z" }
...
所有文档都遵循你的模型的统计模式。

根据样本数据训练模型

你：这里有一些产品样本。请根据它们训练一个模型：
- { 名称: "小工具", 价格: 19.99, 类别: "工具", 库存: 100 }
- { 名称: "小玩意儿", 价格: 29.99, 类别: "电子产品", 库存: 50 }
- { 名称: "小发明", 价格: 39.99, 类别: "工具", 库存: 75 }
Claude：我将根据你的样本训练一个产品模型。
[使用带有样本的generateDataModel工具]
模型训练成功！模型学习到：
- 名称：产品名称（字符串模式）
- 价格：范围19.99 - 39.99（数字分布）
- 类别："工具" 或 "电子产品"（枚举）
- 库存：范围50 - 100（整数分布）
该模型现在可以生成具有逼真变化的类似产品。

连接MongoDB客户端

MongTap服务器与MongoDB客户端完全兼容。通过Claude启动服务器后：

使用MongoDB Shell（mongosh）

mongosh "mongodb://localhost:27017/test"

使用Node.js MongoDB驱动程序

const { MongoClient } = require('mongodb');

async function connect() {
    const client = new MongoClient('mongodb://localhost:27017');
    await client.connect();
    
    const db = client.db('test');
    const collection = db.collection('users');
    
    // 插入操作触发模型训练
    await collection.insertMany([
        { name: 'Alice', age: 30 },
        { name: 'Bob', age: 25 }
    ]);
    
    // 查询操作从模型生成数据
    const users = await collection.find({}).toArray();
    console.log(users); // 统计生成的用户
    
    // 使用生成控制参数
    const consistentData = await collection.find({
        $seed: 12345,  // 一致的结果
        $entropy: 0.5  // 中等随机性
    }).toArray();
    
    await client.close();
}

使用Python（pymongo）

from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017/')
db = client['test']
collection = db['users']

# 插入操作训练模型
collection.insert_many([
    {'name': 'Alice', 'age': 30},
    {'name': 'Bob', 'age': 25}
])

# 查询操作从模型生成数据
for user in collection.find():
    print(user)  # 统计生成的用户
    
# 使用生成控制
for user in collection.find({'$seed': 12345, '$entropy': 0.3}):
    print(user)  # 一致的、低熵生成

高级用法

多个服务器实例

可以同时运行多个MongoDB服务器：

你：为开发、测试和预发布环境启动三个MongoDB服务器。
Claude：我将为你启动三个独立的MongoDB服务器。
[多次使用startMongoServer工具]
已启动3个MongoDB服务器：
1. 开发环境 - 端口：27017，数据库：dev
2. 测试环境 - 端口：27018，数据库：test  
3. 预发布环境 - 端口：27019，数据库：staging
每个服务器都维护自己的模型，并且可以独立访问。

模型持久化

模型会自动保存，并可以在不同会话中重复使用：

你：列出所有可用的模型。
Claude：[使用listModels工具]
可用的模型：
1. users - 包含姓名、电子邮件、年龄的用户资料
2. products - 包含定价的产品目录
3. orders - 订单管理系统
4. customers - 客户数据库
你可以查询这些模型中的任何一个或训练新的模型。

受限生成

生成具有特定约束和控制参数的数据：

你：使用种子12345生成50个年龄在25到35岁之间且结果一致的用户。
Claude：我将根据这些特定约束和种子控制生成用户。
[使用带有约束和生成参数的queryModel工具]
已生成50个结果一致的用户：
- 所有用户年龄在25 - 35岁之间  
- 使用种子12345进行可重复生成
- $entropy参数控制随机程度
- 相同的查询将始终返回相同的结果

配置选项

环境变量

LOG_LEVEL - 日志级别（error、warn、info、debug、trace）
MONGTAP_PORT - MCP服务器的默认端口（默认值：3000）
MONGTAP_STORAGE - 模型存储路径（默认值：./welldb-models）
MONGTAP_MAX_SERVERS - 最大并发MongoDB服务器数量（默认值：10）

MCP服务器模式

MCP服务器可以在不同模式下运行：

# 标准I/O模式（用于Claude Desktop）
node src/mcp/index.js

# TCP模式（用于网络访问）
node src/mcp/index.js tcp --port 3000

# 独立模式（用于测试）
node src/mcp/index.js standalone

🔧 技术细节

MongTap由三个主要组件组成：

DataFlood-JS - 从样本中学习的统计建模引擎
WellDB-Node - MongoDB有线协议实现
MCP服务器 - 大语言模型工具的集成层

┌─────────────────┐     MCP协议      ┌──────────────┐
│ Claude Desktop  │ ◄──────────────────► │  MCP服务器  │
└─────────────────┘                       └──────┬───────┘
                                                 │
                                                 ▼
┌─────────────────┐     MongoDB有线协议   ┌──────────────┐
│ MongoDB客户端  │ ◄──────────────────► │ WellDB-Node  │
└─────────────────┘                       └──────┬───────┘
                                                 │
                                                 ▼
                                          ┌──────────────┐
                                          │ DataFlood-JS │
                                          │  (建模)  │
                                          └──────────────┘

故障排除

Claude Desktop未显示MongTap工具

检查配置文件路径是否正确
确保MongTap的路径是绝对路径，而不是相对路径
完全重启Claude Desktop
查看日志：tail -f ~/Library/Logs/Claude/mcp-*.log（macOS）

MongoDB客户端无法连接

验证服务器是否正在运行：在Claude中使用 "listActiveServers"
检查端口是否被占用：lsof -i :27017
确保防火墙允许本地连接
尝试使用IP连接：mongodb://127.0.0.1:27017

模型生成似乎不正确

提供更多样本数据以进行更好的训练
在样本中使用一致的数据格式
检查模型信息以查看学习到的模式
如果需要，使用额外的约束重新训练

开发

运行测试

# 运行所有测试
npm test

# 运行特定测试套件
node test/mcp/test-mcp-server.js
node test/welldb-node/test-mongodb-server.js
node test/dataflood-js/test-inferrer.js

# 运行集成测试
node test/welldb-node/test-integration.js

项目结构

MongTap/
├── src/
│   ├── mcp/                 # MCP服务器实现
│   │   ├── mcp-server.js    # 核心MCP服务器
│   │   ├── prompt-analyzer.js # 提示的自然语言处理
│   │   └── server-manager.js # 多服务器管理
│   ├── welldb-node/         # MongoDB协议
│   │   ├── server/          # MongoDB服务器实现
│   │   └── storage/         # DataFlood存储适配器
│   └── dataflood-js/        # 统计建模
│       ├── schema/          # 架构推断
│       ├── generator/       # 文档生成
│       └── training/        # 模型训练
└── README.md               # 本文件