Deeprepo

DeepRepo是一个生产级的本地RAG引擎Python库，支持多种AI提供商，提供向量存储、MCP服务器集成和RESTful API，无需外部向量数据库或重型框架。

开发者工具知识管理与记忆 #本地RAG #多AI支持 #MCP集成 #向量检索 .Python

评分 : 2分

下载量 : 6.9K

更新时间 : 2026-03-12

打开站点

什么是DeepRepo MCP服务器？

DeepRepo MCP服务器是一个桥梁，它将您的本地代码库与AI助手连接起来。通过Model Context Protocol（MCP），您可以让AI助手（如Cursor、Claude Desktop）访问和理解您的代码库，从而获得更准确、更相关的编程帮助。

如何使用DeepRepo MCP服务器？

使用非常简单：1) 安装DeepRepo和MCP依赖，2) 配置您的AI助手（如Cursor）连接到MCP服务器，3) 让AI助手分析您的代码库，4) 开始提问并获得基于您代码的智能回答。

适用场景

当您需要AI助手理解特定项目代码时非常有用，例如：新成员加入项目需要了解代码结构、重构大型代码库时寻求建议、调试复杂问题时需要上下文、学习他人代码库时获得解释。

主要功能

多AI助手支持

支持Cursor、Claude Desktop、Antigravity等主流AI助手，让您可以在熟悉的工具中使用代码库知识。

灵活的AI提供商选择

可以使用Ollama（免费本地运行）、OpenAI、Anthropic、HuggingFace等多种AI服务，甚至可以为嵌入和生成选择不同的提供商。

代码库智能分析

自动扫描、分析和索引您的代码库，创建可搜索的知识库，AI助手可以基于此提供准确的代码解释和建议。

实时查询与搜索

提供多种查询工具：智能问答、相似代码搜索、代码库统计等，满足不同的使用需求。

简单配置

通过环境变量或配置文件即可完成设置，无需复杂的部署流程，几分钟内即可开始使用。

优势

无缝集成：与您现有的AI助手工作流完美融合

隐私保护：使用Ollama时所有数据处理都在本地，代码不会上传到云端

成本灵活：支持从免费（Ollama）到付费（OpenAI）的各种选项

上下文感知：AI回答基于您的实际代码，而不是通用知识

易于使用：配置简单，无需深度学习或向量数据库专业知识

局限性

需要初始设置：首次使用需要配置MCP连接

代码库大小限制：非常大的代码库可能需要更多内存和时间处理

AI提供商限制：某些提供商（如Anthropic）没有嵌入API，需要搭配其他提供商使用

本地资源需求：使用Ollama时需要足够的磁盘空间（约4GB）来存储模型

如何使用

安装DeepRepo和MCP依赖

确保已安装DeepRepo核心库，然后安装MCP额外依赖包。

配置AI助手连接

根据您使用的AI助手，编辑配置文件以添加DeepRepo MCP服务器。

设置环境变量

配置您选择的AI提供商，例如使用免费的Ollama或设置API密钥。

启动MCP服务器

运行MCP服务器，AI助手将自动连接。

在AI助手中使用

在Cursor、Claude Desktop等工具中，您现在可以询问关于代码库的问题了。

使用案例

新项目上手

刚加入一个新项目，需要快速理解代码结构和主要功能。

代码重构建议

想要重构某个功能，但不确定最佳实践和现有模式。

调试帮助

遇到一个bug，需要理解相关代码的上下文。

学习代码模式

想学习项目中使用的特定设计模式或架构风格。

常见问题

MCP服务器需要一直运行吗？

使用Ollama需要付费吗？

我的代码会被上传到云端吗？

支持哪些编程语言？

代码库更新后需要重新处理吗？

可以同时连接多个AI助手吗？

🚀 DeepRepo - 本地RAG引擎

DeepRepo 是一个生产级的 Python 库，支持在本地代码库上执行 RAG（检索增强生成），并支持多种 AI 供应商。

🚀 快速开始

安装

cd deeprepo_core
pip install -e .

详细的各供应商设置说明请参阅 INSTALLATION.md。

基本用法

from deeprepo import DeepRepoClient

# 使用 Ollama (免费，本地) 进行初始化 - 嵌入和大语言模型使用同一供应商
client = DeepRepoClient(provider_name="ollama")

# 或者为嵌入和大语言模型使用不同的供应商
# 示例：使用 OpenAI 进行嵌入，Anthropic 进行大语言模型
client = DeepRepoClient(
    embedding_provider_name="openai",
    llm_provider_name="anthropic"
)

# 摄入文档
result = client.ingest("/path/to/your/code")
print(f"已摄入 {result['chunks_processed']} 个块")

# 使用 RAG 进行查询
response = client.query("身份验证是如何工作的？")
print(response['answer'])
print(f"来源: {response['sources']}")

✨ 主要特性

纯 Python 实现：无需使用大型框架（如 LangChain/LlamaIndex），也无需外部向量数据库。
多 AI 供应商支持：支持 Ollama（本地）、HuggingFace、OpenAI、Anthropic 和 Gemini。
MCP 服务器支持：可与 Cursor、Claude Desktop、Antigravity 等 MCP 客户端集成。
基于装饰器的插件系统：便于供应商注册和扩展。
向量存储：使用 NumPy 实现余弦相似度，并以 JSON 格式持久化。
RESTful API：提供 FastAPI 服务，便于集成。
支持 Docker：可进行完整的容器化部署。

📦 安装指南

安装 MCP 依赖

pip install deeprepo[mcp]

启动 MCP 服务器

# 使用 CLI 命令
deeprepo-mcp

# 或者作为 Python 模块运行
python -m deeprepo.mcp.server

配置 Cursor

创建或编辑 ~/.cursor/mcp.json：

{
  "mcpServers": {
    "deeprepo": {
      "command": "python",
      "args": ["-m", "deeprepo.mcp.server"],
      "env": {
        "LLM_PROVIDER": "ollama"
      }
    }
  }
}

使用不同的供应商：

{
  "mcpServers": {
    "deeprepo": {
      "command": "python",
      "args": ["-m", "deeprepo.mcp.server"],
      "env": {
        "EMBEDDING_PROVIDER": "openai",
        "LLM_PROVIDER": "anthropic",
        "OPENAI_API_KEY": "sk-...",
        "ANTHROPIC_API_KEY": "sk-ant-..."
      }
    }
  }
}

启动 FastAPI 服务器

export OPENAI_API_KEY=your-key  # 或者使用 Ollama（无需密钥）
uvicorn web_app.main:app --reload

Docker 部署

docker-compose up --build

服务将在 http://localhost:8000 上可用。

💻 使用示例

基础用法

# 使用 Ollama 进行初始化
client = DeepRepoClient(provider_name="ollama")

# 摄入文档
result = client.ingest("/path/to/your/code")
print(f"已摄入 {result['chunks_processed']} 个块")

# 使用 RAG 进行查询
response = client.query("身份验证是如何工作的？")
print(response['answer'])
print(f"来源: {response['sources']}")

高级用法

# 使用不同的供应商进行嵌入和大语言模型
client = DeepRepoClient(
    embedding_provider_name="openai",
    llm_provider_name="anthropic"
)

# 摄入文档
result = client.ingest("/path/to/your/code")
print(f"已摄入 {result['chunks_processed']} 个块")

# 使用 RAG 进行查询
response = client.query("身份验证是如何工作的？")
print(response['answer'])
print(f"来源: {response['sources']}")

📚 详细文档

支持的 AI 供应商

供应商	成本	速度	适用场景
Ollama	免费	快速	本地开发、注重隐私、离线工作
HuggingFace	免费*	中等	基于云的应用，无需本地设置
OpenAI	付费	非常快	生产环境，追求最佳质量
Anthropic	付费	非常快	生产环境，推理能力出色
Gemini	免费*	中等	测试，适用于 Google 生态系统

*免费套餐有使用限制

供应商示例

# 嵌入和大语言模型使用同一供应商
# Ollama（推荐 - 免费且无限制）
client = DeepRepoClient(provider_name="ollama")

# HuggingFace（免费套餐）
client = DeepRepoClient(provider_name="huggingface")

# OpenAI（付费，质量最佳）
client = DeepRepoClient(provider_name="openai")

# Anthropic（付费，推理能力出色）
# 注意：Anthropic 没有嵌入 API，因此需要与其他供应商配合使用
client = DeepRepoClient(
    embedding_provider_name="openai",  # 使用 OpenAI 进行嵌入
    llm_provider_name="anthropic"     # 使用 Anthropic 进行大语言模型
)

# Gemini（免费套餐，有使用限制）
client = DeepRepoClient(provider_name="gemini")

# 混合使用供应商
# 示例：使用免费的 HuggingFace 进行嵌入，付费的 OpenAI 进行大语言模型
client = DeepRepoClient(
    embedding_provider_name="huggingface",
    llm_provider_name="openai"
)

API 端点

方法	端点	描述
GET	`/`	健康检查
GET	`/stats`	获取向量存储统计信息
POST	`/ingest`	从目录中摄入文档
POST	`/chat`	使用 RAG 进行查询
POST	`/clear-history`	清除对话历史

API 示例

# 摄入文档
curl -X POST http://localhost:8000/ingest \
  -H "Content-Type: application/json" \
  -d '{"path": "/path/to/code"}'

# 查询
curl -X POST http://localhost:8000/chat \
  -H "Content-Type: application/json" \
  -d '{"query": "这段代码是做什么的？"}'

可用的 MCP 工具

工具	描述
`ingest_codebase`	将目录摄入到向量存储中
`query_codebase`	使用 RAG 查询知识库
`search_similar`	查找相似代码，无需大语言模型
`get_stats`	获取向量存储统计信息
`clear_history`	清除对话历史

详细的 MCP 配置请参阅 deeprepo_core/src/deeprepo/mcp/README.md。

配置

环境变量

变量	描述	必需的供应商
`HUGGINGFACE_API_KEY` 或 `HF_TOKEN`	HuggingFace API 令牌	HuggingFace 供应商
`OPENAI_API_KEY`	OpenAI API 密钥	OpenAI 供应商
`ANTHROPIC_API_KEY`	Anthropic API 密钥	Anthropic 供应商
`GEMINI_API_KEY`	Google Gemini API 密钥	Gemini 供应商

切换供应商

# 嵌入和大语言模型使用同一供应商（向后兼容）
client = DeepRepoClient(
    provider_name="ollama",  # 或 "huggingface", "openai", "anthropic", "gemini"
    storage_path="vectors.json"
)

# 嵌入和大语言模型使用不同的供应商
client = DeepRepoClient(
    embedding_provider_name="openai",    # 嵌入供应商
    llm_provider_name="anthropic",      # 大语言模型供应商
    storage_path="vectors.json"
)

或者使用环境变量：

# 单一供应商（向后兼容）
export LLM_PROVIDER=ollama
python your_script.py

# 不同的供应商
export EMBEDDING_PROVIDER=openai
export LLM_PROVIDER=anthropic
python your_script.py

常见用例：

使用 Anthropic 进行大语言模型：由于 Anthropic 没有嵌入 API，建议与 OpenAI 或 HuggingFace 配合使用。
成本优化：使用免费的 HuggingFace 进行嵌入，付费的 OpenAI 进行大语言模型。
性能优化：使用快速的 OpenAI 进行嵌入，强大的 Anthropic 进行大语言模型。

测试

快速开始

# 运行所有单元测试（快速，无需 API 密钥）
pytest tests/unit/ -v

# 运行测试并生成覆盖率报告
pytest tests/unit/ --cov=deeprepo --cov-report=html

# 运行所有测试，包括集成测试
pytest tests/ -v

测试结构

单元测试 (tests/unit/) - 快速、独立，无外部依赖
- test_storage.py - 向量存储和余弦相似度
- test_ingestion.py - 文件扫描和文本分块
- test_client.py - 客户端接口和初始化
集成测试 (tests/integration/) - 端到端测试
- test_document.py - 文档处理流程
- test_all_providers.py - 手动验证供应商

手动测试供应商

# 测试特定供应商
python tests/integration/test_all_providers.py ollama
python tests/integration/test_all_providers.py huggingface openai

详细的测试文档请参阅 tests/README.md。

开发

添加新的供应商

在 src/deeprepo/providers/ 中创建一个新文件。
实现 EmbeddingProvider 和 LLMProvider 接口。
使用 @register_embedding 和 @register_llm 装饰器。
供应商将自动被发现！

示例：

from deeprepo.interfaces import EmbeddingProvider, LLMProvider
from deeprepo.registry import register_embedding, register_llm

@register_embedding("my_provider")
class MyEmbeddingProvider(EmbeddingProvider):
    def embed(self, text: str) -> list[float]:
        # 你的实现
        pass

@register_llm("my_provider")
class MyLLM(LLMProvider):
    def generate(self, prompt: str, context: str = None) -> str:
        # 你的实现
        pass

🔧 技术细节

架构

deeprepo_core/
├── src/deeprepo/
│   ├── client.py       # 主门面
│   ├── storage.py      # 向量存储 (JSON + NumPy)
│   ├── ingestion.py    # 文件扫描和分块
│   ├── interfaces.py   # 抽象基类
│   ├── registry.py     # 基于装饰器的注册表
│   ├── mcp/            # 用于 AI 助手的 MCP 服务器
│   │   ├── server.py       # FastMCP 服务器
│   │   └── README.md       # MCP 文档
│   └── providers/
│       ├── ollama_v.py      # Ollama (本地，免费)
│       ├── huggingface_v.py # HuggingFace (云，免费)
│       ├── openai_v.py      # OpenAI (付费)
│       ├── anthropic_v.py   # Anthropic (付费)
│       └── gemini_v.py      # Gemini (免费套餐)