Knowledge Rag

知识RAG系统是一个本地化检索增强生成系统，通过MCP协议与Claude Code集成，支持对PDF、Markdown等多种格式文档进行混合搜索（语义+关键词），并提供关键词路由功能，适用于个人知识库管理。

知识管理与记忆搜索工具 #本地RAG #混合搜索 #知识管理 #Claude集成 .Python

评分 : 2.5分

下载量 : 6.6K

更新时间 : 2026-03-13

打开站点

什么是Knowledge RAG System?

Knowledge RAG是一个100%在本地运行的智能文档搜索系统，专门为Claude Code设计。它能够理解您文档中的内容，当您向Claude提问时，系统会自动搜索相关文档片段并提供给Claude作为回答参考。想象一下，您有一个包含各种技术文档、笔记、代码示例的文件夹，当您问Claude关于某个技术问题时，系统会自动从您的文档中找到最相关的信息，让Claude的回答更加准确和个性化。

如何使用Knowledge RAG System?

使用非常简单： 1. 将您的文档按类别放入documents文件夹 2. 启动Claude Code 3. 直接向Claude提问系统会自动在后台搜索您的文档，找到相关信息并整合到Claude的回答中。您不需要手动搜索或复制粘贴文档内容。

适用场景

• 技术文档查询：快速查找API文档、配置说明 • 安全研究：搜索漏洞利用、渗透测试方法 • 学习笔记：查找之前的笔记和知识点 • 代码参考：搜索代码示例和最佳实践 • 个人知识库：管理各种格式的文档和资料

主要功能

混合智能搜索

结合语义理解（理解概念含义）和关键词匹配（精确查找术语），提供最准确的搜索结果。您可以通过hybrid_alpha参数调整搜索策略。

完全本地运行

所有数据处理都在您的电脑上完成，文档内容不会上传到任何云端服务器，确保隐私安全。

多格式文档支持

支持PDF、Markdown、纯文本、Python代码、JSON等多种文件格式，自动解析内容。

智能分类路由

根据问题中的关键词自动判断文档类别（如安全、开发、CTF等），提高搜索准确性。

无缝Claude集成

作为MCP服务器直接集成到Claude Code中，提问时自动搜索，无需切换工具。

快速索引更新

文档添加或修改后，可以快速重新索引，支持并行处理提升速度。

优势

🔒 隐私保护：所有数据都在本地处理，不上传云端

⚡ 搜索灵活：支持从纯关键词到纯语义的多种搜索模式

📚 格式兼容：支持PDF、Markdown、代码等多种文档格式

🎯 智能分类：自动识别问题类型，精准搜索相关文档

🚀 响应快速：关键词搜索模式几乎即时返回结果

🔄 易于更新：文档变更后可以快速重新索引

局限性

💻 需要本地资源：需要运行Ollama和Python环境

📦 初始设置：首次安装需要配置Python和Ollama

🔧 技术依赖：需要基本的命令行操作知识

💾 存储占用：向量数据库会占用一定磁盘空间

🐢 语义搜索较慢：纯语义搜索需要生成嵌入向量，速度较慢

如何使用

安装准备

确保您的电脑已安装Python 3.11或3.12，并下载安装Ollama。

下载并安装系统

克隆项目仓库并运行安装脚本，自动设置虚拟环境和依赖。

下载嵌入模型

在Ollama中下载用于理解文档语义的模型。

配置Claude Code

编辑Claude配置文件，添加MCP服务器配置。

添加您的文档

将您的文档按类别放入documents文件夹中。

开始使用

重启Claude Code，系统会自动索引文档，然后就可以直接提问了。

使用案例

技术文档查询

当您需要查找某个API的具体用法或配置参数时

安全研究参考

在进行渗透测试或安全研究时，需要参考特定漏洞利用方法

代码示例查找

需要某个编程任务的代码示例或最佳实践

学习笔记回顾

复习之前学习过的知识点或技术概念

常见问题

我需要把文档上传到云端吗？

支持哪些类型的文档？

搜索速度如何？

如何添加新文档？

需要联网使用吗？

可以搜索中文文档吗？

文档数量有限制吗？

如何优化搜索结果？

🚀 知识检索增强生成（RAG）系统

知识检索增强生成（RAG）系统是一个 100% 本地运行的语义搜索系统，它通过 MCP（模型上下文协议）与 Claude Code 集成。该系统能让 Claude 在你的文档（如 PDF、Markdown、代码等）中进行搜索，为回答问题提供相关上下文。

🚀 快速开始

前提条件

Windows 10/11
Python 3.11 或 3.12
Ollama（用于本地嵌入）
Claude Code CLI

快速安装（自动化）

# 克隆仓库
git clone https://github.com/lyonzin/knowledge-rag.git
cd knowledge-rag

# 运行安装程序
.\install.ps1

手动安装

安装 Python 3.12

# 从 https://www.python.org/downloads/ 下载
# 或者使用 winget：
winget install Python.Python.3.12

安装 Ollama

# 从 https://ollama.com 下载
# 或者使用 winget：
winget install Ollama.Ollama

拉取嵌入模型
```
ollama pull nomic-embed-text
```

克隆并设置项目

git clone https://github.com/lyonzin/knowledge-rag.git
cd knowledge-rag

# 创建虚拟环境
python -m venv venv
.\venv\Scripts\activate

# 安装依赖项
pip install -r requirements.txt

为 Claude Code 配置 MCP

在 ~/.claude.json 的 mcpServers 下添加：

{
  "mcpServers": {
    "knowledge-rag": {
      "type": "stdio",
      "command": "cmd",
      "args": ["/c", "cd /d C:\\path\\to\\knowledge-rag && .\\venv\\Scripts\\python.exe -m mcp_server.server"],
      "env": {}
    }
  }
}

注意：我们使用 cmd /c 和 cd /d 来确保在启动 Python 服务器之前正确设置工作目录。这是因为 Claude Code 可能不遵守 MCP 配置中的 cwd 属性。

重启 Claude Code

✨ 主要特性

特性	描述
混合搜索	结合语义搜索和 BM25 关键词搜索，并使用 RRF 融合
关键词路由	支持基于词边界的路由，用于特定领域查询
多格式解析器	支持 PDF、Markdown、TXT、Python、JSON 文件
重叠分块	智能文本分割，保留上下文信息
分类组织	按安全、开发、日志分析等类别组织文档
MCP 集成	原生支持 Claude Code 工具
持久存储	使用 ChromaDB 和 DuckDB 后端
本地嵌入	使用 Ollama 和 nomic-embed-text（768 维）
并行处理	多线程嵌入生成

📦 安装指南

前提条件

Windows 10/11
Python 3.11 或 3.12
Ollama（用于本地嵌入）
Claude Code CLI

快速安装（自动化）

# 克隆仓库
git clone https://github.com/lyonzin/knowledge-rag.git
cd knowledge-rag

# 运行安装程序
.\install.ps1

手动安装

安装 Python 3.12

# 从 https://www.python.org/downloads/ 下载
# 或者使用 winget：
winget install Python.Python.3.12

安装 Ollama

# 从 https://ollama.com 下载
# 或者使用 winget：
winget install Ollama.Ollama

拉取嵌入模型
```
ollama pull nomic-embed-text
```

克隆并设置项目

git clone https://github.com/lyonzin/knowledge-rag.git
cd knowledge-rag

# 创建虚拟环境
python -m venv venv
.\venv\Scripts\activate

# 安装依赖项
pip install -r requirements.txt

为 Claude Code 配置 MCP

在 ~/.claude.json 的 mcpServers 下添加：

{
  "mcpServers": {
    "knowledge-rag": {
      "type": "stdio",
      "command": "cmd",
      "args": ["/c", "cd /d C:\\path\\to\\knowledge-rag && .\\venv\\Scripts\\python.exe -m mcp_server.server"],
      "env": {}
    }
  }
}

注意：我们使用 cmd /c 和 cd /d 来确保在启动 Python 服务器之前正确设置工作目录。这是因为 Claude Code 可能不遵守 MCP 配置中的 cwd 属性。

重启 Claude Code

💻 使用示例

添加文档

将文档放在 documents/ 目录下，并按类别组织：

documents/
├── security/          # 渗透测试、漏洞利用、漏洞文档
│   ├── redteam/       # 红队相关
│   ├── blueteam/      # 蓝队相关
│   └── RTFM.pdf
├── logscale/          # LogScale/LQL 文档
│   └── LQL_REFERENCE.md
├── ctf/               # CTF 解题报告和方法
├── development/       # 代码、API、框架
│   └── api-docs.md
└── general/           # 其他所有内容
    └── notes.txt

索引文档

Claude Code 启动时会自动对文档进行索引。若要手动重新索引：

# 在 Claude Code 聊天中：
使用 reindex_documents 工具并设置 force=true 来重建索引

搜索

直接向 Claude 提问！RAG 系统会自动提供上下文：

用户：如何在 LogScale 中使用 formatTime？
Claude：[内部使用 search_knowledge，检索相关内容块]
        根据您的文档，LogScale 中的 formatTime...

混合搜索控制

您可以控制语义搜索和关键词搜索的平衡：

// 纯关键词搜索 - 即时响应，无需 Ollama（适用于精确术语的默认设置）
search_knowledge("gtfobins suid", hybrid_alpha=0.0)

// 关键词为主（默认） - 快速响应，有轻微语义增强
search_knowledge("lolbas certutil", hybrid_alpha=0.3)

// 平衡混合搜索 - 两种引擎权重相等
search_knowledge("SQL 注入技术", hybrid_alpha=0.5)

// 语义为主 - 更适合概念性查询
search_knowledge("如何提升权限", hybrid_alpha=0.7)

// 纯语义搜索 - 仅使用 Ollama，无关键词匹配
search_knowledge("如何绕过身份验证", hybrid_alpha=1.0)

📚 详细文档

MCP 工具

`search_knowledge`

结合语义搜索和 BM25 关键词搜索的混合搜索。

参数：

名称	类型	默认值	描述
`query`	字符串	必需	搜索查询文本
`max_results`	整数	5	最大结果数（1 - 20）
`category`	字符串	null	按类别过滤
`hybrid_alpha`	浮点数	0.3	平衡参数：0.0 表示仅使用关键词搜索，1.0 表示仅使用语义搜索

返回值： 包含搜索结果的 JSON，包括内容、来源、相关性得分和搜索方法。

示例：

{
  "status": "success",
  "query": "mimikatz credential dump",
  "hybrid_alpha": 0.5,
  "result_count": 3,
  "results": [
    {
      "content": "Mimikatz 可以从内存中提取凭证...",
      "source": "C:/docs/security/redteam/credential-attacks.pdf",
      "filename": "credential-attacks.pdf",
      "category": "redteam",
      "score": 0.016393,
      "semantic_rank": 2,
      "bm25_rank": 1,
      "search_method": "hybrid",
      "keywords": ["mimikatz", "credential", "lsass"],
      "routed_by": "redteam"
    }
  ]
}

搜索方法值：

hybrid：通过语义搜索和 BM25 搜索都找到（置信度最高）
semantic：仅通过语义搜索找到
keyword：仅通过 BM25 关键词搜索找到

`get_document`

检索特定文档的完整内容。

参数：

名称	类型	描述
`filepath`	字符串	文档路径

返回值： 包含文档内容和元数据的 JSON。

`reindex_documents`

对知识库中的所有文档进行索引或重新索引。

参数：

名称	类型	默认值	描述
`force`	布尔值	false	如果为 true，则清除并重建整个索引（包括 ChromaDB 和 BM25）

返回值： 包含索引统计信息的 JSON。

`list_categories`

列出所有文档类别及其文档数量。

返回值：

{
  "status": "success",
  "categories": {
    "security": 52,
    "Detections_Rules ": 12,
    "redteam": 3,
    "blueteam": 3,
    "ctf": 2,
    "general": 1
  },
  "total_documents": 73
}

`list_documents`

列出所有已索引的文档，可选择按类别过滤。

参数：

名称	类型	描述
`category`	字符串	可选的类别过滤器

`get_index_stats`

获取知识库索引的统计信息。

返回值：

{
  "status": "success",
  "stats": {
    "total_documents": 73,
    "total_chunks": 9256,
    "categories": {"security": 52, "logscale": 12, ...},
    "embedding_model": "nomic-embed-text",
    "chunk_size": 1000,
    "chunk_overlap": 200
  }
}

配置

关键词路由

系统使用基于词边界的关键词路由来提高搜索准确性。

flowchart TB
    QUERY["查询: 'CVE-2021-44228 log4j'"] --> EXTRACT["提取关键词"]

    subgraph ROUTES["🏷️ 关键词路由 (config.py)"]
        SEC["security<br/>anti-bot, waf bypass, cloudflare..."]
        RED["redteam<br/>pentest, exploit, payload..."]
        BLUE["blueteam<br/>detection, sigma, yara..."]
        CTF["ctf<br/>ctf, flag, hackthebox..."]
        LOG["logscale<br/>logscale, humio, lql..."]
        DEV["development<br/>python, javascript, api..."]
    end

    EXTRACT --> CHECK{"词边界检查 (\\b)"}

    CHECK -->|"'api' 在查询中?"| BOUNDARY["不匹配 'RAPID' 或 'capital'"]
    CHECK -->|"'log4j' 匹配"| MATCHED["✓ 匹配 'security' 路由"]

    BOUNDARY --> NOROUTE["不应用路由"]
    MATCHED --> WEIGHT["加权评分<br/>多个匹配 = 更高置信度"]
    WEIGHT --> FILTER["过滤到 'security' 类别"]

在 mcp_server/config.py 中配置路由：

keyword_routes = {
    "security": ["anti-bot", "waf bypass", "cloudflare", ...],
    "redteam": ["pentest", "exploit", "payload", "reverse shell", ...],
    "blueteam": ["detection", "sigma", "yara", "incident response", ...],
    "ctf": ["ctf", "flag", "hackthebox", "tryhackme", ...],
    "Detections_Rules": ["logscale", "humio", "lql", "formatTime", ...],
    "development": ["python", "javascript", "api", "docker", ...]
}

词边界匹配：单字关键词使用正则表达式词边界 (\b) 来防止误匹配。例如，"api" 不会匹配 "RAPID"。

加权评分：当多个关键词匹配时，匹配最多的类别获胜。

分块设置

在 config.py 中调整分块大小和重叠：

chunk_size = 1000      # 每个分块的字符数
chunk_overlap = 200    # 分块之间的重叠字符数

嵌入模型

默认模型是 nomic-embed-text。若要更改：

拉取不同的模型：ollama pull <model-name>
更新 config.py：ollama_model = "<model-name>"

混合搜索调整

hybrid_alpha 参数控制平衡：

hybrid_alpha	行为	速度	适用场景
0.0	纯 BM25 关键词搜索	即时（无需 Ollama）	精确术语、CVE、工具名称
0.3	关键词为主 (默认)	快速	包含特定术语的技术查询
0.5	平衡	中等	通用查询
0.7	语义为主	较慢	概念性查询
1.0	纯语义搜索	较慢（需要 Ollama）	"如何..." 问题

🔧 技术细节

系统架构

系统概述

flowchart TB
    subgraph MCP["🔌 MCP 服务器 (FastMCP)"]
        direction TB
        TOOLS["MCP 工具<br/>search_knowledge | get_document<br/>reindex_documents | list_categories"]
    end

    subgraph SEARCH["🔍 混合搜索引擎"]
        direction LR
        ROUTER["关键词路由器<br/>(词边界)"]
        SEMANTIC["语义搜索<br/>(ChromaDB)"]
        BM25["BM25 关键词搜索<br/>(rank-bm25)"]
        RRF["倒数排名融合 (RRF)"]

        ROUTER --> SEMANTIC
        ROUTER --> BM25
        SEMANTIC --> RRF
        BM25 --> RRF
    end

    subgraph STORAGE["💾 存储层"]
        direction LR
        CHROMA[("ChromaDB<br/>向量数据库")]
        COLLECTIONS["集合<br/>security | ctf<br/>logscale | development"]
        CHROMA --- COLLECTIONS
    end

    subgraph EMBED["🧠 嵌入层"]
        OLLAMA["Ollama<br/>nomic-embed-text<br/>(768 维)"]
        PARALLEL["并行处理<br/>(4 个工作线程)"]
        OLLAMA --- PARALLEL
    end

    subgraph INGEST["📄 文档摄入"]
        PARSERS["解析器<br/>MD | PDF | TXT | PY | JSON"]
        CHUNKER["分块<br/>1000 字符 + 200 重叠"]
        PARSERS --> CHUNKER
    end

    CLAUDE["☁️ Claude Code"] --> MCP
    MCP --> SEARCH
    SEARCH --> STORAGE
    STORAGE --> EMBED
    INGEST --> EMBED
    EMBED --> STORAGE

数据流

1. 文档摄入流程

flowchart LR
    subgraph INPUT["📁 输入"]
        FILES["documents/<br/>├── security/<br/>├── logscale/<br/>├── ctf/<br/>└── development/"]
    end

    subgraph PARSE["📖 解析"]
        MD["Markdown 解析器"]
        PDF["PDF 解析器<br/>(PyMuPDF)"]
        TXT["文本解析器"]
        CODE["代码解析器<br/>(PY/JSON)"]
    end

    subgraph CHUNK["✂️ 分块"]
        SPLIT["文本分割器<br/>1000 字符"]
        OVERLAP["重叠<br/>200 字符"]
        SPLIT --> OVERLAP
    end

    subgraph EMBED["🧠 嵌入"]
        PARALLEL["线程池执行器<br/>(4 个工作线程)"]
        OLLAMA["Ollama API<br/>nomic-embed-text"]
        PARALLEL --> OLLAMA
    end

    subgraph STORE["💾 存储"]
        CHROMADB[("ChromaDB")]
        BM25IDX["BM25 索引"]
    end

    FILES --> MD & PDF & TXT & CODE
    MD & PDF & TXT & CODE --> CHUNK
    CHUNK --> EMBED
    EMBED --> STORE

2. 查询处理流程（混合搜索）

flowchart TB
    QUERY["🔍 用户查询<br/>'mimikatz credential dump'"] --> ROUTER

    subgraph ROUTING["📍 关键词路由"]
        ROUTER["关键词路由器"]
        MATCH{"词边界匹配？"}
        CATEGORY["过滤器: redteam"]
        NOFILTER["无过滤器"]

        ROUTER --> MATCH
        MATCH -->|是| CATEGORY
        MATCH -->|否| NOFILTER
    end

    subgraph HYBRID["⚡ 混合搜索"]
        direction LR
        SEMANTIC["语义搜索<br/>(ChromaDB)<br/>概念相似度"]
        BM25["BM25 搜索<br/>(rank-bm25)<br/>精确术语匹配"]
    end

    subgraph FUSION["🔀 结果融合"]
        RRF["倒数排名融合<br/>分数 = Σ 1/(k + 排名)"]
        COMBINE["合并排名<br/>+ 去重"]
        SORT["按合并分数排序"]

        RRF --> COMBINE --> SORT
    end

    CATEGORY --> HYBRID
    NOFILTER --> HYBRID
    SEMANTIC --> RRF
    BM25 --> RRF

    SORT --> RESULTS["📋 结果<br/>搜索方法: hybrid|semantic|keyword<br/>语义排名 + BM25 排名"]

3. hybrid_alpha 参数效果

flowchart LR
    subgraph ALPHA["hybrid_alpha 值"]
        A0["0.0<br/>纯 BM25<br/>⚡ 即时"]
        A3["0.3 (默认)<br/>关键词为主<br/>⚡ 快速"]
        A5["0.5<br/>平衡"]
        A7["0.7<br/>语义为主"]
        A10["1.0<br/>纯语义<br/>🐢 较慢"]
    end

    subgraph USE["最佳适用场景"]
        U0["CVE、工具名称<br/>精确匹配<br/>无需 Ollama"]
        U3["技术查询<br/>特定术语"]
        U5["通用查询"]
        U7["概念性查询<br/>相关主题"]
        U10["'如何...' 问题<br/>需要 Ollama"]
    end

    A0 --- U0
    A3 --- U3
    A5 --- U5
    A7 --- U7
    A10 --- U10

项目结构

flowchart TB
    subgraph ROOT["📁 knowledge-rag/"]
        direction TB

        subgraph SERVER["🐍 mcp_server/"]
            INIT["__init__.py"]
            CONFIG["config.py<br/>(设置、路由)"]
            INGEST["ingestion.py<br/>(解析、分块)"]
            SERV["server.py<br/>(MCP、ChromaDB、BM25)"]
        end

        subgraph DOCS["📚 documents/"]
            SEC["security/<br/>渗透测试、漏洞利用"]
            LOG["logscale/<br/>LQL 文档"]
            DEV["development/<br/>代码、API"]
            GEN["general/<br/>其他所有内容"]
        end

        subgraph DATA["💾 data/"]
            CHROMA["chroma_db/<br/>(向量存储)"]
            META["index_metadata.json"]
        end

        subgraph FILES["📄 根文件"]
            INSTALL["install.ps1"]
            REQS["requirements.txt"]
            README["README.md"]
            CHANGE["CHANGELOG.md"]
        end
    end

knowledge-rag/
├── mcp_server/
│   ├── __init__.py
│   ├── config.py          # 配置设置
│   ├── ingestion.py       # 文档解析和分块
│   └── server.py          # MCP 服务器、ChromaDB、BM25
├── documents/             # 您的文档放在这里
│   ├── security/
│   ├── Detections_Rules/
│   ├── development/
│   └── general/
├── data/
│   ├── chroma_db/         # 向量数据库存储
│   └── index_metadata.json
├── .claude/
│   └── mcp.json           # 项目 MCP 配置
├── venv/                  # Python 虚拟环境
├── install.ps1            # 自动化安装程序
├── requirements.txt       # Python 依赖项
├── CHANGELOG.md           # 版本历史
└── README.md              # 本文件