Decompose
D

Decompose

Decompose是一个用于AI代理的确定性文本分类工具,通过纯正则表达式和启发式方法将文本分解为结构化语义单元,无需LLM即可实现快速、离线的文档预处理,显著减少LLM处理的token数量。
2.5分
5.0K

什么是Decompose?

Decompose是一个专门为AI代理设计的文本预处理工具。它能够自动将复杂的文档(如技术规范、合同、报告等)分解为结构化的语义单元,并为每个单元添加分类标签、风险评分和重要性标记。这使得AI代理能够更智能地决定如何处理文档的不同部分,从而节省计算资源并提高处理效率。

如何使用Decompose?

Decompose提供三种使用方式:作为MCP服务器集成到AI代理中,作为命令行工具直接使用,或作为Python库嵌入到您的应用程序中。最常用的方式是通过MCP服务器,让您的AI代理(如Claude、Cursor等)能够直接调用文本分解功能。

适用场景

Decompose特别适合处理技术文档、法律合同、工程规范、监管文件等结构化程度较高的文本。它可以帮助AI代理快速识别文档中的关键要求、安全规定、合规条款等重要内容,同时过滤掉背景信息和重复内容。

主要功能

确定性文本分类
基于规则和启发式算法进行文本分类,无需依赖大型语言模型,确保结果的一致性和可预测性。
多维度语义标注
为每个文本单元提供权威性、风险等级、内容类型、重要性评分等多维度标签,帮助AI理解文本的语义价值。
实体自动提取
自动识别并提取文本中引用的标准、规范、法规等实体,如ASTM、ASCE、ISO等标准编号。
智能内容过滤
基于重要性评分和风险等级自动过滤低价值内容,可减少60-80%的LLM处理开销。
多格式支持
支持通过MCP服务器、命令行工具和Python库三种方式使用,满足不同集成需求。
优势
极速处理:500毫秒内处理50页文档
完全离线:无需网络连接或API密钥
结果确定:相同输入总是产生相同输出
成本为零:没有LLM推理费用
易于集成:提供多种使用方式
局限性
基于规则:无法处理规则之外的复杂语义
领域特定:主要针对技术文档和法律文本优化
需要结构化输入:对非结构化文本效果有限
无法生成内容:仅进行分类和提取,不生成新文本

如何使用

安装Decompose
通过pip安装decompose-mcp包
配置MCP服务器
在AI代理的配置文件中添加Decompose MCP服务器配置
使用分解工具
在AI代理中调用decompose_text或decompose_url工具处理文档

使用案例

技术规范分析
分析建筑工程技术规范,提取所有强制性要求和安全规定
合同审查
审查法律合同,识别财务条款和合规要求
文档摘要
为长文档生成简洁摘要,只包含关键信息

常见问题

Decompose需要联网或API密钥吗?
Decompose能处理中文文档吗?
如何自定义分类规则?
Decompose与普通文本分块有什么区别?
支持哪些文件格式?

相关资源

GitHub仓库
查看源代码、提交问题和参与贡献
PyPI包页面
查看最新版本和安装说明
技术博客文章
了解为什么在某些场景下规则引擎优于LLM
MCP协议文档
了解Model Context Protocol的详细规范

安装

复制以下命令到你的Client进行配置
{
  "mcpServers": {
    "decompose": {
      "command": "uvx",
      "args": ["decompose-mcp", "--serve"]
    }
  }
}

{
  "mcpServers": {
    "decompose": {
      "command": "python3",
      "args": ["-m", "decompose", "--serve"]
    }
  }
}
注意:您的密钥属于敏感信息,请勿与任何人分享。

替代品

V
Vestige
Vestige是一个基于认知科学的AI记忆引擎,通过实现预测误差门控、FSRS-6间隔重复、记忆梦境等29个神经科学模块,为AI提供长期记忆能力。包含3D可视化仪表板和21个MCP工具,完全本地运行,无需云端。
Rust
4.5K
4.5分
M
Moltbrain
MoltBrain是一个为OpenClaw、MoltBook和Claude Code设计的长期记忆层插件,能够自动学习和回忆项目上下文,提供智能搜索、观察记录、分析统计和持久化存储功能。
TypeScript
4.1K
4.5分
B
Bm.md
一个功能丰富的Markdown排版工具,支持多种样式主题和平台适配,提供实时编辑预览、图片导出和API集成能力
TypeScript
4.4K
5分
S
Security Detections MCP
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
TypeScript
6.0K
4分
P
Paperbanana
PaperBanana是一个自动化生成学术图表和统计图的智能框架,支持从文本描述生成高质量的论文插图,采用多智能体管道和迭代优化,提供CLI、Python API和MCP服务器等多种使用方式。
Python
6.6K
5分
F
Finlab Ai
FinLab AI是一个金融量化分析平台,通过AI技术帮助用户发现投资策略中的超额收益(alpha)。它提供丰富的数据集、回测框架和策略示例,支持自动化安装与集成到主流AI编程助手。
5.5K
4分
B
Better Icons
一个提供超过20万图标搜索和检索的MCP服务器和CLI工具,支持150多个图标库,帮助AI助手和开发者快速获取和使用图标。
TypeScript
6.7K
4.5分
A
Assistant Ui
assistant-ui是一个开源TypeScript/React库,用于快速构建生产级AI聊天界面,提供可组合的UI组件、流式响应、无障碍访问等功能,支持多种AI后端和模型。
TypeScript
7.3K
5分
F
Figma Context MCP
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
TypeScript
74.4K
4.5分
D
Duckduckgo MCP Server
已认证
DuckDuckGo搜索MCP服务器,为Claude等LLM提供网页搜索和内容抓取服务
Python
85.7K
4.3分
F
Firecrawl MCP Server
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
TypeScript
149.8K
5分
E
Edgeone Pages MCP Server
EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务
TypeScript
33.0K
4.8分
B
Baidu Map
已认证
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Python
50.1K
4.5分
E
Exa Web Search
已认证
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
TypeScript
57.3K
5分
C
Context7
Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务,通过Model Context Protocol直接集成到提示中,解决LLM使用过时信息的问题。
TypeScript
106.0K
4.7分
M
Minimax MCP Server
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Python
63.6K
4.8分
AIBase
智启未来,您的人工智能解决方案智库