🚀 Lyra Intel
Lyra Intel 是一个完整的智能基础设施引擎,用于大规模代码库分析。它能借助人工智能驱动的洞察、安全扫描和语义搜索,以快 10 - 100 倍的速度分析代码库。
🚀 快速开始
只需几条命令,即可快速上手,无需复杂设置。
git clone https://github.com/nirholas/lyra-intel.git
cd lyra-intel
pip install -e .
python cli.py scan /path/to/any/code
python cli.py analyze /path/to/code --output ./results.json
cat results.json | jq .
python launch_dashboard.py
预期结果
运行 scan 命令后,你将看到:
✅ Analyzing repository...
📊 Files analyzed: 156
📈 Total functions: 1,247
⚠️ Issues found: 43
🔐 Security findings: 5
运行 analyze 命令将生成详细的 JSON 文件,包含:
- 指标:行数、复杂度、测试覆盖率
- 安全:漏洞、密钥检测
- 依赖:导入关系、循环依赖
- 模式:代码异味、反模式
- Git 历史:提交统计、贡献者
查看更多快速示例 →
✨ 主要特性
Lyra Intel 包含 70 多个按功能组织的专业组件:
查看所有特性(70 + 组件)
核心分析 - 理解你的代码
- 📁 文件爬虫:并行目录遍历,支持流式处理,内存高效。可处理数百万个文件而无内存问题。
- 📜 Git 收集器:完整的提交历史、责备分析、贡献者统计。了解谁在何时更改了什么。
- 🔍 AST 分析器:多语言语法树解析(Python、JS/TS、Go、Rust、Java、C++、C#、Ruby、PHP)。获取准确的代码结构。
- 🔗 依赖映射器:构建完整的依赖图,支持循环检测。了解你的架构。
- ⚠️ 模式检测器:查找代码异味、反模式、安全问题。在问题变得严重之前检测到它们。
可扩展性 - 从笔记本电脑到企业级应用
- 🖥️ 本地模式:单机器分析,适用于开发。无需设置,可立即在你的机器上运行。
- 🌐 分布式模式:多工作进程处理,适用于更大的代码库。高效扩展分析到 100K + 文件。
- ☁️ 云大规模模式:自动扩展的云基础设施(AWS、GCP、Azure)。分析包含数百万个文件的单体代码库。
存储选项 - 任何规模都具备灵活性
- SQLite:本地开发和小型项目。内置,无依赖。
- PostgreSQL:生产部署。可靠、成熟、可扩展。
- BigQuery:大规模分析。可即时查询 100 万 + 分析结果。
- 缓存层:内存、文件、Redis 后端,支持 TTL/LRU 淘汰。加速重复分析。
🔐 安全 - 在漏洞造成破坏之前发现它们
- 安全扫描器:检测 OWASP 十大漏洞、硬编码密钥、SQL 注入。扫描 50 + 种漏洞模式。
- 漏洞数据库:跟踪已知的 CVE 和公告。及时了解新兴威胁。
- 自定义规则:定义自定义安全模式。强制执行你的组织的安全标准。
🤖 AI 集成 - 获取更智能的洞察
- AI 分析器:代码解释、错误检测、重构建议。立即理解复杂代码。
- 多个提供商:OpenAI(GPT - 4/3.5)、Anthropic(Claude)或本地(Ollama/llama.cpp)。选择适合你工作流程的提供商。
- 成本效益高:使用本地模型进行免费分析,或使用云模型以获得最高准确性。
📊 可视化与报告 - 传达结果
- 图生成器:导出为 D3.js、Mermaid、Graphviz DOT。可视化依赖关系和架构。
- 报告生成器:执行、技术、安全、架构报告。为不同受众提供不同报告。
- Web 仪表盘:交互式 D3.js/Cytoscape 可视化。直观地探索你的代码库。
🌐 API 与企业特性
- REST API 服务器:15 + 个端点,支持集成。基于 Lyra Intel 进行构建。
- 身份验证:支持 API 密钥、JWT、OAuth 2.0(SSO)、LDAP。安全的访问控制。
- 基于角色的访问控制(RBAC):管理团队成员的权限。
- 速率限制:保护你的基础设施。安全扩展。
🔬 法医分析 - 发现隐藏问题
- 法医分析器:代码与文档的双向映射。自动查找文档差距。
- 死代码检测器:查找未使用的函数、类、导入。清理你的代码库。
- 复杂度分析器:循环复杂度、认知复杂度、Halstead 指标。识别有问题的代码。
📋 更多功能
- 代码生成:基于 AI 的函数/类/API 生成,支持自定义模板
- 差异与影响分析:了解更改内容及其影响
- 迁移规划:提供逐步指导,规划框架/版本升级
- 代码性能分析:检测 N + 1 查询、阻塞 I/O、低效算法
- 模式分析:从 ORM 模型进行数据库模式分析
- 文档生成器:自动生成 API 文档和更新日志
- 工作流引擎:定义和执行多步骤分析管道
🔍 自动发现管道(新功能)
- GitHub 扫描器:自动从 GitHub 发现新的 MCP 加密工具
- AI 工具分析器:使用 AI/模式匹配提取工具定义
- 安全扫描器:扫描发现的工具是否存在漏洞
- 注册表提交器:将批准的工具提交到 Lyra 注册表
- 每日自动化:使用 GitHub Actions 工作流进行持续发现
查看发现文档 →
📦 安装指南
克隆仓库
git clone https://github.com/nirholas/lyra-intel.git
cd lyra-intel
安装(需要 Python 3.9+)
pip install -e .
💻 使用示例
基础用法
python cli.py scan /path/to/any/code
python cli.py analyze /path/to/code --output ./results.json
高级用法
python launch_dashboard.py
📚 详细文档
Lyra Intel 包含全面的文档,涵盖了平台的各个方面:
核心文档
-
📖 FEATURES.md - 详细的特性文档,包含以下内容的代码示例:
- 语义搜索(基于机器学习的代码搜索)
- SSO 集成(OAuth 2.0、SAML 2.0、LDAP)
- 语言解析器(C++、C#、Ruby、PHP)
- 插件系统
- IDE 扩展(VS Code、JetBrains)
- CI/CD 集成(GitLab、Bitbucket、GitHub Actions)
- 导出格式(PDF、SARIF、Excel、CSV)
- WebSocket 流式传输
- 交互式 CLI
- Web 仪表盘
- 监控与指标(Prometheus、Grafana)
-
💻 EXAMPLES.md - 实用的代码示例,包括:
- 快速开始(60 秒分析)
- 核心分析工作流
- 语义搜索使用方法
- SSO 设置与配置
- 特定语言解析
- 自定义插件开发
- IDE 扩展安装
- CI/CD 管道集成
- 实时 WebSocket 流式传输
- 监控设置
- 完整的端到端工作流
-
🏗️ ARCHITECTURE.md - 技术架构文档:
- 系统概述与设计
- 核心组件架构
- 数据流图
- 模块组织
- 扩展点
- 部署架构(单服务器、Kubernetes、AWS)
- 性能与可扩展性
- 安全架构
- 技术栈
-
🔌 API.md - 完整的 REST API 参考
-
🚀 DEPLOYMENT.md - 部署指南(Docker、Kubernetes、AWS)
-
📜 openapi.yaml - OpenAPI 3.0 规范
实际工作流
- 💼 USE_CASES.md - 实用的工作流和最佳实践:
- 保护遗留代码库
- 提交前代码质量检查
- CI/CD 安全管道
- 代码审查辅助
- 单体代码库迁移规划
- 技术债务跟踪
- 构建团队知识库
- 集成模式
- 性能优化技巧
入门指南
- ⚡ QUICKSTART.md - 5 分钟快速上手
- 🔧 INSTALL.md - 安装说明
- 📚 TUTORIAL.md - 常见用例的逐步教程:
- 首次分析
- 安全审计
- 语义搜索设置
- CI/CD 集成
- 自定义插件开发
- 生产部署
- 实时仪表盘
- ❓ FAQ.md - 常见问题解答
- 🤝 CONTRIBUTING.md - 贡献指南
🔧 技术细节
架构
lyra-intel/
├── src/
│ ├── core/ # 主引擎编排
│ ├── collectors/ # 数据收集(文件、git)
│ ├── analyzers/ # 代码分析(AST、依赖、模式)
│ ├── storage/ # 数据库和持久化
│ ├── agents/ # 多智能体系统
│ ├── search/ # 代码和语义搜索
│ ├── query/ # 自然语言查询
│ ├── visualizers/ # 图生成
│ ├── reports/ # 报告生成
│ ├── web/ # Web 仪表盘
│ ├── api/ # REST API 服务器
│ ├── auth/ # 身份验证和授权
│ ├── plugins/ # 插件系统
│ ├── ai/ # AI 集成
│ ├── metrics/ # 指标收集
│ ├── events/ # 事件系统
│ ├── notifications/ # 通知和警报
│ ├── forensics/ # 法医分析
│ ├── cache/ # 缓存层
│ ├── pipeline/ # 流式管道
│ ├── testing/ # 测试基础设施
│ ├── knowledge/ # 知识图谱系统
│ ├── diff/ # 差异和影响分析
│ ├── generation/ # 代码生成
│ ├── security/ # 安全扫描
│ ├── migration/ # 迁移规划
│ ├── profiler/ # 性能分析
│ ├── schema/ # 模式分析
│ ├── docgen/ # 文档生成
│ ├── integrations/ # 外部集成
│ └── workflow/ # 工作流引擎
├── config/ # 配置文件
├── scripts/ # 实用脚本
├── Dockerfile # 容器构建
├── docker-compose.yml # 多服务部署
└── cli.py # 命令行界面
处理模式
本地模式
适用于开发和小型仓库:
from src import LyraIntelEngine, EngineConfig, ProcessingMode
config = EngineConfig(mode=ProcessingMode.LOCAL, max_workers=8)
engine = LyraIntelEngine(config)
result = await engine.analyze_repository("/path/to/repo")
分布式模式
适用于具有多个工作进程的较大代码库:
config = EngineConfig(
mode=ProcessingMode.DISTRIBUTED,
max_workers=50,
)
云大规模模式
适用于企业级分析:
config = EngineConfig(
mode=ProcessingMode.CLOUD_MASSIVE,
cloud_provider="aws",
cloud_region="us-east-1",
max_cloud_workers=1000,
)
分析结果
引擎生成全面的分析结果,包括:
- 文件指标:总文件数、大小、按扩展名的行数
- 代码结构:函数、类、方法及其复杂度得分
- 依赖:导入/导出关系、循环依赖
- Git 历史:提交、作者、更改频率
- 模式:代码异味、反模式、安全问题
结果存储在 SQLite(或你配置的后端)中,并可以 JSON 格式导出。
云支持
Lyra Intel 旨在高效利用云资源:
| 提供商 |
实例类型 |
支持现货实例 |
优化效果 |
| AWS |
EC2、Lambda、ECS |
✅ 支持 |
~70% 节省 |
| GCP |
Compute Engine、Cloud Run |
✅ 支持 |
~70% 节省 |
| Azure |
VMs、Functions |
✅ 支持 |
~70% 节省 |
包含自动扩展和成本优化功能。
💼 常见用例
实际团队使用 Lyra Intel 进行以下工作:
🔒 安全团队
“我需要扫描我们 500K 行代码的代码库以查找漏洞”
- 保护遗留代码库 - 30 分钟内完成全面审计
- 自动 CI/CD 安全检查
- 提交前钩子,阻止不安全的代码
- 定期安全扫描
👨💻 开发团队
“新开发人员加入 - 如何让他们在 200K 行代码的代码库中快速上手?”
- 构建团队知识库 - 对代码库进行语义搜索
- 查找相似的代码模式
- 通过可视化了解架构
- 跟踪技术债务
🏗️ 平台团队
“我们需要从 Node 14 升级到 Node 18 - 是否安全?”
- 规划单体代码库迁移 - 逐步迁移计划
- 分析所有包的影响
- 识别重大更改
- 估算每个包的工作量
📊 工程负责人
“我们的代码质量是在提高还是在下降?”
- 跟踪技术债务 - 每月趋势跟踪
- 可视化指标随时间的变化
- 优先修复问题
- 向管理层展示基于数据的报告
🔍 代码审查
“每次拉取请求的审查时间太长 - 每个 PR 需要 30 分钟”
- AI 驱动的代码审查 - 30 秒内提供自动洞察
- 安全分析
- 复杂度警告
- AI 改进建议
查看 7 个完整的工作流及代码示例 →
🤖 MCP 集成(Claude 与大语言模型)
可以直接从 Claude、Claude Code 或任何支持 MCP 的大语言模型中使用 Lyra Intel。
快速设置
npx lyra-intel-mcp
{
"mcpServers": {
"lyra-intel": {
"command": "npx",
"args": ["-y", "lyra-intel-mcp"]
}
}
}
可用的 MCP 工具
| 工具 |
描述 |
analyze-codebase |
综合代码分析,包括 AST、依赖、指标 |
search-code |
基于机器学习的语义代码搜索 |
get-complexity |
循环复杂度、认知复杂度和 Halstead 复杂度 |
get-security-issues |
安全漏洞、密钥、合规性检查 |
discovery-scan-github |
在 GitHub 上查找新的 MCP 加密工具 |
discovery-analyze-repo |
从仓库中提取 MCP 工具定义 |
discovery-run-pipeline |
完整的发现 + 分析 + 提交流程 |
示例提示
"Analyze my project at ~/code/myapp for security issues"
"Search for authentication patterns in the codebase"
"Scan GitHub for new MCP crypto tools from the last 7 days"
"Run the discovery pipeline and submit approved tools"
查看完整的 MCP 文档 →
🏛️ 架构
架构概述
Lyra Intel 的架构设计旨在提供高效、可扩展和安全的代码分析解决方案。它包含多个核心组件,每个组件负责特定的功能,这些组件协同工作以实现全面的代码分析。
组件架构
- 核心引擎:负责整体的编排和协调,确保各个组件之间的流畅交互。
- 数据收集器:从文件系统和 Git 仓库中收集代码数据。
- 分析器:执行代码分析,包括 AST 解析、依赖映射和模式检测。
- 存储模块:管理数据的持久化,支持多种存储选项。
- AI 集成:与各种 AI 提供商集成,提供智能分析和洞察。
- 可视化和报告:生成直观的图表和详细的报告,方便用户理解分析结果。
数据流程
数据从收集器进入系统,经过分析器处理后存储在存储模块中。用户可以通过 Web 仪表盘或 API 访问分析结果,可视化和报告工具将结果以易于理解的方式呈现给用户。
部署架构
支持多种部署方式,包括单服务器部署、Kubernetes 集群和云服务(如 AWS),以满足不同规模和需求的用户。
性能与可扩展性
通过分布式处理和自动扩展功能,能够高效处理大规模代码库,确保在不同负载下的性能稳定。
安全架构
采用多层次的安全措施,包括身份验证、授权和漏洞检测,保障系统和数据的安全。
技术栈
使用了多种先进的技术和框架,如 FastAPI、React、Prometheus 等,确保系统的高性能和可维护性。
🌐 实时 HTTP 部署
Lyra Intel 通过 MCP 可流式 HTTP 传输协议进行部署,可通过 HTTP 访问,无需本地安装。
端点
https://modelcontextprotocol.name/mcp/lyra-intel
从任何 MCP 客户端连接
将以下配置添加到你的 MCP 客户端配置文件(Claude Desktop、Cursor、SperaxOS 等)中:
{
"mcpServers": {
"lyra-intel": {
"type": "http",
"url": "https://modelcontextprotocol.name/mcp/lyra-intel"
}
}
}
可用工具(6 个)
| 工具 |
描述 |
analyze_repo |
分析 GitHub 仓库 |
get_repo_tree |
获取仓库文件树 |
search_code |
搜索代码 |
get_file_content |
获取文件内容 |
get_repo_languages |
语言分析 |
get_recent_commits |
获取最近的提交 |
示例请求
分析 GitHub 仓库
curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
-H "Content-Type: application/json" \
-d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"analyze_repo","arguments":{"owner":"nirholas","repo":"universal-crypto-mcp"}}}'
获取仓库文件树
curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
-H "Content-Type: application/json" \
-d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"get_repo_tree","arguments":{"owner":"nirholas","repo":"agenti"}}}'
搜索代码
curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
-H "Content-Type: application/json" \
-d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"search_code","arguments":{"query":"MCP server","language":"typescript"}}}'
列出所有工具
curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
-H "Content-Type: application/json" \
-d '{"jsonrpc":"2.0","id":1,"method":"tools/list"}'
也可在以下平台使用
由 modelcontextprotocol.name 提供支持 — 开放的 MCP HTTP 网关
📈 指标与监控
可在以下地址访问指标:
- Prometheus:
http://localhost:9090
- Grafana:
http://localhost:3000
- API 健康检查:
http://localhost:8080/api/v1/health
关键指标:
lyra_intel_requests_total - 总 API 请求数
lyra_intel_analysis_duration_seconds - 分析性能
lyra_intel_ai_tokens_total - AI 使用跟踪
lyra_intel_cache_hits_total - 缓存效率
🤝 贡献
我们欢迎贡献!请参阅 CONTRIBUTING.md 获取贡献指南。
🐛 故障排除
常见问题及解决方案:
数据库连接失败
docker-compose restart postgres
docker-compose logs postgres
内存使用率高
export WORKERS=4
docker-compose up -d --scale api=1 --memory 4g
API 速率限制
export RATE_LIMIT_PER_MINUTE=1000
查看完整的故障排除指南 →
📊 项目状态
- ✅ 核心分析引擎
- ✅ 多语言支持(10 + 种语言)
- ✅ AI 集成(OpenAI、Anthropic、Ollama)
- ✅ 安全扫描(OWASP、密钥、依赖)
- ✅ 导出格式(JSON、HTML、PDF、SARIF、CSV、Excel)
- ✅ IDE 插件(VS Code、JetBrains)
- ✅ 平台集成(GitHub、GitLab、Bitbucket)
- ✅ 云部署(AWS、Kubernetes、Docker)
- ✅ 实时流式传输(WebSocket)
- ✅ Web 仪表盘(React)
- ✅ 监控(Prometheus、Grafana)
- ✅ 企业特性(SSO、RBAC、审计日志)
🌟 展示你的支持
如果你觉得 Lyra Intel 有帮助,不妨考虑:
- ⭐ 给这个仓库加星 - 帮助更多人发现这个项目
- 🐛 报告问题 - 通过报告漏洞帮助我们改进
- 💡 分享想法 - 提出功能和改进建议
- 🤝 贡献代码 - 请参阅 CONTRIBUTING.md 获取贡献指南
- 📢 传播消息 - 与你的团队和社区分享
每一个星星、贡献和推荐都有助于壮大社区!
🙏 致谢
使用了以下出色的开源工具构建:
📧 联系与支持
- 问题与漏洞报告:GitHub 问题
- 文档:完整文档
- 贡献:请参阅 CONTRIBUTING.md
📄 许可证
本项目采用 MIT 许可证 - 详情请参阅 LICENSE 文件。
由 nich 用心打造 | 在 X.com 关注我