arxiv-mcp-server - 支持搜索、详情获取等功能的arXiv论文检索MCP集成工具

探索

Arxiv MCP Server

一个基于Model Context Protocol的arXiv论文检索服务，提供搜索、获取论文详情、按分类检索及PDF全文提取功能。

研究与数据搜索工具 #论文检索 #学术工具 #PDF解析 #arXiv .JavaScript

评分 : 2.5分

下载量 : 9.2K

更新时间 : 2025-07-28

打开站点

安装

复制以下命令到你的Client进行配置

{
  "mcpServers": {
    "arxiv": {
      "name": "arxiv-mcp-server",
      "command": "node",
      "args": ["build/index.js"],
      "cwd": "C:/path/to/arxiv-mcp-server",
      "enabled": true,
      "alwaysAllow": [
        "search_papers",
        "get_paper",
        "search_by_category",
        "get_paper_content"
      ],
      "env": {}
    }
  }
}

注意：您的密钥属于敏感信息，请勿与任何人分享。

🚀 arXiv MCP Server

arXiv MCP Server是一个实现了模型上下文协议（MCP）的服务器，它提供了与arXiv API交互的工具，可用于搜索和获取学术论文。

🚀 快速开始

本服务器实现了模型上下文协议，为从arXiv预印本库中搜索和获取论文提供了工具。它允许AI助手通过各种标准搜索论文、获取特定论文的详细信息、按类别搜索以及从PDF中提取全文内容。

✨ 主要特性

搜索论文：使用各种标准（标题、作者、摘要、类别等）搜索论文。
获取论文详情：通过arXiv ID获取特定论文的详细信息。
类别搜索：在特定的arXiv类别中搜索论文。
PDF内容提取：下载并提取论文PDF的全文内容。
结构化结果：返回经过正确解析的JSON数据，而非原始XML。
缓存机制：智能缓存PDF，避免重复下载。

📦 安装指南

前提条件

Node.js 18+
npm 或 pnpm

安装步骤

克隆此仓库：

git clone https://github.com/your-username/arxiv-mcp-server.git
cd arxiv-mcp-server

安装依赖：
```
npm install
```
构建项目：
```
npm run build
```

💻 使用示例

作为MCP服务器启动

启动服务器：

npm start

服务器将在标准输入输出上运行，允许它与MCP客户端进行通信。

MCP客户端配置

将以下配置添加到你的MCP客户端设置中。对于Claude Desktop，将其添加到claude_desktop_config.json文件中：

{
  "mcpServers": {
    "arxiv": {
      "name": "arxiv-mcp-server",
      "command": "node",
      "args": ["build/index.js"],
      "cwd": "C:/path/to/arxiv-mcp-server",
      "enabled": true,
      "alwaysAllow": [
        "search_papers",
        "get_paper",
        "search_by_category",
        "get_paper_content"
      ],
      "env": {}
    }
  }
}

对于其他MCP客户端，使用类似的配置结构。请确保：

更新cwd路径，指向你的arxiv-mcp-server目录。
确保build/index.js文件存在（先运行npm run build）。
alwaysAllow数组列出了无需用户确认即可使用的工具。

基础用法

`search_papers`

通过各种标准在arXiv上搜索论文，具有灵活的查询选项。参数：

query（字符串，可选）：跨所有字段的通用搜索查询。
category（字符串，可选）：arXiv类别（例如cs.AI、physics.optics）。
author（字符串，可选）：要搜索的作者姓名。
title（字符串，可选）：要在标题中搜索的单词。
abstract（字符串，可选）：要在摘要中搜索的单词。
start（数字，可选）：分页的起始索引（从0开始，默认值：0）。
max_results（数字，可选）：返回的最大结果数（最大2000，默认值：10）。
sort_by（字符串，可选）：按relevance、lastUpdatedDate或submittedDate排序。
sort_order（字符串，可选）：排序顺序为ascending或descending。

示例响应：

{
  "feed_title": "arXiv Query: search_query=all:machine+learning",
  "total_results": 150000,
  "start_index": 0,
  "items_per_page": 10,
  "papers": [
    {
      "id": "http://arxiv.org/abs/2104.13478",
      "arxiv_id": "2104.13478",
      "title": "Advanced Machine Learning Techniques",
      "summary": "This paper discusses advanced machine learning techniques...",
      "authors": ["John Smith", "Jane Doe"],
      "published": "2021-04-28T09:00:00Z",
      "updated": "2021-04-28T09:00:00Z",
      "categories": ["cs.LG", "cs.AI"],
      "links": [
        {
          "href": "http://arxiv.org/abs/2104.13478",
          "rel": "alternate",
          "type": "text/html"
        }
      ]
    }
  ]
}