SemanticScholarMCP

探索

Semanticscholarmcp

一个提供Semantic Scholar学术图谱API访问的MCP服务器，支持搜索学术论文、作者信息、获取引用分析及PDF下载等功能。

研究与数据搜索工具 #学术搜索 #论文分析 #引用追踪 #PDF下载 .Python

评分 : 2分

下载量 : 13.0K

更新时间 : 2025-07-31

打开站点

安装

复制以下命令到你的Client进行配置

{
  "mcpServers": {
    "SemanticScholarMCP": {
      "command": "/Users/your-username/Desktop/SemanticScholarMCP/venv/bin/python",
      "args": ["/Users/your-username/Desktop/SemanticScholarMCP/src/semantic_scholar_mcp/server.py"],
      "env": {
        "SEMANTIC_SCHOLAR_API_KEY": "your-actual-api-key-here"
      }
    }
  }
}

{
  "mcpServers": {
    "SemanticScholarMCP": {
      "command": "/Users/your-username/Desktop/SemanticScholarMCP/venv/bin/python",
      "args": ["/Users/your-username/Desktop/SemanticScholarMCP/src/semantic_scholar_mcp/server.py"]
    }
  }
}

注意：您的密钥属于敏感信息，请勿与任何人分享。

🚀 语义学者MCP服务器

语义学者MCP服务器是一个模型上下文协议（MCP）服务器，它提供对语义学者学术图谱API的访问。借助该服务器，你可以搜索学术论文、作者，还能获取有关引用和参考文献的详细信息。

🚀 快速开始

此MCP服务器能让你轻松访问语义学者学术图谱API，搜索学术资源并获取详细信息。你可按以下步骤进行安装和配置。

✨ 主要特性

论文搜索：使用各种过滤器搜索学术论文。
论文详情：获取特定论文的详细信息。
批量论文检索：一次性获取多篇论文的信息。
作者搜索：按姓名查找作者。
作者详情：获取作者的详细信息及其发表的论文。
引用分析：获取引用特定论文的其他论文。
参考文献分析：获取特定论文引用的其他论文。
引用上下文：获取一篇论文引用另一篇论文的上下文。
文本片段搜索：在学术论文中搜索文本片段。
PDF下载：以合适的文件名和元数据下载开放获取的PDF文件。
PDF可用性检查：在下载前检查PDF文件是否可用。
智能命名：以论文标题和年份作为文件名保存PDF文件。
元数据支持：在PDF文件属性中嵌入标题、作者和年份信息。

📦 安装指南

克隆此仓库：

git clone <repository-url>
cd SemanticScholarMCP

安装依赖项：

pip install -r requirements.txt

（可选但推荐）设置你的语义学者API密钥：

export SEMANTIC_SCHOLAR_API_KEY="your-api-key-here"

注意：API密钥是可选的。即使不设置，服务器也能正常工作，但你将共享公共速率限制（所有未认证用户每秒最多1000个请求）。

（可选）安装PDF元数据支持：

pip install -e ".[metadata]"

📚 详细文档

开发

设置开发环境

# 安装开发依赖项
pip install -e ".[test,dev]"

运行测试

# 运行所有测试
make test

# 仅运行单元测试（快速，无API调用）
make test-unit

# 运行集成测试（需要API密钥）
export SEMANTIC_SCHOLAR_API_KEY="your-api-key"
make test-integration

# 运行性能测试
make test-performance

代码质量

# 运行代码检查
make lint

# 格式化代码
make format

配置

将此服务器添加到你的MCP客户端配置中：

{
  "mcpServers": {
    "SemanticScholarMCP": {
      "command": "/Users/your-username/Desktop/SemanticScholarMCP/venv/bin/python",
      "args": ["/Users/your-username/Desktop/SemanticScholarMCP/src/semantic_scholar_mcp/server.py"],
      "env": {
        "SEMANTIC_SCHOLAR_API_KEY": "your-actual-api-key-here"
      }
    }
  }
}

无API密钥的配置（共享公共速率限制）：

{
  "mcpServers": {
    "SemanticScholarMCP": {
      "command": "/Users/your-username/Desktop/SemanticScholarMCP/venv/bin/python",
      "args": ["/Users/your-username/Desktop/SemanticScholarMCP/src/semantic_scholar_mcp/server.py"]
    }
  }
}

重要提示：

请将 your-username 替换为你实际的用户名。
API密钥是可选的，但推荐使用以获得更高的速率限制。
无API密钥：所有用户共享公共速率限制（每秒1000个请求）。
使用免费API密钥：你将拥有更高的专属速率限制。

可用工具

论文工具

`search_papers`

使用各种过滤器搜索学术论文。

参数：

query（必需）：搜索查询字符串。
limit：最大结果数（默认：10，最大：100）。
offset：跳过的结果数（默认：0）。
fields：要返回的字段列表，以逗号分隔。
publication_types：按出版类型过滤。
open_access_pdf：过滤具有开放获取PDF的论文。
min_citation_count：最小引用次数。
year：出版年份或年份范围（例如，"2020 - 2023"）。
venue：出版场所。

`get_paper`

获取特定论文的详细信息。

参数：

paper_id（必需）：论文ID（语义学者ID、DOI、arXiv ID等）。
fields：要返回的字段列表，以逗号分隔。

`get_paper_batch`

在单个请求中获取多篇论文的信息。

参数：

paper_ids（必需）：论文ID列表，以逗号分隔。
fields：要返回的字段列表，以逗号分隔。

作者工具

`search_authors`

按姓名搜索作者。

参数：

query（必需）：作者姓名或搜索查询。
limit：最大结果数（默认：10，最大：1000）。
offset：跳过的结果数（默认：0）。
fields：要返回的字段列表，以逗号分隔。

`get_author`

获取特定作者的详细信息。

参数：

author_id（必需）：作者ID。
fields：要返回的字段列表，以逗号分隔。

引用和参考文献工具

`get_paper_citations`

获取引用特定论文的其他论文。

参数：

paper_id（必需）：要获取引用的论文ID。
limit：最大结果数（默认：10，最大：1000）。
offset：跳过的结果数（默认：0）。
fields：要返回的字段列表，以逗号分隔。

`get_paper_references`

获取特定论文引用的其他论文。

参数：

paper_id（必需）：要获取参考文献的论文ID。
limit：最大结果数（默认：10，最大：1000）。
offset：跳过的结果数（默认：0）。
fields：要返回的字段列表，以逗号分隔。

`get_citation_context`

获取一篇论文引用另一篇论文的上下文。

参数：

paper_id（必需）：被引用论文的ID。
citing_paper_id（必需）：引用论文的ID。

文本搜索工具

`search_snippets`

在学术论文中搜索文本片段。

参数：

query（必需）：文本片段搜索查询。
limit：最大结果数（默认：10，最大：100）。
offset：跳过的结果数（默认：0）。

PDF工具

`get_paper_pdf_info`

检查论文的PDF可用性。

参数：

paper_id（必需）：要检查PDF可用性的论文ID。

`download_paper_pdf`

如果论文的PDF可用，则下载该PDF，使用论文标题作为文件名并设置元数据。

参数：

paper_id（必需）：要下载PDF的论文ID。
download_path：保存PDF的目录（默认：~/Downloads/semantic_scholar_papers）。

特性：

使用论文标题作为文件名（例如，"Machine Learning in Healthcare (2023).pdf"）。
在PDF元数据中设置标题、作者和出版年份。
自动处理重复文件名。
创建有组织的文件夹结构。

💻 使用示例

搜索机器学习相关论文

search_papers("machine learning", limit=5, year="2023")

获取特定论文的详细信息

get_paper("10.1038/nature14539")

查找引用特定论文的其他论文

get_paper_citations("10.1038/nature14539", limit=10)

搜索作者

search_authors("Geoffrey Hinton")

获取引用上下文

get_citation_context("paper-id-1", "paper-id-2")

检查PDF可用性

get_paper_pdf_info("10.1038/nature14539")

下载论文PDF

download_paper_pdf("10.1038/nature14539")

这将保存PDF文件，文件名类似：

"Deep learning (2015).pdf"

文件中嵌入了包括标题、作者（LeCun, Y., Bengio, Y., Hinton, G.）和年份（2015）的元数据。

API速率限制

语义学者API有以下速率限制：

无API密钥：所有未认证用户共享每秒1000个请求的速率限制（在高流量时可能会受到限制）。
使用免费API密钥：你将拥有更高的专属速率限制。

为确保性能稳定，建议获取免费API密钥。

🔧 技术细节

故障排除

速率限制错误

如果你看到以下错误：

Error: Rate limit exceeded. Please wait a moment and try again, or get an API key for higher limits.

这意味着你已达到共享公共速率限制，或者由于高流量API受到限制。

即时解决方案：

获取免费API密钥（推荐）：
- 访问 https://www.semanticscholar.org/product/api 。
- 注册免费账户。
- 获取你的API密钥。
- 将其添加到你的Claude桌面配置中：
```
"env": {
  "SEMANTIC_SCHOLAR_API_KEY": "your-actual-api-key-here"
}
```
- 重启Claude桌面应用。
等待并重试：共享公共速率限制可能只是暂时超出。
使用较小的结果限制：减少查询中的 limit 参数。
分散请求：避免连续快速发出多个请求。

配置问题

确保配置中的Python路径指向正确的虚拟环境。
验证服务器脚本路径是否正确。
检查虚拟环境中是否安装了所有依赖项。

测试连接

你可以通过让Claude以较小的限制搜索单篇论文来测试服务器是否正常工作：

search_papers("machine learning", limit=1)

错误处理

所有工具都包含全面的错误处理，如果请求失败或API返回错误，将返回详细的错误消息。

📄 许可证

本项目采用MIT许可证 - 详情请参阅 LICENSE 文件。

🤝 贡献

欢迎贡献代码！请随时提交拉取请求。

search_papers

使用Semantic Scholar搜索学术论文

参数

query : str*

描述

搜索查询字符串

参数

limit : int*

描述

最大结果数量

参数

offset : int*

描述

跳过的结果数量

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

参数

publication_types : Optional[str]*

描述

按出版物类型过滤

参数

open_access_pdf : Optional[bool]*

描述

过滤有开放获取PDF的论文

参数

min_citation_count : Optional[int]*

描述

最小引用次数

参数

year : Optional[str]*

描述

出版年份或年份范围

参数

venue : Optional[str]*

描述

出版场所

get_paper

获取特定论文的详细信息

参数

paper_id : str*

描述

论文ID（可以是Semantic Scholar ID、DOI、ArXiv ID等）

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

get_paper_batch

批量获取多篇论文的信息

参数

paper_ids : str*

描述

逗号分隔的论文ID列表

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

search_authors

按名称搜索作者

参数

query : str*

描述

作者姓名或搜索查询

参数

limit : int*

描述

最大结果数量

参数

offset : int*

描述

跳过的结果数量

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

get_author

获取特定作者的详细信息

参数

author_id : str*

描述

作者ID

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

search_snippets

搜索学术论文中的文本片段

参数

query : str*

描述

搜索文本片段的查询

参数

limit : int*

描述

最大结果数量

参数

offset : int*

描述

跳过的结果数量

get_paper_citations

获取引用特定论文的论文列表

参数

paper_id : str*

描述

要获取引用的论文ID

参数

limit : int*

描述

最大结果数量

参数

offset : int*

描述

跳过的结果数量

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

get_paper_references

获取特定论文引用的论文列表

参数

paper_id : str*

描述

要获取引用的论文ID

参数

limit : int*

描述

最大结果数量

参数

offset : int*

描述

跳过的结果数量

参数

fields : Optional[str]*

描述

逗号分隔的返回字段列表

get_citation_context

获取一篇论文引用另一篇论文的上下文

参数

paper_id : str*

描述

被引用的论文ID

参数

citing_paper_id : str*

描述

进行引用的论文ID

download_paper_pdf

下载论文的PDF（如果可用），使用标题作为文件名并设置元数据

参数

paper_id : str*

描述

论文ID（Semantic Scholar ID、DOI、ArXiv ID等）

参数

download_path : Optional[str]*

描述

保存PDF的目录

get_paper_pdf_info

获取论文的PDF可用性信息

参数

paper_id : str*

描述

论文ID（Semantic Scholar ID、DOI、ArXiv ID等）

Figma Context MCP

Framelink Figma MCP Server是一个为AI编程工具（如Cursor）提供Figma设计数据访问的服务器，通过简化Figma API响应，帮助AI更准确地实现设计到代码的一键转换。

Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器，提供丰富的网页抓取、搜索和内容提取功能。

TypeScript

189.7K

5分

Duckduckgo MCP Server

已认证

DuckDuckGo搜索MCP服务器，为Claude等LLM提供网页搜索和内容抓取服务

Python

109.1K

4.3分

Edgeone Pages MCP Server

EdgeOne Pages MCP是一个通过MCP协议快速部署HTML内容到EdgeOne Pages并获取公开URL的服务

百度地图MCP Server是国内首个兼容MCP协议的地图服务，提供地理编码、路线规划等10个标准化API接口，支持Python和Typescript快速接入，赋能智能体实现地图相关功能。

Context7 MCP是一个为AI编程助手提供实时、版本特定文档和代码示例的服务，通过Model Context Protocol直接集成到提示中，解决LLM使用过时信息的问题。

MiniMax Model Context Protocol (MCP) 是一个官方服务器，支持与强大的文本转语音、视频/图像生成API交互，适用于多种客户端工具如Claude Desktop、Cursor等。

Exa MCP Server是一个为AI助手（如Claude）提供网络搜索功能的服务器，通过Exa AI搜索API实现实时、安全的网络信息获取。

智启未来，您的人工智能解决方案智库

安装

工具列表

内容详情

替代品

安装

🚀 语义学者MCP服务器

🚀 快速开始

✨ 主要特性

📦 安装指南

📚 详细文档

开发

设置开发环境

运行测试

代码质量

配置

可用工具

论文工具

search_papers

get_paper

get_paper_batch

作者工具

search_authors

get_author

引用和参考文献工具

get_paper_citations

get_paper_references

get_citation_context

文本搜索工具

search_snippets

PDF工具

get_paper_pdf_info

download_paper_pdf

💻 使用示例

搜索机器学习相关论文

获取特定论文的详细信息

查找引用特定论文的其他论文

搜索作者

获取引用上下文

检查PDF可用性

下载论文PDF

API速率限制

🔧 技术细节

故障排除

速率限制错误

配置问题

测试连接

错误处理

📄 许可证

🤝 贡献

替代品

`search_papers`

`get_paper`

`get_paper_batch`

`search_authors`

`get_author`

`get_paper_citations`

`get_paper_references`

`get_citation_context`

`search_snippets`

`get_paper_pdf_info`

`download_paper_pdf`