智能体时代的 MCP · 数据结构 v1.2.0 · Apache 2.0 即将开源

一个科研级的
论文知识库
为 AI 智能体而生。

MCP 服务 · 精选数据库 · 即将开源的抽取工具链。为认真的 CV/ML 研究者而造。接入 Claude Code:5 分钟扫描一个领域,精读任意论文的任意段落,一次调用横向对比 100+ 篇论文的方法与实验数据。

21,116
精选论文
1.15M
段落
16,864
主图
365,777
引用边
17
MCP 工具

覆盖会议:CVPR · ICCV · ECCV · ICLR · ICML · NeurIPS · AAAI · ACL · EMNLP · NAACL · IJCAI · WACV · BMVC · 3DV · SIGGRAPH · TPAMI · IJCV · 每周刷新。

产品

三大支柱,一个技术栈。

为 2026 年研究者真实的工作方式而设计:LLM 智能体随手可得,替你阅读。我们把知识库交给那个智能体 —— 预先蒸馏、结构化、引用锁定。

1. MCP 服务

17 个工具,为智能体而生。

一次 MCP 连接,智能体即可调用 searchquotecompare_methodsfind_baselinessurveytrendsnarrative_threadsget_figurebibtex 等共 17 个 —— 严格按 Anthropic 工具设计指南构建,带 defer_loading

~0.5s p95 搜索 · 每次调用 ~$0
2. 精选数据库

重质,不重量。

CV/ML 顶会的 21K 篇论文,基于开放的 schema v1.2 用 GPT-5.5 + Opus-4.7 蒸馏 —— 7 类贡献分类 + 6 字段叙事弧 + 数据集/指标网格 + 主图元数据。混合检索:BGE-1024 稠密 + BM25 + RRF + Qwen3 cross-encoder 重排。

段落引用 · 引用图 · 作者/分面索引
3. 开源

在你的实验室本地托管语料。

Schema 规范、蒸馏 prompt(Opus / GPT-vision)、Marker/PyMuPDF 图片抽取、LanceDB + SQLite FTS5 索引构建器、引用图解析器、FastMCP 服务 —— 全部以 Apache 2.0 发布。卡片数据以 CC-BY-SA 上 Hugging Face。把实验室的私有论文喂进来,在团队内开放。

Apache 2.0 · v0.1 即将
工具面

17 个工具 —— 按使用场景设计。

严格按 Anthropic 最佳实践优化智能体消费:每个工具都有明确的 "何时用" + "何时不用" 子句,延迟工具通过 discover_tools 自动发现。

检索 · 找论文
search(query, k, filters)
混合检索 (BGE + BM25 + RRF + Qwen3 重排)。主入口。
deep(paper_ids, include)
按 ID 取完整蒸馏卡片。
find_baselines(paper_id)
这篇论文对比了谁(库内 + 外部模型)。
find_citing(paper_id)
反向查找:谁引用了这篇(365K 已解析边)。
find_lineage(paper_id, direction)
沿 builds_on 链走 —— 方法的祖辈 / 后代。
graph(seed, mode, depth)
主题 / 同方法 / 同数据集邻居。
find_experts(topic)
某主题的 top 作者(论文数 + 代表作)。
领域级聚合 · 看全局
survey(topic, k=50)
领域地图:方法/任务/贡献分布,各方法锚论文,主流数据集,叙事样本。
trends(topic, year_range)
方法家族的时序流行度 + 新兴 / 衰减信号。
narrative_threads(topic, k=100)
100+ 篇论文串成一条叙事线 —— problem→gap→insight→approach→evidence。
compare_methods(topic | paper_ids)
表格化对比:方法 · 数据集 · 关键指标 · SOTA 标注 · 代码。
analyze(query, k=100)
一次调用批量 50–200 张 L1 卡片。可选服务端摘要。
深读 · 段落 + 图层级
quote(query, k, paper_id?)
对 1.15M 段落的逐字检索。可按 paper 过滤。
get_figure(paper_id)
主图(架构图)的 base64 JPG + 图注。
compare(paper_ids, aspects)
卡片矩阵的并排对比(方法 / 数据集 / 结果 / 代码)。
bibtex(paper_ids)
干净的 BibTeX 条目,直接粘进 .bib。
discover_tools(query) · status()
按描述匹配自动发现延迟工具 · 服务健康 + 语料统计。
快速开始

两条命令。
一分钟。

从 Claude Code(或任意兼容 MCP 的智能体)接入。申请到 access 后把 YOUR_KEY 替换掉。

其他 MCP 客户端(Codex、自定义 LangChain 智能体):走 streamable-http 传输的 HTTP + JSON-RPC,鉴权用 X-API-Key header 或 Authorization: Bearer

1 · 注册 MCP 服务
# 在终端里
claude mcp add \
  --transport http \
  -s user \
  litscan-rag \
  https://mcp.acceptpaper.com/mcp \
  -H "X-API-Key: YOUR_KEY"
2 · 使用
# 在 Claude Code 对话里
> 扫描一下 2024–2026 年稀疏视角 3D
> 人体重建的论文。列出主流方法家族、锚定
> 论文、关键 benchmark,以及新兴的方向。

# Claude 内部:
# 1. 调用 survey(topic, k=50) → 领域地图
# 2. trends(topic) → 时序信号
# 3. quote(...) 验证有争议的说法
# 4. find_baselines(top-3) 做对比
# → 返回带引用的综合回答
为什么选 acceptpaper

为 AI 原生研究工作流而造。

现有工具是为坐在网页前的人眼设计的。acceptpaper 是为替你工作的 LLM 智能体设计的。

能力 acceptpaper PaperQA2 Elicit OpenScholar
MCP 原生(智能体接口)
预蒸馏的结构化数据v1.2(7 类 + 6 字段)纯文本半结构化纯文本
段落级检索1.15M 段落
图检索(主图 JPG)16K仅 v3
引用图(已解析)365K 条边工具调用部分经 S2
按会议级别加权排序
每次查询成本(检索)$0$0.05–2$0.01–.50~$0.10
领域聚焦CV/ML 顶会偏生物通用通用
开源许可证Apache 2.0(筹备中)✓ Apache闭源✓ Apache
实验室语料可自托管即将部分
数据结构 v1.2

每张卡片都是一个 引用锁定的小数据库

一篇论文不只是文本。我们的蒸馏为每篇论文生产 30+ 个结构化字段 —— 7 类贡献分类、6 字段叙事弧、带 SOTA 标志位的数值化评测数据集、baseline 对比串、关键模块、主图元数据。智能体读到的只是它需要的那一片切片,不必每次查询都重新解析 PDF。

// excerpt of one L2 card
{
  "source_id": "cvf:CVPR.2026:1024",
  "title": "DiHuR: Diffusion-Guided Generalizable Human Reconstruction",
  "contribution_type": {
    "primary": "combination",
    "secondary": ["empirical_study", "ablation_heavy"]
  },
  "narrative": {
    "problem": "Reconstructing detailed 3D humans from ~3 sparse cameras…",
    "insight":  "SMPL vertices map to consistent semantic regions…",
    "evidence": "CD 1.117 vs GP-NeRF 3.876 on THuman; gains hold on ZJU-MoCap"
  },
  "eval_data": [
    {"name":"THuman","metric":"Chamfer Distance","value":1.117,"is_sota":true},
    // + 9 more entries
  ],
  "compares_with": ["NeuS", "SparseNeuS", "PIFuHD", "GP-NeRF", "SIFU"],
  "hero_figure": {"page":1, "caption":"Given 3 views with minimal overlap…"}
}
开源

通向 Apache 2.0 的路线图。

托管服务对学术用户永久免费。工具链以开源方式发布,任何实验室都可以自托管自己的语料。

v0.1
Schema 规范 + 1K 样例
Pydantic L2Card 规范、JSON 样例、用于 LanceDB+FTS5 的 build_index.py
目标:2026 Q1
v0.2
蒸馏流水线
生产级 prompt、重试、校验器、图片抽取、段落切片。自带 LLM key。
目标:2026 Q2
v0.3
完整语料上 HuggingFace
46K 卡片、1.15M 段落、16K 图、引用图。CC-BY-SA。一行命令下载。
目标:2026 Q3
v1.0
生产级自托管
Docker compose、Terraform 模块、实验室多租户鉴权、文档站。
目标:2026 Q4
获取访问

欢迎研究者。
不接受爬虫,不接受机器人。

学术 / 研究用途免费 API key。只需简单告诉我们你是谁、在做什么 —— 我们用来决定优先级和扩展会议覆盖。

申请 API Key

通常 24 小时内回复。

服务概览
  • 免费档: 1000 次 search / 天,deep/find_* 无限。
  • SLA 目标: p95 < 500ms 搜索;p99 < 2s。
  • 语料更新: 计划每周 arXiv 入库;会议论文集发布后 1 周内入库。
  • 隐私: 查询日志保留不超过 24 小时。
  • 引用: 致谢欢迎,不强制要求。