您的位置: 首页> AI模型

1小时文献量30秒读完！手把手教你构建论文总结 Agent Skill

匿名上传

发布时间:2026-02-04 09:24:01

大家好我是小肥肠。转眼又到了写论文的季节，你是不是又在为需要阅读大量参考文献发愁？今天我们将开发一个 Agent Skill。你只需提供文件源文件，它便能自动输出文献总结报告，告别低效的人肉阅读，让 AI 替你完成最枯燥的预研工作。

1. 前言

面对堆积如山的参考文献，最让人崩溃的往往不是看不懂，而是看不完。传统的查阅方式是逐一打开 PDF，手动标记重点，再苦哈哈地归类整理，效率极低且容易遗漏关键信息。

本文我们将开发一个 Agent Skill，利用 PyMuPDF4LLM 精准拆解 PDF 论文后调用 AI 深度分析总结。你只需提供文件，它便能自动输出结构化报告，告别低效的人肉阅读，让 AI 替你完成最枯燥的预研工作。

先来看一下实现效果，原文PDF如下：

经过 Agent Skill整理后的内容：

2. 前置设计工作

2.1. 需求背景

在科研或深度学习过程中，我们往往面临两个核心痛点：

从上图可以看出我们面临的主要是信息过载与论文格式难以解析的两大痛点。基于 Agent Skill，我们可以将这些枯燥、重复、高出错率的预研工作完全自动化。AI 不再只是个翻译官，而是变成了一个能直接操作本地文件、精准拆解结构并产出专业简报的科研数字助手。

2.2. 技术栈梳理

在创建Skill前，需要进行几个前置操作：

安装python（这个不讲了，网上手把手教程很多，自行根据自己的操作系统搜索一下安装教程）
安装安装PyMuPDF4LLM，打开命令提示词，输入如下指令

pip install pymupdf4llm

3. 安装ClaudeCode，整合大模型，我这边整合的Doubao-Seed-Code，具体教程可参考：

文风自我进化？10分钟教你用 Agent Skills 搭建一个能“无限迭代”的小说生成器

3. 技术实现

本文的Agent Skill目录结构设计如下：

xfc-paper-summary/
├── SKILL.md          # 必填：使用说明 + 元数据
├── scripts/          # 可选：可执行代码
├── references/       # 可选：文档资料
└── assets/           # 可选：模板、资源文件

1. 按照上述目录结构创建文件夹

2. 编写读取文献代码

进入xfc-paper-summary/scripts/路径，创建process.py文件，填入源代码：

import pymupdf4llm
import os
import sys

def extract_pdf_to_markdown(input_path: str) -> str:
    if os.path.isabs(input_path) and os.path.exists(input_path):
        target_path = input_path
    else:
        target_path = os.path.join(os.path.dirname(os.path.dirname(__file__)), "assets", input_path)
    if not os.path.exists(target_path):
        raise FileNotFoundError(f"未找到文献文件，请检查路径是否正确: {target_path}")
    markdown_text = pymupdf4llm.to_markdown(target_path)
    return markdown_text

if __name__ == "__main__":
    if len(sys.argv) > 1:
        pdf_input = sys.argv[1]
    else:
        assets_dir = os.path.join(os.path.dirname(os.path.dirname(__file__)), "assets")
        if not os.path.exists(assets_dir):
            os.makedirs(assets_dir)
            
        pdf_files = [f for f in os.listdir(assets_dir) if f.endswith(".pdf")]
        if not pdf_files:
            print("Error: assets 目录下没有找到 PDF 文件，请提供绝对路径或放入 assets 中。")
            sys.exit(1)
            
        print(f"检测到 assets 中的文献: {', '.join(pdf_files)}")
        pdf_input = pdf_files[0]

    try:
        print(f"--- 正在解析文献: {pdf_input} ---")
        md = extract_pdf_to_markdown(pdf_input)
        print(md) 
    except Exception as e:
        print(f"解析过程中出现故障: {e}")
        sys.exit(1)

在代码中判断有没有输入绝对路径，若没有则找到assets 文件夹，调用 pymupdf4llm 库，将原本是图片感或二进制格式的 PDF 论文转换成带格式的 Markdown 纯文本。

3. 编写SKILL.md

进入xfc-paper-summary/路径，创建SKILL.md文件，这里给出编写思路，自行去豆包里扩充就行：

--- 
name: xfc-paper-summary description: 资深论文解析专家。支持自动解析本地PDF并生成结构化总结报告。 
---

编写提示词：
1. 调用 .claude/skills/xfc-paper-summary/scripts/process.py 解析文献
2. 深度拆解与总结，需要拆解为以下框架
- 研究背景
- 核心方法论
- 实验结论
- 局限与启发
3. 使用 `write_to_file` 工具将总结后的内容写入.claude/skills/xfc-paper-summary/reference/文件夹下