Agent skill
paper-explain-figures
解读论文 Figure 的含义并输出一份“教会人类如何读图”的高可读性 Markdown 报告;支持输入 1 个或多个 figure 文件绝对路径与人工解读,自动尝试从图附近检索生成该图的源代码,并采用类似 parallel-vibe 的方式通过 `codex exec`/`claude -p` 以进程级隔离解读每张图(并发上限默认 3,可在 config.yaml 调整)。⚠️ 不适用:用户只是想改图尺寸/裁剪/改格式;或要求直接修改图片/源代码(本 skill 对图片与源代码全程只读,严禁修改)。
Install this agent skill to your Project
npx add-skill https://github.com/huangwb8/ChineseResearchLaTeX/tree/main/skills/paper-explain-figures
Metadata
Additional technical details for this skill
- author
- Bensz Conan
- keywords
-
paper-explain-figures explain-figures paper reading figure interpretation vision codex exec claude -p
SKILL.md
paper-explain-figures
与 bensz-collect-bugs 的协作约定
- 因本 skill 设计缺陷导致的 bug,先用
bensz-collect-bugs规范记录到~/.bensz-skills/bugs/,不要直接修改用户本地已安装的 skill 源码;若有 workaround,先记 bug,再继续完成任务。 - 只有用户明确要求“report bensz skills bugs”等公开上报时,才用本地
gh上传新增 bug 到huangwb8/bensz-bugs;不要 pull / clone 整个仓库。
目标
对用户提供的 1 张或多张论文 Figure:
- 将 Figure 转为
.jpg(用于视觉理解;转换失败则保留原图并显式说明) - 在 Figure 附近自动检索“生成该图的源代码”(可能找不到;找不到则为
NULL) - 综合三类信息输出可读性强的报告:
- 理解 1:视觉理解(从 jpg/原图直接读图)
- 理解 2:源代码理解(以代码为准;代码决定图的真实含义)
- 理解 3:用户人工解读(帮助猜测用户关注点;可能有误)
强约束(必须遵守)
- 目录管理硬约束:所有中间产物必须托管在当前工作目录下的隐藏目录
.paper-explain-figures/(该目录名在脚本中硬编码;不允许改到别处)。 - 运行时隔离硬约束:runner / 图片转换器产生的 HOME、TMP、XDG cache/state/config 等运行时辅助文件,也必须重定向并收纳到
.paper-explain-figures/内。 - 只读约束:全程只读访问用户的 Figure 与源代码文件;严禁修改它们(包括格式化/重写/覆盖)。
输入
用户会输入 1 个或多个信息:
- 1 个或多个 figure 文件的绝对路径
- 可选:对 figure 的人工解读(全局或按 figure 分配)
- 可选:用户显式给出源代码文件绝对路径(优先作为“候选入口”)
输出
- 最终报告:默认输出到当前工作目录
paper-explain-figures_report.md - 所有中间文件与日志:落到
.paper-explain-figures/(按 run/job 分目录保存)
标准报告格式(每张图必须按此结构输出)
每张图在同一个 Markdown 文件中以 ## 级标题分隔:
# Figures
## Figure: xxx
> 文件位置: xxx
> 源代码: xx.R 第xxx-xxx行
### 图表核心含义
...
### 变量定义
| 元素 | 定义 |
| --- | --- |
| ... | ... |
### 解读要点
1. ...
2. ...
### 解释
...
### 科学价值
...
技术路径(进程级隔离 + 并发上限)
为保证“每张图的解读相互独立”,本 skill 采用 worker 脚本在 shell 中启动独立进程执行:
codex exec "..."(推荐:更容易做本地文件读取 + 视觉理解)claude -p "..."(可选)
并发上限默认 3(可在 paper-explain-figures/config.yaml 调整)。
使用方式(建议)
在当前目录运行(推荐,产物会落到当前目录与 .paper-explain-figures/):
python3 paper-explain-figures/scripts/paper_explain_figures.py \
--fig /abs/path/to/figure1.png \
--fig /abs/path/to/figure2.pdf \
--note "你对这些图的关注点/背景解释(可选)"
如果该 skill 已做系统级安装(路径因平台而异,以下仅示例):
python3 ~/.codex/skills/paper-explain-figures/scripts/paper_explain_figures.py --fig /abs/path/to/figure.png
常用参数(按需):
# 启用并行(默认串行,减少 API 限流/封禁风险)
python3 paper-explain-figures/scripts/paper_explain_figures.py --fig /abs/path/to/figure.png --parallel
# 并发上限(默认 3;也可改 config.yaml:defaults.max_parallel)
python3 paper-explain-figures/scripts/paper_explain_figures.py --fig /abs/path/to/figure.png --parallel --max-parallel 3
# 指定 runner(codex/claude/local)
python3 paper-explain-figures/scripts/paper_explain_figures.py --fig /abs/path/to/figure.png --runner codex
⚠️ 安全提示:--runner shell 已禁用,因为它无法对“.paper-explain-figures 之外绝不泄露中间文件”提供严格保证。
清理方式
在触发目录执行:
rm -rf .paper-explain-figures
Recommended Agent Skills
Expand your agent's capabilities with these related and highly-rated skills.
systematic-literature-review
当用户明确要求"做系统综述/文献综述/related work/相关工作/文献调研"时使用。AI 自定检索词,多源检索→去重→AI 逐篇阅读并评分(1–10分语义相关性与子主题分组)→按高分优先比例选文→自动生成"综/述"字数预算→资深领域专家自由写作(固定摘要/引言/子主题/讨论/展望/结论),保留正文字数与参考文献数硬校验,强制导出 PDF 与 Word。支持多语言翻译与智能编译(en/zh/ja/de/fr/es)。
nsfc-humanization
去除 NSFC 标书中的 AI 机器味,使文本读起来像资深领域专家亲笔撰写(不适用:非标书内容/需修改格式/需补充新内容)
nsfc-research-foundation-writer
nsfc-research-content-writer
当用户明确要求"写/改研究内容""研究内容+创新+年度计划编排"时使用。为 NSFC 正文"(二)研究内容"写作/重构,并同步编排"特色与创新"和"三年年度研究计划",输出可直接落到 LaTeX 模板的三个 extraTex 文件。
nsfc-qc
当用户明确要求"标书QC/质量控制/润色前质检/引用真伪核查/篇幅与结构检查"时使用。对 NSFC 标书进行只读质量控制:并行多线程独立检查文风生硬、引用假引/错引风险、篇幅与章节分布、逻辑清晰度等,最终输出标准化 QC 报告;中间文件默认归档到“交付目录内的隐藏工作区(.nsfc-qc/)”,并兼容 legacy `.nsfc-qc/`。
nsfc-code
根据 NSFC 标书正文内容,结合申请代码推荐库,为你给出 5 组申请代码1/2(主/次)推荐与理由;输出到 NSFC-CODE-vYYYYMMDDHHmm.md(只读,不修改标书)
Didn't find tool you were looking for?