Skip to main content

论文指南

本检查表是一份主观性较强但实用的指南,用于检查计算机科学论文(特别是会议和期刊投稿)中的写作质量、结构合理性和内容呈现。尽管部分条目具有主观色彩,但其目标是提供具体提醒并指出常见问题。本项目为持续更新版,欢迎社区反馈与修订。


1. 🎯 标题与摘要

  • 1.1 标题应不超过 15 个词。避免使用通用短语(如“A Novel Framework...” 这种信息量低的表达)以及过于狭窄的主题(会减少潜在读者),目标是简洁且信息充足。
  • 1.2 标题应明确体现问题解决方案,并包含至少一个技术关键词(如 jailbreak、OOD detection、graph learning)。
  • 1.3 避免使用冷僻或歧义缩写。LLM、AI、ML 这类缩写在 CS 领域是可以接受的,但 AD(可能是广告或异常检测)这类就应避免。
  • 1.4 摘要应包含四个核心要素:(1)问题或任务定义,(2)提出的方法或思想,(3)主要结果,(4)广泛意义或影响(部分内容可合并)。
  • 1.5 摘要避免未定义的缩写,以及模糊的形容词(例如 “important”、 “novel”、 “state-of-the-art” 等不加说明的表述)。
  • 1.6 附加项:摘要中应至少包含一个具体的、可量化的结果或发现以增强吸引力。例如:“我们的方法在 jailbreak detection 上实现了 11.2 倍推理加速。”

2. 📚 引言部分

  • 2.1 在前两个段落中清楚地定义研究问题或任务。
  • 2.2 引言应包含真实应用背景或相关工作引用(最好两者都有)。
  • 2.3 引言结尾简要介绍方法名称及其基本思想。
  • 2.4 明确列出贡献(如:“(1) 首个框架..., (2) 新数据集..., (3) 大规模实验...”)。
  • 2.5 每项贡献都应明确、可验证,避免使用“提供见解”、“提升理解”等模糊表述。
  • 2.6 彩蛋:第一页中包含吸引人的图,如与现有工作的比较、性能亮点或核心思想示意图。

3. 🔍 相关工作

  • 3.1 所有引用的工作都应与本文方法、基线或任务直接相关。
  • 3.2 至少提及近年被引用次数最多的 3 篇相关论文中的一个作为 baseline。
  • 3.3 相关工作部分不超过 1.5 页(除非是综述类论文)。
  • 3.4 可使用 LLM 辅助检索,但所有引用必须手动验证,切勿盲信 LLM
  • 3.5 彩蛋:使用相关工作部分引出 baseline 算法,结合表格展示新方法的优势。

4. 🧪 方法部分

  • 4.1 所有符号在首次出现时均已定义。
  • 4.2 所有公式均有正文引用与解释(如 “Eq. (3) 表示...”,若未引用可考虑内联以节省空间)。
  • 4.3 方法的每个模块或组件都有图示或文字描述。
  • 4.4 每个小节最好与总览图中的组成部分对应,并在展开前写一个总览段。
  • 4.5 总览图和伪代码无需都放正文,伪代码建议放附录。
  • 4.6 本节内容应让审稿人无需查看附录或代码即可理解方法。
  • 4.7 彩蛋:删除不会影响理解的内容,长数学公式 ≠ 好论文。

5. 📊 实验部分

  • 5.1 使用不少于 3 个数据集(除非文章为新数据集介绍)。
  • 5.2 比较不少于 3 个 baseline 方法,并说明为什么选这些方法,它们是否是 SOTA。
  • 5.3 包含至少一个消融实验。
  • 5.4 在合适情况下报告标准差或置信区间。
  • 5.5 描述硬件环境、使用的软件库和超参数。
  • 5.6 不忽略负面结果,失败案例有参考价值。
  • 5.7 评估指标需定义清晰,并说明合理性。
  • 5.8 图表在正文中都有引用。
  • 5.9 除了“数值优于 baseline”,是否有深入分析,如为何方法有效或失败在哪。
  • 5.10 彩蛋:考虑他人复现难度;若有“trick”应去除。

6. 🧾 写作质量与风格

  • 6.1 所有缩写首次出现时有定义(如 ML、LLM),不重复定义。
  • 6.2 无长句(>25词)不加逗号或句号。
  • 6.3 无段落超过 10 行。
  • 6.4 被动语态比例应低于 30%。
  • 6.5 彩蛋:检查是否充斥 LLM 风格的华丽词汇(如 encompass, intricate 等)。

7. 🖼️ 图表部分

  • 7.1 所有图表标题 ≥ 2 行,并包含解释内容;避免无说明地插图。
  • 7.2 图中文字大小 ≥ 8pt,标签清晰不被裁剪。
  • 7.3 所有配色在灰阶打印下依旧可辨别(部分审稿人会打印论文)。
  • 7.4 所有方法都在图例或表格中标明。
  • 7.5 图表优先放页面顶部(非硬性要求,但更清晰)。
  • 7.6 无冗余图表,每张图都提供新信息。
  • 彩蛋:图表为无损格式(如 PDF),严禁使用低分辨率图片

8. 🧱 结构与排版

  • 8.1 无 LaTeX 警告或 bad boxes。
  • 8.2 小节标题符合论文结构(如 Introduction, Method, Experiments 等)。
  • 8.3 正文中需明确引用附录具体章节(如 “见 Appendix B.2”)。
  • 8.4 全文不得出现孤立行(orphan line),即段首或段尾仅一行。
  • 8.5 不连续堆叠多个图表,中间必须有解释文字。

9. 📎 参考文献

  • 9.1 引用格式符合目标会议或期刊要求。
  • 9.2 所使用的数据集、工具包、模型等均已引用。
  • 9.3 至少引用一篇目标会议/期刊的文章。
  • 9.4 自引比例 ≤ 20%。
  • 9.5 BibTeX 已去重并检查拼写错误。

10. 🛑 引用真实性检查(避免 LLM 幻觉)

  • 10.1 所有引用已手动验证其真实存在,标题、作者、会议与年份均匹配。
  • 10.2 不包含由 LLM 虚构的引用。
  • 10.3 若由 ChatGPT、Copilot 等生成引用,需在 Google Scholar 或 Semantic Scholar 等站点交叉验证。

11. 🧠 提交前的最终检查

  • 11.1 PDF 可在 Overleaf/本地无警告编译。
  • 11.2 文件命名符合投稿要求(匿名时不可包含作者信息)。
  • 11.3 无任何泄露作者身份的信息(如元数据、文件名、代码注释)。
  • 11.4 论文总长度(包括参考文献与附录)不超过页数限制。
  • 11.5 论文已由非作者完整阅读一遍,且无需中途停顿查阅。
  • 11.6 所有合作者已列出,避免遗漏作者(真实案例屡见不鲜)。
  • 11.7 彩蛋:提交后,换设备换系统(如 Windows/Mac)登录检查论文显示是否正常。

本项目属于 cs-paper-checklist。欢迎通过 PR 提出修改建议。