就在上周,我带的一个小师弟在办公室里差点哭出来。他准备了半年的 Asiacrypt 论文,在截稿后不到二十四小时,收到了 Program Chair 的 Desk Reject 邮件。原因荒谬得让人吐血:他的 PDF 属性里,作者一栏赫然写着他自己的中文拼音。这是他用 Overleaf 导出 PDF 时,本地系统和 Mac 账户自动带入的元数据。半年心血,连审稿人的面都没见到,直接变成了废纸。
作为发过五篇顶会的过来人,我太清楚这种痛了。学术界最惨的事,不是你的算法被审稿人喷有漏洞,而是你自以为写了一篇能中 Best Paper 的大作,却因为在匿名和格式细节上裸奔,被程序委员会在第一轮直接无情秒杀。五月的学术界历来是兵家必争之地。看着手头的 Asiacrypt、ICCD 还有 MLCAD 截稿日一天天逼近,大家都在疯狂地改论文。如果你还在犹豫手头的成果该往哪儿投,或者想快速查看哪些会议还来得及投?试试本站的 全球会议截稿查询,支持按领域和时间筛选。但无论你投哪个,在按下 Submit 按钮前,必须把下面这几个细节给我死死卡住。
隐藏在 PDF 属性里的致命元数据
很多人以为,只要在 LaTeX 源码里把 \author 删了,或者写上 Anonymous Authors,双盲评审的匿名工作就做完了。这简直是天真得可爱。现在的 PDF 生成工具,无论你是用 pdfLaTeX、XeLaTeX 还是 Overleaf,在编译时都会默认把你的系统用户名、甚至你本地文件的路径打包进 PDF 的 Metadata(元数据)里。如果审稿人或者 PC 用 Adobe Acrobat Pro 打开你的论文,点开文件属性,你的名字、学校、甚至你给这个文件起的名字如 Draft_v3_ZhengZhang.pdf 就会一览无余。
要避开这个坑,你必须在编译的最后一步进行元数据清洗。如果你使用的是 hyperref 宏包,一定要在引言区显式地将 pdfauthor 和 pdftitle 设为空白,例如使用 \hypersetup{pdfauthor={Anonymous} }。在生成最终版 PDF 后,不要直接上传。在 Linux 系统下,推荐使用 pdfinfo 命令去检查你的 PDF 属性;或者在本地用 Acrobat 软件的删除隐藏信息功能,彻底抹去作者信息和编辑历史。别嫌麻烦,这几分钟的操作,保的是你半年的劳动成果。
欲盖弥彰的致谢与项目资助信息
这是另一个让人啼笑皆非的重灾区。很多作者在写论文时,习惯性地把 Acknowledgement 或者是 Funding 信息写在正文里,等到要投双盲会议时,才急忙用百分号把这几行代码注释掉。然而,有些期刊或会议模板(比如 IEEE ICCD 的双栏模板)在注释掉这些大段文本后,会导致排版出现微小的位移,甚至在某些编译器下,注释掉的文本依然会在 PDF 的底层数据流里留下痕迹。
更低级的错误是,有人虽然把致谢部分删了,却在正文中保留了类似于“本研究得到了国家自然科学基金项目(项目号 622XXXXX)的资助”这样的字眼。你要知道,项目基金号是完全公开且可查的,审稿人顺着基金号往系统里一搜,你老板的名字、你的单位瞬间就曝光了。正确的做法是,在准备投稿版本时,直接在 LaTeX 源文件中使用条件编译宏包(如 comment 宏包),或者干脆物理删除这些敏感行,等录用后再加回来。任何能暗示你实验室、你导师或你研究组过往论文的表述,哪怕是“在我们之前的研究 [12] 中”,也必须无情地改成“在文献 [12] 中”。
系统填报时的利益冲突与盲区
搞定了 PDF,别以为就万事大吉了,投稿系统才是最后一道鬼门关。现在的会议,无论是使用 EasyChair、HotCRP 还是 OpenReview,系统里的每一个表单都暗藏杀机。最典型的是 Conflict of Interest(COI,利益冲突)的填报。以 MLCAD 会议为例,如果你没有认真填写你和你所有合著者在过去几年内有合作关系的人员名单,系统在分配审稿人时,极有可能把你的论文分给你同系的老同事,或者你之前合作过的学者。你可能觉得这是好事?错。一旦系统检测到这种关联,或者在后期被 PC 发现,这属于严重的学术不端,论文直接被撤销,甚至可能面临长达几年的禁投处罚。
此外,系统填报的论文标题、摘要,必须与你上传的 PDF 保持绝对一致。审稿人在系统里挑论文(Paper Bidding)时,通常只能看到你填在网页表单里的 Abstract。如果你因为赶在最后一分钟提交,在系统里随便胡乱贴了一版旧摘要,而 PDF 里是新摘要,审稿人一旦发现对不上,会觉得你的态度极其敷衍,直接在 Bidding 时给你差评,最后你的论文大概率会被分给完全不对路的审稿人,被批得体无完肤。
别把命运交给审稿人的仁慈
我想给所有在深夜改格式的学弟学妹们一个冷酷但真实的观点:审稿人其实并不是在欣赏你的学术成果,在大多数情况下,他们只是在疲惫的工作之余,试图在一堆稿件中寻找拒绝你的理由。格式不规范、匿名没做彻底、页数超标一行,都是他们能给出的、最省力也最不需要承担学术责任的拒稿借口。
在五月这波截稿洪流中,在按下那个红色的 Submit 之前,请对照以下这份无情自查清单,逐字逐句确认一遍:
用无痕浏览器或命令行工具读取一遍导出的 PDF 文件,确认 Metadata 中不含有任何作者姓名、学校名称、本地路径或含有拼音的设备名称。
检查正文中是否有我们之前的工作、我们实验室开发的工具等第一人称暗示,确保所有对自身工作的引用都已转化为客观的第三人称叙述。
检查 LaTeX 源码,确保所有致谢、基金资助、机构标志、甚至是带有学校后缀的邮箱地址都已彻底清除或替换为 anonymous 占位符。
在投稿系统中,核对所有作者的拼音拼写、邮箱、以及 Conflict of Interest 列表,确保没有遗漏近三年的学术合作者。
将最终版 PDF 下载到本地,用最普通的 PDF 阅读器打开,拉到最后一页,确保参考文献没有因为字体、间距问题多溢出一行,严格卡在会议要求的页数限制内。