每天学习亿点点day 7: 论文写作的基本法 转载自知乎:顶会最佳论文得主经验谈:论文写作的灵魂、技巧与高度提升 - 北京智源人工智能研究院的文章 - 知乎 https://zhuanlan.zhihu.com/p/135989892

01追忆“我”的第一篇论文

大多数同学一开始是不知道如何写论文的,甚至写一个论文摘要的时候,看半天都无从下手。其实,科研论文的写作本身就是一件不简单的事情,包括我也是和大家一样,从一个“科研小白"开始,通过不断的科研思维锻炼并加以用心的体会总结,慢慢成长了起来。

首先,分享一段“黑历史”,回顾一下我第一篇论文的写作历程(上图左边是该论文发表后的样子)。当时是2007年3月份,我还是硕士二年级在读,恰遇机器学习领域的顶级会议NIPS(其通常截稿日期是在5月份左右),便一口气洋洋洒洒写了篇有60页之多的投稿论文。就是想到哪说到哪儿,最后的效果和这个彩旗一样杂乱(上图右边),当时我的合作导师是微软亚研院的刘铁岩老师,在提交给他之前,我甚至还稍作修改并缩减到46页。其实当时自我感觉非常良好,认为每个地方写的非常清楚。我想当时刘老师看完这篇文章后的状态一定是这样子的(如下图)。

刘老师的这个状态也是现在我在指导学生论文时候的状态,也就是一种生无可恋的感觉。包括我的很多毕业生,当他们进入了工业界或者学术界,在给他们的学生修改第一篇论文的时候,就说跟我说:‘老师,我现在是真的深刻体会到了你当初的那种感觉’。其实,学术论文写作并没有大家想象的那么困难,我相信通过一定的逻辑思维训练并掌握一定的写作技巧,就可以迅速脱离“论文写作小白”的现状”。(兰老师给咱们做心理建设,是不是超级暖心)

02论文的层次结构——分块

其实我在写第一篇论文的时候,根本不清楚应该写成一个什么样子的文章,甚至不清楚文章格式是什么样子、每个部分应该囊括什么内容。我相信大家的起点比当初的我要高很多的,很多同学可能经过了一些专业的培训,看了很多学术论文,也有了一定的论文意识。这个意识也就是论文的分块。我们通常将学术论文分成了七个板块(如下图所示):首先会有一个摘要(Abstract)、引言(Introduction)以及相关工作(Related Work)的介绍,然后介绍你文章的主体内容(理论、模型或算法),接下来会用很多的实验(Experiments)去验证你所表述的核心内容,最后可能会有一些讨论(Discussion)和结论(Conclusion)。可是,对于大多数同学来说,就算熟悉了论文的分块结构,也不知道怎么下笔,加上拖延症晚期的患病史,很多同学会卡在摘要部分的写作上面并为之抓狂一整天。(哇,兰老师,我们在您眼里是透明的吗?)其实这个现象只是一个小小的缩影,因为写一个摘要等同于写整篇文章,那么我们该如何避免呢?

 

03论文写作的灵魂——逻辑

在我看来,学术论文写作本身是一个非常严谨的科学问题,其灵魂也就是“逻辑”:整个论文结构的块与块之间需要逻辑,每一块中段落与段落之间需要逻辑,甚至每一段中句子与句子之间也需要逻辑。那么我们如何把论文的“逻辑”很好的展示给审稿人或者读者?我自己用的是一种叫“3W2H”的写作方法(如上图所示):

  • Why?
    对应论文的动机(Motivation),即:为什么要做这个工作,有什么新颖的发现,以往的工作有什么缺陷,总之让审稿人觉得这篇工作是必要的。
  • What? 对应论文的贡献(Contribution),包括:本文的主要工作,对于社区的帮助,值得展示给大家的内容。
  • How? 对应论文的方法介绍(Theorem& Model & Algorithm),包括:这个部分需要强调你的”招数“厉害在哪里,是如何实现的。
  • How much? 对应论文的实验(Experiments& Discussion),即:展示你方法的效果有多好,写下你的观察并给出你的讨论。
  • What then? 对应论文的结论(Conclusion),包括:这项工作接下来的发展,对社区未来所产生的推动作用。

在完成这个“逻辑树”后,我们便建立起论文的整体逻辑架构。“3W2H”中的每一个元素都不是相互独立的,而是可以相互促进的,你可以在不断思考的过程中,发现其中某个点的不足之处,并加以提升。其实,论文能不能被录取,靠的就是“3W”,所以在平日的写作当中,最重要的是在整理三个W的思路。我相信,只要你把三个W梳理清楚了,就可以把握文章的块与块之间的逻辑关系,就可以很清晰的判断这篇文章到底是不是一篇合格的科研论文。那么,我们如何建立起3W思想呢?建议同学们平日里的每一个工作,就尝试去写一个包含“3W2H”这五个部分的草稿(Draft)。在构建这个Draft的时候,需要确认你要做什么(What),为什么要做这个工作(Why),我这个工作会产生什么样的影响(Whatthen)。这个Draft需要清楚地包含以下几个部分:记录时间,我为什么要做这个工作,现在的理解是什么。在后期的工作中不断的修改与完善这个Draft,总结来说就是我们要不断的站在一个全局的角度去看待你的核心问题,而不是钻入其中一个点无法绕出来,最终导致局部最优。

 

最后,不得不提的就是很多同学在写作时最容易忽略的东西:段落与段落之间、句子与句子之间的逻辑关系。大家是否都有这种习惯:"Obviously,..."或者"Apparently, ...",很多你认为很显然的推导,其实在审稿人那里都不那么显然了。在审稿人或者读者在阅读文章过程中,当遇到其中某一小步无法跨过去的时候,就会产生了疑惑,而当这些小步积累到一定程度的时候,就会对整个文章理解产生很大的偏差。(小朋友,你是否有很多问号?)所以我们在平常的写作之中,如果把握好每一个句子间的逻辑关系,那么整体的逻辑关系一定很明晰,就不会让你的导师出现“生无可恋”的感觉了。

04论文写作中的“小而美”——润色

但论文光有逻辑肯定是不够的,它只能说是一篇合格的论文,并不能表示你已经写出一篇很好的论文了。什么意思呢?大家可能很会喜欢《奇葩说》这个节目,因为节目中讲的道理很接地气,能用一些例子等来激发你内心的一些思考。我们写论文也一样,需要加进一些小而美的技巧,让你的文章显得内容很丰富、很有内涵,也容易读者理解和引起共鸣。下面,我介绍几个技巧。

①善用名言——科学也有科学之美

首先,是论文润色的技巧“善用名言”。比如来自UCLA的朱松纯教授通常会在论文的开头使用名家名句,在这里借用名言有时候是作为论证研究的问题的重要性,有时候是作为引子(即:引出问题和引发思考)。当然,如果想用一两句话,试图成功论证一个庞大的知识体系,那我觉得这可能不是科学,而是神学。就如同对衣服的修修补补需要穿针引线,对于行文思路的描述也需要一个很好的启发式思维,打开你的视角的同时,也启发了读者的兴趣世界。(想要我们推送更多名言的话,比如“上帝不掷骰子——爱因斯坦”,但是左上角却可以关注公众号哦!)

②举例子、做类比——科学来源于生活,立足于实践

第二个技巧是“举例子”,它也非常重要。以我们在AAAI2016发表的文章——“Text Matching as Image Recognition”为例,我们在文章里引入了一种文本匹配的新视角,并建立了一个层次化模型,虽然从文字上表达不是一个很复杂的逻辑概念,但读者却并不容易容易理解什么是“多层次数学模型”,也可能会产生歧义。这时,如果从一个例子入手,详细地解释模型对于整句式如何拆分、判别的,再导出计算方面所对应的数学映射关系,这将是更容易理解的。例如,我们通过使用下图中的三个颜色框来表征论文所提出的“多层次”模型,分别对应单词完全一致的情况,短语的相近匹配(顺序和与语义的打乱),和句子语义的匹配三个层次。

如果说举例子是使自己算法具象化的一种表现,那么作对比分析或者相近的类比分析将会是更有效、更有说服力的方法,并且使你的文章更加特点鲜明。如下图所示,将较为难理解的文本匹配任务与机器视觉中的基础任务(图像识别)进行相似性的类比,以一种互补理解的形式将文本层次和图像层次的抽象关系直接展现在读者面前,这也是大家常用的写作技巧之一。

另外,在论述所研究问题时,不妨立根求源,科学技术来源于生活,解决问题是为了使我们的生活更加美好。所以当写作遇到瓶颈的时候,不妨“行有不得,反求诸己”,只不过这个“己”可能不仅仅是个人意识到的问题,也可能是自然界抛给我们的橄榄枝。

③善用图表——生动形象

第三个技巧就是“善用图表”。图表对于数据的论证和可视化都有着非常重要的作用,在科技论文中,图表肯定是不可或缺的。但如何让图表自成体系地论述清楚文章的研究思路,这就是一个相当富有挑战性的任务了。以来自UC Berkeley的Trevor教授的一篇文章为例(如上图),图中首先以启发式问题引入,然后提出推断模型的反证法,然后根据数据反推,直到得出最后的结论,仅仅一个图就能清晰的突出文章的主要贡献,直观而又生动。这样的话,摘要的文字性综述再加上图表的生动“翻译”,基本在短时间内就可以让读者,建立起对一篇新文章的深刻影响,这将是一个加分项,也非常有利于学术交流。("人类获取的信息83%来自视觉"——心理学家赤瑞特拉。我也要善用名言,现学现用!)

说到这里,我想告诉大家的是,前面讲的这些技巧通常不是分离的,在论文的每一个部分都可以综合使用。比如下面一段话来自我写的一篇文章,它获得了2012年SIGIR最佳学生论文奖。这段话属于论文的motivation部分,用来表达我们想做的研究很重要,综合运用了举例解释、对比、名言和数据支撑等来论证工作的重要性,最后用提问的方式来得出一个结论。通过综合应用这些技巧,给人的印象就会显得比较深入、有层次、有说服力等。

④承前启后——Smooth

承前启后,非常的关键。在较长的论述和算法推导过程中,借用连词以及一些逻辑词,将是文章行文思路的点睛之笔。具体的可以借鉴一些简单的四六级写作的连词,这里简单罗列几个:First,Second,Third,Finally,As a result,Consequently...我最初写理论文章的时候,对于承前启后的意义也不是太理解,觉得自己把理论表达清楚了就行了,后来才明白它们可以使得读者们即使看不懂你说的理论,也可以大致判断出你写的是哪一方面,接下来将要讲什么。这样他读你的文章就会感觉比较顺,并且愿意顺着继续读下去。当然更高级一点的话,就是要让读者觉得你每一句话都是水到渠成的,思路一直被你拽着往前走,不做过多的联想,觉得你说的就是他想的,以至于读起来感觉酣畅淋漓。

05思想、逻辑和文化的融合——语言

除了润色之外,论文写作中的英文语言表达能力也是一个加分项。我们中国人由于并非英文的native speaker,需要考虑到和国外的文化差异。中国人在写作时,特别喜欢用用which、what等等一些修饰语、定语从句等,这要么可能是好显得自己好像很有文化,要么可能就是水平有限、不这样写就写不好。但如果我们仔细去读国外学者的文章,会发现他们的表达风格非常直接,特别善于用一些简单的例子来讲清楚大道理,很少用一些高大上的词汇。我觉得这是需要我们特别注意的,不要刻意追求说一些高深的大道理,而是用真诚、接地气的方式,用小的、局部的例子讲明白你要表达的内容。

06文章的全局高度如何提升——高屋建瓴,点状突围

到这里,你可能会说我的文章已经很有逻辑、思想,也很润色了,但就是觉得高度不够。那很多人就会想到,是不是可以通过写成一个Framework(框架)来显得很高大上一些?我觉得一个工作能成为一个Framework当然是有高度有创新的,但是不能为了Framework而Framework。正如同读博士的意义。上图描述了从本科到博士的过程,等到了博士阶段,便需要在自己的领域的特定研究方向能有一个突围,突出现有研究的局限,但同时又不能忽略了领域已经有的研究所形成框架,也就是说要将自己所进行的工作与现有的领域和研究更加深刻的连结在一起,能够作为一个突出贡献点,对扩宽领域的知识面做出巨大贡献,这将是文章高度的体现。研究工作也是这样的,真正要挖掘自己的工作的价值。举个最简单例子,比如你提出了一个创新,如果能将其他人的工作成果作为其中一个special case,那你确实产生Framework了;或者说你的成果和别人作类比的话,发现相当于步入了另外一个新的发展阶段,那你的工作就高大上了。所以我们不应该为了Framework而Framework,而是首先要努力探索你工作的边界在哪里,随后去发现你可以往哪个角度去推进整个研究工作。

(什么?这么多具体而针对性的干货还不够干?我已经快被你们榨干了啊,委屈巴巴,好吧……祭出压箱底的法宝,请看兰老师接下来的“大招”!)

07把经验转化成能力——复盘

复盘,至少对我来说是分享给大家的最大一招了。它能真的帮你把经验转化成能力。记得当初在微软的时候,刘铁岩老师带我们做了这样一个活动。我们在论文投稿的过程中,基本都会从一篇论文的初稿开始,改很多版本,最终版本和初稿相比基本已经面目全非。那么在论文投稿结束呢?这就是你反思成长的时刻了。我们将最新的版本到最早的版本重新串了一遍,标注出哪些地方改了、为什么这么改,改之前和改之后的差别有多少等,从读者的角度考虑,从自身的角度,也从导师的身上学习,这样就形成了一个累积的笔记。在这个过程中,我感觉非常的受益。

最后,我将一句名言送给大家:“像一个行动者一样去思考,像一个思考者去行动”,知行一定是合一的,在写论文或者研究工作的时候,如果能不断地把思考和行动放在一起,我相信你们一定都会成为写论文的高手。

08回顾总结——提纲挈领,融会贯通

现在,相信大家在读完兰艳艳的经验分享之后,会对如何写好一篇高质量的学术论文产生一些新的启示。这里不妨总结回顾一下前面的内容:有了“3W2H”的论文灵魂审问逻辑,有文章润色的四个经验技巧,有“融合文化和逻辑”的语言表达,有“从面到点”的突破和拔高,有“不断复盘、追问”式的能力增长等。需要提醒大家注意的是,这些经验或技巧,均不是互相割裂的,它们应该在被提纲挈领理解的基础上,彼此融合在一起,渗透进一篇论文写作的各个部分之中。

Q&A

Q: Abstract、Introduction、Related Work和Conclusion四个部分容易混淆,如何区别?

A: 容易混淆Abstract、Introduction、Related Work和Conclusion这些部分,其实是没有抓住各个部分的侧重点,这里不妨,再对科技类文章的组织架构,进行重新解读,做一些简单的“训诂”,以更好地帮助你理解各个部分的突出要点是什么,与其他部分的区别在哪里。

Q: 我的算法改动很微小,如何体现所做工作的创新性等问题?

A:我们的固有印象总是将创新点作为学术研究的卓越贡献,方法上的创新固然会被考虑,但是比起为了“创新”而“创新”,更重要的是你所提出的解决办法,有没有解决原先存在的问题。只要是解决了现有问题并有贡献的,哪怕是很微小的一步,很简单的一步,也是值得称赞的。另外,我们再换一个角度来思考,自然界的规律都是大道至简的,作为深刻影响经典力学的牛顿第二定律,从形式上来说,也是F=ma的线性逻辑。所以用最简单的方法解决最复杂的问题。(在这里,小编推荐大家一句话:"Make everything as simple as possible, but not simpler." - by Albert Einstein。)

Q:论文被拒稿之后怎么办?

A:当论文在一次审稿“杯具”之后,首先要做的是仔细阅读审稿人的意见,看是否对论文的进一步修改有帮助。其次,不要害怕文章被别人看到,更应该反其道而行之,找一些师兄师姐和导师,让他们给你提意见,若他们是此领域的,会给出一些更有针对性的建议,若他们不太了解你的研究领域所做的工作,那么重新组织你的思路,能够给其他学科的人解释清楚自己的工作,这将是自己的条理的完整性的提升一个很好的促进方式。

另外:可以参考本系列第二场直播,以及总结稿件。北京大学施柏鑫老师站在审稿人的立场上,会给出一些审稿人的思考角度,如何与审稿人Rebuttal,这也是一门学问。

Q:如何评价自己的研究工作是有价值的?

A:这方面其实就是我前面“3W2H”中讲的why和what,首先,它们一定是建立在你大量的调研和基础上,比如你肯定需要读很多文章、参加很多分享或讲座,这样才能使得你比较清楚自己研究领域的问题是什么,你已经研究到了什么程度。第二个方面,你还可以通过去请教你的导师、领域专家或者其他比你更senior的一些人,请他们来指导你去形成一些评判。

posted @ 2021-05-26 15:04  Tonarinototoro  阅读(358)  评论(0编辑  收藏  举报