代码改变世界

理工科论文写作心得【待续】

2018-07-07 11:28  bluemapleman  阅读(858)  评论(0编辑  收藏  举报

最近正好在写人生的第一篇期刊论文,过程中磕磕绊绊,一点点从完全不知道怎么下手写,到现在对一篇论文的各个部分该怎么写有了初步的体会,在此记录下来,以供日后有需要时回头参考。

PS:
1.这里的理工科论文所指代的就是一般情况下需要做科学实验以验证某个假设这种类型的论文。
2.此处暂且只谈论文的写作,不是谈做研究的整个过程,做研究还包括敲定论文的研究方向,和写论文前预先做实验的工作。

先来张提纲挈领的图(来自知乎用户Zeth的帖子):

这里写图片描述

论文的框架

首先论文是有一个比较标准的框架的,即应该包含哪几个部分的内容,一般来说,按照先后顺序会分成以下几个部分。

  • Abstract
  • Introduction
  • Literature Review
  • Methodology
  • Experiment (and Results)
  • Discussion
  • Conclusion

下面我们就各个部分写什么内容来做一下介绍。

Abstract

摘要(Abstract)是对整个文章正文部分的总结,包括文章的研究背景,具体研究问题/研究目标,实验所用数据集来源及大小,分析方法/实验模型,以及对最后结论的简要介绍。

注意:【实际情况中,由于摘要是总结性质的,所以往往是在论文的正文部分写完之后才会写。】

当然这里要注意的一点是,既然是简要介绍,那么就是要保证表达比较凝练,要非常简要地把所要求的各个条目覆盖到,但都不能发散。

  • 研究背景/意义 background/meaning

    我们写论文就是为了讲清楚一个研究问题,而我们研究任何问题一定是有研究它的比较实际的意义(否则就没有写论文的必要了),而这个意义往往是基于当前某个领域的的某个具体问题的发展情况来谈的。换言之,当我们谈背景,就自然会引发出研究该问题的意义。

  比如说,我们写我们发现的一种用机器学习做更为准确的证券价格趋势预测方法的介绍论文。

  当前的实际背景是:对于目标证券价格的预期,是证券交易参与者确定自身交易行为与交易策略的基本依据。但由于证券价格序列本身的非平稳特征,以及个人所得信息的有限,如何做到短期内比较准确的价格预测一直是一个非常困难的问题。已有的传统预测方法包括基本面分析,技术分析和模型分析,但是这些现存方法的表现都不能让人满意(大背景)。近年随着计算机科学与统计学理论的发展,机器学习逐渐成为热门的研究领域,且已经在许多涉及预测工作的实际问题中取得了远超传统方法的不俗表现。(小背景)

  那么我们的研究问题比较显然的意义就是:通过对机器学习方法的引入,实现了在相同情形下,超越以往大部分传统预测方法的预测精确度。(其实也就是要针对背景中的现存问题的回应)

而我们在写这一部分时,思路一般就是:研究问题所属领域的大致发展状况,然后研究问题的相关具体发展情况(这里必然是存在某个研究漏洞需要弥补),然后就可以说“我们为了弥补这个漏洞,研究了XXX问题。“

承接上面证券价格预测的例子,研究背景的写作示例:

对于目标证券价格的预期,是证券交易参与者确定自身交易行为与交易策略的基本依据。但由于证券价格序列本身的非平稳特征,以及个人所得信息的有限,如何做到短期内比较准确的价格预测一直是一个非常困难的问题。已有的传统预测方法包括基本面分析,技术分析和模型分析,但是这些现存方法的表现都不能让人满意。近年随着计算机科学与统计学理论的发展,机器学习逐渐成为热门的研究领域,且已经在许多涉及预测工作的实际问题中取得了远超传统方法的不俗表现。
  • 研究问题/研究目标

    研究问题其实就是顺接着上面的背景/意义部分,自然会被提出来的。这里又单独列示是为了强调摘要是必须明确写明本文的研究问题的。

    承接上面的证券价格预测的例子,此处我们的研究问题就是:

      是否可以通过将机器学习方法引入到证券价格预测之中,实现超越所有已有预测方法的精确度的预测。
    
  • 数据集

    既然是理工科论文,一般都会涉及在数据集上做实验。而摘要中也需要简明地介绍你所用数据集的来源,大小,以便读者看你的文章能快速确定你是在什么数据上做文章。

    承接上面的例子,此处我们的数据集可以是:

       我们搜集了多支知名国际股票指数在2010-2017年期间的周收盘价序列。
    
  • 分析方法/模型

    这里就是文章最核心的部分,即我们落脚如何实现文章意义的部分。

    因为研究背景,研究问题往往不是一篇论文独有的东西,它可以套用到很多相似的论文上面,但是你所用的一整套的分析方法,或者你设计提出的一套解决问题的模型,才是真正决定你的文章在该领域有学术价值所在。

    承接上例:

    通过从证券价格的序列中提取技术指标作为输入特征向量,我们使得机器学习模型也可以进行证券价格的预测工作。
    
  • 结论

    简要地说明一下文章结论,即针对上面提到的研究问题的回答。这个部分也是为了让读者快速了解你在这个问题上到底最后做得怎么样。

    承接上例:

        对比机器学习模型与传统方法在相同国际指数数据集上的表现后,我们发现机器学习模型确实实现了远超传统方法的预测精度。
    

Introduction

引入【Introduction】,此部分的内容主要是对于研究问题背景的引入,即一个逻辑链从大到小说清楚为什么要研究这个研究问题(或者说当前已有相关研究的缺陷/gap在哪里),归根到底是要落脚到研究问题的意义上。(往往还会在最后包含对于文章后面的文本结构的简要介绍。)、

这个部分为了辅助说明,会需要开始引入一些文献,以佐证你说的每一个观点,进而达到使读者觉得跟着你的逻辑链走下来,到你的研究问题是顺理成章的。

Literature Review

文献回顾(Literature Review),是铺陈你为了解决研究问题,所阅读参考过的相关文献的整理与总结。

这个部分一定会要求引用比较大量的文献,因为就是做相关文献的回顾,以说明你所研究问题的当前发展情况。

比如我的研究问题是将机器学习引入证券价格预测是否能够有更高的预测精度,那么我可能就需要阐述以下相关情况:

  • 证券价格预测的传统方法/模型有哪些
  • 传统预测方法的效果如何/已经做到何种程度了
  • 机器学习方法的应用场景,以及具体的突出之处。
  • (如果有)已有的将机器学习引入到证券价格预测问题中的研究是怎么做的,效果如何。

每一个要点都需要有若干文献的支撑,这是规范。

Methodology

Experiment (and Results)

Discussion

Conclusion

论文写作的顺序