如何读论文？

转载自：https://www.bilibili.com/read/cv14189252?from=note，参考：https://www.bilibili.com/read/cv14172121?from=note；https://www.bilibili.com/read/cv14360379?from=note； https://www.bilibili.com/read/cv13657929?from=note；

论文的结构

1、标题

2、摘要

3、导言

4、算法

5、实验

6、结论

三遍读一篇论文

1、第一遍

标题 =》摘要 =》结论

主要了解题目是什么，是否跟自己相关
然后看摘要（简要介绍论文在做什么）
直接跳到结论（结论通常和和摘要是一样的，摘要里面可能提出了一两个问题，用一些实际的结论、实际的数字证明一下）

读完这三个部分，大概就知道论文讲的是什么，可以跳到一些实验部分、一些关键的图和表，也可以看一眼在方法中的图和表在干什么

这一遍通过十几分钟的时间，大概就知道这篇文章大概讲什么，质量怎么样，结果怎么样，方法看上去怎么样，最重要的是是不是适合自己，再决定要不要继续读下去

2、如果觉得有必要继续往下读，就进行第二遍阅读

第二遍对整个文章过一遍，然后知道每一块在干什么东西，可以沿着标题一直往下读到最后

不必太在意很多细节（公式证明等一些很细节的部分可以忽略掉），重要的是搞清楚那些重要的图和表都是在干什么，比如：

方法中整个流程图长什么样子
算法的图长什么样子
实验里面每张图的x轴在干什么，y轴在干什么，每个点是什么意思
作者提出的方法和别人的方法是怎么对比的，之间差距有多大等

不必特别理解作者的意图，可以留到最后

这一遍大概对整个论文的各个部分都有一个大概的了解，中间可以把相关的文献圈出来（作者做某一个问题，这个问题是谁提出来的，然后又是在谁的方法上改进上来的），如果发现引用的重要文献没有读过的话，就把它圈出来

这一边读完之后，再决定要不要继续精读，有可能就到此为止了，知道他解决了什么问题，结果怎么样，大概用了什么方法

如果觉得文章太难了读不懂，可以去读他之前引用的那些文章（之前的工作），读起来门槛可能更低一点，读完之后再回过来读这一篇文章

如果觉得不需要了解那么深，可能做的方向跟这个不一样，了解即可

3、如果觉得还可以继续往下走的话，就可以进行第三遍阅读

第三遍是最后一遍也是最详细的一遍，需要知道每一句话在干什么，每段在说什么：

可以想象在读这个文章的时候在脑子里不断地去重复这篇文章
或者说提出什么问题用什么方法来解决这个问题，然后去想如果是我来做这个事情的话怎么办，我可以用什么来实现这个东西或者说在做实验的时候我应该怎么做
也可以说是如果换成我自己来做的话我应该怎么做，能不能比他做得更好
或者说作者说这个文章有些地方没往下走的，留到之后的结果了。如果我来做的话，我是不是能够往前走

这一遍最关键的是知道每一句话在干什么，而且能够脑补一下他的整个过程是什么样子的，就好象是自己再做一遍一样

看完这一遍之后大概是对整个论文的细节都比较了解了，关上文章大概也能回忆出很多细节的部分，然后在之后再基于它做研究，或者说之后再提到它的时候可以详细地复述出来

读论文的三个阶段中

第一遍耗时最少，做海选
第二遍的时候对相关的论文做一部精选
最后一遍就是重点研读的一些论文

如何读论文【论文精读】

——分享读论文的小技术

论文的结构

00:31

视频源不见了，标记失效

title(标题)

abstract(摘要)

intro(导言)

method(提出的算法)

exp(实验)

conclusion(结论)

当然可以可以从头读到尾，但是论文这么多时间划不来，而且适合的文章可能就一小部分，需要快速找到适合的文章，并对他进行精读

01:03

视频源不见了，标记失效

怎么样花三遍读一篇论文

01:22

视频源不见了，标记失效

第一遍：

需要关注标题【了解这篇论文是不是跟自己相关】；

摘要【简单的介绍这篇论文在做什么】；

然后直接跳到结论【通常跟摘要是一样的，但是把摘要中提到的一两个问题用一些实际的结论，实际的数字证明了一下】

然后可以跳到实验部分看一些关键的图和表；

然后也可以去瞄一眼在方法里面的图和表；

这样大概可以通过十几分钟的时间就可以知道这篇论文在讲什么了，质量怎么样，结果怎么样，方法怎么样，是不是适合自己，从这里就可以决定要不要继续读下去，要读的话就走第二遍。

第二遍：

对整个文章过一遍【从标题一直往下读到最后】，知道每一块到底在干什么东西；

这时候不用太注意很多的细节，公式、特别的证明或者一些很细节的部分可以忽略掉

主要是搞清楚重要的图和表，知道每一个字都在干什么【流程图长什么样子；算法的图长什么样子；实验里面每张图的x轴y轴在干什么，每个点是什么意思；作者提出的方法跟别人的方法是怎么对比的，之间的差距有多大】

这时还没有特别没有搞得懂他在干什么，这个可以标记，留到之后

在这一遍大概对整个论文的各个部分都有一个大概的了解，可以将相关的文献圈出来【作者根据其他的观点提出来的，或是改进的等等，这些文献没有读过的话可以圈出来】，读完之后就可以继续判断要不要继续往下读，

P.S. 若到此为止：知道他解决什么问题，结果怎么样，大概用了什么方法，但是觉得文章很难看不得懂，可以去读他们之前引用的那些文章，读完之后再回头读这篇文章

第三遍（最详细的一遍）：

在这一遍需要知道每一句话在干什么，每一段在说什么；在大脑中脑补整个过程是怎样的，使得自己想做过了一样；

在读的过程中，思考自己来完成作者所提出的问题时需要怎么做，需要用什么方法来实现这个东西；在读实验部分时，思考自己能不能比作者做的更好；作者留下的问题，思考自己能不能继续往前走

在这一遍对整个文章的细节都了解，可以回忆的出文章很多细节的部分，然后在之后基于他做研究，或者在之后提到它的时候，可以详详细细的复述一遍。

第一遍是做海选；第二遍对相关的论文做精选；第三遍重点研读一些论文

小作业：深度学习浪潮的奠基作之一，[ImageNet Classification with Deep Convolutional Neural Networks](https://papers.nips.cc/paper/2012/hash/c399862d3b9d6b76c8436e924a68c45b-Abstract.html)

这个方法很接近吴恩达说的。https://mp.weixin.qq.com/s/WS079LD8EfEbC-RBy2JHYg

作者：爱喝水的崩奔 https://www.bilibili.com/read/cv13467043?from=note 出处：bilibili

可以看看datawhale这个组织做的transformers的教程，github链接：https://datawhalechina.github.io/learn-nlp-with-transformers/

另外可以尝试给pencil加一个指尖套😂写起来会舒服很多（个人小建议，不是这个评论的重点😁）

我个人一般先扫一遍abstract，然后Ctrl f找关键字，然后读conclusion，然后再联系关键字，联系自己需要的内容，但我的专业所读的论文不需要很多的计算图标公式等等，可能和大家的方法不一样。

https://web.stanford.edu/class/ee384m/Handouts/HowtoReadPaper.pdf

省流助手：先读摘要，然后看结论，符合需求看实验和方法，看不懂就去看里面引用的文献。

自荐一下：https://zhuanlan.zhihu.com/p/403433120。里面有整个方法的实现过程说明，提供的样例代码可直接运行，里面图文都很用心（刚写好一个月，已经92个点赞，368个收藏）。希望对您有帮助。

想和各位以及沐神探讨，我每次都是看完abs后不看exp部分直接看method，如果是很熟悉的领域大概十分钟就读完了。这样会不会有什么弊端？我自己这样做的理由是，我觉得一篇文章它既然发出来了，肯定结果很好，不好的结果也不会放出来（我顶多也就看一下那个对比sota的performance表格）。我总感觉，真的要想知道这个algorithm适不适合我的project，得上手跑了才知道。

第一遍：关注标题、摘要、结论，看是否自己研究的相关。看完之后可以看部分实验和方法里的关键图和表，进而判断这篇论文是否适合自己

第二遍：忽略部分细节，看懂重要图和表里的每个词，方法对比等。圈出部分重要文献。看懂文章针对的问题、解决方法、效果怎么样

第三遍：最详细的一遍，知道每一段和每一句干什么，脑补过程、换位思考

Titile
2. Abstract
3. Introduction
4. Method
5. Exp
6. Conclusion

第一遍
1. Titile
2. Abstract
3. Conclusion
4. 简单看下method和exp的图表

第二遍：过一遍整个文章
1. 不用太在意细节，例如公式等
2. 要看懂图和表在干什么
3. 流程图是什么样
4. 算法大体是什么样
5. 结果中的图是什么样
6. 方法是如何与别人对比的，差距多大。
第三遍：是否需要往下精度？（如果研究相关的话，可以往下继续深读）
1. 最详细的一遍，每段话在说什么？

李老师，你好，我有一个关于目标检测方面的问题，请问您：在我训练模型的时候，如果训练集中加入了一些无检测目标的图片，全是背景，这样的图片在模型训练的时候会影响模型的结果吗？（我理解的答案是不会，主要是因为没有办法计算损失，看到有文章说会影响模型结果，那怎么影响的各位有答案吗，）如果李老师有时间，希望为我解答一点。十分感谢。如果有其它同学有答案，也希望能给我一点解答。十分感谢。

如何将读论文和看懂代码相结合呢，我研究生入学一年了，论文看得也不少，但对于理解源代码，再加上融合自己的想法进行实现还是很困难，之后老师会结合代码讲论文吗？

你要理解原来算法的原理，精确到tensor过了某一层以后形状发生什么变化了。然后还要对你代码用到的框架有一定的认识，不需要到源码级别的认识，至少知道如何搭建一个基本的框架，一个tensor你能把它变着法转，哪里的参数不用梯度更新能够给他no_grad掉。完事儿找一个baseline，我相信这个你已经有了，但是不知道怎么改对吧。先跑通，跑通以后试验各种参数，比较结果，然后设断点，一步步debug，看tensor的shape变化，看调用了哪些函数。完事儿，找到最关键的主类或者py文件，也就是这份代码对应的论文的核心。这个时候如果你对代码框架有比较好的认识，其实有基础就行。你就看看从main函数开始，一直到调用这个主类模块，经过了哪些，就是数据怎么读取的，做了什么预处理，什么时候变换了属性和形状，到哪儿进入的网络，从这个点开始，基本就是你要修改的代码，如果你有思路修改，就复制一份你要修改的代码，手边准备一张纸，左边是原来的网络结构，右边你可以画你想的网络结构，先把代码中每一行在纸上网络结构对应上，可以直接标记行号，其实到这里，就知道最小的代码粒度和论文中算法最基础的“一步”对应关系。我这里说的修改网路结构，其实你要是想改公式实现，想引入新的变量都差不多如此。因为在论文中，在你的理解中，不会精确到代码最小粒度，我说的代码最小粒度，就是你debug过程中每走一步的变化。当然你要是想随便搞一搞，就加点层数，扩宽宽度，在别人的基础上加点trick，还有一个思路，就是去找你这个方向，有关系的两个工作，就是最近的论文是在前一篇论文的基础上做的改进，时间间隔越短，关联性越强越好，这个应该不难吧。完事儿，两篇论文打印好，一左一右，找到对应的代码，最好用的同一框架，也用的相同数据集，这个应该很正常吧。两份代码也一左一右，然后照着读吧，论文理解透了以后，就在代码里找不同吧，看看最近这个作者怎么折腾前人的代码，最后，把这些代码改进的地方用你自己的语言记录下来，把最近这份代码关了，复制一份前人的代码，按照你记的改进的笔记，一条条用你的思路改，不要求一定完全相同，至少改完能跑起来，效果差点没事，万一你效果比最近这个作者还好，这可能就是一个改进的trick。综上，给你泼点冷水，不要一上来就觉得自己看点论文跑点线程baseline就有好多想法，说白了都是laji，你要抱着这种心态看呆你实现不了的laji，然后抱着学习的心态看待前人工作，不要觉得我想了个新想法就一定比前人强，你也不要孤立的看待每一份工作，多找找关联，多找找不同，这些关联就是后人的idea来源，这些不同就是后人如何把自己的idea加到程序里。先去学，不要动不动就实现自己的idea，有了记下来，一个月你可能记下来100个，找个时间一个个划拉，划拉的时候这里边可能这个和那个能组合，最后就剩下一个了，再开始大干一场。这个过程中干嘛呢？就按我说的，找几篇人家的工作，论文过完就开始找代码的不同，你这样搞仨月再去实现自己垃圾堆中剩下的那个idea，才是一份有价值有意义的工作。不然你即使够呛学会改程序，也会迷失在你所谓的idea垃圾堆里。

网友讨论：

吴恩达有一个讲读论文的视频说刚接触一个领域的时候related work可以跳过, 一方面不了解, 另一方面这一部分有可能是为了讨审稿人欢心, 故意引用了很多文章(有可能引用到审稿人的).

沐神，感觉这种重读经典论文的感觉确实很好，因为自己入行较晚，很多经典的东西都是看了别人的简单讲解囫囵吞枣就完事了，没有采取过这种回归当年的视角，看了视频后确实受益匪浅。
不过我不知道大家有没有这样的疑惑，就是做研究的时候怎么去追SOTA，读了别人的文章怎么去发现里面的新坑，然后迁移一些其他方向的知识过来做点创新工作。希望沐神能选两篇有这种连贯性的文章，简单讲讲第二篇是怎么样follow第一篇的工作，同时准确定位到能创新的点的。毕竟能做Alexnet这样划时代的工作的是少数的，而且下一个划时代的工作也需要这种incremental research一点点积累的厚积薄发，所以感觉这种能力也挺重要的。

你可以从overfeat-rcnn-fastrcnn-fasterrcnn这种文章读过来感觉，效果比较好，不过更希望沐神能带我们一起读‘

沐神说过拟合代表深度学习的一个派别，深度学习说可以用很大的模型，通过正则使得不要过拟合，这个也是当时流行的观点，但在现在，大家好像都在说正则好像不是很重要，更关键的是神经网络的设计，使得你在没有很好的正则情况下也一样能训练出来，但这也是新的方向。为什么正则不重要了呢？因为不用正则也可以避免过拟合了，因为你有很多方法防止过拟合，比如Batch Normalization. 我说一下我读的paper观点（大家批判阅读），正则化技术对网络泛化从经验上确实有提升，但是网络泛化性能不起决定性作用（而且Batch Normalization在paper作者眼中就是一种隐式正则）。

还想请教一下老师或者是大佬们，研一刚开始读论文要做代码复现，然后将代码中的数据模块改成导入自己的数据集，再加上对论文代码中的模型的修改，这个可以有具体的讲解吗？读代码和改代码感觉还是对新人不是很友好😭，代码有点看不太懂，该怎么着手去学着改代码呢？这个感觉如果赶时间的话，先看看整体别人的代码架构（略读，注意看注释），找到模型里面需要改动的部分，弄清楚接口（函数、类的传入和输出）和重要张量的形状和意义，明白做了哪些操作，对着这一部分需要的部分改就行了…有空再去精读其他的部分，学习代码写和软工的思路…，我大概现在这么体会的…也期待沐神的指点。我是天坑近年跳出来的计算机研一，代码能力也比较差，我在复现论文时会找一些有代码的论文然后弄清他们的输入输出数据，顺畅的跑下来一趟以后使用自己的数据集，一步一步学着怎么把原始数据集调整成输入的形式，面向接口编程（笑哭，感觉挺有效率的，大段代码现在就弄清几个调用和每块的目的，没有看详细的细节，现在复现了一些以后可以比较快的找到代码段间的关系，就会深入一些比较短的模块，每行加注释弄清是干什么的，感觉按行标几次代码自己也能写出来了，这是我的体会，大三之前没接触过任何计算机相关课程，希望对题主有帮助，也希望题目会引起老师的注意，期待老师的指点。但是接触工程代码小项目就能动不动几千行上万行，导师又push的紧…每个算法都读一遍真的不现实…我还是觉得挑重点的好，我自己接触最多的就是一万多的一份asem，要我继续写和完善，我的做法就是尽可能分清楚那些部份做完了，自己画思维导图速度过。对感觉这也是蛮好的思路学到了，画画思维导图还是特别有用的（今天数位板刚到，总算可以方便画了，面向接口编程加一可能这就是类写得好的代码带来的福利吧哪天我开源出来的代码也能这么优美呢xmsl 。

我当时花了点时间学会pycharm上用服务器远程解释器debug。然后coding技能
就直线上涨。学会看代码结构，分模块看，比如哪些是训练代码，哪些是测试代码，哪些是数据读取预处理，哪些是模型结构，先把块划分一下再看细节，一般先从trian.py或test.py看。学会看代码结构，分模块看，比如哪些是训练代码，哪些是测试代码，哪些是数据读取预处理，哪些是模型结构，先把块划分一下再看细节，一般先从trian.py或test.py看。说说自己的经验，注重输入和输出，快速理解函数的含义。然后按照这个思路从大到小，从行为去理解一个模块，然后确定这一模块很重要再深入。写代码同理，先给目标，拆解这个目标有几个部分，拆解到自己能够实现就可以。iPad➕Apple Pencil yuds。

goodnotes，好像是4代，沐神没升级吧可能。

可以看看datawhale这个组织做的transformers的教程，github链接：https://datawhalechina.github.io/learn-nlp-with-transformers/
另外可以尝试给pencil加一个指尖套写起来会舒服很多（个人小建议，不是这个评论的重点😁）
自荐一下：https://zhuanlan.zhihu.com/p/403433120。里面有整个方法的实现过程说明，提供的样例代码可直接运行，里面图文都很用心（刚写好一个月，已经92个点赞，368个收藏）。希望对您有帮助。
你要理解原来算法的原理，精确到tensor过了某一层以后形状发生什么变化了。然后还要对你代码用到的框架有一定的认识，不需要到源码级别的认识，至少知道如何搭建一个基本的框架，一个tensor你能把它变着法转，哪里的参数不用梯度更新能够给他no_grad掉。完事儿找一个baseline，我相信这个你已经有了，但是不知道怎么改对吧。先跑通，跑通以后试验各种参数，比较结果，然后设断点，一步步debug，看tensor的shape变化，看调用了哪些函数。完事儿，找到最关键的主类或者py文件，也就是这份代码对应的论文的核心。这个时候如果你对代码框架有比较好的认识，其实有基础就行。你就看看从main函数开始，一直到调用这个主类模块，经过了哪些，就是数据怎么读取的，做了什么预处理，什么时候变换了属性和形状，到哪儿进入的网络，从这个点开始，基本就是你要修改的代码，如果你有思路修改，就复制一份你要修改的代码，手边准备一张纸，左边是原来的网络结构，右边你可以画你想的网络结构，先把代码中每一行在纸上网络结构对应上，可以直接标记行号，其实到这里，就知道最小的代码粒度和论文中算法最基础的“一步”对应关系。我这里说的修改网路结构，其实你要是想改公式实现，想引入新的变量都差不多如此。因为在论文中，在你的理解中，不会精确到代码最小粒度，我说的代码最小粒度，就是你debug过程中每走一步的变化。当然你要是想随便搞一搞，就加点层数，扩宽宽度，在别人的基础上加点trick，还有一个思路，就是去找你这个方向，有关系的两个工作，就是最近的论文是在前一篇论文的基础上做的改进，时间间隔越短，关联性越强越好，这个应该不难吧。完事儿，两篇论文打印好，一左一右，找到对应的代码，最好用的同一框架，也用的相同数据集，这个应该很正常吧。两份代码也一左一右，然后照着读吧，论文理解透了以后，就在代码里找不同吧，看看最近这个作者怎么折腾前人的代码，最后，把这些代码改进的地方用你自己的语言记录下来，把最近这份代码关了，复制一份前人的代码，按照你记的改进的笔记，一条条用你的思路改，不要求一定完全相同，至少改完能跑起来，效果差点没事，万一你效果比最近这个作者还好，这可能就是一个改进的trick。综上，给你泼点冷水，不要一上来就觉得自己看点论文跑点线程baseline就有好多想法，说白了都是laji，你要抱着这种心态看呆你实现不了的laji，然后抱着学习的心态看待前人工作，不要觉得我想了个新想法就一定比前人强，你也不要孤立的看待每一份工作，多找找关联，多找找不同，这些关联就是后人的idea来源，这些不同就是后人如何把自己的idea加到程序里。先去学，不要动不动就实现自己的idea，有了记下来，一个月你可能记下来100个，找个时间一个个划拉，划拉的时候这里边可能这个和那个能组合，最后就剩下一个了，再开始大干一场。这个过程中干嘛呢？就按我说的，找几篇人家的工作，论文过完就开始找代码的不同，你这样搞仨月再去实现自己垃圾堆中剩下的那个idea，才是一份有价值有意义的工作。不然你即使够呛学会改程序，也会迷失在你所谓的idea垃圾堆里。

花三遍，读一篇论文
第一遍（花时最少，做海选）
第一遍读论文的时候，需要去关注标题和摘要
读完摘要之后，直接跳到结论这边
读完这三个部分，大致就知道这篇论文是在讲什么东西了
第二遍（对相关论文做以进一步精选）
第二遍里面我们就要对整个文章完整过一遍，然后知道每一块到底在干什么东西，我们可以沿着从标题一直往下读到最后，但是这个时候也不需要注意太多的细节，以及一些公式的证明等等。
关注的地方
第二遍阅读的时候，最重要是搞明白那些重要的图和表，都要知道他每一个字在干什么事情
作者提出的方法和别人提出的方法是怎么进行对比的？之间差距有多大？这个时候可能你还没有特别搞懂他在干什么。但是不要紧，你可以将不懂的地方标记下来，留到之后第三遍进行阅读
达到的效果
第二遍阅读完之后，你就对整个论文的各个部分，都有一个大概的了解，中间可以把作者引用的别人的相关文献圈出来，比如作者是在某某某的方法上进行了改进，做了哪些改进之类的。这里需要注意的是，如果你发现作者引用的这些重要文献是你没有读过的，那么你需要把它圈出来，作为你的稍后阅读清单
对后续的影响
这一遍阅读之后，你需要再继续思考一下这篇论文的质量以及和自己研究方向的契合程度，决定一下自己要不要进行第三遍的完完全全彻底的精读
第三遍（重点研读）
第三遍是最后一遍了，也是最详细的一遍，这里就需要自己知道每一句话在干什么，每一段在说什么
一边读，可以一边在脑子里面思考一些问题：
比如说，如果要是我来写这篇文章，我会如何组织这个结构？
读实验部分的时候，可以思考一下，作者是如何描述自己的实验的，你可以思考，如果换自己来做的话，能不能比作者做得更好？
这一遍读的时候，一定要明白作者每句话，每个字在说什么，并且最好可以脑补出它整个流程是什么样子的，似乎是自己在做实验，写论文一样。如果有困难的话，可以借助思维导图或者流程图这样的工具，把他的整个流程以可视化的形式展现出来，帮助自己理解。

先想清楚目的，带着目的和需求去阅读文献
第一步，文献浩如烟海，先海选找适合的、感兴趣的论文，优先找好的论文，相关领域顶刊和高被引的，先看title&keyword就能排除掉一部分论文了，这是最快速的筛选，半分钟之内完成吧。然后读abstract和conclusion，了解大概是做什么的，有什么结论，10分钟之内完成。
第二步，看重要的图和表，图表相关的文字解释，图表是非常直观且高信息密度的，需要的时间不一定，图表吸引到你了，就接着进入精读阶段，这一步也可以看看实验结果之前的方法，以及前面的intro，可能会发现一些之前的研究基础和前置知识，需要的话点开引文补充相关前置知识，不过同一领域的intro可能差不多，引文文献有很多重复。
第三步，如果找到了对你来说非常重要、质量很高、感兴趣的论文，就开始从头到尾的精读，代入自身去阅读，我会怎么做，我能做什么，他的研究有哪些问题，我还能做点啥来优化、改进、创新？

输入和输出的逻辑不是简单逆序，写文章的逻辑是基于背景，方法和实验，最后得出结论。你第一遍读这篇文章的时候，并不能确定这篇文章是否真正是你需要的，所以先读标题，摘要，结论，比较省时间，后续用得到就按顺序精度，学习其中的方法和实验操作。

第一遍：关注标题、摘要、结论，看是否自己研究的相关。看完之后可以看部分实验和方法里的关键图和表，进而判断这篇论文是否适合自己
第二遍：忽略部分细节，看懂重要图和表里的每个词，方法对比等。圈出部分重要文献。看懂文章针对的问题、解决方法、效果怎么样
第三遍：最详细的一遍，知道每一段和每一句干什么，脑补过程、换位思考

posted on 2022-01-03 19:17 lmqljt 阅读(697) 评论(0) 收藏举报

刷新页面返回顶部

lmqljt

如何读论文？

导航

公告