如何读文章

如何读文章

读文章的目的 #

读文章的结果,应该形成如下的知识框架:

  1. 标题、作者、单位、刊物、年份
  2. 大问题(任务)
  3. 小问题(现有方法的不足)
  4. 解决方案(细节+公式)
  5. 为什么方案能够有效(或者不使用这个方案是否也能解决小问题?)
  6. 如何验证(数据集设计、评价指标、实验设计、消融实验)

读文章的方法 #

转一个N年前写的。

选paper #

根据名称、来源、年份、作者、引用数,选取最新的,最有影响力的paper。 名称决定了内容相关性 来源决定了paper质量 年份决定了paper的新颖程度 作者有时候决定了任务的一系列成果 引用数决定了paper的影响力。

读paper #

要“主动”的读paper!!! 要“主动”的读paper!!! 要“主动”的读paper!!! 带着问题去paper中找问题。有助于快速定位要点和快速理解文章。我个人一般是按下面几个要点去探索一篇文章。

  1. Task

    了解文章要解决的主要问题是怎么样的。 abstract,introduction,conclusion

  2. Related Work (有的文章可以把这部分放到最后再读)

    针对task,现有工作是怎么做的,有哪些视角和方法。 视角决定了你未来可能采用的方式。 常用的方法奠定了你在这个领域的基础。这些文章也非常重要。如果对这些文章不理解。通常去要发掘其中的关键、经典文章,精读。 abstract, introduction, related work.

  3. Motivation

    这是为什么有这么一篇文章的关键。要么遇到了新的task,要么是现有task中,现有方法解决不了一些特定的问题。 abstract,introduction,conclusion

  4. Method

    这与motivation是息息相关的。前面提出了现在有什么问题,那么method就要有相应的解决方案。通常情况下,一个问题对应一个模块,多个问题对应多个模块。 abstract,introduction,conclusion、method/framework

  5. 验证

    所有提出的解决方案,都需要用实验验证其有效性。这依赖于实验设置与实验效果。 实验设置包含数据集、评价指标、baseline。 数据集会有相应的处理,以符合文章task的基本假设。例如,如果文章是解决推荐系统的冷启动问题,那么在数据中,一定会想办法构造冷启动的情况,并加以验证。 评价指标应该是能够评价motivation问题的方案。例如,如果说现有方法在top-5表现不好,那么就会有top-5的各类指标。 baseline应该是SOTA的方法,能够与提出方法做公平对比。可以是子分支的SOTA方法,也就是说它的performance不一定是全部方法中最好的,但是基本接近第一梯队,并且在分支里是最好的。例如,如果改进SVM达到了接近CNN的效果,即便没有超过,也是一篇优秀的论文。 实验效果应该说明提出方法的某个角度的问题。 每一张图、每一个表,都有着作者相应的解释,证明提出方法在motivation上的有效性。或者提出的方法本身的一些特性研究,如泛化能力,子模块的必要性等。 experiments.

  6. 未来可以拓展的方向

    文章通常会给出一些作者考虑的可以继续深入的角度,供参考。 conclusion.

快速扫文章 #

上述是精读一篇文章的方法。如果文章本身不复杂,或是本身对领域比较了解时,可以简化上述过程。读一读abstract,了解1、3、4,即可确定是否需要继续深入了解这篇文章。

略读: 读一读abstract,conclusion,introduction,结合method部分,即可理解文章的概要。