如何读文章
读文章的目的 #
读文章的结果,应该形成如下的知识框架:
- 标题、作者、单位、刊物、年份
- 大问题(任务)
- 小问题(现有方法的不足)
- 解决方案(细节+公式)
- 为什么方案能够有效(或者不使用这个方案是否也能解决小问题?)
- 如何验证(数据集设计、评价指标、实验设计、消融实验)
读文章的方法 #
转一个N年前写的。
选paper #
根据名称、来源、年份、作者、引用数,选取最新的,最有影响力的paper。 名称决定了内容相关性 来源决定了paper质量 年份决定了paper的新颖程度 作者有时候决定了任务的一系列成果 引用数决定了paper的影响力。
读paper #
要“主动”的读paper!!! 要“主动”的读paper!!! 要“主动”的读paper!!! 带着问题去paper中找问题。有助于快速定位要点和快速理解文章。我个人一般是按下面几个要点去探索一篇文章。
-
Task
了解文章要解决的主要问题是怎么样的。 abstract,introduction,conclusion
-
Related Work (有的文章可以把这部分放到最后再读)
针对task,现有工作是怎么做的,有哪些视角和方法。 视角决定了你未来可能采用的方式。 常用的方法奠定了你在这个领域的基础。这些文章也非常重要。如果对这些文章不理解。通常去要发掘其中的关键、经典文章,精读。 abstract, introduction, related work.
-
Motivation
这是为什么有这么一篇文章的关键。要么遇到了新的task,要么是现有task中,现有方法解决不了一些特定的问题。 abstract,introduction,conclusion
-
Method
这与motivation是息息相关的。前面提出了现在有什么问题,那么method就要有相应的解决方案。通常情况下,一个问题对应一个模块,多个问题对应多个模块。 abstract,introduction,conclusion、method/framework
-
验证
所有提出的解决方案,都需要用实验验证其有效性。这依赖于实验设置与实验效果。 实验设置包含数据集、评价指标、baseline。 数据集会有相应的处理,以符合文章task的基本假设。例如,如果文章是解决推荐系统的冷启动问题,那么在数据中,一定会想办法构造冷启动的情况,并加以验证。 评价指标应该是能够评价motivation问题的方案。例如,如果说现有方法在top-5表现不好,那么就会有top-5的各类指标。 baseline应该是SOTA的方法,能够与提出方法做公平对比。可以是子分支的SOTA方法,也就是说它的performance不一定是全部方法中最好的,但是基本接近第一梯队,并且在分支里是最好的。例如,如果改进SVM达到了接近CNN的效果,即便没有超过,也是一篇优秀的论文。 实验效果应该说明提出方法的某个角度的问题。 每一张图、每一个表,都有着作者相应的解释,证明提出方法在motivation上的有效性。或者提出的方法本身的一些特性研究,如泛化能力,子模块的必要性等。 experiments.
-
未来可以拓展的方向
文章通常会给出一些作者考虑的可以继续深入的角度,供参考。 conclusion.
快速扫文章 #
上述是精读一篇文章的方法。如果文章本身不复杂,或是本身对领域比较了解时,可以简化上述过程。读一读abstract,了解1、3、4,即可确定是否需要继续深入了解这篇文章。
略读: 读一读abstract,conclusion,introduction,结合method部分,即可理解文章的概要。