【Exploring and Thinking】——闵凡老师论文写作课程学习心得

开始之前先给自己打个鸡血吧:

A journey of a thousand miles begins with a single step. 千里之行始于足下。

文章标题

  • 前言
  • 写学术论文前的准备
    • 写什么
    • 如何写
  • 科研工具
    • 排版神器——Latex
      • Latex初体验
    • 翻译助手
    • 词汇搭配
    • 文献管理工具
  • 怎样写学术论文
    • 标题
    • 摘要
    • 关键字
    • 引言
    • 相关工作
    • 算法部分
    • 实验部分
      • 数据集
      • 方法和实验过程
      • 实验结果
    • 参考文献
    • 图表的注意事项
    • 如何对审稿人进行回复
    • 一些关于论文写作的注意点
      • 论文写作从1到N
  • 总结
  • 致谢

前言

作为刚上岸的科研小白,对于看和写论文都正处于迷茫状态。而本帖子是学习了闵凡老师《论文写作》课程之后的心得体会,闵凡老师以幽默风趣的风格介绍了科研论文写作的相关知识,以及一些前人踩过的坑,虽然说并不能立刻达到一个质的飞跃,但是千里之行始于足下,一点一滴的积累也让我收获颇丰。
在此附上老师课程系列配套文字学习材料(保姆级教程),需要的自取https://blog.csdn.net/minfanphd/category_11436381.html。

写学术论文前的准备

万事开头难,在写作之前一定要想清楚自己的研究方向和明确希望达到的目标结果。写作的前提是需要选择一个合适的题目,磨刀不误砍柴工。可以从闵老师提到的What?When?开始思考。

写什么

​写学术论文之前需要确定一个可行的研究方向。这就需要多和自己的导师沟通,导师推荐往往是最优的一个选择。一般来说,导师自己擅长的有积累的领域可以提供的资源和指导也更多。

而对于新的研究方向,除了自己感兴趣以外,重要的是要可行性。方向偏僻不代表不能写出好的文章,而热门的研究方向也未必能写出有深度的好文章。可以多阅读自己领域的前沿文章,看看最新的研究方向和关注点,也可以询问同门的师兄师姐,找到一个合适的切入点,在他们的基础上去创新也是一件有意义的事情。

如何写

文不厌改,反复推敲、细细斟酌才好,好文章都是修出来的。按照计算机的角度来说,论文写作也是一个迭代循环的过程。从有idea开始,就可以立即动笔开始写,珍惜灵光一现的时刻,最好是时常记录。从初稿开始,到最终投出去的稿子,会修改完善很多次。投出去的稿子也可能再次返工修改,所以这也是个漫长的过程,需要做好长期反复修改的心里准备。

修改
修改
倒腾*n次
初稿
第一版
第二版
第n版
终稿

科研工具

排版神器——Latex

工欲善其事,必先利其器。在我本科写毕业论文时使用的是word编辑器,无论是内容排版还是格式调整起来都比较麻烦。特别是遇到修改图的位置的时候,改一张图的格式,全文其余部分都需要再次改动,可谓是牵一发而动全身。

而对于广大的科研工作者,投稿SCI期刊往往给出的是LaTeX模板(毕竟TeX系统是科学出版的事实标准)。总结了LaTeX排版在论文投稿中的优点在于:

  1. 相比于Word排版时需要设置各种复杂的样式外观,使用LaTeX排版,投稿期刊给出了论文模板,我们只需编辑自己的内容即可得到符合期刊要求的外观,只需要我们集中精力编辑正确的内容即可。
  2. 投稿期刊被拒搞转而投稿新的期刊时,只需更换新期刊的模板文件,无需更改原内容,可以节省大量的排版时间。
  3. 公式、图表、参考文献的引用均为自动化编号,使用简洁高效。

Latex初体验

安装TeXLive软件+安装TeXstudio编辑器即可完成安装。学习了关于这个工具的使用方法,如比如cls文件:控制论文的总体格式。bst文件:用于控制参考文献的格式。下载了老师所发的模板实例源文件,打开Texworks,通过编译之后可以看到右边出现的pdf文件,即改即编,非常的方便。如下图所示:

【Exploring and Thinking】——闵凡老师论文写作课程学习心得_第1张图片

翻译助手

  1. 做科研一定要有倒腾的精神。写出一篇好的文章并不是一蹴而就的,而是一个反复折腾的结果。
  2. 科研文章的英文水平并不需要达到太高水平,只需要按照固定的套路(对比古代的八股文格式)写清楚过程再加以润色即可。在修改润色文章时,可以借助谷歌和百度翻译,从英文——>中文——>英文的顺序死磕每一个句子。

词汇搭配

​ 一般而言, 未出现在任何学术论文中的单词, 不可以使用。除此之外,在英文写作过程中可能会遇到各种语言上的障碍,我认为主要分为两种:

  1. 词组搭配是否存在
  2. 词组搭配是否地道

可以借助https://www.linggle.com ,通过对英文搭配进行概率统计,为我们提供可供选择的可用搭配。比如:present a method后面的介词搭配到底是for还是to?如下图所示:通过查询可以看到present a method for这个表达更常见。

【Exploring and Thinking】——闵凡老师论文写作课程学习心得_第2张图片

文献管理工具

​俗话说读书百遍,其意自现。对于科研也是一样的,文献管理工具有很多,这里用到的Zotero可以轻松地收集、组织、引用和分享研究资源。可以在我的笔记本电脑、iPad、手机等上同时运行网络服务和离线服务。通过这个工具可以存储和格式化书目信息,还可以组织、标记和搜索这些信息,自动、无缝地从书籍、期刊文章和其他在线资源中提取信息。

怎样写学术论文

阅读!阅读!阅读!

​1.对于刚接触这个领域的小白来说,最好且直接的方法就是借鉴别人优秀的文章,大量阅读高质量的论文,(例如IEEE、TPAMI、AAAI等顶会顶刊文章)。
2. 阅读综述也是一个比较好的选择。综述是针对某一专题,对大量原始研究论文中的数据、资料和主要观点进行归纳整理、分析提炼而写成的论文。阅读综述可以帮助我们建立起来知识结构之后,只有对这个领域有充分了解之后才有idea。
3. 除此之外,阅读顶刊论文不仅能帮助我们对这个领域存在的问题和用过的研究方法有一定的了解,迅速找出切入点,避免和前人的工作重复,这样不仅耽误时间,同时也耗费精力。在这个过程中,我们也能积累一些常用的英文表达和句型。
例如,当在introduction介绍本文工作时,可以用以下的句型,快速选择并完成撰写:

This paper reports on…

The present work deals mainly with…

The primary goal of this research is…

The emphasis of the paper is to…

The present study focuses on…

In this paper, … is discussed/ studied/ presented/ investigated/ described/
4. 科学论文有比较清晰的结构,一般包括:Title(标题)、Abstract(摘要)、Introduction(介绍)、Related works(相关工作)、Your Contribution(贡献)、Support(theoretical or experimental)(支撑、理论、实验)、Discussion(讨论)、Conclusion(结论)、Reference(参考文献)。

标题

标题就是门面,是对一篇论文的第一印象,所以好的标题是非常重要的。总结了一个好的标题应包含如下特点:

  1. 标题要有吸引力,应该能够高度概括一篇论文的创新点以及主要的贡献(提出新的且有效的方法)。做到准确(Accurancy)、简洁(Brief)、清楚(Clear)。
  2. 对于标题长度也有一定的规范性,一般在40-60个词左右。
  3. 标题应该易于理解,不能有歧义。
  4. 尽量少使用base on ,这样会让读者以为是对该技术的简单扩展或应用;通常使用throught,with来表示技术。
    注意题目不能过于笼统,不能出现范围太广,题不扣文的情况。

摘要

摘要即论文提要。摘要需要用简单、明确、易懂的语句高度概括出研究的背景、作者的观点、论文的主要内容、核心问题和方法。摘要的撰写应包含但不限于以下几个方面:

  1. 简单介绍问题背景及其重要性。确定本文的研究领域,所研究的topic。

  2. 现有工作。可以描述解决问题的最新方法。

  3. 本研究领域存在的不足和问题。但是切记批评语气不能过于强烈,不能全盘否定前人的工作。

  4. 本篇论文的主要工作,所作出的贡献和创新点。

  5. 算法的第一/二/三个方面/技术/阶段。

  6. 实验设置。简单概括所用的数据集,实验参数等等,包括数据集的来源和内容。

  7. 实验结果。这里应该强调对比前人所得出的结果应该更加有优势。

  8. 更高层次的贡献(可选)。该论文对其他领域的启发和应用。

    在写摘要时需要注意:

    1. 避免出现已经是常识的内容。
    2. 可以多用被动句,避免出现长句。
    3. 时态一般为一般现在时。
    4. 不用引用,一般不出现公式和图。
    5. 缩写首次出现需要加以说明。

关键字

关键字是对表述论文的中心内容有实质意义的词汇。除了文章标题,关键字也用作计算机系统标引论文内容特征的词语,便于信息系统汇集,以供读者检索,所以关键字也是很重要的。

  1. 高度概括;
    关键字可以列出本文的技术、使用的方法等等。
  2. 关键词最好3~5个;
    除了相关的术语,关键词不能过长。
  3. 关键词应有序;
    关键词的摆放可以按字母的升序排列。

引言

​引言,顾名思义。有一种承上启下的作用,也可看成是对整篇论文的总的表达。论文的引言部分几乎涵盖了本文的所有细节,审稿人阅读摘要后,就是引言。不同于东方的写作风格,这里应将自己的亮点开门见山的表达出来。在引言部分,需要注意以下几点:

  1. 引言可以扩展摘要的每个句子;可以将摘要中的每个句子扩展为引言中的一段,言中每段首句有顺承递进的关系。
  2. 每段5~10句;
    一句大概是50~150个单词。
  3. “开局一张图”,在引言的部分可以整体框架图或者说是算法图,通过该图读者应该能够更快掌握全文主要思想,对论文的技术路线有更深入的了解,一目了然。
  4. 尽量少使用别人的引言,会导致论文查重量上升。

相关工作

相关工作部分有时也可看做是文献综述。重点是突出其他人的工作,这些工作与自己的工作有某种联系。这一部分的阐述可以有以下三种方式:

  1. 按作者
    这种方式加工少,其实就是简单地罗列。
  2. 按年代
    这种方式,按年代整理,算是对发展史的整理。
  3. 分类法(最优)
    最好的是对相关工作进行分类,不要简单地进行罗列,而是要对于列出的要有自己的评价,讨论其优势和重要性,也要描述局限性。使用 gentle words, 避免使用主观词 (very、quite…)。
    引用不要放在句子的开头,也不要让引用充当句子成分。一个地方最多引用3篇参考文献。

算法部分

算法部分可以作为论文的理论支撑,这里的算法描述可以用伪代码。同时需要注意以下几个方面:

  1. 需要明确输入和输出。
  2. 伪代码中只需要显示主要步骤以及注释。
  3. 算法描述篇幅不宜过长和冗余。
  4. 对于基础的复杂度分析,不能犯错误,因为这一类错误
  5. 注意数学表达式和符号(比如向量和标量的表示,如下图所示:)
    【Exploring and Thinking】——闵凡老师论文写作课程学习心得_第3张图片

实验部分

对于理工科来说,所产出的论文需要实验数据和结果作为支撑。因此在这个部分需要详细描述整个实验过程、实验方法以及实验结果。这个部分需要的字数要求也更多,占据的篇幅比较长。这一部分通常包含实验参数设置(数据集)、实验过程和方法、实验结果。

数据集

一个数据集关乎实验的成败。如果数据集良好,那么可以做出鲁棒性较强的结果,如果缺少或者数据集太少,实验结果就没那么有说服力。数据集的部分需要注意:

  1. 数据集的信息要有注释。需要详细阐述数据的来源,数据集简单的介绍。对于缺少数据集的可以合成数据或者进行数据采样来解决该问题。
  2. 可以用表格或者图来展示数据统计信息,特别是对于多个数据集。(如下图所示:表格展示了两个数据集(NLST、TCGA-BRCA)上的统计信息,使得读者一目了然实验数据分布)
    【Exploring and Thinking】——闵凡老师论文写作课程学习心得_第4张图片

方法和实验过程

这一部分需要对实验过程有更多细节性的描述。比如实验具体的参数设置(数据集划分情况、选用的优化器······)

实验结果

实验结果需要描述实验的最终结果,模型比较和性能评估可以选用图和表格来阐述不同的结果。经典的、基本的和最新的方法都应该加以比较。通常使用直方图(对于不同的研究方向所得的模型使用不同的图)进行比较。但数据太多的时候,表格比数字更好。这部分需要注意以下几点:

  1. 内部比较
    必须获得已有算法的源码或者动手实现该算法,对实验结果进行展示。进行内部比较时,需要展示各个参数引起的性能变化。在有很多参数的时候,只讨论最重要的参数。
    如下图所示:在两个数据集上设置不同的参数,所得到的模型精度用折线图表示出来,直观的表述出不同参数下的实验结果。
    【Exploring and Thinking】——闵凡老师论文写作课程学习心得_第5张图片

  2. 外部比较
    进行外部比较时,主要是与现有的方法进行比较,展示主要方法相对于其他方法的优势。用一张三线表格清晰的阐明不同方法不同模型的效果,使得论文的创新结果更有说服力。
    如下图所示:列出了不同方法在这两个数据集上的表现,对于本文所提出的方法,应该加粗加以强调。
    【Exploring and Thinking】——闵凡老师论文写作课程学习心得_第6张图片

  3. 实验结论
    1)实验结论是对实验的总结以及未来可以改进的方向。
    2)结论一般不要太长, 5 句就够了。
    3)如果要讨论说进一步工作,可以列出 3 至 5 条。这一部分不是必须的,但可能是一个加分项,因为在这里提供了新的研究思路,使得相同领域的一些学者可以按照这种思路继续进行研究。

参考文献

在写这一部分的时候,很多人容易掉以轻心,认为论文主体已经完成,忽视了这部分的重要性。恰恰相反,这一部分在毕业论文时常常作为答辩老师抓的痛点,因为细节不可忽视。需要注意的点有:

  1. 以年份为主线的综述也不值得提倡,因为计算机技术更新的太快,每一年可能有许多相关的论文发表出来。并且年份并不能代表技术的更新过程。
  2. 格式需要规范,可以借助一些工具进行导入。例如:endnotes、Zotero等等

图表的注意事项

一幅图胜过千言万语。图片可以直观地解释论文文本中的歧义,让读者或评论者一目了然。表可以列出比较数据,这更令人信服。

  1. 尽量使用矢量图,并确保清晰的缩放(例如EPS格式的图片)。
  2. 选择科学且合适的绘图工具。(例如:Draw.io)
  3. 图注在于将图片解释清楚,无需在意过长。
  4. 在句首引用数字时,务必使用“Figure 1”。在其他地方,“Figure 1”或“Fig.1”的使用取决于图形标题的格式。
  5. 表格应该使用三线表,强调的结果可以用加粗标出。
  6. 表格中的数据格式应该保持一致。

如何对审稿人进行回复

在投出论文到发表,会经历一个评审阶段。审稿人要求我们的稿件修改时,会提出一些意见有助于提高论文的质量,我们需要对审稿人的评论做出点对点的回复。

  1. 有些期刊规定了回复时间,需要在规定的时间范围内进行回复,回复时间不宜过长。
  2. 对于审稿人提出的意见,需要保持一个良好的心态,态度要端正。
  3. 进行点到点的回复,不要顾左右而言他。修改之后可以用蓝色标注出来以突出。

一些关于论文写作的注意点

  1. 一篇论文并非十全十美,但是在总结和展望部分不要给自己挖坑,用词不要太极端。这里的展望如果写得好被引用的次数可能会增加。
  2. 在论文写作中,除了那种已有的公式(欧氏距离、曼哈顿距离等)可以用 “formula” 来描述。自己写的式子,一般叫等式,用 “equation” 来表达。
  3. 空格的错误比较常见,比如标点符号前(后)多(少)空格,参考文献引用的方括号前面没有空格等。

论文写作从1到N

对于毕业来说,虽然一篇足够了。但是对于科研人来说,一时写论文一时爽,入坑了之后尽可能的产出时一件非常有成就感和价值感的事情。如何从1篇到N篇,可以从三个角度来思考和解决问题:

  1. 问题的角度
    这个问题与其他问题有没有关联,解决这个问题是否有意义?
  2. 算法的角度
    前人针对在这个领域做过什么算法研究,方法有什么异同点,还存在哪些不足?
  3. 应用的角度
    这个问题应用于什么领域,在不同的应用中是否能相互借鉴,能否解决一些实际的问题?
    每个角度都根据第一篇论文的内容或者学过的内容进行拓展。如果思路不够宽广,最大的可能是读的文献太少。一篇论文有1-3个创新点就足够了。

总结

  • 通过课程学习,我对科研论文写作有了进一步的理解和体会。一是对科技论文的整体框架有了新的认识和把握。二是积累了论文中每个部分的书写格式和书写经验。
  • 站在巨人的肩膀上做研究,虽然说并不能立马达到一个质的飞跃,但是前人踩过的坑还是能够避免一些的。
  • 本贴作为对课程的总结,希望自己在写得时候时常翻开看看。在交给导师之前自己也能规避一些错误(少挨骂)。

致谢

感谢闵老师的不吝赐教,科研路遥遥,唯有奋斗可抵岁月漫长。

你可能感兴趣的:(学习方法)