深度学习直接缝了别的模型,在论文中这种创新点应该如何描述呢?

作为散养硕士,我们希望能早早发小论文,然后去实习&考公&考编,虽然知道网上大家都说缝模块来水论文,那怎样才能优雅的缝出一篇中稿率更高的论文(即如何更好地讲故事)呢?
简洁版:相似领域找灵感,边试边改勇投稿。

1.怎么找模块?

(1)缝一些常见模块

(2)相似领域比如说,最新的顶刊顶会的通用骨干网络、可以作为你的骨干网络,相似领域的模块,可以作为你其中信息融合或者其他的模块。
多模态的目标检测/语义分割/目标跟踪,行人重识别,红外与可见光图像融合,这些就是相互之间为相似领域。
超分/去雾/去噪/去云/低光增强等里面的模块,都可以作为别的领域的模块。
甚至传统的图像滤波器,如sobel,bilateral等,都可以作为卷积算子嵌入模块中,作为一个子分支,补充某种类型的图像特征。这种具有先验知识的传统+深度学习的方法还是比较受审稿人喜欢的。

2.怎么编故事?
创新无非是:新问题,新方法,新损失,新数据集。
贡献可以是:大的框架+小的模块(可*2)+实验效果。(3到4个点)
论文的框架:(有时候是新瓶装旧酒,换一个说法)往往就是你的这篇论文主打的卖点,即核心要解决的问题,比如现有研究往往会忽略xxx,现有研究通常xxx效果不佳。如果这个问题是别人都没怎么提到过的,就是一个新问题,比如说,红外与可见光图像融合任务中,很少人会想到用低光增强去增强可见光图像。涉及到多任务,也是近年来的热点,多任务就是叠不同任务的模型,有的分开叠,有的合到一起。
新的数据集:符合特殊的研究对象,已有数据集缺乏某种场景,缺乏某些任务标签,更好的为多任务服务。
新的损失:一般适合低层视觉任务,核心是你想让被约束的网络生成啥样的结果,比如想让目标级更好的保留原有模样,结果与mask × 源图像作损失,或者用一些显著性检测网络处理作损失。还有一些感知损失,色彩一致度损失等。

模块的创新:你从哪抄的,就仿照别人怎么写,你只是在别人的基础上进行改进,这个改进作用大不大不重要,重要的是,你多个块包装起来的整体要有比较大的改进(消融实验体现出来),记得“规范”引用别人的论文。

方法上面的创新,个人觉得追热点是很重要的,尤其是近三年(最好就是今年的顶会,如CVPR等,顶刊周期特别长,方法时效性有点差)的相似领域,找那些模块缝合并微调,组合成新的模块,自己命名。改动大就明说受什么启发,改动小就在引言一句带过。这样的方法既有理论基础,又大概率能涨点。好多人直接拿相同领域的老论文的点或者大家用烂了的注意力机制来缝,稍微懂点的都知道你是水论文,怎么就不能好好包装一下呢?
举个例子,丁霄汉大佬提出的结构重参数以及相关的后续工作,包括其他人的后续研究,都可以作为你的其中一个模块的点来用,替换掉多尺度特征提取部分网络,主打一个轻量级网络设计,解决现有算法计算量和参数大,直接用轻量级网络又会性能下降的问题。

同样的,看顶会论文,别人用这样的方法解决这样的问题,你要思考你的领域是否会存在这样的问题,能不能也用这样的方法解决,然后做实验。如果这个过程中发现新问题并解决,那太好了,你的研究就是很棒的。如果没有发现新问题而实验还不错,没关系,这就要看你怎么吹了。如果实验效果不好,思考一下为什么,确实没办法就换一个。

再次重申一遍,是一个大点加俩凑的小点,大点体现在某种新方法新思想,也是论文的主题,核心要讲的东西,为了工作量到位,再去凑一两个小模块,就是那种别人的a+b包装成你提出的c。大点也是从相似领域那里借鉴来的,不是自己想出来的。一定是围绕主题展开讨论,然后顺带搞几个模块让你的方法看起来复杂一点,写起来内容多一点,可能效果好一点。而不是上来就抄几个模块乱缝,咱们是跟模板作文一样,有框架的填素材。
实验效果:对比实验和泛化实验堆量,别人用5个对比算法,你用10个,别人比两个数据集,你比4个。前提还是你的方法整体上是最好的。如果是低层视觉任务(图像增强类型的基本都是),可以做一些高层视觉任务(目标检测,语义分割,显著性检测等)的不同算法对比实验,主打一个卷死同行。(这个非常建议想发一二区的朋友来做)
在计算机领域,一区特别看重好的创新+足够的工作量+写作很规范逻辑很通顺,二区是一些创新+足够的工作量+写作规范逻辑通顺,三区是一般的创新+还行的工作量+写作比较规范基本也到位,四区是各方面中规中矩,论文算是规范。中文期刊看基金、学校和圈子比较多,波动性比较大,中文EI和三区差不多,普通北核跟四区差不多,甚至有时候不如四区。

3.如何画图更专业?
常说的四种图:摘要图,方法图,对比图,消融图。
摘要图:通过一个图来让别人知道你要做什么,有时候是用不同算法对比结果来体现你的方法的特殊性,有时候用指标对比体现你的SOTA。这个一区基本都要,二区弄得好会比较出彩。
方法图:也就是你的网络模型,能放到一张图就不要拆成多个图,太散乱就不知道你在说什么。
对比图:很常规的东西,自己看论文。这里说的是指标,有时候可以用雷达图来对比,会显得又专业又炫酷,但会比较碰运气。
消融图:同上。
一般用visio画,ppt,亿图之类的也很多。

4.论文的结构以及对应功能?
摘要:客观说明整篇论文的工作。
引言:引出问题及自己的工作。
1)任务的目的,意义,应用
2)该领域的研究发展历程,还存在什么问题,甚至解决这个问题的发展过程及出现的新的子问题。
3)自己提出一种新方法,解决这些问题,贡献点1234(一般三到四个)
近期工作:针对这些问题,别人怎么做的,有时候不单单是该领域,可能会涉及到别的领域。从而引出你的方法。
方法:问题描述(有的人会写,分析得比较漂亮),整体方法,单个模块,损失函数。
实验:实验设置(数据集,对比算法,评价指标,实验参数,伪代码流程图等),对比实验(用来训练的数据集),泛化实验(别的数据集),验证实验(高层视觉任务对比实验),消融实验(消掉不同模块,主要是你作为创新点提到的模块)
总结:总结这一系列过程,但存在xx问题(客观且无伤大雅),可能可以怎么解决,未来我们还会继续研究。
补充一点,你的整篇论文一定是围绕一个核心论点(解决某一个最重要的问题或者核心任务)展开说的,其他的是解决核心问题的过程中顺带解决的子问题,尤其是引言部分,一定要好好理这个逻辑关系,千万别到处拼凑论文,这抄一点那抄一点,逻辑乱七八糟,甚至跟主题都没多少关系。(审过印度人的论文,逻辑乱七八糟,都不知道在讲什么,不愧是出了名的烂。)

5.小白如何入门?
以下建立在已经确定具体方向的基础上。
(1)了解该领域(任务)在做什么
通过综述论文(最好是一区)了解该领域是做什么的,现有研究怎么做,效果怎么样,未来还可以做什么方向。
也可以通过一些前沿论坛的视频了解,中国图象图形学报的b站号定期会举办各种图像领域的前沿论坛,邀请行业大佬来做分享,比如图像融合,我记得就有3期。
(2)了解该领域的具体研究
通常都是先从顶刊顶会看起,尤其是带开源代码的论文以及经常用来对比的方法,重点看。尝试跑一下开源代码,看代码怎么对应论文的方法。
(3)尝试做实验,加模块
尝试加一些注意力机制,或者是别的相似领域的模块,改改损失函数和训练策略等。一方面是感受不同的网络模块和损失函数会带来怎样不同的效果,另一方面也会加强你的代码能力。
p. s. : 很多人可能会问,为啥不是先系统学习深度学习的基础知识呢?我觉得深度学习更注重实践,实践的过程也会加深你的理解,在实践的过程慢慢补遇到的问题和不会的知识。学了一大堆,还不如直接上手理解得透彻。

这样一套下来,你的论文棒得不行,再找靠谱的师兄师姐导师改改,大语言模型(chatgpt,文心一言,讯飞星火等)中翻英,注意一下时态(尽量一般现在时,容易出现一般过去时,要小心),然后deepl英翻中看看意思有没有变,中文版写得好,英文版不会有什么大问题的,这样搞几乎也不用担心什么语法问题,润色问题。最后就是积极投稿,疯狂产出,随着你越来越熟悉,你的点子就会越来越多。
此外,尽量避开热门期刊的上半年的毕业季(1到5月)和下半年的饱和期(8到11月,上半年收稿收够了,不够年底会冲业绩),这个规律主要是在MDPI比较明显,其他的有待考究。
论文返修的时候,最好在截止时间的一半提交,太快会觉得你不认真改,太慢会觉得你不着急或者太拖拉。
顺带一提,有实力(院校级别高,导师关系硬)的组可以冲一二区,有钱的组可以冲开源二三区,散养富哥可以冲开源三四区,散养赌徒可以冲便宜的小众开源四区和中文EI期刊的英文版且冲量(赌能拿国奖回血,研一也可以水一篇水北核拿一等做赌资,疯狂缝论文,主打一个不要脸)。以下行为坚决反对:不想努力的富哥氪金让别人给你写(小心被人骗钱),又菜又穷又想水毕业的看看你研三的师兄能不能帮你水一篇,奖学金全给他(啥也不懂也不努力就想混毕业,做梦去吧)。
最后,你的科研大概率是没办法给你工作方面助力的,只是让人看起来硕士期间确实做了点东西,但能不能匹配岗位需求,还需要额外作准备,比如学习目标岗位的知识技能,找目标岗位的实习,做目标岗位相关的项目(熟悉或复现开源项目也算,重点是问到都能说出点东西来),早些规划早做准备,毕竟这是往后余生为数不多能逆风翻盘的机会。

你可能感兴趣的:(深度学习,人工智能,神经网络,语音识别,计算机视觉,transformer,AI写作)