论文设计

论文设计

首页 > 论文设计

论文查重的背后逻辑
2022-06-07

我们在写好一篇论文后,最先要做的就是对其进行学术不端检测。普通期刊对来稿的重复率要求控制在20%以内;大部分核心期刊则是将重复率控制在10%。论文检测有很多系统,期刊编辑部最常用的是知网。

●学术不端的危害

具体表现在以下四个方面:

1)影响发表,这是学者们和学生们最关注的问题。

2)影响毕业,因为重复率的问题,很多人毕不了业或延毕。

3)影响声誉,对我们来说,“实事求是”是最核心的价值观念。学术不端行为会损害学者们在社会上的学术声誉,甚至阻碍各个领域的科学发展。

4)影响人生,总体而言,学术不端会让个人走向穷途末路。事实上,互联网上的那些案例只是冰山一角。

我们写论文不能动抄袭的心思、不能抱有侥幸心理,要学会“玩文字游戏”。这里的“文字游戏”是指同样的意思,我们可以换一种表述方式,还可以加上自己对专业领域的理解去写论文,即在现有的基础上对论文内容进行一种更高端的表示与呈现。

●了解检测规则

1)具体算法

这里的具体算法是指评判文中有几个字连续与他人相同就被标红的算法。

假如一个查重系统检测出我们连续六个字与他人雷同就被标红,我们可以在这6个字中设置一个阻碍物。倘若这六个字组合构成的是一种相沿成习的、我们无法改变的说法,那就可以用参考文献的方式去回避。在此,不建议所有内容都用参考文献部分来表述。目前,知网采用的是连续13个字连在一起就算是抄袭了他人文章的算法。在2019年之前,无论是知网还是其他检测系统,我们只要把别人的文字转换成图片是查不出来的,当时没有图片识别功能。但现在,数据技术高级了,图片、代码、公式中的文字,查重检测系统都能识别,我们要注意。

2)对标文献

检测系统对标的文献来源是自有的数据和网络资源。自有数据即论文、法规条例、著作、报纸文和学位论文等;网络资源主要包括网页信息与百度文库。还有一种情况就是,我们也没有参考别人的论文,也没有用法规、条例,更没有引用著作里面的内容,我们就是用的自己的语言进行表述,但也被标红了,这或许是一种约定俗成的说法,别人都这么表述,但有人在我们之前表述过了,就“变成”我们抄袭别人的内容了。

3)开放程度

大部分检测网站的账号对个人开放,唯独知网除外。大部分的期刊查重用的是知网的标准,所以有时我们要想在投稿前用知网标准先自测一下。在这种情况下,有几种方法提供给大家:一种方法是我们可以通过个人向购买检测资格,但我们不是去淘宝上购买,而是要去知网上找老师协商购买。需要注意的是,个人用户购买检测账号后,要在一年之内用完。另一种方法就是垂询所在学校的学报单位或者是教务处、图书馆,同样有负责老师提供论文检测服务。

目前,国内对个人开放的检测系统主要包括万方、维普、paperpass和大雅。

4)能识别与不能识别的内容

能识别的:

文字,包括约定俗成的说法。

图片,包括P过的图。有关这部分内容,中国知网是能识别出来的,知网的图片识别技术很高级,并且接下来可能还会更高级。

代码跟公式。有关这部分内容,我们得按照常规的用法,不能把别人创立的公式或者是生成的代码变成我们的。

法律条文、案例引用现在已经不归入抄袭了(知网)。实际上,还是有些会归入抄袭,我们结合一个案例来看:

案例分析

以下是一篇包含法律条文引用情况的例文,我们来分析一下知网对其查重过程:

图片

结合上图,我们来看一下。这篇文章最初检测时,去除本人文献复制比重复率为16.1%,去除引用文献复制比重复率为10.5%,算是很低了。

接下来,我们来看看刚才讲到过的涉及法律条款引用的问题。

有时,我们需要做政策分析,在这种情况下,如果我们把这些政策一梳理,很可能会出现“整片红”的情况。但主要还是需要参考中国知网的法律条款数据库里面是否收录了相关政策内容。

法律法规、政府文件和科技报告这三块内容是知网里本身就收录的,在查重时就把这些免责了。因此,我们也无需过于担心。

在这里,有一个标红部分调整小方法:我们知道,知网的算法标准是13个字连一起则标红的,那就可以用我们对这个专业或者这个定义的理解,给它重新表述一遍,这个几乎是没关系的。有些表述起来极其困难的,就可以放进参考文献。

不能识别的:

“思想抄袭”。如果我们认为别人的观点很好,但我们与该作者的重合部分很少,那我们可以在这上面做文章,即进行“思想抄袭”。我们要结合新背景,用我们自己的专业理解,再用我们自己的话语体系去改良原有观点即可。这时,我们的观点跟他几乎是不同的了,但是有继承性关系。

迁移使用。可以有度地使用他人的形式、逻辑与观点。例如,一篇文章的框架很好、逻辑很好,我们就看一下他的观点跟另外几个学者的观点能不能合成一个我们自己的观点。也就是“集众家之长。我们要结合现在的一些变化,甚至包括一些技术、工具、理论,把别人的观点或定义进行完善即可,这也是完全合法合规的。

●重复率高的原因

1)抄袭太肆意

无论是数据、内容、公式还是图表,尤其是实验数据,我们是坚决不能抄的。不管是抄袭数据还是内容,都要适可而止。如果我们觉得一篇论文内容很好,可以结合自己的理解将其变成自己的。就像写作文,别人写“去春游”,我们也可以写。但是,不能人家玩什么、我们也玩什么,我们可以玩一样的东西,但是每个人的心情、感想是不一样的,词汇量也不一样。我们把这些东西一加工,论文也就不一样了。

2)仿写不到位

在模仿时,我们很容易被别人带到他们的逻辑顺序、序列里去,然后就走不出来、就不会创新了。总结起来,就是仿写不到位。实际上,仿写论文是有技巧的。首先,我们要清楚:自己不能被别人带走,要带着自己的思想去仿写。那我们仿写哪些内容呢?可以仿逻辑、仿框架、仿用词、仿研究方法、仿理论。当然,我们可以不用别人的理论。我们会发现,一般的文章都用一个理论,为什么这篇文章用了两个理论,它是怎样把这两个理论给搭起来的?这两个理论又是一种什么样的关系?我们可以用这种方式去做仿写。

3)引用太多

在做论文综述时,我们引用的绝对多。我们要了解自己语言表述逻辑,引用也要有自己的风格。有些作者在写书之前,自己的这些观点都已经用论文的形式发出来了,或者别人就在我们之前用了这个概念、这些内容了,到时候我们会变成抄袭其他人的,这种情况是非常容易出现的。

4)创新不足

创新不足与引用太多有密切关联。也就是说,我们迁移使用的度没把握好,或者是说在“思想抄袭”方面,我们实际上既没搞清自己到底要什么,又没搞清楚用哪些方法来做。


点赞 0

踩踩 0