知网查重是一种用于检测学术论文、期刊文章等文本内容是否存在抄袭行为的系统。下面是关于知网查重如何进行查重以及其规则的一些详细解释。
知网查重的原理是连续出现13个字符类似就判断为重复部分,并将重复的内容计算到论文的重复率之中。论文查重系统会对内容进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。用户将论文上传至查重系统后,系统自动对论文进行检测,待查重完毕后即可提供用户一份查重报告单。
知网查重系统在对任意一篇论文进行查重时,首先会对该论文进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。这样的分层多阶指纹结构,不仅可以满足对超长文献的快速检测,而且,因为最小指纹粒度为句子,因此也满足了系统对检准率和检全率的高要求。
论文的格式对查重结果有一定影响。如果格式正确,知网查重系统会自动识别论文中不需要查重的部分,如参考文献等,并在报告中显示为灰色字体;如果格式不正确,可能会导致这些内容被误判为正文参与查重,从而提高重复率。
知网查重系统也有自己的检测阈值,即系统设定的一个重复率上限。如果论文的重复率超过了这个阈值,就会被判定为存在抄袭行为。不同版本的知网查重系统设定的阈值也可能不同。
同时知网查重系统采用了先进的模糊算法,如果整体结构和大纲被打乱,可能会引起同一处的文章检测第一次和第二次标红不一致或者第一次检测没有标红的部分第二次检测被标红。因此在修改重复内容的时候尽量变换句式,不要打乱论文原来的整体大纲和结构。
在进行知网查重时需要注意选择合适的版本进行查重。不同版本的知网查重系统可能存在差异,因此需要选择与自己所在学校或者机构要求相符的版本进行查重。